人工智能 · 2024年5月6日 0

AI赋能优质直播内容创作的方法是什么?

作者丨周乾

优质的直播内容已经成为各大直播间营收增长的核心驱动力,而在打造优质直播内容的方式中,AIGC无疑是目前更具性价比和效率的方向。事实上,AI在直播间的应用也越来越深入,比如AI数字人主播、AI技术推动直播服务的优化和升级等等。

直播行业线上化程度高,且内容质量直接决定其价值创造,这两大特征使得AIGC应用在其中能够产生最大化的价值,并能够迅速渗透至核心生产环节。

这些听起来让人感觉新的增长机会近在眼前,而参差不齐、真真假假的应用能力让人感到焦虑又踌躇——想跟上AI 浪潮,但投入了成本,真能产生效益吗?哪些层面才能产生效益?

为此,我们深入直播行业调研,并采访到直播行业的技术TOP厂商,将AI技术在直播行业的细分应用场景挖掘出来,供大家参考与讨论——AI+直播是如何降低直播内容生产的成本和门槛,来赋能优质直播内容的创作,提升直播内容的质量、互动性和个性化体验。

AIGC为内容生产降本提效

AI技术以“低门槛、低成本、高效率”的创作模式赋能直播内容创作,已经显著地推动了降本增效的进程。主要体现在以下几个方面:

虚拟主播生成:

AI技术可以生成虚拟主播形象和声音,通过深度学习算法训练模型,创造逼真的虚拟形象,提供新颖的直播体验。虚拟主播可以24小时不间断直播,不需要休息,也不受到情绪、健康等因素的影响。通过预先设定的脚本和互动话术,能够持续吸引用户注意力,提高直播的频率和覆盖度,同时减少了对真人主播的依赖,降低了成本。

直播行业TOP技术厂商即构科技目前也推出“即构数智人”产品,据相关产品负责人表示,目前的数字人技术厂商,主要是为客户提供一个SaaS软件,例如“即构数智人”平台,通过这个软件直接推流到第三方平台去做直播。然后客户在这个软件后台去设定所谓的“人货场”,即开播前在后台选择虚拟主播、提前设定好产品介绍,以及可以去生成数字化的直播场景。

AI主播作为一个新型事物,目前处在发展应用的初期,平台、商家,以及MCN等都表现出了拥抱探索的心态。技术的发展有一个过程,目前AI直播在互动反馈、画面效果等方面仍然存在着短板,而技术的突破也直接决定了数字人直播的发展走向。

内容创作辅助:

在内容创作的辅助方面,主要分为视频和音频两大类。

AI视频创作类工具,如百度的“度加”,允许用户输入文案后自动匹配视频素材和编辑,快速生成内容丰富的视频。AI技术还可以基于热点新闻和用户兴趣自动生成文案脚本,为创作者提供灵感和素材,降低创作门槛。还包括个性化推荐、实时弹幕处理等。

AI音频频创作类工具,AI技术在声音创作方向上提供了文本配音、音色定制、智能变声等功能,帮助创作者高效简洁地完成配音工作。以即构科技的“VC音色转换”为例,该技术可支持Any-to-One音色转换,即将任意说话人的语音转换为特定音色,算法可实时生成高清目标音色语音,保留原始语气与说话韵律。

比如,主播想把自己的语音转换为蜡笔小新的声音,就可以在直播过程中实时换上蜡笔小新的声音,等于是给自己的声音换上“新皮肤”,立即调动起直播间的氛围。

另外,AI为直播间的运营也提供极大助力,比如内容分析、推荐等,此环节与直播内容创作不直接相关,在此不做深入讨论。

AI技术优化带来内容质量提升

越来越多的直播间通过AI技术来优化直播内容质量,保护用户体验,从而留住更多用户。从内容生产来说(不包含运营环节),主要是两个方向:

首先是AI技术优化直播的清晰度和流畅度。

比如,在直播、1V1视频聊天中,外界环境“不友好”比如光线暗的时候,主播视频画面清晰度低,容易有噪点,粉丝的观感体验就很差,画面“又黑又糊”,很容易就丧失耐心,退出直播间。

而通过AI技术,比如即构科技“AI画质增强算法”,能够在光线暗的环境下,对主播开播视频画面进行“调色”:拉高亮度、饱和度、降低视频噪点,提升直播画面质感,相当于一个智能、实时的“调色插件”,这样以来,观看直播的用户对于直播间的好感度也会提高。

其次是直播技术创新方面,如AI辅助的绿幕技术、虚拟背景、AI降噪等,为直播带来新的视听效果。

直播三要素“人、货、场”中,直播间是否具备足够有创意、足够氛围感、足够引发观众”冲动消费“的场景,对于整场直播的销售效果有着直接的影响。因此各大直播间或者直播平台都选择用虚拟场景直播,用相比实景更加具有创意和吸睛的方式来撬动流量。

即构科技相关产品负责人反馈,一款绿幕应用(用于绿幕直播间实时换背景),在接入即构绿幕抠图技术后,半年内新增5万用户(也就是主播);23年下半年,该绿幕软件结合直播机一起售卖,目前已经新增近2千用户,今年预计将达到1万用户增量。

近10倍的效益增长足以显示出直播市场对于直播抠绿幕换背景的需求,我们也看到,越先使用AI+直播技术的,也越先收获了效益。

另外,在直播场景中,主播在做外景直播时,常常有不确定的噪音“乱入”,严重影响用户听感,甚至会让用户离开直播间。此时,主播通常选择降噪,但一般降噪技术,在降低噪音的同时,也会损伤音乐声音。假如主播表演个弹唱,降噪技术直接就把音乐伴奏识别为噪音,一并消除了大部分,别说普通用户的听感不舒适,对于热爱音乐的用户简直是一种折磨。

对此,即构科技针对性地推出了“场景化AI降噪”,在消除环境噪音的同时,还能保障纯净音乐伴奏声。并且能根据不同的直播环境(户外噪音环境&音乐演奏场景),智能调整最佳降噪策略——如果是户外噪音,没有音乐演唱,AI降噪将启动消噪,保障优质人声;如果环境里有音乐伴奏,AI降噪将自动识别音乐伴奏,降噪同时,保留人声和纯净音乐。如此,主播无论在怎样的环境开播,无需手动操作,AI降噪都能实时保护主播人声和音乐的最佳音质,保证用户最舒适的听感。

另外,AI技术还通过内容水印、内容指纹识别、监测与屏蔽技术等,保护直播内容的版权,减少盗版风险。

AI技术不仅提高了直播内容创作的效率和质量,还为直播平台和创作者提供了更多的创新可能性和商业机会。可以预见的是,随着AI技术的不断进步,未来直播内容创作将变得更加智能化、个性化和互动化。

AI 能发挥的“降本增效”的作用,无非是对劳动力的“替代”,而非“超越。但AI未来的发展速度将比我们想象的更快,对直播内容创作的赋能或许也很快就将从“降本增效”转变为“不可替代的全新生产方式”。积极拥抱AIGC,不仅仅是企业降本增效的手段,而是跟上时代发展脚步的基础门槛。

从最早的工业革命开始,任何一种技术的发展,都是通过工具赋能,来增强人本身的能力,从而降低社会发展对专业人才的依懒性。让不会织布的工人通过纺纱机就能进行织布作业、让不会除草的居民通过割草机也能轻松修剪草坪,而AIGC也同样是一种工具赋能,让不会绘画的人可以制作出精美的图片、让文笔不好的人可以撰写出优秀的文本。

新技术改变人类生产和生活方式的同时,也催生生产关系的改变。蒸汽机和内燃机的问世,为汽车的诞生奠定了基础,但这仅仅是个开始。汽车真正成为改变世界的驱动力,是亨利·福特引入的流水线生产方式——一场关于生产关系的变革。从此汽车实现大规模生产,价格变得亲民,走进寻常百姓家,成为推动社会经济转型的强大引擎。