互联网资讯 · 2024年3月10日 0

寻找“Sora”在抖音、优酷的下落

OpenAI又一次震撼了科技圈。

当地时间 2 月 15 日,OpenAI 推出旗下首款视频生成模型Sora。官方介绍写道:“我们打造了一种名为Sora的文本到视频模型。Sora能够生成长达一分钟的视频,同时保持视觉质量和对用户提示的遵循。”

Sora是日语“天空”的罗马音字母,在英语里则有小鸟在空中咏唱的意思。它像是OpenAI此前推出的图像生产系统DALL·E与AI聊天机器人ChatGPT的混合升级视频版本。

过去一年,生成式AI视频创业已是一条热门创业赛道,涌现出了一批备受瞩目的独角兽,也给出了不少有创意的作品。但外界普遍仍抱有AI生成视频和实拍差距明显,全面推广商用并不会在短期内实现的想法,然而Sora的演示样片彻底颠覆了大众的认知。

通过OpenAI给出的案例演示来看,用户只需要输入简短的文字描述,Sora就可以将文本内容转化为一分钟的高清视频。

年轻的东亚女性走在充满霓虹灯的东京街头、两艘战船在咖啡杯里斡旋、黑人小伙在云端听歌、古镇巷子里迎接龙灯的男女老少……画面不仅包含高度详细的场景、神态动作机器逼真的人物形象,更是呈现出如同电影效果的摄影机运动曲线和同一场景多景别取景。

不仅如此,Sora还可以根据静态图像制作动画,立体平面多种风格都可以实现,说是动画工作室出品的最新短片也不为过。

如果不仔细观察,视频画面基本没有AI制作的违和感,甚至可以抵得上好莱坞娴熟的现场实拍和庞大的后期团队合在一起数月的工作量。

Sora的进化速度,连《流浪地球》的导演郭帆都发朋友圈感慨,“太快了”,并配上了“哭泣”的表情。

不止大佬郭帆,整个影视行业都在密切关注Sora。

从样片来看,Sora呈现的效果远超Pika、Runway。之前的文生视频模型基本上是生成单镜头,一旦输入新的提示语,画面主体会出现明显变化。Sora生成的视频在视角转换、镜头景别切换后,可以保持主体的一致性,这让一个人足不出户制作独立完整的视频作品变为可能。

Sora正式上线后,专业短视频制作成本或将大幅度降低。

“用AI工具开发一个小说IP,前期开发的文字和图片成本可能是以前的十分之一,做一条30秒预告片DEMO的成本,成本可能是以前的二十分之一。”老邱认为,“有好多故事和题材,一个人用Sora就能做一条片子。”

但Sora的高效率会不会冲击到影视行业从业者的饭碗?

以短视频团队为例,短视频平台上1秒种长度的专业内容基本就对应着1个小时的专业工作量,一个账号基础配置包括出境博主、摄影师、剪辑师的3人团队。一个日更30秒视频的账号需要小团队每日的高频产出来维持更新频率。

使用AI生成视频后,不仅可以省去实地拍摄的所有成本,摄影师和剪辑师可有可无,甚至连博主都不需要了。只需一个人阐述文本内容就能运作多个账号,且每个账号的主角还能不一样。

据美媒报道,好莱坞正在担心AI将导致舞美、后期、特效等岗位出现大面积失业。有统计称,美国的创意行业未来三年将有近20.4万个岗位受到AI的冲击。

去年5月2日,美国编剧工会(WGA)宣布罢工。7月13日,代表16万演艺人员的美国演员工会及广播电视艺人联合工会(SAG-AFTRA)也宣布与制片公司的谈判破裂,从即日起进行罢工。两次大罢工,原因除了演员、编剧与资方的薪资矛盾外,人工智能可能取代演员和编剧的威胁成为主要原因。

据中国侨网消息,参与谈判的人表示,通货膨胀和流媒体生态系统、福利以及不受监管地使用人工智能的威胁削弱了他们的基本工资。

但也有业内人士对此抱有不一样的态度。乐观主义者将Sora视作是“视频行业的iphone时刻”,将它视作辅助创意执行的工具。

老邱也是类似的观点,“AI将大幅提升影视作品的产量,更多元的品类和商业玩法,从而抵消专业从业者被AI替岗的冲击。”

AI生成工具需要大量内容进行训练,而这些内容都是此前创意行业从业者辛勤工作得出的成果,所以有创意工作者在质疑大模型训练是否侵权,AI生成的内容是否可以商用,甚至一些编剧拒绝将其作品用于AI训练和创作素材。

客观来说,版权保护、就业岗位与生成式AI发展存在相互制约的。目前,各国司法机构都没有给出明确的界定,短期内相关方还会处于博弈状态。

而相比起国外创意工作者担忧版权被侵权,国内从业者则看淡许多。目前,影视行业在研究如何引导AI制作电影短片。

受Sora影响的不止影视、创意、广告等行业。

Sora发布后,此前宣布全面拥抱AI的图片软件公司Adobe股价应声下跌7%,哪怕其去年推出的主打文生图的FiReflyimage2、矢量图模型FiReflyVecTorModel以及设计模版生成模型FiReflydesignModel已经令人惊艳。

让人惊讶的是,Sora背后团队的核心成员仅有13人, 2位负责人也不过刚博士毕业。TiM Brooks是DALL-E 3作者之一,在英伟达实习时负责过视频生成研究项目;WilliaM Peebles则与CV行业大神级人物谢赛宁合作发表了DIT模型,首次将TRansfoRMeR与扩散模型结合到了一起。

从时间线来看,Sora并非是酝酿多年的项目,就是这支年轻的团队在一年内搞出来的成果。TiM Brooks称:“我们认为建立能够理解视频的模型,并理解我们世界中所有这些非常复杂的交互,对于人工智能系统而言是非常重要的一步。”

Sora一出,OpenAI在生成式AI领域的领军地位再次得到了巩固,市场立刻给出了积极反馈。

面对外界的惊叹,OpenAI一如既往以退为进,用谦虚的言辞炫耀着实力。

OpenAI称,Sora存在难以准确模拟复杂场景的物理特性、无法理解因果关系的具体实例和混淆提示空间细节的缺陷,目前还处在测试阶段。公司将会给视觉艺术家、创意工作者提供访问权限,以便收集专业人士的改进建议,进一步完善模型。

接连不断的颠覆性产品让OpenAI的影响力与日俱增。尽管还保持着独特的股权结构,但OpenAI确实越来越商业化了。

一夜之间,Sora成为行业投资人议论的焦点。OpenAI的每一次突破都会让资本对它的想象空间进一步扩大,同行竞争者能够拿到的资源也会变少。

不少小型初创公司创始人在看到Sora呈现的效果不得不思考新的发展方向。有分析人士甚至悲观地表示,ChatGPT终结了AI文本生成创业,Sora要终结AI视频生成创业了。

前阿里技术副总裁,正在进行AI创业的贾扬清认为:“从算法小厂的角度,要不就算法上媲美OpenAI,要不就垂直领域深耕应用,要不就选择开源。”

OpenAI的遥遥领先使得其越发向着垄断巨头的趋势进化,让诸多AI领域的创业公司如坐针毡。

除了AI创业者,作为大模型的根基,芯片制造领域和OpenAI的关系也在变得微妙。

ChatGPT爆火后,从绝对数值来看,英伟达显然是比OpenAI更大的受益者。2月,英伟达市值飙升至1.8万亿美元,赶超谷歌、亚马逊,成为美股第三大上市公司。

如果能拥有算力芯片的研发、制造和生产能力,OpenAI就可以串联起整个产业链,奥尔特曼越发想介入上游。

2月,OpenAI创始人奥尔特曼被爆在跟中东投资人兜售旨在提高全球芯片制造能力的大项目。知情人士透露,奥尔特曼认为现有的AI芯片供应量跟不上AI的高速发展,芯片会成为实现通用人工智能障碍,他希望筹集5至7万亿美元来建立新的AI芯片企业。

奥尔特曼的表述显然言过其实。根据市场调研机构IC insights报告,2023年全球整体芯片市场的收入预计提高24%,史上首次突破5000亿美元。按现在的增长速度,2030年芯片业收入才有望突破1万亿美元。

同为舆论焦点人物,英伟达首席执行官黄仁勋虽然认为各国都需要建设独立的AI基础设施,但是并不认可奥尔特曼的夸张性表达

他认为,芯片业的扩张并不意味着数量爆发,而是要提升AI计算的效率,过去十年算力成本已经下降了100万倍。一味地扩大产能将导致供需失衡,冲击芯片的价值。

OpenAI展现出的实力越大,外界对它的担忧和争议也会越多。自ChatGPT爆火,舆论对AI的边界应该设在哪里的争议就没有停下来。从文字到图片、从图片到视频……AI以假乱真变得越来越难以识别。按照现在的进度,AI生成从二维进入三维世界大概率只是时间上的早晚问题。

新的一片天空已然拉开大幕,AI行业思考如何在激烈的市场竞争中占据一席之地固然重要,但更重要的是得处理好人类和AI的伦理规范。

AI可以生成虚幻的数字影像世界,但监管它的规则,还是由人类来制定的。