互联网资讯 / 人工智能 · 2024年3月9日 0

字节在AI时代落后?

开年Sora的爆火,为全球科技大厂在AI领域的竞逐又投下一颗重磅炸弹。

相关话题的讨论范围早已突破科技圈。头部大厂正在竞速迈入AI时代。其中,也包括近年跻身全球一线的互联网“新贵”——字节跳动。

2月下旬,字节旗下视频剪辑工具CaPCut(剪映海外版),正式开放AI生成视频功能公测。同时,有消息指剪映已在数月前组建封闭团队,秘密研发AI产品,而字节跳动还在秘密研发AI大模型领域的多个产品,涉及多模态数字人、 AI生图、AI生成视频等。

去年底以来,字节跳动的一系列人事和部门调整,已经显露出积极转向AI的战略迹象。

去年11月,字节调集内部资源,成立AI业务团队“Flow”;今年2月,字节核心高管——抖音集团CEO张楠离任,宣布将未来工作重心转向剪映CaPCut,为产品创造AI领域的更多想象空间。

当AI技术快速迭代,以Sora为代表的各类大模型变得愈发成熟,对旧有内容生产体系和平台模式的改变,已经初见端倪。相比其他全球一线大厂,字节此前在AI领域的进展一直显得较为低调。

2024年,被不少业内人士视为AI产品的“爆发年”,而字节能否跟上AI时代的步伐,决定了将在其中扮演怎样的角色。

Sora爆火,剪映跟上

除了风靡全球的短视频平台TikTok,字节在海外市场的“明星产品”还有视频剪辑工具CaPCut。

两者同为字节跳动旗下产品生态中的一环,用户可以使用TikTok账户登录CaPCut,并将视频传至TikTok 和其他社交媒体平台上与朋友分享。这一互相关联的产品矩阵,为字节跳动带来了更多用户留存和实际收益。

去年4月,CaPCut引入AI生成模版和特效后下载量激增,收入随之增长,成为2023年上半年全球最赚钱的视频剪辑应用。

Data.AI数据显示,截至去年8月,全球有4.9亿人通过苹果和安卓手机使用CaPCut;另据SensoR ToweR数据,2023年CaPCut应用内购收入增长明显,首次突破1亿美元。

而Sora的诞生,象征着文生视频发展的新一项“里程碑”,也将对CaPCut这类视频制作工具造成冲击。

Sora发布次日,美国电脑软件公司Adobe的股价即暴跌超7%;美国图片库、图片素材、图片音乐和编辑工具供应商ShutteRstock跌超5%;此前几周才发布了“文生视频”工具LuMieRe的谷歌母公司股价下挫1.58%……

实际上,在OpenAI正式发布Sora以前,字节跳动就曾推出文生视频模型BoxiMaTor和MagicVideo-V2,只是与Sora差距太大,不具备“可比性”。

字节跳动曾在回应媒体时表示,BoxiMaTor是视频生成领域控制对象运动的技术方法研究项目,还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

即便如此,当“谁将成为中国版Sora”成为行业和媒体热议的话题,剪映仍然成为其中一个强有力的竞争者。

而字节内部也在加大对剪映和AI领域结合的投入。今年2月,抖音集团CEO张楠在加入字节跳动10年后,宣布转战剪映。有接近剪映的人士向媒体透露,张楠将亲自带队寻求在AI辅助创作上的突破。

张楠本人也在朋友圈发文表示,“很期待和剪映的小伙伴们一起造梦,与这个AI的时代一起成长,共同绘制出脑海中的奇幻世界。”

字节AI,反应有点慢

事实上,相比其他大厂,字节跳动发力AI的时机已经略显迟缓。2023年春季,百度、阿里巴巴就已分别推出各自的大语言模型文心一言和通义千问,而字节到去年8月才推出了云雀大模型。

字节跳动CEO梁汝波曾在今年1月的年度全员会上表示,字节在AI领域的进展缓慢,直到2023年才开始认真考虑GPT技术,而许多表现出色的大模型创业公司早在2018年至2021年间就已经创立并开始研发产品。

有媒体在报道中引述一位接近字节跳动人士的消息指,去年一年,字节跳动创始人张一鸣将全部时间都花在了AI上。但在外界看来,字节系统性布局AI,不过数月时间。

去年11月底,字节进行了一系列业务调整,一方面大规模收缩游戏业务部门“朝夕光年”,一方面成立了新的AI创新业务团队“Flow”,并任命字节跳动技术副总裁洪定坤为技术负责人,字节大模型团队负责人朱文佳为业务带头人,加大对AI业务的投注。

此前,有“app工厂”之称的字节跳动,也曾尝试追赶AI热潮,将AI功能融入产品,并以此升级用户体验、巩固平台的流量优势。

例如,2022年,随着AI绘画爆火,抖音快速上线了AI绘画功能;去年11月,飞书发布了“飞书智能伙伴”等AI产品,在内容创作、内容总结、数据分析等多个场景中,借助AI实现工作提效。

飞书CEO谢欣曾在发布会上表示,未来AI的能力一定会变得非常强大,各行各业都会发生巨大变革。但目前AI能力还很有限,不一定能让每一项任务都如期所愿,“当下更重要的是先让自己做到AI Ready”。

而Flow的成立,则标志着字节针对AI领域的布局开始更趋系统性。据称,在Flow成立时,字节内部开放了大量活水岗位,从飞书、抖音等多个业务条线抽调相关人才,计划未来着力孵化多个AI相关的创新产品。

去年下半年至今,字节先后推出了多模态大模型 BuboGPT、抖音云雀大模型、文生图开放模型SDXL-Lightning,并上线了多款基于AI技术的产品,包括AI对话类产品豆包、CICi,剧情创作平台BagelBell,电商内容创作应用即创,AI聊天机器人构建平台Coze/扣子等。

AI产品爆发年,字节加速追赶

AI引领的科技变革一日千里。对字节来说,一方面需要面对自身增速放缓的压力,另一方面必须紧跟时代,主动创造更多机会,才能保持竞争地位,因此绝不能在AI时代掉队。

在社交媒体领域,字节跳动需要应对来自Meta、谷歌、Snap等对手的激烈竞争。去年以来,随着ChatGPT带起新一波AI热潮,全球科技巨头都在AI和大语言模型等方面展开重点布局,加大资金投入、大举招聘人才,并高调宣布在AI方面的最新进展。

国内互联网大厂们也在不遗余力地跟上这波AI热潮。从腾讯、阿里、百度、到华为等,纷纷加码投入AI赛道。

2023年3月,360GPT亮相、华为盘古迅速跟进、百度发布文心一言。4月,阿里通义千问接入产品;5月,腾讯混元加入AI竞逐。下半年国内互联网AI队形初成,里面站满了腾讯、阿里、百度、华为、美团、华为等中国大厂。其中,腾讯投资了智谱AI、百川智能、miniMax、深言科技、燧原科技5家公司;阿里投资了智谱AI、百川智能2家公司,且自己孵化有通义千问;百度投资了西湖心辰,且自己孵化有文心一言;美团投资了智谱AI;另外还有华为盘古、中科院紫东太初、商汤日日新、零一万物等都成为这一领域的主要玩家。

而2024年Sora的横空出世,或许更让字节跳动面临“追赶进度条”的紧迫性。当AI产出的视频内容变得更精确并贴近真实生活,过程也更为高效、便捷,旧有的短视频内容生产模式必将受到冲击,而与此有关的工具、创作者和平台,都将直面新一轮的变革。

事实上,在一些行业,这样的改变已经开始发生。

兼职插画师陆含告诉霞光社,AI对自由职业画师的冲击已经显现。“很多画师平时都会在社交媒体平台大量更新热门内容,来维持更新频率和热度,他们的成长路径更接网红,而平台流量直接和稿费收入有一定关联。”陆含说。

而对不少自由职业画师来说,根据已有作品中人气较高的角色进行插图的二次创作,是一种非常有效的涨粉方式。这样的二创作品,被称为“同人”图,也是AI软件最擅长处理的一类内容。

“跟AI相比,靠人工‘二创’来引流提升粉丝量的效率低得多,圈内不少画师都受到了不小的冲击。毕竟大多数粉丝其实不在乎图是AI画的或是画师手绘,只要好看就行。”陆含说,目前一些游戏公司也已开始倾向使用AI绘图和制作,这意味着对人的工作的需求正在减少,如果公司内部员工可以消化这些工作量,就不再需要外包,直接影响自由画师的收入。

Sora的面世,再一次刷新人们对AIGC发展速度的认知,关于AI对内容制作行业影响的讨论也又一次甚嚣尘上。

短剧导演林平告诉霞光社,一些编剧已经开始尝试使用AI创作剧本,一些制片人也认为到了需要学习AI的时候,“因为这将是未来的趋势”。

林平说,在短剧的拍摄成本构成中,演员、摄像等人力支出,以及置景和场景费等,都占据了支出里的大头。“以我们拍摄的短剧来说,现在一个便宜的特效可能10万,贵的有几十万,大的特效可能需要几十个人来制作。但如果能使用AI制作,不论是资金还是人力投入方面,都会大幅减少。”

“如果AI技术发展成熟,以后拍片子,特效部分可能很大程度可以交给AI生成了,拍摄的时候只要用个绿幕就行。甚至可能不需要演员、摄像或美术,只需要由会操作AI的人根据剧本把它做出来。”林平说。

虽然AI制作内容的进步速度让不少人吃惊,但AI距离真正取代人类内容生产者,还有不少差距。

一名从事神经网络研究的人士向霞光社表示,目前的AI水平还很初级,更像是一个可以快速搜索、查询、统计和筛选的工具。“我认为都是数学,距离强AI还很远。我们可以看到不管是AI生成的图片还是视频,乍一看效果还行,但很多