4月1日消息,过去一周,国内外AI圈子又有众多话题涌现。关于大模型的落地,成为AI大佬们热衷谈论的主题之一。
近期,国内又有多个大模型及相关产品开源,开源生态建设,也成为AI大佬们关注的重点之一。
谈大模型落地
百度沈抖谈大模型产业落地
3月28日,在博鳌亚洲论坛2024年年会上,百度集团执行副总裁、百度智能云事业群总裁沈抖对大模型产业落地发表了看法,他表示,大模型的产业落地,既不能冒进,也不能坐在那里等“爆款”,而应该先把大模型应用到企业研-产-供-销-服的各个环节里面去,实现降本增效。
沈抖表示从百度过去一年的经验来看,在大模型落地上,生成式AI是真的用起来了。但这个过程中还是有不少问题:
第一个是,千万不能冒进。在解决行业问题的时候,一定要根据自己的需求,绝对不是模型越大越好;而且一些小模型,针对特定的场景经过精调之后,出来的效果比大模型还要好,而且成本低。
第二个,也不能不积极,不能只想着做爆款。大家都在聊大模型要到产业里面去、到场景里面去,其实很多场景是靠挖掘出来的。大模型出来后,我们发现它能力很强,但它也不是神器,不是妙药,不是放到哪里它就能立刻生效。其实它应该是在研-产-供-销-服的每个环节,但凡与信息流通有关的环节,都应该把大模型加进去提效。
大模型的产业落地不是“爆款思维”,大模型的能力最后就像氧气一样,深入到我们生活的方方面面,就是这样一个过程。
第三个,还是要有一点耐心。大家感觉大模型现在真的影响了我们很多吗?也没太感觉到。但是从百度过去一年的实践看,很多企业在核心场景中都在使用大模型,你会发现它其实已经潜移默化在我们生产生活的不少环节中发生作用了。所以大模型落地既不能做技术的冒进,也不能坐在这里等,而应该把生成式AI应用到自己的研、产、供、销、服的各个环节里面去,实现降本增效。
澜舟科技“周明曲线”:To B 400亿参数大模型落地最好
澜舟科技创始人兼CEO周明是世界自然语言处理(NLP)领域的领军人物,曾任国际计算语言学学会(ACL)主席、微软亚洲研究院副院长、中国计算机学会副理事长。
在此前澜舟科技的大模型技术和产品发布会上,周明就谈到大模型toB落地的“九字法则”。周明表示,雷军所说的互联网的七字法则“专注、极致、口碑和快”仍然适用,还要再加上“成本”,大模型创业不能不在意成本,一定要有造血的能力,形成大模型落地九字法则:“专注、极致、口碑、快、成本”。
在大模型落地方向上,澜舟科技不追求AGI,也不追求超越GPT-4,而是把大模型如何更好地服务客户放在首位,选择了更加非标准化的To B市场。
周明认为,做To B,大模型成本与客户预期必须找到平衡。在调研了102家企业之后,澜舟科技找到了“周明曲线”的最佳临界值——400亿。也就是400亿大模型能很好地兼顾技术领先性与低成本的需求。
谈大模型开源
上周,昆仑万维开源了数字智能体全流程研发工具包AgentStudio,今天,澜舟科技正式宣布开源Mengzi3-13B大模型。
360创始人周鸿祎在上周也透露“这两天准备开源 360 智脑的一个70亿参数大模型”。具体开源时间尚未公布
周鸿祎称自己是开源的信徒,信奉开源的力量。发挥开源的力量,让大家不用再各自闭门造车,重复发明轮子。关于大模型开源还是闭源的问题,业内争论颇多。
此前特斯拉CEO埃隆·马斯克(Elon MUSk)还为此将Open AI及其CEO萨姆·奥特曼(SaM AltMan)告上法庭。马斯克在诉讼中表示,OpenAI最近与科技巨头微软的合作关系,严重损害了它致力于公共、开源的AGI的初衷。GPT-4是一个闭源模型,这违反了开源精神,此举是出于商业目的,而非人类利益。