大型模型的现阶段：跳出对话框，迈向产业端

大模型热潮涌动了一年多后，越来越多人平复了激动的情绪，开始从客观的视角重新思考大模型的价值和机会。

红杉资本在Al Ascent 2024的开场演讲中提到，大模型的创造能力和推理能力，第一次实现了以类似人类的方式进行交互，将支撑起数十万亿美元的市场。

然而和AGI的遥远梦想相比，大模型的创业者们却不得不正视摆在眼前的现实挑战：大模型的训练成本高达数千万元，但至今还鲜见杀手级应用，在质疑声中，生存仍然是最先要考虑的问题。

一面是重构千行万业的机会，一面是必须要翻越的高山，2024年的大模型市场，还会翻出怎样的浪花？

据不完全统计，国内已经有200多个大模型，并且引发了说法。可稍微理性一些就能明白，“大炼模型”不过是早期过于狂热的产物，不少大模型存在“套壳”的嫌疑，有机会上牌桌中终归只有头部几家。

市场研究机构CB insights发布的《2023年人工智能行业现状报告》显示，2023年中国AI领域的投融资数量约为232笔，同比下降38%；融资总额约为20亿美元，同比下降70%。大模型热度空前的局面下，资本市场却罕见“降温”。

对2023年的融资数据再深挖一层，融资额度在5000万元以上的项目只有26个，其中还包括少数几家企业的多轮融资。而大模型本就是一门“烧钱”的生意，那些拿不到钱的创业者，注定会悄无声息地消失。

事实也是如此。大模型热潮进入到第二年，真正有机会进入决赛圈的企业，似乎只剩下两个流派。

一派是有资源、有技术、有人才的科技大厂，比如百度的文心大模型、阿里的通义系列大模型、华为云的盘古大模型等。在ChatGPT走红之前，这些科技大厂就已经开始探索大模型的方向，对大模型价值的理解也更加深刻。

比如华为云在2023年7月发布的盘古大模型3.0，被定位为“一个面向行业的大模型系列”，注意力聚焦在了产业层面。百度创始人李彦宏也曾多次公开表示，“卷大模型没意义，卷AI原生应用才有价值。”

另一派是被互联网大厂青睐的明星创业者，目前主要是智谱AI、月之暗面、百川智能、零一万物和miniMax，被媒体形容为“大模型五虎”。

五家“独角兽”拿走了大模型领域40%以上的融资，但总融资额不到200亿元，而亚马逊已经为AnthRopic投资了40亿美元，微软对OpenAI的注资早已超过100亿美元。 “缺钱”仍将是国内大模型创业者的常态。

需要说明的是，现阶段的大模型市场远没有到决赛时刻，淘汰赛才刚刚开始，新的大模型仍有机会崛起，一些熟面孔也可能跑不到最后。但可以笃定的是，大模型不是一场毫无章法的无序竞争，并不难猜测接下来的走向。

当前大模型被普遍认可的有三个价值，即效率、体验和创造，且都不缺少落地的土壤：在体验层面优化人机交互，创造层面已经产生了大量的AIGC内容，效率层面的直接例子就是编程和研发效率的提升。

而价值体现的唯一路径，正是将模型和各行各业的需求融合。也就意味着，“炼大模型”将是小部分玩家的战场，将大模型的能力落地到千行万业，才是每一个开发者都可以参与其中的事，才会是大模型的终极方向。

走出对话框，走向产业端

互联网技术的普及，在很多人眼中是先To C再To B的路线，不管是电商、搜索还是网络游戏，目标对象都是个体为单位的消费群体，直到国内的人口红利见顶，“产业互联网”的概念才渐渐被讨论。

以至于在大模型浪潮兴起后，不少人想要重走互联网的“老路”。可把视角放大一些的话，互联网的繁荣其实是网络传输技术落地应用的“果”，借用业内普遍将算力比作电力的比喻，算力和数据是“燃料”，而大模型对标的是蒸汽时代的发动机、电力时代的电动机，扮演的是“引擎”的角色。

以电动机为例，在日常生活中无处不在，却几乎没有人会注意到，因为创造价值的是电动机驱动的空调、洗衣机、榨汁机等产品。沿用同样的逻辑，对话式AI就像是给电动机加了扇叶，目的是给人们演示电动机的作用，想要进一步释放大模型的价值，必须要走出对话框，走向产业端。

科技大厂选择“面向行业”的原因也就不难理解。尽管大模型产业应用的时间并不长，价值却早已被验证。

早期是科研等领域的试水。

2018年的时候，谷歌大脑团队就宣布完成了可识别蛋白质结晶的计算机视觉技术，用于辅助多种疾病的药物研发。

预训练大模型诞生后，不少科研机构开始将大模型能力应用到药物研发领域。比如西安交通大学第一附属医院的刘冰教授团队，基于盘古药物分子大模型发现了全球40年来首个新靶点、新类别的抗生素，将先导药物的研发周期缩短至1个月，研发成本较传统方式降低了70%。对比新药研发“平均需要10年时间、花费10亿美元”的铁律，大模型的能力几乎可以用“降维打击”来形容。

然后是大中型企业的探索。

不同于外界印象中的“守旧”形象，拥有丰富私有数据资源的大中型企业，在大模型落地应用中，可以说是名符其实的先驱。

可以找到的案例也更多。蚂蚁金服发布了金融大模型，涵盖理财顾问、保险代理、投研、金融营销、保险理赔等业务；山东能源集团在华为云上搭建了“盘古矿山大模型”，涵盖9大专业40多个应用场景，推进人工智能大规模“下井”；广发证券通过盘古大模型大幅提升了预测精度，企业财务异常识别准确率高达90%…有别于自上而下的赋能，大中型企业已经学会了使用工具。

现在越来越多行业开始拥抱大模型。

比起缺乏付费意愿的C端用户，一旦大模型释放的生产力被印证，B端客户对新技术的渴求要更加强烈。

IDC曾在2023年第四季度进行过一场AI应用调研，结果显示超过九成企业已经布局了AI应用，已经接触大模型并且有明确预算的企业占比24%、34%的企业开始制定潜在应用场景、35%的企业开始进行试点，仅有7%的企业对生成式AI完全没有规划。历史上的每一次工业革命，都离不开新旧生产力迭代，只要大模型能够做出场景创新，大大小小的企业总能在权衡后做出正确的选择。

不过，大模型的落地是个相当复杂的系统工程，除了在方向上达成共识，还要找到更高效、更普适的路径。

终端和大模型加速融合

智能手机、PC、智能汽车、智能音箱等数量庞大的终端，俨然是大模型落地中不可或缺的一环。如果把大模型比作“超级大脑”，智能手机、智能汽车等终端就是人类走向AI时代的“器官”。

所以在过去一年中，端侧AI的说法被频频提及。

华为在2023年8月的鸿蒙4.0发布会上，官宣了小艺智能助手的升级，不仅支持用户使用自然语言进行交互，还能帮助用户输出小作文、图片、视频等内容；三星将生成式AI作为Galaxy S24系列的最大卖点，实现了即圈即搜、通话实时翻译、笔记助手；即使是慢了半拍的苹果，也在不久前公布了自己研发的MM1多态大语言模型…大模型和终端的融合已经是一种现在进行时。

端侧AI的理念，让外界看到了人机交互再次被重构的可能。就像触摸屏淘汰了传统的键盘和鼠标，打开了超级app的格局，大模型让“人机对话”成为现实，和智能助手聊聊天就能点外卖、打车、购物。

倘若只是从“入口之争”的角度看待大模型和终端的关系，不仅和大模型走出对话框的趋势相悖，也低估了终端厂商的决心。

不久前结束的第21届华为分析师大会上，华为副董事长、轮值董事长徐直军在主题演讲中提到了两个不应被忽略的信息：

第一个是打造统一的开发者平台，面向鲲鹏、昇腾和鸿蒙生态所有的开发者，将基于华为云打造一个统一的开发者平台，给开发者一个统一的入口，让开发者在这三个生态上自由地移动。

第二个是打造“小艺”超级智能体，基于盘古大模型把“小艺”打造成为超级助手，并把HaRMonyOS Next打造成为一个原生智能的操作系统，统一AI能力底座，构建系统级原生智能。

统一的开发者平台和系统级原生智能，既是进一步打通产业端和消费端的关键，也是对大模型和终端深度融合的注解。

比如开发者可以通过盘古大模型理解和匹配用户的高阶意图，结合意图框架做服务管理和分发，精准地触达目标用户，在电商、政务、金融、教育等场景中提供用户需要的个性化服务；再比如加速大模型工程化，在数据工程、模型开发和应用开发等环节外，不断简化应用部署和分发的流程，原本需要面向不同终端开发不同app的服务，也许只需要唤醒“小艺”就能满足。

刚刚，华为开发者大会2024（HDC2024）官宣，将于今年6月21日~23日在东莞举办。根据HDC2024邀请函中释放的信息，会上将发布盘古大模型5.0，并将和HaRMonyOS Next鸿蒙星河版同台亮相。同时也预示着，徐直军在主题演讲中的内容并非是在“讲故事”，而是2024年即将上演的一幕。

做一个大胆的预测，在HDC2024披露更多关于盘古大模型5.0以及端模融合的消息后，将有越来越多的终端厂商跟进，讨论的焦点将不再局限于端侧大模型，而是怎么打通生态、怎么为开发者赋能，跳出“入口之争”的思维误区，推动大模型从尝鲜期走向落地期，从“好玩”走向“好用”。

有别于行业端落地的润物无声，数以亿计、乃至十亿计的智能终端，直接影响着普罗大众的体验和感知。终端和大模型的结合，不单单是终端厂商的“战争”，关系着每一个开发者的前途命运。大模型的行业应用和用户教

chatGPT

近期文章

互联网资讯 · 2024年4月25日 0

大型模型的现阶段：跳出对话框，迈向产业端

You may also like...

发表评论取消回复

互联网资讯 · 2024年4月25日 0

You may also like...

易烊千玺公司因侵权被强制执行50元

华为Mate50保时捷版或将采用独特的陶瓷撞色ID设计

中国租车业的创新者

发表评论 取消回复

发表评论取消回复