大模型似乎没能带来更多的估值上的想象力。
今年3月14日,OpenAI发布GPT-4,大模型理解能力、可靠性有了进一步提升。两天后,百度闻心一言正式发布,直到8月底,文一言才正式向大众开放服务。
百度之外,科大讯飞5月6日发布星火大模型,9月5日,面向全民开放。商汤方面。4月份,发布日日新大模型体系,8月底,日日新大模型获批。腾讯浑元、阿里通以千问,也纷纷跑步入场。
如今,首个国产大模型亮相半年过去了,各家资本市场表现如何?
百度3月14日港收盘股价129港元,9月18日收盘132.2港元。
商汤4月11日收盘3.33港元,9月18日收盘股价1.46港元。
科大讯飞5月8日收盘63.76元,9月18日收盘48.38元。
对于大模型概念,确实喧嚣过,但是目前来看,繁华褪尽,市场似乎并不买账。
8月15日,《生成式人工智能服务管理办法(征求意见稿)》开始施行,AIGC产品合规之路明朗,于是,国产大模型密集发布,百度、讯飞、商汤等一众大模型玩家开始抢夺ToC市场。
那么人们手机中的“第一个大模型应用&Rdquo;能不能成为AI生成的“第一入口&Rdquo;?值得深究。
大模型“内卷&Rdquo;到前台,AI落地半场开香槟?
可以确定的一点是,走到前台,市场期待的是应用意义上的“产品化&Rdquo;。大模型能够解决什么样的客观问题,能解决问题的应用,才是有商业价值的应用。
大模型最直接的应用,是语音助手。
大模型强化一波语音交互应用,可能会给某些硬件行业带来“第二春&Rdquo;,比如智能音箱有了新卖点,小度智能音箱可能会找到新的增长点。
语音助手领域的应用,最顺利的可能还是汽车。
文心一言收获了吉利、长城、红旗、东风日产、岚图,ChatGPT接入奔驰,星火大模型接入广汽,华为盘古接入赛力斯&hellIP;&hellIP;这也是大模型最容易商业化的场景之一。毕竟,对于车载场景来说,语音助手应用是刚需,也是比较成熟的B端落地领域。
大模型向C端渗透过程中,虽然已经迈出重要的一步,但距离真正的大规模应用,恐怕还有距离。
如今的欢呼,倒像是半场开香槟,现实是大模型还远未到成熟的阶段。
人们需要接受的是,大模型看起来很强,但你真正用它去解决问题的时候,会发现真正没有那么的强。
对于一些最实际的,哪怕是简单的需求,大模型都还没有办法满足,背后有数据的问题,生态的问题,但归根到底,还是只能有限地解决实际需求。
首先是数据新鲜度的问题。在实际的使用过程中,我们发现,同样的问题,大模型给出的答案甚至不如搜索。
这是百度搜索给出的答案:
这是文心一言给出的答案:
从时效性以及准确度来说,反而是搜索更符合常理,也更符合人们对于真实场景的认知。
“凡是要跟语言文字或程序代码打交道的应用场景,都可能有文心一言的用武之地。&Rdquo;王海峰曾对外界表示。
的确,大模型的应用场景很大,但现实是,真实的需求场景中,当下的大模型产品似乎还有不少能够提升的空间。
相比文心一言,讯飞星火大模型给出了答案,但时间是2022年度上市公司排名,并不是当下最新的数据,也同样是数据新鲜度的问题。
数据新鲜度的问题,本质上是数据生态的孤岛问题。
对于某些垂直领域的提问,大模型给出的答案无论是从专业度上还是从时效性上都似乎不能满足人们的需要。这可能是因为,无论是文一言,或是星火大模型,大家对垂直领域的数据训练其实还不够。
比如,对于财经信息方面,大模型给出结果可能还不如财经信息网站上搜到的结果准确,可用,当然这里面可能会涉及版权的问题,但本质上其实就是数据生态的孤岛的问题。
拿ChatGPT来说, OpenAI、Google 及其支持的 AnthRopic 多年来一直在使用其他网站或公司的在线内容来训练他们的生成式 AI 模型,虽然数据的量有保证了,但也有潜在的法律问题。
当大模型走向前台,这种数据孤岛问题会更加突出。因为用户不在乎你怎么获取数据,用户只在乎,你的工具好不好用。
天眼查app搜索大模型,相关结果有100多家,虽然其中也有不少大模型都发布了各自的app,但目前来看真正好用的其实不多,大量用户涌入还是因为有新鲜感,大模型在C端应用方面做的工作其实也还很有限。
比如,用户想把一张2K分辨率的图片清晰度生成为4K,其实技术上并不复杂,但大模型却给不出结果,对于普通用户来说。用过一次不好用,恐怕就很难再坚持用下去了。
就像曾经的智能音箱、语音助手, 其实大家手机里都有AI语音助手,为什么使用的频率并不高?其实还是因为不好用。所以,对于百度、讯飞甚至商汤来说,挑战不在于能不能把C端的应用做出来,而在于做的够不够好。
百度产品上比较成功的就是百度搜索,智能搜索的确很强大,但大模型产品能不能做到像搜索一样的水平,需要打一个问号。
对讯飞而言,一些硬件产品做得不错,但考验在于软件产品的定义能力;对于商汤来说,ToB的应用做了不少,但ToC显然还是需要更多的经验。
目前来看,国产ToC的大模型差异化并不大,大多是内容创作、AI绘画、翻译、AI办公等场景应用,也能帮助人解决一些实际的问题,比如生成会议大纲,给PPT写提纲、写研报、写工作日报。
但接下来,能不能ToC的大模型真正做成“爆款&Rdquo;,做出差异化,恐怕考验的就不仅是AI技术了。
大模型产品化的窗口期不多了
大模型落地B端的一个最大阻碍是不能理解业务。
举个例子,金融领域是强数据导向的领域,人们需要在数据的基础上去做决策,如果把大量的数据以及金融理论用来训练AI,那么面对瞬息万变的市场,大模型的决策有多少的准确度?用户敢不敢用?
之前马斯克曾表示,FSD V12几乎完全是神经网络,构筑了一套端到端自动驾驶技术。也就是说,端到端的信息输入输出过程是一个“黑箱&Rdquo;。
你不知道AI是怎么具体做决策的,但是你最终会得到一个可用的结果。
大多数时候,这样的应用是没有问题的,比如出行领域,人们需要的是安全到达目的地,即便是决策黑箱的问题存在,但并不影响实际应用。
决策黑箱最大的问题是决策信任的问题,云到端的大模型也有类似的问题。
比如,你问大模型一个问题,AI问题给出的答案够不够真实可信?这个问题还需要花大力气解决。简单点说,要去教大模型什么样的结果是正确的,是易用的,这就需要不断把模型的输出结果跟现实去“对齐&Rdquo;。
这也是大模型落地C端的一个重要挑战。
输出结果的真实性,有效性能不能得到最基本的保证?这是大模型应用能否真正迎来大爆发需要解决的前置问题。
过去ChatGPT花了大量的成本去做这个件事,文心一言,星火大模以及商汤的日日新大模型显然也需要经历这个过程。
目前阶段,通用大模型的应用热更像是人们的一场自嗨,公司发布大模型往往会伴随着一系列的公关活动,但除此之外,能给B端公司带来怎样的效益增量,仍然没有一个较为清晰的方案,只是空有一句“AI智能化大模型降本提效&Rdquo;的公关话术。
这种品宣做“巨人&Rdquo;业务上做“矮子&Rdquo;的现状,无非是想打上大模型的标签,好让二级市场高看自己一眼。不过,市场已经在用脚投票,最终还是会看实际的商业化表现。
互联网江湖认为,如果说过去大模型的价值,在于对科技企业的“标签化&Rdquo;想要在二级市场谋个好价格,那么接下来能不能活下去,就在于能否完成“产品化&Rdquo;,真正靠应用能力“打天下&Rdquo;。
硅谷教父彼得&Middot;蒂尔