互联网资讯 · 2024年2月14日

IDC发布《2022中国大模型发展白皮书》,揭示中国版ChatGPT的甄别方法?

文|智能相对论

作者|叶远风

谁在跟风,谁又有真本事能做出中国版的对标产品来?

这恐怕是ChatGPT这股热潮以来,关心中国AI发展的业界人士最想问的问题。

或者说,在中国人工智能不落后于全世界的当下,业界也在普遍渴望一个真正有实力的ChatGPT类产品出现。

但是,在一个人人都有那么点AI底子、能说出一些AI技术成果的今天,如果没有专业的、系统的判断标准,这个问题可能很难有答案——风潮下人人都像是跟风的,也都像是有能力的。

不过,IDC刚刚发布的一个关于大模型的报告,却某种程度上“附带”解决了这个问题。

IDC《2022中国大模型发展白皮书》,道出中国版ChatGPT甄别方式? -

当大模型能力的判断有了较为权威的行业标准后,谁能做出真正的ChatGPT类产品,其实已经有了答案。

ChatGPT是AI的一大步, 但只是大模型的一小步

在问能不能之前,先要问是什么。

虽然ChatGPT的问世已经有数个月的时间,但对多数人尤其是行业外的“吃瓜群众”而言,除了知道这是AI领域的一大突破外,对它究竟是什么并没有深入地了解。

实际上,ChatGPT就是一种大规模语言模型(LLM Large Language Model),是大模型在NLP领域不断发展的一种结果。

从技术角度看,目前大模型已经深入各个AI领域,如NLP、CV、科学计算等,但它最早发端于NLP,以谷歌的BERT、OpenAI的GPT和百度文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升。

随着“大本营”NLP领域大模型的不断进化,最终OpenAI的GPT率先开出了ChatGPT这朵花。

所谓GPT,即Generative Pre-Trained Transformer,就是通过Transformer为基础模型,使用预训练技术得到通用的文本模型。

GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,ChatGPT本质就是GPT-3.5,只不过因为强大的对话能力突然爆火起来。不同的是,ChatGPT采用了新的指示学习(Instruction Learning)和人工反馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)来指导模型的训练,前者带来了理解能力,后者增强了模型效果。

无论如何,大模型良好的通用性、泛化性,以及显著降低人工智能应用门槛的优势,在ChatGPT上得到了淋漓尽致的展示。

从这个意义上看,任何NLP领域的大模型,在良好的发展之后,都会、都可以生长出自己的ChatGPT,或者,更专业的概念称为ChatBot类产品。

“智能相对论”总结目前市面上领先的NLP大模型以及ChatBot产品如下:

IDC《2022中国大模型发展白皮书》,道出中国版ChatGPT甄别方式? -

从这个列表可以看出两件事:

1、所有成型的ChatBot都只能是大模型发展的一种产品化结果,国外Google的Bard、国内百度的文心一言(ERNIE Bot)都是如此,其本质都是前期大模型家族的最新产品。

2、不管哪个ChatBot,能做得怎么样,几乎都取决于前期大模型家族的发展情况。

对大多数缺乏优秀大模型基础的厂商而言,要么必须花长周期重走一遍类似从“文心”到“文心一言”的路径,要么就绕过大模型直接做ChatBot——其质量可想而知。

而判断大模型家族的基础究竟如何,IDC的报告刚好就起到了作用。

此次IDC为了充分评估大模型技术能力、功能丰富度与底层深度学习平台开发能力,以及对各行业赋能的实际效果,并考虑到大模型的未来商业化前景,搭建起了大模型评估框架V1.0:

IDC《2022中国大模型发展白皮书》,道出中国版ChatGPT甄别方式? -

最终,IDC中国将大模型市场服务划分成了L1-L5五个层级(层级越高,厂商在大模型市场梯队越靠前),最终评价结果是当前大部分厂商能力处于L2-L3层级。其中,最为凸显的是唯一处在第一梯队的百度文心大模型,产品能力、生态能力达到L4水平,应用能力达到L3水平:

IDC《2022中国大模型发展白皮书》,道出中国版ChatGPT甄别方式? -

目前,被IDC高度评价的文心大模型已经建设了包括基础大模型(NLP、CV、跨模态)、任务大模型、行业大模型三大类在内的36个大模型。IDC认为,百度文心大模型在产品能力上呈现出较强技术实力和平台积累,“文心大模型+深度学习平台”创新了人工智能研发应用范式,满足市场大规模落地需求,达到行业前端水平。

IDC中国副总裁兼首席分析师武连峰表示,“大模型的背后蕴藏着一场人工智能落地模式的变革。如今火爆全球的ChatGPT背后的技术支撑正是大模型。没有对大模型的长期投入,就不会诞生ChatGPT这样的应用。在IDC提出的大模型评估框架下,百度文心大模型在本次评估中表现非常突出,是其打造文心一言的坚实基础。”

因此,国内已经宣布要做ChatGPT类产品的科技大厂中,能够最终做出类ChatGPT产品的,可能还是只有拥有中国科技企业最成熟的大模型开发工具和产品体系的百度。

当然,这个结果并不意外,国内长期坚持在大模型领域投入的,百度就是其中一。

大模型评估框架下, ChatBot两种发展路径显现

既然IDC以权威、系统的方式证明了国内(主要是百度文心、文心一言)有充分的推出ChatBot的大模型基础能力,那么为什么最先走出来被广泛关注到的还是ChatGPT?

如果从文心的发展与GPT的发展对比来看,大模型时代,ChatBot的两种发展路径的不同已经显现出来。

早在2019年3月,百度就做出了文心 ERNIE 1.0,这一技术创新与“同类”GPT-1、BERT的差距都只有几个月,且百度积累的大规模知识和海量多元数据,让文心得以快速发展。

到了2021年,ERNIE 3.0大模型即拥有千亿参数,后来ERNIE 3.0 Titan更是达到了2600亿。

这个发展过程,百度也逐渐构建起一套包括文心大模型层、工具平台层、产品与社区的三层体系,这就是IDC在报告中强调的,“模型+工具平台+生态”三级协同加速产业智能化。

IDC《2022中国大模型发展白皮书》,道出中国版ChatGPT甄别方式? -

说白了,百度从一开始就在想着怎么让文心大模型进产业、怎么落地获得商业价值,也是按照这个“总纲”在走、在设计其整个体系。

最典型如,文心已累计发布11个行业大模型,在金融、能源、制造、城市、传媒、互联网等行业拥有实际落地的标杆案例,盯住的是解决客户的实际痛点,把大模型能力应用到客户业务流程关键环节中,求技术效果突破、求产品创新、求生产流程变革、求降本增效,等等。

在这些行业大模型往下,还有任务大模型、基础大模型的全力支撑;再往上,又有工具、产品的落地转化。

这种体系化面向产业的做法,一方面源于中国独特的产业智能化需求的大背景,另一方面与百度将AI的发展更多地转向现实产业价值有关。

如果说这种做法有什么后果,那就是集中B端落地、晦涩的技术和产品带来的技术认知不足。

现在,大洋彼岸的ChatGPT突然搞出了“大新闻”,举起了旗帜,文心基于此前的能力积累也能做出类ChatGPT的面向C端大众的ChatBot产品文心一言,于是,这就成了百度彰显自身技术能力的一个契机。

反过来看,ChatGPT则先面向C端做出了老少咸宜的大众化可触达产品,相似的技术底子下,声量自然就更高。

毫无意外的是,在OpenAI的布局中,ChatGPT接下来也会尝试走入更多垂直产业中发挥价值。

最终,两种路径都将殊途同归,实现B、C的全覆盖,只是所处阶段不同而已。

技术层不可跟风也跟不了风, 但ChatBot产业应用却值得广泛尝试

做ChatBot,在技术层面不应该跟风上马,它只能是LLM的一种自然的结果。

用更直接的话说,如果认为ChatBot真的有用,想要造福自身业务或者惠及伙伴、客户,更多缺乏基础的科技大厂应该沉下心来做这件事,而不是大干快上、急着表态。

跟风哄抬股价、刺激关注并不可取,最终欺骗的是投资者和关心企业的人。

不过,在这股风潮中,于产业方而言,却并不存在什么跟风不跟风。

作为AI领域好不容易等来的确确实可能改变价值认知的产品,ChatBot在任何产业都值得尝试,只要有益于业务都可以探索这股AI的全新力量。

之前,在ChatGPT被归入的AIGC(生成式AI)场景下,百度文心已经有大量的产业实践。

例如,ERNIE 3.0文本理解与创作API,覆盖写作文、摘要、文案、小说、对联等多项生成能力,每天服务上万用户;而基于文心大模型的智能视频合成平台则让用户在一键输入新闻图文内容链接后,就可以自动化完成视频制作,这些都大大提升了内容

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册