落地为王阶段,在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。 作者|刘珊珊 编辑|杨 铭 轰轰烈烈大模型,走到市场化大规模落地前夜。 8月15日,《生成式人工智能服务管理暂行办法》施行。这是我国第一部AIGC管理办法,明确行业健康、安全、规范同时,进一步促进生成式人工智能应用的加速落地。 这被解读为,在国内已经打响半年,热度空前的”千模大战”迎来关键战场节点,正式进入应用PK、”落地为王”阶段。 硝烟背后,业界与大众普遍关心话题是:当大模型逐渐变成一种基础能力,如何进行技术上的迭代升级?又如何与更多行业结合,提速规模化、商业化进程,在竞赛长跑中占据领先地位? 这考验着入局者的智慧,亦决定入局者未来命运走势。 “通用人工智能绝不仅仅是单个企业、单个科研院所的使命,而是整个社会的机会,大模型赋能个体和行业的大未来正在到来。”8月15日,长达140多分钟的讯飞星火认知大模型V2.0升级发布会上,身着传统黑西裤、白衬衫的科大讯飞董事长刘庆峰说。 这是科大讯飞大模型又一次重要亮相–自5月6日对外正式展示至今,讯飞星火认知大模型刚好100天,期间经历了V1.5的迭代。 当前V2.0 升级,是在提升通用能力基础上,重点突破代码能力和多模态能力。根据刘庆峰的说法,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路。 这些能力,已同步在iFlyCode1.0(编程助手)、讯飞智作2.0(视频创作平台)、星火语伴2.0(练习口语)等应用和产品上,成为科大讯飞大模型落地应用和商业化上的重要一步。 从技术能力来看,讯飞星火V1.5Python语言效果只有41分,V2.0已有61分,接近ChatGPT。根据计划,到今年10月24日,讯飞星火各个代码纬度能力将比ChatGPT,实现中文超越、英文相当的水平,到明年上半年对标GPT-4。 这意味着,伴随大模型进入”落地为王”的中场战事阶段,中国大模型也将迎来自己的领先时刻。 01大模型落地,从产业开始 命运齿轮,转动于5月6日。彼时科大讯飞躬身入局,发布星火认知大模型1.0版本。 短短几个月,大模型已在国内掀起一场场”肉搏战”。通用、行业、垂直、开源和闭源等不同类型大模型,基于GPT,就像树干上的枝丫一样,疯狂开枝散叶。互联网、人工智能巨头、创业公司、各类型中小企业、研究机构入局者数不胜数,几乎每天都有不同类型大模型推出。 比如,10亿级参数规模大模型–参数量被默认为通用大模型、垂直和行业模型区别重要因素。规模参数越高,对算力、数据、资源、技术要求就更高,但在国内,10亿级参数以上多模态大模型却超80个。 这并不意味着赛道的真正崛起。在国内,投资者逐渐趋冷,部分入局者黯然离场;在国外,ChatGPT诞生9个月花费近2亿美元,高昂成本让OpenAI有”破产风险”。 盲目烧钱不可持续,大模型成本、商业化落地两大难题,让大众开始重新审视,大模型的经济和社会价值。 各界”到底需要什么大模型”探讨中,深耕行业,与生态结合,让大模型在不同行业、不同类型企业发挥生产力作用,成为解决大模型难题,真正产生价值行业共识。 “谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”刘庆峰明确断言。在他看来,对科大讯飞这样体量的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,连上桌机会都没有。 通用还是垂直选择题上,每家企业都有自己理由和抉择。多模态通用大模型,被业界视为”综合大学学生”,可能在某些垂类领域沉淀数据有所不足,却是各个行业通向智能化、通用化必由之路,也是业界公认事实。 事实上,应用落地才是衡量一切大模型价值最高标准。最大难题是,如何搞懂行业、每个客户需求,以及应用安全、易用,具备产业价值。 行业场景分为政府及大型企业(ToB、ToG)、个人(ToC)、中小企业(ToSME)等不同类型。不同行业与大模型结合本质逻辑不同,如ToB、ToG,往往要求逻辑复杂定制化场景中,必须做到可控、可追溯、可修正。ToSME同样有定制化需求,但降本增效,给企业带来增长价值,却是衡量关键。 多位观察人士认为,深入行业Know-how基础上,和大模型能力融合,是大模型产业化最有效路径。 刘庆峰认为,其前提是,要在国产算力安全和数据安全下,回归场景驱动。”场景给客户带来的价值是什么,新增效益,还是节约成本、提高质量,同时能够让用户快速地、低技术门槛训练,才能够使它赋能千行百业。” 这是科大讯飞在8月15日推出星火一体机重要原因–其与华为昇腾AI联合研发,意在为每一家企业提供专属的大模型,适合有数据安全需求的大型客户。 “开箱即使用,提供从底层算力、AI 框架、训练算法、推理能力、应用成效等全栈 AI 能力。”刘庆峰称。 对科大讯飞来说,TOB端探索出的大模型赋能路径是,在研、产、供、销、服、管等各维度赋能。例如,大模型掌握行业基本能力、通用知识后,结合企业专属知识库,让新员工也能迅速掌握经验和知识,大幅提升工作效率。 不止科大讯飞,百度、腾讯、阿里、360都试图通过为企业提供专属大模型,加快产业融合、落地速度。”落地为王阶段后,淘汰赛就会一触即发。”多位观察人士判断。 必须意识到,受制于数据、算力、场景等限制,真正能跑通大模型商业化的入局者,数量将不会太多。其一,大模型仍会像互联网、人工智能、云计算一样,以互联网、科技大厂为主导;其二,大厂不会局限于泛通用行业,而是”大模型+业务”深入垂类,走通用+垂类”并行”路径。 比如科大讯飞,星火是多模态通用大模型,却早已开枝散叶,应用在教育、医疗、办公、数字员工、汽车、金融、工业等多垂类场景。 02千模大战,讯飞星火凭啥第一? 当前,赛道各纷纷结合自身已有业务场景,试图在大模型释放更大价值前,抢占战场制高点。 但客观来看,科大讯飞目前是脱颖而出,走得最快的那个。 这从科大讯飞最新财报,大模型加持后的商业化增长,得到印证。今年上半年,教育、开放平台及消费者、智慧汽车、智慧医疗、智慧金融等业务收入分别为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元,分别同比增长3.63%、21.6%、26.14%、37.13%和22.19%。 “可以看到,大模型正实实在在推动产业前进。” 刘庆峰称。 这也让外界颇为疑惑:ChatGPT都遭遇变现难题时,科大讯飞为何领先业界,先一步尝到大模型的商业化甜头? 有人工智能从业人士对“极点商业”称,大模型应用落地,其实是一条技术—产品—场景—规模化的演变路径。“就像一个木桶,不能存在短板,才有成功接受市场考验可能。” 大模型并非短期内一蹴而就,而是长期技术沉淀下所推动。1999年成立的科大讯飞,24年来在刘庆峰博士带领下,一直是人工智能领头羊形象存在,在深度学习算法、行业大数据、知识图谱、多模态感知、系统工程等技术方面有着深厚积累。 外界未曾关注到的是,其在认知大模型上也有近十年沉淀。2014年,科大讯飞启动“讯飞超脑”计划,实现机器从“能听会说到能理解会思考”。到2022年,累计摘取16项国际人工智能大赛的冠军,其中认知智能领域有13项冠军。 这离不开研发的持续投入。2022年,科大讯飞总研发投入33.6亿元,研发人员数量占公司总人数的比例为约60%。而根据最新财报,科大讯飞上半年研发支出16.6亿元,同比去年同期16亿元增加大约3.8%。这是星火认知大模型短时间内多次重要升级关键。 研发投入、技术领先带来的,是在G/B/C端应用场景不断拓展,占据更多用户心智。根据IDC《中国人工智能软件2022年市场份额》,在语音语义AI市场,科大讯飞位于榜首,持续领先百度智能云、阿里云。 长达20年多年的技术沉淀,让科大讯飞在大模型的打造上,有了“所有技术平台完全自主研发,每一阶段技术都可控”的底气。 比如,在大模型多个关键技术,多家权威评测就将讯飞火星排在了第一位。 根据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,超过商汤商量、通义千问等大模型,在四大评测维度中的智商指数、工具提效指数两个维度获得第一。 IT之家评测中,在完善度、功能性、易用性等维度,讯飞星火同样超过文心一言、通义千问、360智脑,排在第一。 《麻省理工科技评论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识6个大类中得分率排名第一,超过文心一言、商汤商量、通义千问,获得“最聪明”的国产大模型称号。 商业化探索上,有别大多数大模型,科大讯飞采取的是“技术能力+落地应用”并行策略。 一个细节是,科大讯