落地为王阶段,在算力、平台、模型、应用、生态等方面,都有持续深入的企业,对产业来说有更强的吸引力。 作者|刘珊珊 编辑|杨 铭 轰轰烈烈大模型,走到市场化大规模落地前夜。 8月15日,《生成式人工智能服务管理暂行办法》施行。这是我国第一部AIGC管理办法,明确行业健康、安全、规范同时,进一步促进生成式人工智能应用的加速落地。 这被解读为,在国内已经打响半年,热度空前的”千模大战”迎来关键战场节点,正式进入应用PK、”落地为王”阶段。 硝烟背后,业界与大众普遍关心话题是:当大模型逐渐变成一种基础能力,如何进行技术上的迭代升级?又如何与更多行业结合,提速规模化、商业化进程,在竞赛长跑中占据领先地位? 这考验着入局者的智慧,亦决定入局者未来命运走势。 “通用人工智能绝不仅仅是单个企业、单个科研院所的使命,而是整个社会的机会,大模型赋能个体和行业的大未来正在到来。”8月15日,长达140多分钟的讯飞星火认知大模型V2.0升级发布会上,身着传统黑西裤、白衬衫的科大讯飞董事长刘庆峰说。 这是科大讯飞大模型又一次重要亮相–自5月6日对外正式展示至今,讯飞星火认知大模型刚好100天,期间经历了V1.5的迭代。 当前V2.0 升级,是在提升通用能力基础上,重点突破代码能力和多模态能力。根据刘庆峰的说法,代码能力是支撑认知大模型智慧的关键维度,多模态能力则是实现通用人工智能的必经之路。 这些能力,已同步在iFlyCode1.0(编程助手)、讯飞智作2.0(视频创作平台)、星火语伴2.0(练习口语)等应用和产品上,成为科大讯飞大模型落地应用和商业化上的重要一步。 从技术能力来看,讯飞星火V1.5Python语言效果只有41分,V2.0已有61分,接近ChatGPT。根据计划,到今年10月24日,讯飞星火各个代码纬度能力将比ChatGPT,实现中文超越、英文相当的水平,到明年上半年对标GPT-4。 这意味着,伴随大模型进入”落地为王”的中场战事阶段,中国大模型也将迎来自己的领先时刻。 01大模型落地,从产业开始 命运齿轮,转动于5月6日。彼时科大讯飞躬身入局,发布星火认知大模型1.0版本。 短短几个月,大模型已在国内掀起一场场”肉搏战”。通用、行业、垂直、开源和闭源等不同类型大模型,基于GPT,就像树干上的枝丫一样,疯狂开枝散叶。互联网、人工智能巨头、创业公司、各类型中小企业、研究机构入局者数不胜数,几乎每天都有不同类型大模型推出。 比如,10亿级参数规模大模型–参数量被默认为通用大模型、垂直和行业模型区别重要因素。规模参数越高,对算力、数据、资源、技术要求就更高,但在国内,10亿级参数以上多模态大模型却超80个。 这并不意味着赛道的真正崛起。在国内,投资者逐渐趋冷,部分入局者黯然离场;在国外,ChatGPT诞生9个月花费近2亿美元,高昂成本让OpenAI有”破产风险”。 盲目烧钱不可持续,大模型成本、商业化落地两大难题,让大众开始重新审视,大模型的经济和社会价值。 各界”到底需要什么大模型”探讨中,深耕行业,与生态结合,让大模型在不同行业、不同类型企业发挥生产力作用,成为解决大模型难题,真正产生价值行业共识。 “谁能在具备社会刚需的应用场景落地,谁就能最先形成自我造血的良性循环。”刘庆峰明确断言。在他看来,对科大讯飞这样体量的公司,不做通用大模型就不可能在国际舞台上未来争得一席之地,连上桌机会都没有。 通用还是垂直选择题上,每家企业都有自己理由和抉择。多模态通用大模型,被业界视为”综合大学学生”,可能在某些垂类领域沉淀数据有所不足,却是各个行业通向智能化、通用化必由之路,也是业界公认事实。 事实上,应用落地才是衡量一切大模型价值最高标准。最大难题是,如何搞懂行业、每个客户需求,以及应用安全、易用,具备产业价值。 行业场景分为政府及大型企业(ToB、ToG)、个人(ToC)、中小企业(ToSME)等不同类型。不同行业与大模型结合本质逻辑不同,如ToB、ToG,往往要求逻辑复杂定制化场景中,必须做到可控、可追溯、可修正。ToSME同样有定制化需求,但降本增效,给企业带来增长价值,却是衡量关键。 多位观察人士认为,深入行业Know-how基础上,和大模型能力融合,是大模型产业化最有效路径。 刘庆峰认为,其前提是,要在国产算力安全和数据安全下,回归场景驱动。”场景给客户带来的价值是什么,新增效益,还是节约成本、提高质量,同时能够让用户快速地、低技术门槛训练,才能够使它赋能千行百业。” 这是科大讯飞在8月15日推出星火一体机重要原因–其与华为昇腾AI联合研发,意在为每一家企业提供专属的大模型,适合有数据安全需求的大型客户。 “开箱即使用,提供从底层算力、AI 框架、训练算法、推理能力、应用成效等全栈 AI 能力。”刘庆峰称。 对科大讯飞来说,TOB端探索出的大模型赋能路径是,在研、产、供、销、服、管等各维度赋能。例如,大模型掌握行业基本能力、通用知识后,结合企业专属知识库,让新员工也能迅速掌握经验和知识,大幅提升工作效率。 不止科大讯飞,百度、腾讯、阿里、360都试图通过为企业提供专属大模型,加快产业融合、落地速度。”落地为王阶段后,淘汰赛就会一触即发。”多位观察人士判断。 必须意识到,受制于数据、算力、场景等限制,真正能跑通大模型商业化的入局者,数量将不会太多。其一,大模型仍会像互联网、人工智能、云计算一样,以互联网、科技大厂为主导;其二,大厂不会局限于泛通用行业,而是”大模型+业务”深入垂类,走通用+垂类”并行”路径。 比如科大讯飞,星火是多模态通用大模型,却早已开枝散叶,应用在教育、医疗、办公、数字员工、汽车、金融、工业等多垂类场景。 02千模大战,讯飞星火凭啥第一? 当前,赛道各纷纷结合自身已有业务场景,试图在大模型释放更大价值前,抢占战场制高点。 但客观来看,科大讯飞目前是脱颖而出,走得最快的那个。 这从科大讯飞最新财报,大模型加持后的商业化增长,得到印证。今年上半年,教育、开放平台及消费者、智慧汽车、智慧医疗、智慧金融等业务收入分别为22.9亿元、24.2亿元、2.1亿元、1.9亿元、0.9亿元,分别同比增长3.63%、21.6%、26.14%、37.13%和22.19%。 “可以看到,大模型正实实在在推动产业前进。” 刘庆峰称。 这也让外界颇为疑惑:ChatGPT都遭遇变现难题时,科大讯飞为何领先业界,先一步尝到大模型的商业化甜头? 有人工智能从业人士对“极点商业”称,大模型应用落地,其实是一条技术—产品—场景—规模化的演变路径。“就像一个木桶,不能存在短板,才有成功接受市场考验可能。” 大模型并非短期内一蹴而就,而是长期技术沉淀下所推动。1999年成立的科大讯飞,24年来在刘庆峰博士带领下,一直是人工智能领头羊形象存在,在深度学习算法、行业大数据、知识图谱、多模态感知、系统工程等技术方面有着深厚积累。 外界未曾关注到的是,其在认知大模型上也有近十年沉淀。2014年,科大讯飞启动“讯飞超脑”计划,实现机器从“能听会说到能理解会思考”。到2022年,累计摘取16项国际人工智能大赛的冠军,其中认知智能领域有13项冠军。 这离不开研发的持续投入。2022年,科大讯飞总研发投入33.6亿元,研发人员数量占公司总人数的比例为约60%。而根据最新财报,科大讯飞上半年研发支出16.6亿元,同比去年同期16亿元增加大约3.8%。这是星火认知大模型短时间内多次重要升级关键。 研发投入、技术领先带来的,是在G/B/C端应用场景不断拓展,占据更多用户心智。根据IDC《中国人工智能软件2022年市场份额》,在语音语义AI市场,科大讯飞位于榜首,持续领先百度智能云、阿里云。 长达20年多年的技术沉淀,让科大讯飞在大模型的打造上,有了“所有技术平台完全自主研发,每一阶段技术都可控”的底气。 比如,在大模型多个关键技术,多家权威评测就将讯飞火星排在了第一位。 根据新华社研究院中国企业发展研究中心发布《人工智能大模型体验报告2.0》(以下简称《报告》),讯飞星火以总分1013分位列本次国产主流大模型测评榜首位,超过商汤商量、通义千问等大模型,在四大评测维度中的智商指数、工具提效指数两个维度获得第一。 IT之家评测中,在完善度、功能性、易用性等维度,讯飞星火同样超过文心一言、通义千问、360智脑,排在第一。 《麻省理工科技评论》则将讯飞星火称为“最聪明”的大模型。在8个一级大类的600道题目的测试和盲评中,讯飞星火认知大模型V2.0在编程能力、理科综合、逻辑思维、数学专项、语言专项和综合知识6个大类中得分率排名第一,超过文心一言、商汤商量、通义千问,获得“最聪明”的国产大模型称号。 商业化探索上,有别大多数大模型,科大讯飞采取的是“技术能力+落地应用”并行策略。 一个细节是,科大讯
讯飞星火在大型战场中找到领先时机
OpenMagic API
Need more than content? Move into the product flow.
If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.
