互联网资讯 · 2024年1月11日 0

大模型的关键:模型、行业理解和场景应用

当前,中国国产大模型进入高速发展期,千行百业加速拥抱大模型。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,涌现出一批具有行业影响力的预训练大模型。

对大模型有良好的预期,吸引了全世界多个科技巨头做战略级投入,但大模型也面临着成长的烦恼。从技术上和产业应用两个层面来说,大模型的应用难点有很多。

作为人工智能领域的代表企业,百融云创认为,在技术方面,比较典型的一个问题是,在实际的应用中,大模型会常常发生一些事实性错误。这是因为对于大模型的训练数据中未曾覆盖到的信息,大模型会按照上下文的概率进行事实编造,从而导致大模型产生“幻觉”。

让大模型变得更可靠,生成式AI和决策式AI的有机融合发展或许将是一个有效路径。比如针对生成式AI在权衡一些对冲性的信息时,不能做出正确取舍的弊端,可以在模型建设中加入决策式AI的决策树等算法,通过引入显性的逻辑规则来判断相互矛盾的信息,进而给出最优解。

在产业应用方面,很多产业机构还是将大模型当作“玩具”,还不足以作为“工具”使用。要真正实现大模型的落地,产业机构需要的不仅是大模型本身,还需要充分的行业Know-how、行业知识库,以及对于落地场景的深入挖掘。在实际的交互中决定需要哪些功能,以及可能以何种方式与这些功能产生链接,强化大模型的“工具”能力。

简而言之,大模型在产业领域的应用绝不是单纯的技术问题,能否打造“模型-行业理解-场景应用”的完整体系才是决定成败的关键。

随着技术的演进发展,行业也将发展出几大不同的路径,即以科技巨头为主的底层大模型、新兴创业公司主导的各类“小模型”,以及像百融云创这样的AI科技公司研发的行业大模型。后续,外界对于大模型的关注将转向其在垂直领域的落地,行业大模型势必将迸发出更多势能,垂类应用和模型能力的结合也会更为紧密。