3月18日消息,在澜舟科技大模型技术和产品发布会上,澜舟科技创始人CEO周明博士发表了《大模型技术和应用双轮驱动加速创新》主题演讲。他回顾了澜舟科技的发展历程,总结出大模型创业在企业级客户中落地的九字诀,并展望了澜舟科技未来的发展方向。
澜舟科技于2021年6月正式成立, 致力于自主研发大模型技术和行业应用,在去年3月发布了孟子GPT V1(MChat)大模型,今年1月孟子大模型GPT V2对公众开放。
公开资料显示,澜舟科技创始人CEO周明是世界顶级的AI科学家,自然语言处理领域的代表性人物。曾任微软亚洲研究院副院长、国际计算语言学协会主席。现任中国计算机学会副理事长、中国中文信息学会常务理事。
2024年是大模型落地元年
周明回顾了过去一年来大模型在六个领域的迅速发展:
• 大模型的能力得到快速提升:在更长的上下文处理能力、数学能力和推理能力、安全对齐等方面得到大幅度增强。
• RAG:通过结合搜索相关数据库的结果与用户指令进行生成,可有效改善模型幻象、实时性、数据安全等问题。
• GPTs:用户基于大模型的超强能力方便地搭建自定义的GPT。
• 多模态大模型:Sora突破了4秒钟限制,可以生成60秒的视频,而且生成的视频质量大幅度提升。
• 大模型原生应用方面略现端倪:譬如,利用大模型构建AI搜索、角色扮演聊天、数字人等。
• 大模型开源:LLaMA等开源模型有力地推动大模型的普及和发展,也显著地改变了大模型的竞争格局。
周明强调2024年将是大模型落地元年,如何利用大模型技术助力企业成长已成为业界关注的焦点。政府工作报告新鲜出炉,特别强调以人工智能+,驱动各行各业的转型升级。周明认为要把握好这个历史契机,通过落地,创造价值,拉动创新。
周明强调,澜舟科技注重“技术创新和落地应用”双轮驱动。在积极研究和掌握前沿技术的同时,公司也致力于确保这些技术的有效应用。
大模型落地九字法则
而谈及如何做好大模型落地应用,周明表示,雷军所说的互联网的七字法则“专注、极致、口碑和快”仍然适用,还要再加上“成本”,大模型创业不能不在意成本,一定要有造血的能力,形成大模型落地九字法则:“专注、极致、口碑、快、成本”。
周明称,这“九字诀”融会贯通在澜舟的一切行动之中:
首先,澜舟科技定位非常清楚,就是做大模型技术+企业场景应用的一个综合公司。
企业定位做2B、做技术和服务,需要明白克服什么挑战,不能盲目地天天练大模型,发布了、开源了就可以了,不是这样的。
通过过去两年多的积攒调研客户,澜舟科技发现了四大问题,如果解决不好,大模型基本上就是泡影。
这四大问题:一是训练和部署的成本问题。动辄上千万的模型销售,用户是不能接受的;二是行业的适配,很多人说大模型做出来之后千行百业随便用,肯定好使,没有这种好事;三是幻象问题,很多大模型生成的解决内行人看起来像外行,外行的人看起来像内行,这样似是而非的东西企业不敢用;四是数据安全的问题,企业的数据不愿意拿出来,怎么样解决企业的担心。
针对大模型训练和部署的成本高的问题,澜舟科技专注把ToB场景使用最多的LLM模型做到最佳并大幅度提升大模型的推理效率。
针对大模型的行业落地适配问题,澜舟科技提出了L1-L2-L3-L4的层次化分级服务体系, 基于L1-通用大模型,在此基础上加入行业数据训练出L2-行业/垂直大模型,如金融、编程大模型。
针对大模型的幻象问题和用户数据安全问题,孟子大模型提出了改进的RAG能力。通过孟子大模型理解用户意图,可分别经过大模型自身,或者通过RAG查找用户知识库,甚至通过Web搜索,最后多路召回搜索结果,经过排序输出最可信结果。
目前,澜舟科技已经形成了从预训练,到SFT,到强化学习,安全,降低幻觉的完备的孟子大模型训练体系,并提出了“一横N纵”的发展体系。
其中“一横”即为孟子大模型技术,而“N纵”是基于孟子大模型的面向ToB应用最重要的技术和产品。“N纵”的应用能力型产品,包括AI文档理解、文档问答、文档辅助写作、机器翻译、澜舟智会、AI搜索等。
希望通过“一横N纵”,彻底贯彻大模型落地九字法则:专注、极致、口碑、快、成本。
周明强调,澜舟一方面聚焦自己擅长的能力和场景,另外一方面会注重与开源社区、与客户和合作伙伴携手共进,共同拓展更广阔的市场空间,实现互惠共赢的局面。
据悉,澜舟科技已经携手客户及合作伙伴,如传神、数说故事、华为云、华夏基金、同花顺、中金公司等,共同开展深入合作。