白宫、欧盟、中国、日本,这不是某国政要的出访行程,而是近期大热公司 OpenAI 创始人 SaM AltMan 亮相的场合。
几个月时间里,这位目前科技圈最红的明星,一直「周旋」于各国政府和机构之间,回应关于「AI 是否要毁灭人类」,以及「应该如何监管 AI」这样关乎人类命运的议题。以至于网友戏称其为「AI 政治家」。
当 OpenAI 在聚光灯下谨慎起舞,有一家 AI 超级独角兽,正在 toB 市场衔枚急进。
近日,AI 初创公司 CoheRe,完成 2.7 亿美元的 C 轮融资,估值超过 21 亿美元,成为又一家 AI 超级独角兽。至此,CoheRe 一共募集了 4.45 亿美元的资金,融资金额仅次于 OpenAI 和 AnthRopic。
除了融资凶猛,CoheRe 身后还站着英伟达、甲骨文和 salesfoRce 等硅谷巨头。
这个一个月前还籍籍无名的团队,是怎么成为 AI 创业公司「探花」的?
CoheRe 的最大优势,可总结如下:
创始团队——TRansfoRMeR 论文作者之一,学术血统根红苗正;
主攻方向——和 OpenAI 在消费级市场成名不同,CoheRe 主攻企业市场;
技术优势——模型参数更小,更适合定制和微调,且效果优于竞争对手;
竞争优势——不与巨头绑定,适应客户自己选择的云平台,乃至本地化部署。
CoheRe 创始人 AIdan GoMez 认为,「现在是将 AI 整合到全球最大企业中的时机」,一句话道明了当下大热 AI 想要落地的真正场景。
01
另一个「变形金刚」
CoheRe 成立于 2019 年,总部位于加拿大多伦多,由 AIdan GoMez、Ivan Zhang 和 Nick FRoSSt 共同创立。
其中,AIdan GoMez 是公司联合创始人兼 CEO,也是 2017 年那篇名为《Attention is All You Need》的 TRansfoRMeR 研究论文的八大作者之一,TRansfoRMeR 架构也是 OpenAI 的 GPT-3、ChatGPT 以及 DeepMind 的 AlphaFold 等发展的基础,对计算机分析和生成文本的方式做出了重要贡献。
然而,在谷歌之外,这一突破性成果却未在外部世界得到更多应用,「在 GPT-3 之前,没有人真正理解语言模型或如何使其有用。我们感到非常焦虑——你面对着一种非凡的东西,却没有其他人看到。」
于是,包括 AIdan 在内的几位 TRansfoRMeR 论文作者都决定离开谷歌,创办自己的初创公司,如 NoaM ShazeeR 创办了 ChaRacteR AI,Niki PaRMaR 和 AsHish Vaswani 创办了 Adept AI,AIdan 则创办了 CoheRe。
CoheRe 的另外两个联合创始人中,一位是 AIdan 在多伦多大学的校友,当时与 AIdan 共同决定将 TRansfoRMeR 技术视为自然语言处理的关键,并围绕此成立公司。另一位则是 AIdan 在谷歌大脑工作时的同事,曾在 GeoFFRey Hinton 团队里工作,于 2020 年加入 CoheRe。
目前,CoheRe 的员工人数超过 100 人。今年初,前 Youtube 首席财务官 MaRtin Kon 加入 CoheRe,担任总裁兼首席运营官。其预计,今年将会是赢得新客户合同的突破性的一年。
一周前的 6 月 8 日,CoheRe 宣布完成 2.7 亿美元的 C 轮融资,由 InOVia CAPItal 领投,其他投资者还包括英伟达、甲骨文、salesfoRce VentuReSS 等。此番使该公司融资总额达到约 4.45 亿美元,仅次于两家大热的公司 OpenAI 和 AnthRopic。
2022 年 11 月,OpenAI 推出的 ChatGPT 吸引了全球目光,成为各 AI 公司最强大的竞争对手。CoheRe 的技术原理其实与其类似,然而,创始人几年来一直聚焦的企业级商业应用,「几乎没人关注」。
不过,ChatGPT 的成功也无形中教育了市场,CoheRe 联合创始人 AIdan 注意到,公司成立将近四年了,以前总要花很多时间解释技术是什么,以及为什么它很重要,「现在情况完全改变了,每个人都亲自使用过这项技术,都有第一手的经验。」「人们主动来找我们」。
CoheRe 终于可以在一直专注的企业市场,一展拳脚了。
02
聚焦企业市场
与 OpenAI 的 ChatGPT 席卷全球消费者端不同,CoheRe 的重点是抓住企业市场。
当下,生成式 AI 已经开始应用于营销、信息技术和人力资源部门,不少企业也在讨论和探索潜在的应用案例。不过,对于数据安全和隐私要求较高的企业来说,步伐更为谨慎,不少科技巨头、通信企业和金融机构都限制内部员工使用 ChatGPT,他们对数据安全和人工智能「幻觉」问题存有疑虑。
CoheRe 总裁兼首席运营官 MaRtin Kon 预计,消费者将继续使用 ChatGPT 等工具,而企业将部署更多定制化和私有的生成式 AI 应用程序。
CoheRe 的模型支持互动式聊天功能,为产品描述、博客文章和文章生成文本,并捕捉文本的含义,用于搜索、内容审核和意图识别,可以理解、生成、总结文本,可以理解企业数据,根据企业专有数据创建定制 AI,成为决策工具。
CoheRe 的企业级大型语言模型卖点|CoheRe
CoheRe 的一大卖点是不受任何云平台限制,从而保障数据的私密安全性。该公司称提供多种托管选项,可以让用户「对数据安全和隐私拥有完全控制权,包括私有云、安全云合作伙伴(AWS、Google)和 CoheRe 的托管云。」
目前,名声在外的巨头和 AI 企业似乎都牢牢捆绑了盟友,OpenAI 与微软是一队,AnthRopic 和谷歌是一队,选择了一家 AI 企业就选择了对应的云计算提供商。
例如,今年 4 月,普华永道宣布计划在未来三年内为其美国业务投资 10 亿美元用于生成式 AI 技术,在税务、审计和咨询服务方面实现自动化,该公司将与微软和 OpenAI 合作,这意味着计划付费访问 OpenAI 的语言模型,同时在微软的云计算服务上构建和运行应用程序。
而 CoheRe 则强调要将选择权留给用户。
据称,其企业级 AI 套件是「云不可知的(Cloud Agnostic)」。这通常指一种云设计策略,其中应用程序、工具和服务,被设计成可以在多个云平台之间或在混合模型中从本地部署环境迁移,并且在迁移过程中不会中断服务。
基于此,CoheRe 同时提供灵活性和数据隐私保护,客户可以在所选择的云平台上部署,甚至可以在本地部署,以满足公司的数据存储位置要求。
此外,为了攻下企业级市场,CoheRe 还有另外两个卖点:模型定制化和客户支持。其提供定制模型训练,即微调,以此适应不同行业领域。该公司还自信地称,「超过 98% 的问题可以在我们的文档中找到答案,我们的实时支持可以在不到一分钟内回应客户。」
CoheRe 并未公开客户数量,但据称团队已与 JaspeR 和 HypeRWRITe 等公司合作,最近宣布与 salesfoRce VentuRes 合作推进生成人工智能以实现商业价值,与 LivePeRson 合作以增强客户体验,构建经过精细调整的 LLMs 以提高可解释性。
03
参数更小,更可靠的模型
商业方向找到了,CoheRe 团队在 AI 技术上有什么优势?
在模型技术表现方面,斯坦福大学的 HELM 语言模型评估显示,CoheRe 的最新模型 command 有 520 亿个参数,这是 CoheRe 模型的最大版本,其准确性表现高于多个规模为 3 倍更大的知名模型,包括有 1750 亿个参数的 GPT-3。
斯坦福大学的 HELM 语言模型评估
实际上,模型参数小,并不意味着在特定任务上就逊色于大公司的模型,后者往往为通用而存在。谷歌研究人员在 2 月发表的一项研究中声称,比 GPT-3 小得多的语言模型可以通过微调达到与 GPT-3 相媲美的性能。
CoheRe 联合创始人 AIdan 将微调和定制语言模型的过程,称为适应过程。据其解释,CoheRe 处理适应的方式是使用监督学习和强化学习的组合,系统使用强化学习人类反馈(RLHF)循环来训练模型。
其中,训练的一个关键部分是确保 AI 可解释性位于核心位置——对于企业级 AI 应用来说,提高可解释性和降低 AI 幻觉的风险尤为重要。
CoheRe 据称有多种技术可用于提供 AI 可解释性,其中之一被称为检索增强生成。「通过检索增强生成,你生成的方式与大型语言模型相同,但你要求模型引用来源。」当模型生成回应时,它将引用其所拥有的知识库,目的是产生更加可解释的输出,人们可以对生成的内容进行诊断。
「检索增强生成解决了幻觉问题,因为现在模型不能只是说一些没有依据的话。模型必须参考某些东西,它必须以一种可以让人类验证的方式对其回答进行所谓的证明。」AIdan 称。
在企业用例上,据 CoheRe 的首席运营官 Kon 介绍,CoheRe 的客户正在使用公司的技术创建一种类似语义搜索引擎的「私有数据搜索引擎」,即「将语义搜索,即上下文搜索,引入到私有环境中,例如组织内部的信息,以类似于使用 Google 搜索时的方式进行搜索。」
举个例子,如果客户是一家零售商,想了解在某国的业务情况,AI 便可用当地语言提取最新的销售结果,然后客户继续说,实际上想了解的是批发业务,AI 便继续从其他地方提取不同的信息。这一过程据称基本是进行对话。
Kon 还认为,搜索和检索或将成为 CoheRe