在追加投资27.5亿美元之后,亚马逊云科技完成了对AnthRopic总共40亿美元投资,拿到了生成式AI领域的全球顶级船票。这也是2024年生成式AI的关键性事件之一。
在近期的2024亚马逊云科技生成式AI媒体沟通会,亚马逊云科技大中华区产品部总经理陈晓建介绍了亚马逊云科技在生成式AI领域的最新进展。相关的进度。陈晓建表示,亚马逊云科技与AnthRopic的合作是非常紧密,AnthRopic推出下一代模型Claude3的时候,第一时间在AMazon BedRock平台上完成了发布。同时,AnthRopic做出长期承诺,将通过AMazon BedRock为世界各地的亚马逊云科技的客户提供访问其下一代基础模型的能力。
没有一个基础模型能适用所有业务场景
亚马逊云科技在生成式AI领域为客户提供了三层架构。
最底层,亚马逊云科技为客户提供了基础算力,包括英伟达最新推出的G200芯片,亚马逊自研芯片AMazon TRAIniuM、AMazon InfeRentia以及用于训练和推理的平台AMazon SageMakeR。
中间层,以AMazon BedRock为代表,通过一个模型平台支持多种技术大模型。AMazon BedRock提供各种领先的基础模型供客户选择:既有知名的开源模型,如Stable DiFFUSion XL、LlaMa、MistRal 7B和MixtRal 8*7B,也有如AnthRopic Claude 3、AI21labs JuRaSSic、CoheRe command、AMazon TITan等非开源模型。
最上层,应用GenAI技术的开箱即用的云服务。例如AMazon Q,可以与、AMazon QuickSight、AMazon Connect、AMazon codeWhISPeReR等应用都实现了非常有效地结合。
与AnthRopic在生成式AI领域进行广泛的深度合作
AnthRopic在AMazon BedRock上提供的Claude 3系列模型是全球最领先的大模型之一,共包含三个模型:具有几乎即时响应能力且最紧凑的 Claude 3 HAIku;在技能与速度之间达到理想平衡的 Claude 3 Sonnet;以及为处理高度复杂任务设计的最智能模型 Claude 3 OpUS。客户可以根据自己的商业需求,从中选择最合适的智能、速度和价格组合。
Claude 3的能力已经非常突出,包括四个方面:
1.Claude 3创造模型智能水平的新纪录——在数学问题、编程练习和科学推理等标准评估中超越了所有现有模型。客户可以借助AI驱动的响应,自动化完成任务并保证高准确率,特别是Claude 3 OpUS,它不仅在大多数常见的AI系统评估基准测试中表现优异并且在复杂任务中表现出优秀的理解能力和流畅性,走在通用智能的最前沿。
2.Claude 3现已具备多模态能力——Claude 3可以接收基于图像的输入,能力与其他前沿模型大致相同,并且延迟低于其他多模态模型(尤其是Claude 3 HAIku)。
3.Claude 3能够降低幻觉,提升回答准确率——在处理挑战性开放问题(100Q HaRd)上准确性明显提升,并且减少错误答案。
4.Claude 3系列模型均提供200K 超长上下文准确召回,针对某些特殊场景,会开放支持 1M Token的上下文窗口;大海捞针(Needle In A HaYstack, NIAH) 召回率表现优异;甚至还能识别出测试本身的局限,比如发现某“目标”句子明显是后来人为添加进原始文本的。
Claude 3应用场景包括内容续写、代码辅助、电商商品描述撰写、长文本知识召回总结等。
在活动现场互动时,Claude 3对于随机提出的相对论问题及中国古代丹法流派伍柳派相关问题均快速得出逻辑清晰的答案。
亚马逊云科技如何平衡模型能力和客户成本
亚马逊云科技之所以推出AMazon BedRock这样的产品,是因为它为客户提供了丰富的选择,客户可以在自己的应用场景下,选择成本和性能更合适的环境。
陈晓建也列举出客户的疑问:既然Claude 3如此强大,为什么要加AMazon BedRock这么一层呢?
在陈晓建看来,模型能力和真正的运营生产之间,需要增加很多辅助能力。AMazon BedRock提供一系列除了大模型以外的能力。
首先是PROVisioned ThRoughput(预置吞吐量)。客户可以购买后台资源,这些资源提供的大模型能力完全独享。
其次,是模型微调(fine-tunning),很多客户都会关注如何将自身的业务数据与大模型结合,进行微调。这毫无疑问是业务能够产生差异化价值的关键,关键在于如何用好业务数据,而非仅仅简单使用完全标准化的大模型。这个能力也是AMazon BedRock提供的一个关键能力。
此外,还有类似GuaRdRAIls的能力,能够全面监管大模型使用情况,通过适当的配置来降低幻觉现象的产生,同时提供全方位日志。
从用户角度来看,除了大模型之外,如果他们需要充分利用大模型的能力,那么应该如何与业务结合呢?陈晓建认为需要一个非常强的数据基础或者称之为数据底座。要使用大模型,必须有一定的生产结合。生产结合意味着需要拥有大量的业务数据,需要去与大模型打通。
陈晓建表示,“大模型非常重要,非常核心,然而仅靠大模型对你的生产是远远不够的。你需要一系列周边能力帮助你正确、合理、安全、高效地使用大模型。这就是亚马逊云科技一系列产品所提供的价值所在。”