互联网资讯 / 人工智能 · 2026年5月5日 0

Amazon S3的发展历程与未来展望——访谈技术副总裁Mai-Lan Tomsen Bukovec

2006年3月14日,Amazon S3(Amazon Simple Storage Service)首次推出,标志着“弹性存储”概念的诞生。这个看似简单的服务,允许开发者以极低的成本存储无限量的数据。至今,Amazon S3已经承载了超过500万亿个对象,并在人工智能飞速发展的新时代中,逐渐蜕变为一个从“被动数据湖”向“主动智能基础设施”的转变。

在Amazon S3推出20周年之际,我们有幸与亚马逊云科技的技术副总裁Mai-Lan Tomsen Bukovec进行了一场深入对话。她在访谈开始时兴奋地分享了一个喜讯:Amazon S3 Vectors在2026年NAB Show上获得了“年度最佳产品奖”。

Amazon S3的发展历程与未来展望——访谈技术副总裁Mai-Lan Tomsen Bukovec

亚马逊云科技技术副总裁Mai-Lan Tomsen Bukovec

在谈及Amazon S3的创新发展时,Mai-Lan总结道:“我们对每一个字节的承诺,从未改变。”无论是非结构化数据、文件,还是向量数据,这一原则始终如一,并将在未来继续坚持。

S3 Tables打破“只读”界限:Iceberg与数据表的编辑革命

回顾Amazon S3的发展历程,Mai-Lan认为其产品的核心定义是“弹性”。这种弹性不仅体现在存储容量上,还体现在产品形态的多样性上。S3最初是一个巨大的非结构化数据仓库,用户若想修改其中某个文件,必须替换整个对象。而S3 Tables的推出彻底打破了这一局限,通过原生支持Apache Iceberg格式,Amazon S3中的数据首次变得“可编辑”。

她表示:“这是一个巨大的飞跃,意味着用户可以利用S3的价格优势,直接操作数据表。更令人兴奋的是,这一变化催生了新的生态学反应。”

在S3 Vectors和S3 Files的组合中,Mai-Lan指出,S3 Files在物理存储上是对象,但在逻辑接口上则符合POSIX标准的文件系统,这使得开发者可以通过文件目录与数据交互,无需重构代码。

延迟与成本的经济权衡

尽管AI追求极致低延迟,Mai-Lan坦言,S3的架构延迟确实高于数据库。然而,她认为这并非缺陷,而是一种设计上的权衡。很多科研分析和大范围的产品相似度搜索,完全可以在100毫秒的延迟下顺利运行。

随着进入Agent时代,成本的考量变得更加重要。Mai-Lan指出,AI Agent往往会发起数十甚至数百个并行查询,这种情况下,底层存储和分析服务的成本效率直接决定了一个Agent的盈利能力。

跨越2020年的工程承诺:数年的严谨

在长达20年的服务中,Mai-Lan感慨,最令人印象深刻的并非某个新功能,而是一项对底层的重构,即引入“强一致性”。她回忆说:“在发布强一致性之前,我们绝对无法通过写测试用例覆盖所有场景,因为S3太庞大。”

这种“对每一个字节负责”的执着体现在S3底层的微服务中,它们每天都在默默执行完整性校验,确保数据的可靠性。

访谈的最后,Mai-Lan提到了亚马逊的领导力准则——“Are Right, A Lot”。她强调,关键在于领导者要不断证伪自己的信念,寻找改进现有系统或构建新能力的机会,这种执着可能正是亚马逊在AI时代成为数据韧性与技术创新标杆的底层逻辑。