2024 年 7 月 4 日,备受瞩目的世界人工智能大会暨人工智能全球治理高级别会议(WAIC)将于上海开幕。自 2018 年首次举办以来,WAIC 已走过六个年头,如今,WAIC 已经成为全球人工智能领域最具权威和影响力的行业盛会。
在本届 WAIC 即将开幕之际,终端侧 AI 推动者、领导者高通宣布了即将登展 WAIC 的消息,并迅速引发了业界的广泛期待。
据了解,7 月 4 日-6 日期间,高通将带来一系列的主题演讲和直播访谈,将重点分享 AI 技术基础研究、领先产品应用和未来行业赋能愿景上的最新进展。例如,大会当天,高通公司中国区董事长孟樸将出席活动,并发表主题为“推动终端侧 AI 发展让智能计算无处不在”的演讲,同时还有“拥抱 AI 终端创新”等系列直播访谈节目。高通公司中国区研发负责人徐晧也将发表“终端侧 AI 规模化扩展,释放工业化创新活力”的演讲,并通过媒体直播间分享“我们可以用上怎样的 AI 硬件?”。
技术展示环节更是亮点频现,包括首个在 Android 智能手机上运行的大语言和视觉助理大模型(LLaVA)、骁龙 X ElITe 终端上的剪映 AI 视频编辑功能、第三代骁龙 8 赋能 Android 智能手机带来创新终端侧生成式 AI 体验等等。
这一系列技术展示,将是高通公司在推动终端侧 AI 技术边界拓展与行业生态合作方面的集中展现,也是对未来智能科技发展趋势的一次生动预演,相当值得期待了。
当下,生成式 AI 已经成为行业炙手可热的话题,特别是随着生成式 AI 技术在全球数以亿计的终端中的大规模应用,以终端侧为主旋律的生成式 AI 浪潮已然到来,而引领这一变革的核心力量,正是高通。
高通作为 AI 行业变革的赋能者,已经从底层芯片、到软硬件生态建设,以及应用的落地,都做足了准备,赋能引领行业创新。
比如在标准制定上,去年,高通发布了《混合 AI 是 AI 的未来》白皮书,明确指出云端与智能手机、汽车、个人电脑及物联网终端的协同工作,将促进更强大、更高效且高度优化的 AI 发展,这是实现 AI 普惠的必由之路。今年,高通又推出了《通过 NPU 和异构计算开启终端侧生成式 AI》白皮书,深入解析了 Hexagon NPU 为核心的异构计算技术,并探讨了如何利用这些技术,在生成式 AI 需求激增的背景下,为终端侧带来丰富多样的生成式 AI 应用场景。
再比如在底层芯片方面,早在 2015 年,高通就在骁龙 820 平台上集成了首个 AI 引擎;在今天的第三代骁龙 8 上,高通将高性能 AI 注入整个平台系统,采用面向生成式 AI 应用重新设计的 Hexagon NPU,够在终端侧运行高达 100 亿参数的模型,无论是首个 Token 的生成速度还是每秒生成 Token 的速率,都处在业界领先水平。例如在生成式 AI 语言理解模型 MoBIleBERT 上,第三代骁龙 8 的表现比竞品 A 高 17%,在鲁大师 AIMaRk V4.3、安兔兔这些 AI 基准测试的总分方面,第三代骁龙 8 也是远超竞品。
更重要的是,高通还将大语言模型完整的搬到了端侧运行,赋能众多的 AI 手机。比如包括三星、小米、荣耀、OPPO 、vivo 等在内的手机厂商,其发布的骁龙 8 Gen3 手机,均已具备了在端侧运行生成式 AI 的能力。
借助第三代骁龙 8 的 AI 能力,此次展会,高通也将展示首个在 AndRoid 智能手机上运行的大语言和视觉助理大模型(LLaVA)。
除了移动端,在 AI PC 领域,高通还带来了骁龙 X ElITe 和骁龙 X Plus PC 平台,凝聚了高通在通用处理和 AI 异构计算多年积累的技术成果,其集成的 NPU 更是具有 45TOPS 的恐怖算力,这是 PC 平台中最强大的 NPU。
当下,微软 SuRfACE 系列新品,以及联想、戴尔、惠普、宏碁、华硕等品牌,也都已经或即将发布搭载骁龙 X 系列平台的 Windows 11 AI PC 新品。在这次展会上,高通就将展示骁龙 X ElITe 终端上的剪映 AI 视频编辑功能,可以期待,无论是消费者还是企业用户,借助骁龙 X ElITe 终端,都能够全天候利用 AI 增强的终端侧工具来提升生产力、创造力和协作能力。
不仅如此,高通还积极投身 AI PC 生态的建设,让开发者能够获取基于异构计算的 AI 加速,高通打造了 AI 软件栈(QualcoMM AI Stack)。它能够支持目前所有的主流 AI 框架,包括 TensoRFlow、PyTorch、ONNX、KeRas;它还支持所有主流的 AI RuntiMe,包括 DiRectML、TFLITe、ONNX RuntiMe、ExecuToRch,以及支持不同的编译器、数学库等 AI 工具。
就在 6 月份,高通还针对其 45 TOPS 的 Hexagon NPU 开发、优化并验证了 AI 模型。注册开发者可以前往高通的 AI Hub 获取这些预训练模型,快速构建人工智能应用。据介绍,高通 AI Hub 提供了各种针对骁龙 X 系列处理器的边缘设备优化的 AI 模型,涵盖图像分类、对象检测、语义分割和生成式 AI 等领域。此外,AI Hub 还提供了便捷的工具和文档,帮助开发者轻松地在视觉、音频和语音等应用中部署 AI 模型。
其所做的这一切,正如高通公司 AI 产品技术中国区负责人万卫星所言:
高通具备顶尖的异构计算能力,使 AI 能力能够贯穿整个 SoC,将 CPU、GPU、NPU 和高通传感器中枢的能力都充分释放给应用开发者。
可以说,骁龙 X ElITe / X PlUS PC 平台的推出,如同为 AI PC 的变革性体验打下了扎实的地基,而借助骁龙 X ElITe 平台强大 AI 能力和高通在生态建设上的开放策略,接下来会有更多 AI 生成式应用的涌现。
写在最后
在刚刚结束的 MWC 上海展会上,高通 AI 产品技术中国区负责人万卫星发表了“终端侧生成式 AI 的未来”的主题演讲,他提到,凭借面向生成式 AI 全新设计的 NPU 和异构计算系统,高通正为终端侧 AI 规模化扩展提供了有力支持。此外,高通还致力于构建完善的 AI 生态系统,不断推动 AI 技术的创新与发展。
利用领先的边缘 AI、高性能低功耗计算和无与伦比的连接,高通正不断推动终端侧 AI 的规模化扩展,让智能计算无处不在。随着 WAIC(世界人工智能大会)的到来,可以期待,终端侧 AI 领导者的高通还将带来更多新的惊喜。
7 月 4 日-6 日,WAIC,我们现场见!