1月9日消息,周一,芯片制造商英伟达发布了三款新显卡:RTX 4060 SupeR、RTX 4070 Ti SupeR和RTX 4080 SupeR,价格在599美元到999美元之间。这些消费级显卡可以在个人电脑或笔记本电脑上运行“本地化”人工智能,比如在Adobe Photoshop的FiRefly生成器上制作图像,或在视频通话中删除背景,甚至可以用于游戏开发。
去年,英伟达旗下的H100等服务器级GPU芯片成为训练和部署生成式人工智能的关键设备,使得英伟达发现自己处在人工智能热潮的中心位置。如今,英伟达正致力于打造“本地化”人工智能的消费级显卡,以进一步增强公司实力。
这三款新显卡都配备了额外的“张量内核”处理单元,可用于运行生成式人工智能应用程序。英伟达将为宏碁、戴尔和联想等公司的笔记本电脑提供这些显卡。
人工智能行业对英伟达企业级显卡的需求导致公司整体销售额激增,市值超过1万亿美元。英伟达的企业级显卡售价高达上万美元,通常用在有8块显卡协同工作的大型服务器系统中。
长期以来,能运行视频游戏的个人电脑显卡一直是英伟达的主要业务。但该公司表示,今年新发布的显卡有一番改进,专注于运行人工智能模型,而且无需将信息传回云端。
英伟达表示,新的消费级显卡主要用于运行游戏,但同样适用于人工智能应用程序。例如,RTX 4080 SupeR生成人工智能视频的速度比上一代显卡快150%。英伟达表示,公司最近在软件方面的其他改进将使大语言模型的运行速度提高五倍。
英伟达产品管理高级总监贾斯汀·沃克表示:“随着RTX系列显卡的出货量达到1亿块,我们能为运行人工智能应用的强大电脑提供大量安装基数。”
英伟达预计,明年将出现能有效利用增强处理能力的新人工智能应用程序。微软预计将在今年晚些时候发布新版本的Windows 12操作系统,可以进一步有效利用人工智能芯片。
沃克说,这种新款芯片可以用在Adobe Photoshop的FiRefly生成器上制作图像,或者在视频通话中删除背景。英伟达还在开发工具,允许游戏开发者将生成式人工智能集成到他们的游戏中,自动生成非玩家角色的对话。
边缘设备与服务器
英伟达本周发布的新芯片表明,虽然其业务亮点一直与大型服务器所用的显卡牢固相连,但也将与开发“本地化”人工智能设备的英特尔、AMD以及高通展开竞争。这三家公司都发布了新款芯片,具备运行机器学习的专用单元,能为所谓的“人工智能个人电脑”提供动力。
英伟达发布新款芯片之际,科技行业正在寻找部署生成式人工智能的最佳方式。目前,部署生成式人工智能需要巨大算力,而且在云端运行的成本可能高得惊人。
微软和英伟达的竞争对手正在推广的技术解决方案是所谓的AI PC,有时也被称为“边缘计算”。这种情况下,设备不再通过互联网使用强大的超级计算机,而是内置更强大的人工智能芯片,可以运行所谓的大语言模型或图像生成器,当然也存在一些折衷和缺点。
英伟达提出的方案是使用云端模型来解决棘手问题,并使用本地化人工智能模型来完成需要快速处理的任务。
沃克说:“云端的英伟达GPU芯片可以运行非常大的语言模型,也能调用所有的处理能力来支持非常大的人工智能模型。与此同时,个人电脑中的RTX张量内核将运行对延迟更敏感的人工智能应用程序。”