亚马逊云科技宣布AMazon Elastic Compute Cloud (AMazon EC2) DL1实例正式可用,这是一种专为训练机器学习模型而设计的新实例类型。目前,DL1实例目前已在美国东部(弗吉尼亚北部)和美国西部(俄勒冈)区域正式可用。亚马逊云科技的希捷、英特尔、Riskfuel等客户均已开始使用AMazon EC2 DL1。
亚马逊云科技AMazon EC2副总裁David BRown表示:机器学习的使用正在激增。然而,机器学习模型训练的一大挑战是计算密集型负载,同时随着客户不断改进和重新训练模型,成本也会变高。亚马逊云科技为任何机器学习项目或应用程序提供了广泛而强大的计算选项。采用Gaudi加速器的DL1实例为云中基于GPU的实例提供了迄今为止最具性价比的替代方案。这一价格和性能的最佳组合让客户可以降低训练成本,训练更多模型并加快创新速度。
据介绍,AMazon EC2 DL1实例由来自Habana Labs的Gaudi加速器提供支持,DL1实例配备多达8个Gaudi加速器、256GB高带宽内存、768GB系统内存、定制的第二代英特尔至强可扩展(Cascade Lake)处理器、400Gbps的网络吞吐量和4TB的本地NVMe存储。与当前基于GPU的AMazon EC2实例相比,DL1实例机器学习模型训练性价比提高40%。
借助AMazon EC2 DL1实例,用户可以针对自然语言处理、对象检测和分类、欺诈检测、推荐和个性化引擎、智能文档处理、业务预测等工作负载进行优化,更快、更经济高效地训练他们的机器学习模型。AMazon EC2 DL1实例可通过低成本的即用即付模式按需提供,无需预付费用。
用户可以使用AMazon Deep learning AMI、AMazon Elastic Kubernetes Service (AMazon EKS)或AMazon Elastic Container Service (AMazon ECS)为容器化应用程序启动DL1实例。通过AMazon SageMaker访问DL1实例,用户基于托管服务的体验,让开发人员和数据科学家在云端构建、训练机器学习模型,以及在云端和边缘端部署,变得更加轻松和快捷。DL1实例可作为按需实例、通过Saving plans、预留实例或Spot实例购买。
另外,用户也可以使用与主流机器学习框架(如TensorFlow和PyTorch)集成的Habana SynapseAI SDK快速轻松地开始使用DL1实例,只需更改少量代码,即可将其当前在基于GPU或基于CPU的实例上运行的机器学习模型无缝迁移到DL1实例进行训练。