人工智能 · 2024年2月6日 0

AWS张侠:TensorFlow在AWS平台上承载全球85%负载,开发成本可降低54%

随着5月12日AWS宣布Amazon SageMake 在宁夏区和北京区正式上线,中国机器学习产业链迎来重要一极。

其重要程度如果要用数据来衡量,AWS首席云计算企业战略顾问张侠博士披露的一个数据足以让同行不可小觑。张侠博士表示,全球使用最主流TensorFlow框架做机器学习,大概85%的负载都在AWS平台上。

AWS张侠:TensorFlow在AWS平台上承载全球85%负载,开发成本可降低54%

作为全球机器学习最主流框架,TensorFlow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护,自2015年11月9日起,TensorFlow依据阿帕奇授权协议(Apache 2.0 open source license)开放源代码。据2019年9月TensorFlow 产品总监Kemal El Moujahid 披露的数据,TensorFlow在全球的下载量已经超过了 4000 万次。

同样让人惊艳的数据是,在AWS平台上有一个使用SageMaker+TensorFlow的具体案例,可以把效率从65%提高到90%,训练时间从30分钟缩短到14分钟。另一个角度,从全球目前看到的统计数字,整套Amazon SageMaker把总体拥有成本降低54%,开发效率提升10倍。而在中国AWS也在评估一些类似的数据。

为什么选择AWS的机器学习呢?张侠博士认为,AWS提供了非常广泛、深入的机器学习服务,其中它的一个重要产品就是Amazon SageMaker。它使得企业能够加速对机器学习的整个学习、建模、发展、实验的整个过程。AWS云平台其他所有的手段,包括数据存储、数据仓库,物联网和机器学习一起形成所谓的AIoT,智能的物联网。再包括使用一些容器的方法,快速的来部署,把机器学习的应用做成一个容器化的服务,在容器里可以快速部署。所以云计算和机器学习在一体化之后,AWS可以提供最广泛、最深入的解决方案。

而大宇无限机器学习技术总监苏映滨则认为性能、成本、算法、丰富度、便捷性都是企业决定使用Amazon SageMaker的考量范围,除此之外,还有一个重点是服务能力,或者说用户体验,就是可用率以及能够提供支持包括额外提供一些AI的支持。

从2019年12月re:Invent上发布的Amazon SageMaker Studio等六大主要的功能开始,不到5个月时间,AWS在中国发布Amazon SageMake,包括SageMakerStudio等最新的功能。北京区、宁夏区作为AWS全球24个大区的第五个区和第六个区对产品的上线,表明了AWS对中国市场的重视程度。张侠博士表示,“我们非常清醒地意识到随着中国的经济发展,这个市场无疑是经济发展的最重要的市场之一,也是我们最重要的市场之一。”

而对于Amazon SageMaker的落地场景,张侠博士认为,中国是一个接受创新非常快的地方,如使用的人脸识别、使用汽车的牌照识别进入停车场等等类似的大量场景,不光开始的快,并把它落实变成一个真正的应用,在全球范围内很多还是处在非常领先的地位的。因为中国的文化现在是非常开放,也非常愿意去接受这些创新的东西的阶段。

“场景其实也是非常多方面的。比如说客户服务,这是一个比较独特的场景,这个场景里面现在很多进展,包括Amazon Connect的Contact Lens,在客服里面通过机器学习的方法、语义的理解,去强化这方面的内容。在金融里面,比如说交易里面越来越自动化,包括最近一些新的客户投资的产品,智能投顾,一直是比较热门的话题,很多券商、投资公司都在这方面去做一些事情。这个方面如果要建一些模型,然后再推荐一些股票、基金什么的,可能可以摆脱一些人为的因素,相对有一些比较独立的效果。从教育、健康、卫生等场景非常多。几乎想象力就是边界,我们在很多地方随着时间都能够往前推进。”

AWS机器学习方案包括SageMaker在内的三层服务堆栈

实际上,Amazon SageMaker只是AWS机器学习解决方案的一个层面。AWS提供的机器学习解决方案是一个包括三层的服务堆栈。如下图所示,Amazon SageMaker是其中间层。在这一层,主要通过Amazon SageMaker这一完全托管的服务,完全消除了机器学习过程中的繁重工作,让开发高质量模型变得更加轻松。

AWS张侠:TensorFlow在AWS平台上承载全球85%负载,开发成本可降低54%

AWS也根据不同类型客户的需求,提供了全面的机器学习解决方案。三层服务堆栈的底层,为想要自己构建算法或开发新框架的客户提供灵活选择,客户可以选择使用TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras等机器学习框架和基础架构。在这一层,AWS 专注于性能、灵活性,降低成本,以便任何用户都可以使用最新的基础设施,对多种框架进行试验。借助AWS,客户可以访问针对机器学习的、最强大的 GPU 实例,应对最苛刻的应用场景。

在三层服务堆栈的顶层,AWS提供了训练好的人工智能服务,这些服务主要解决与人类认知相关的典型问题。例如,计算机视觉方面的服务,可以识别图像或视频中的对象、人员、文本、场景、活动和不安全或不适宜的内容。个性化推荐服务可以从库存中向消费者推荐多种产品和服务。客户可以直接在其应用中调用AWS提供的这些人工智能服务,而无需关注服务背后的机器学习模型。

AWS对开源比较重视,早在2019年1月25日,亚马逊AWS发布开源服务Amazon SageMaker Neo,它可以帮助使用者在多个操作环境中运行机器学习训练模型。

Amazon SageMaker Neo 让客户只需训练一次模型,即可以高达 2 倍的性能在任意场景运行。在连接的端点设备上运行的应用程序对于机器学习模型的性能尤其敏感。它们需要低延迟决策,通常部署在多种不同的硬件平台上。Amazon SageMaker Neo 针对特定硬件平台编译模型,自动优化模型性能,使它们能够以高达两倍的性能运行,而又确保精确性丝毫不打折扣。因此,开发者不再需要花费时间,根据每一个硬件平台手动调整他们已经训练过的模型(节约时间和成本)。SageMaker Neo 支持英伟达、英特尔、Xilinx、Cadence 和 Arm 硬件平台以及一些主流框架,如 Tensorflow、Apache MXNet 和 PyTorch。

对于未来AWS在开源方面的考量,张侠博士回答199IT提问时表示“实际上我们在整个Amazon SageMaker人工智能平台里面,多个方位、多个角度,从框架到算法,都经常会融进一些开源的内容。两周之前,在PyTorch方面,我们刚宣布了一个Torch Serve的开源模型,是PyTorch框架下的,所以开源产品是随时都会推出的。”

据张侠博士了解,中国有各种各样的企业都有在使用Amazon SageMaker,一些大的传统企业,比如做家用电器的企业,智能冰箱是可以用语音对话的。

创新类的,比如在线教育、做自动驾驶的公司,还有一些新创的公司,集中在一些新的领域,像叽里呱啦、流利说,还有其他很多的教育相关的应用,比如判卷子、判分等等,所以在线教育有很多案例。

在医疗卫生行业,从基因到一些智能的新的应用技术,比如说用机器学习的方法来读一些脑部供血的状况、癌症发展的状况,有很多公司在做类似的内容,也是一个比较典型的应用场景。

张侠博士强调,“企业可以说从大到小,几乎各种各样行业都会有一些突破。他们真正的共同点是这些企业都处在一个创新的很好的状态,是一个在走上坡、积极努力进取状态,去找一些新的市场、新的服务和突破点,更好的提供更新的价值,我觉得这是他们真正的共同点。”

Amazon SageMaker对未来数据分析行业有何影响,张侠博士认为,SageMaker对数据分析行业影响较大,云时代更多的海量的实时的数据,需要的不是像以前传统批量的分析,而更多是前瞻性的、预测性的、实时的分析。使用人工智能机器学习的这些方法做数据分析,无疑是一个大数据发展的非常重要的趋势。在这里如果能够使用SageMaker来加速数据分析模型、建模的过程,是能够很有效的推进这个工作的。“在实际工作中,我们也看到确实是这么个情况,比如今天我在准备一些材料,跟我们客户要分享,这个材料里面其中就有关于零售类客户的一些数据分析,数据怎么样通过SageMaker做一些机器学习类的分析,能更好的进行预测的内容。所以这个事情是真实发生的。”