互联网技术 / 互联网资讯 · 2023年11月15日 0

深度学习框架的发展史:TF和PyTorch主导,未来十年迎来黄金时期

过去十年,机器学习领域涌现了大量算法和应用。在这些深度学习算法和应用涌现的背后,是各种深度学习工具和框架。它们是机器学习革命的脚手架:TensoRFlow 和 PyTorch 等深度学习框架的广泛使用,使得许多从业者能够更容易地组装模型。

回顾深度学习框架的演变,我们可以清楚地看到深度学习框架和深度学习算法之间的紧密耦合关系。这种相互依赖的良性循环推动了深度学习框架和工具的快速发展。

神经网络的概念已经出现一段时间了。在 21 世纪初之前,有一些工具可以用来描述和开发神经网络。这些工具包括 MATLAB、OpenNN、Torch 等,它们要么不是专门为神经网络模型开发定制的,要么拥有复杂的用户 API,缺乏 GPU 支持。在此期间,实践者在使用这些原始的深度学习框架时不得不做很多繁重的工作。

青铜时代(~2012 年)

2012 年,多伦多大学的 Alex KRizhevsky 等人提出了一种深度神经网络架构,后来被称为 AlexNet,该架构在 imageNet 数据集上达到了 SOTA 精度,并大大超过了第二名的选手。这一出色的结果引发了深度神经网络的热潮,此后各种深度神经网络模型在 imageNet 数据集的准确性上不断创下新高。大约在这个时候,一些早期的深度学习框架,如 CaFFe、ChAIneR 和Theano 应运而生。

铁器时代(2015 ~ 2016)

AlexNet 的成功引起了计算机视觉领域的高度关注,并重新点燃了神经网络的希望,大型科技公司加入了开发深度学习框架的行列。其中,谷歌开源了著名的 TensoRFlow 框架,它至今仍是 ML 领域最流行的深度学习框架。CaFFe 的发明者加入了 FACEbook 并发布了 CaFFe2;与此同时,FACEbook AI 研究(FAIR)团队也发布了另一个流行的框架 PyTorch,微软研究院开发了 CNTK 框架。亚马逊采用了 MXNet,这是华盛顿大学、CMU 和其他机构的联合学术项目。

罗马时代(2019 ~ 2020)

深度学习框架经过一轮激烈的竞争,最终形成了两大「帝国」:TensoRFlow 和 PyTorch 的双头垄断,这两大「帝国」代表了深度学习框架研发和生产中 95% 以上的用例。2019 年,ChAIneR 团队_将他们的开发工作转移到 PyTorch;微软_停止了 CNTK 框架的积极开发,部分团队成员转而支持 Windows 和 ONNX 运行时上的 PyTorch。KeRas 被 TensoRFlow 收编,并在 TensoRFlow 2.0 版本中成为其高级 API 之一。在深度学习框架领域,MXNet 仍然位居第三。

工业时代(2021+)

深度学习在自动驾驶、个性化推荐、自然语言理解到医疗保健等广泛领域取得了巨大成功,带来了前所未有的用户、开发者和投资者浪潮。这也是未来十年开发深度学习工具和框架的黄金时期。

展望未来,有几个技术趋势有望成为下一代深度学习框架的主流:

基于编译器的算子优化。如今,许多操作符内核都是通过手动或第三方库实现的,这些库针对特定的硬件平台。深度学习编译器已经提出了在任何硬件后端上有效优化和运行计算的建议。

统一的 API 标准。许多深度学习框架共享类似但略有不同的用户 API。JAX 受到了用户的热烈欢迎,它的 API 完全与 NuMPy 兼容。

数据搬运作为一等公民。最近开发的深度学习框架,如 OneFlow,将数据通信视为模型训练的整体计算图的一部分。

总结

我们正处于一场人工智能革命的黎明。人工智能领域的新研究和新应用正在以前所未有的速度涌现。另一方面,人类的大脑包含大约 100 万亿个参数(即突触)。未来的深度学习框架很可能是算法、高性能计算、硬件加速器和分布式系统的跨学科成果。