人工智能 · 2024年1月8日 0

互联网巨头为何纷纷深入研究人工智能?

 一、人工智能悄然兴起

“人工智能”涵盖了很多前沿技术和分支,却很难用一句话来定义,因为它一直处在发展当中。比如,一些在过去看来很“人工智能”的事情,现在却变成了简单的“机械重复”,像是数字的高速计算、图像的处理等。但总体上来看,“人工智能”的本质和目的一直没有发生太多变化,那就是“完成人类的部分脑力工作”。

互联网巨头为何纷纷深入研究人工智能?
  20世纪60年代开始,就有许多科幻电影和科幻小说描述着人类对“人工智能”的憧憬和恐惧,比如斯皮尔伯格的知名影片《人工智能》。不过在现实中,长久以来,受到技术、科技发展和应用层面的限制,人工智能只是一件人人都在说,都以为别人在做,但事实上却没多少人知道该怎么做的事——无论在学术研究层面还是在应用层面都是如此。

人工智能曾经在20世纪90年代互联网泡沫破裂前风靡一时,到了21世纪伊始却变成了一个禁忌,大家开始怀疑它是否存在。而到了2011年,美国资本市场再度为人工智能而疯狂。风险投资机构和顶级科技公司们开始频繁投资这个领域的创业公司,投资范围从应用层面的机器人、增强现实,到底层技术层面的深度学习算法、神经网络芯片等,人工智能项目也遍地开花。比如,Google接连投资了虚拟现实创业公司Magic Leap,收购了人工智能公司DeepMind;Facebook收购语音识别公司Wit.ai,等等。

除了投资外部团队之外,像IBM、Google、Facebook和百度等国内外科技巨头们也纷纷加强自己的人工智能方面的专业团队,招募了一批人工智能尤其是深度学习相关领域的科学家,如深度学习鼻祖之一Geoffrey Hinton加入了Google,Yann LeCun加入了Facebook担任人工智能实验室负责人,Andrew Ng(吴恩达)加入百度负责深度学习研究院等。

  二、驱动人工智能发展的内外动因

“人工智能”的再度兴起并非偶然,外部环境和人工智能自身都在发生演化。我们认为,驱动人工智能领域发展到现在程度的外部动因有:

1.传感器能力和数量的大幅提升:LIGA等微电子技术的日趋成熟,推动着传感器的能力有了质的飞跃,而大量智能设备的出现则进一步加速了传感器领域的繁荣。这些延伸向真实世界各个领域的触角是机器感知世界的基础,而感知则是智能实现的前提之一。

互联网巨头为何纷纷深入研究人工智能?
  2.计算成本的大幅下降:摩尔定律使得计算成本在迅速下降,同时云计算的出现、GPU的大规模应用使得集中化的数据计算能力变得前所未有得强大。大规模的的集中式计算使得人工智能的发展速度指数级加快。过去仅训练深度神经网络模型对某一物体的认知就要花费近一年时间,而现在这个时间被缩短到几天内。

互联网巨头为何纷纷深入研究人工智能?
  3.海量数据的出现:根据预计,2015年全球产生的数据总量将达到十年前的20多倍。如此海量的数据给机器学习的提供了足够多的素材(但是需要注意的是,在其中真正有标注的数据不超过总量的10%)。

互联网巨头为何纷纷深入研究人工智能?
  当然,更重要的驱动因素是内因——算法的进步。当下人工智能领域最先进、应用最广泛的核心技术是深度神经网络(深度学习)。而且,直到2006年,深度神经网络才得到快速发展,逐渐成为人工智能领域的主流研究方向。

21世纪人工智能的里程碑事件之一是,2006年Geoffrey Hinton发表的论文《A fast learning algorithm for deep belief nets》。他在此文中提出的深层神经网络逐层训练的高效算法,让当时计算条件下的神经网络模型训练成为了可能,同时通过深度神经网络模型得到的优异的实验结果让人们开始重新关注人工智能。之后,深度神经网络模型成为了人工智能领域的重要前沿阵地,深度学习算法模型也经历了一个快速迭代的周期,Deep Belief Network、Sparse Coding、Recursive Neural Network, Convolutional Neural Network等各种新的算法模型被不断提出,而其中卷积神经网络(Convolutional Neural Network,CNN)更是成为图像识别最炙手可热的算法模型。

目前,随着GPU和CPU集群的出现,云端的计算资源已经慢慢不再是人工智能的发展瓶颈。而人工智能算法模型的进一步丰富和改进以及本地化人工智能的实现成为了人工智能新的主要发展方向。

 三、人工智能的三步走

从人工智能的整个发展历程来看,按照应用场景和人工智能资源的集中度,可以大致分成三个阶段。

第一阶段:实验室研究阶段,这一阶段的人工智能资源高度集中。人工智能在2011年前的发展大致还处于实证研究阶段,资源高度集中在国家或大学资助的研究机构中,用于算法模型的训练和研究,人工智能还只能为极少数人接触到。这一阶段大量的工作除了在算法模型本身的研究外,还包括建立计算能力本身。

第二阶段:企业应用阶段,这一阶段的人工智能资源被少部分科技巨头掌握。在人工智能表现出一定的实际应用价值后,科技巨头们一拥而上,纷纷希望在这个领域取得突破。在少部分核心企业掌握了大规模的人工智能资源以后,其它小规模的企业一般会利用这些核心企业提供的人工智能资源接口和其支持的人工智能应用为自身的发展提供服务。由于掌握大规模的计算资源是这一模式的前提,因此这一阶段人工智能资源的集中度仍然非常高,而这将是人工智能在企业场景下的主要应用形式,即集中计算,分布使用。

第三步:个人应用阶段,这一阶段的人工智能资源被分散到个人手中。显然,依赖于云端大规模计算资源的人工智能算法限制着人工智能在消费者场景的应用,因为集中式计算意味着巨量的网络资源消耗,并且因为网络问题,难以在消费者应用场景中有稳定的表现。因此,人工智能的本地化,也就是从集中走向分布(细化到智能手机、可穿戴设备等)实现将是人工智能在消费者场景中得到普及的关键一步。伴随着人工智能的本地化实现,将使得人工智能真正延展到手持设备、家用电器、汽车等消费级应用。

互联网巨头为何纷纷深入研究人工智能?
  人工智能本地化实现的难点在于本地的计算能力在如今动辄几个G的算法模型面前杯水车薪、无能为力。一部iPhone 6手机采用一般的CNN算法去处理一张200*200像素图像的ImageNet千分类问题需要的时间是300毫秒,但这样的处理速度对于用户体验来说是灾难性的。要提高本地的图像识别处理速度,目前能够想到的途径有三条:一是精简算法模型,根据实际的场景适配需要的精度,让模型尽可能简化,二是提升CPU的计算能力。目前的智能手机CPU已经在20nm制程以下,按照传统路线,CPU提升的极限可能在7-10nm,这其实非常有限。而且,大功耗也是一般移动设备难以承受的,因此只有为人工智能算法模型重新开发专门的芯片才有可能满足本地的计算要求。

从这个角度来看,人工智能在消费者场景实现的关键是对算法模型优化和用户场景的综合理解,以及底层硬件的设计制造。而人工智能的企业应用则会是巨头们的游戏。

  四、人工智能的产业生态

人工智能产业主要由底层可应用技术(图像识别、语音识别、自然语言处理、硬件技术等)、计算资源(大规模GPU集群)、基础数据服务,以及企业/政府/消费者应用组成。遵循产业的一般发展规律,人工智能的发展路径仍然是从底层可应用