人工智能 · 2024年1月11日 0

谷歌人工智能教父探讨人工智能

谷歌人工智能教父探讨人工智能

Geoffrey Hinton. (Michelle Siu)

当谷歌的AlphaGo战胜了人类顶级棋手,人工智能开始更多进入大众视野。无论是其深度应用还是可能存在的隐患,都是大家讨论的话题。

即使是在科技大佬之间,观点也存在截然相反的情况。马斯克就曾表示 “我们会在智力上远远落后于AI,以至于最终成为AI的宠物。”在另外一方面,Alphabet董事长施密特则表示:“如果你担心人工智能在智商上超越人类、然后消灭人类,那你科幻电影一定是看多了。”

在日前,福布斯记者彼得·海伊(Peter High)对人工智能教父杰弗里·辛顿(Geoffrey Hinton)进行了专访,他谈到了很多关于人工智能的看法。在他看来,神经网络正在向大脑靠近,AI的火爆不是因为其技术和原理,所谓的隐患更只是一个科技界的政治问题。他更是透露,AlphaGo拥有了直觉。

辛顿早在1970年代初期就开始从事人工智能科研工作,是名副其实的AI先驱。曾先后供职于萨塞克斯大学、加利福尼亚大学圣地亚哥分校、剑桥大学、卡内基梅隆大学、以及伦敦大学学院,现任多伦多大学荣誉教授。他曾获得过机器学习领域的加拿大国家研究大奖,该奖项为联邦政府给予科学研究的最高荣誉及财务资助。2013年3月,辛顿的公司被谷歌收购,其也随之加入谷歌。

以下为主要内容:

神经网络正向大脑靠拢

  海伊: 多伦多大学的资料上显示,您一直致力于探寻一个高效的深度学习算法,像人类习得知识一样,能够从一个庞大且多维的数据集合中梳理其复杂的结构。我想请您就这方面谈谈您的看法,还有您在多伦多大学和在谷歌的日常工作方面。

辛顿: 我们的大脑,毋庸置疑,非常擅于处理并理解多维的数据,例如从视觉神经传来的信息是百万级权重的并且随着时间极速变化的。我们每看到一个场景,大脑就能帮我们正确的解读。如果我们看到的是一头大象,那么大脑不会把它解读成一条狗。但是在实验室中,我们的神经网络系统偶尔会理解出错。虽然如此,在绝大多数情况下,我们的技术还是能够准确的理解某个多维的输入代表的意思。随着该神经网络进行的学习次数的增加,正确率也会提高,这是传统计算机所不能达到的,我们在向人类的大脑靠拢。这和单纯的对低维度、少量训练数据、参数不多的简单模型从统计学角度进行数据挖掘是有本质上的不同的。

大脑令我着迷的地方在于它所拥有的参数远多于训练数据,所以现阶段的人工智能网络还不能说非常成功。现阶段我们能做到的是,我们的神经网络系统可以很好地处理百万级权重以及百万级训练数据。有的时候,十亿级也可以处理很好。但是我们的参数数量并不能像人类大脑那样,远远超过训练数据数量。对于每一秒的输入,人类大脑大概有一万个参数来处理。对于人脑这样庞大的系统是如何工作的,以及它是怎样分析数据的,我们目前所知还甚少。

海伊: 宏观的看,在人工智能的发展历程中,您觉得我们已经到达了什么阶段?

辛顿: 我觉得我们已经跨过了一个很重要的门槛。就在不久之前,AI领域的大部分从业者还在通过逻辑来处理AI技术。这种人工智能还是基于逻辑推理的层面,对内部含义的表示采用的还是符号结构。现在我们拥有了这个庞大的神经网络,一切都改变了。我们现在的策略是,用巨大的矢量来表示内部含义,而且也不再采用逻辑推理的方法。我们是让这个巨大的神经网络自己学习,不再需要编程的介入。此前,人们觉得这简直是天方夜谭。

举个例子,拿一串英文字符及其对应的法文字符组成一对字符串对,如果有足够的字符串对的话,神经网络系统就能够自动习得这两种语言,如果你给它一个英文句子,它能基本无误的将这句英文转化为法文。现在这项技术还不是很成熟,但是目前神经网络系统已经能够掌握该方法的核心,只是在速度方面还有待改进,我相信很快该技术就能够付诸实际应用了。20、30年以前的人会觉得这个想法太可笑了,要让一个机器学习一门语言,你当然需要将大量的语义学,世界常识等信息进行编程。如果仅凭一些数据,但这些数据并没有包含该语言的实际知识,来让机器完全凭空、傻瓜似的、自动地学习,这在当时听起来有点可笑。现在,模仿神经网络这个概念被引进了,这个想法听起来就没有那么可笑了,因为大脑就是这样工作的。所以我说,我们已经跨过了一个很重要的门槛。现在大部分AI界的人,特别是年轻人,都相信如果你想让一个系统获得以百万比特为计量单位的知识的话,最好的办法就是让它自己学,靠手动输入是完成不了的。

海伊:所以说把逻辑推理的方式淘汰掉是因为你已经从这个疯狂幻想的边缘走到了技术的核心,而且这项技术也在发展且越来越规范。

辛顿:是的,在此之前我们之中的很多人都相信,如果有足够的计算能力以及数据,那么我们的设想就能实现,现在也确实实现了。现在我们的技术越来越成熟,如果能够获得更强的算力、更大的数据集合,那么我们的模型也就能被不断优化。这在一切都需要编程的时代是做不到的,所以神经网络系统比之前所有的AI算法都更高级。

坚信人工智能源于大脑的工作机理

  海伊:我觉得很神奇,你从1970年代就开始研究人工智能了。你在1978年获得了爱丁堡大学人工智能方面的博士学位,并且由于当时计算机发展水平的限制,你的研究也受到了阻碍。这期间你也没有对那些反对者多加解释,哪怕他们可能会变成你的同事、投资人、或者可能会从其他方面帮助你。不知道现在这些研究人工智能的20多岁的年轻人是否意识到,自己是站在巨人的肩膀上,而正是这些巨人才是真正有远见卓识的人、排除掉这条路上所有阻碍的人。能不能谈一下是什么激励着你,让你拿到人工智能的博士学位之后依然将这项研究作为你未来的职业发展方向,毕竟在当时,如果你从事人工智能行业的话,成功的可能性并没有现在这么大。

辛顿: 我觉得原因是这样的,大脑肯定有其工作的机理。大脑是怎么学习东西的?它是怎样利用那些简单的神经元来运算极其复杂的事情的?我主要的动力来自于,我相信,大脑的运行机制和当时数字计算机的运行机制肯定是不一样的,因为没有人在给你的脑子编程。

我记得在1973年,当时有人跟我解释,神经网络系统是永远不会实现的。他们说:“神经网络没法运行递归算法。”那个时候,递归算法被当作是智能的本质。看起来我只能演示给他们看。所以我开始给他们展示,神经网络是如何进行真正的递归运算的。这里真正的递归我指如何利用节点之间的连接强度来做一些事情。比如我们想要对这句话进行理解:John did not like Bill because he was rude to Mary. 要理解这里面的从句部分“he was rude to Mary”,我们会用到将“He was rude to Mary. ”这句话作为独立的句子理解时所用到的神经节点及连接。所以说我需要做的就是存储当前进行到的位置,离开主句开始理解从句,然后再回来。我要对此进行展示,那么我就要有这个神经网络系统,没有它就做不成。所以我开始搭建这个可以做真正的递归的神经网络系统,通过在神经节点之前设立临时权重来记录节点信息。我记得当时我跟我所在的科研小组提及过这个想法,但是他们不理解我为什么要做这个事情。有趣的是,我当时想要攻破的难题,现如今变成了非常流行的技术。几年之前,因为我们要探寻到底人类为什么可以自主学习,这个问题就流行起来了。所以说人类花了四十年的时间才意识到,神经网络才是我们要攻克的难题。

多领域专家实现深度神经网络成果

  海伊: 你在2004年成立了神经计算与自适应感知(NCAP)项目,将计算机科学家、生物学家、电子工程师、神经系统科学家、物理学家和心理学家聚集到一起,复制人脑的运行机制。这件事需要很多学科的知识作为支撑。您能讲讲找到这些学科的世界级大师并且成立这个组织的故事吗?

辛顿: 没有人有必要是所有这些领域的专家,那太难了。你需要的是找到某个领域的专家,然后告诉他这个项目是什么。这样你就可以问他问题,省去了你翻阅资料的时间。例如你找到了