斯坦福大学每年都会发布一份《人工智能指数报告》(The AI Index Report)。近日2021年度报告已经发布,这也是该报告的第四期,主要讲述 AI 领域在2019-2020年的变化情况。
斯坦福《AI 指数报告》包括政策、国别分析、技术报告等多个关键部分,对 AI 相关的所有数据进行长期的跟踪、收集、提炼和视觉化,旨在为社会公众提供一份详实、无偏差、精密审查过的数据报告,从而帮助全球的政策制定者、研究者、公司高管、媒体记者等人士更好地理解 AI 这一复杂领域的最新技术进展和形势变化。
该报告由斯坦福大学的 Institute for Human-Centered Artificial Intelligence (以人为本的人工智能研究院) 汇总制作。该机构由知名 AI 研究者李飞飞教授和斯坦福大学教务长 John Etchemendy 共同领导。
值得注意的是,今年的《AI 指数报告》指出了2020年全球 AI 发展的一些亮点,其中包括:
1)对期刊上来自中国研究者的 AI 论文的引用数量在去年以微弱优势(20.7%)首次超越美国(19.8%)并且全球领先;
2)美加两国 AI 方向应届博士毕业生的外籍比例提升4.3%,达到64.3%,其中81.8%选择留美;
3)AI 方向博士毕业生65%进入业界工作,较2010年提升了20%,标志着业界在 AI 技术发展中扮演的重要性与日俱增;
4)AI 领域总融资额增加了9.3%,但完成新融资的 AI 创业公司的数量,已经连续三年下降;
5)受新冠疫情影响,2020年制药方面的 AI 私募投资额较前年暴增了4.5倍。
论文引用数中国首次超美
报告作者发现,在2020年,中国首次在期刊论文 (journal papers) 引用数量这一指标上超越了美国。而此前在2004年和2017年,中国曾先后两次在期刊论文总发表数量上超越美国。
这一发现的数据来源综合自微软学术图谱 (Microsoft Academic Graph)。至于该论断的具体国别定义方法,采用的是论文作者所供职的单位。
也就是说,“中国论文引用数首次超美”这一论断,其实说的是:来自中国大学、科研机构和公司的作者,在全球期刊上所发表的论文,其被引用的数量首次超过了为美国大学科研机构和公司供职的作者。这个定义方法不局限于作者本人的国别。
也就是说,《AI 指数报告》的这一发现足以体现,中国作为一个国家已经开始展现出在 AI 研究上略优于美国的实力实力。
让我们来详细看一下过去一年全球主要 AI 科研强国在论文发表和引用方面的数据。根据经合组织定义,所有涵盖在人工智能或机器学习类目下的论文都统计在内。
在2020年,全球共有22.8万篇 AI 论文在期刊上发表,较2019年增加34.5%,增幅也有所提升:
这些 AI 期刊论文的总引用数量达到93.7万次,其中中国占据了20.7%,首次超过美国(19.8%)。与此同时,欧盟地区的期刊论文引用数量份额持续降低至11%:
不过这份《AI 指数报告》也指出,虽然在期刊论文引用数上今年退居第二,美国在学术会议上发表的论文 (conference papers) 的引用数量仍然以较大优势领先中国。这一优势已经持续了十年:
不仅如此,2019年时,中国在 AI 学术会议论文发表总数比例上基本追平美国,到了2020年却又有大幅下滑,占15%,落后于美国18.9%:
其它值得留意的数据:
1/ 在所有 AI 科研实力较强的国家和地区,占比最高的 AI 期刊论文来源仍然是学术机构,不过排名第二的来源开始出现差异:在美国,业界公司及其关联研究机构发表的论文占19.2%;在中国和欧盟,国有科研机构的论文占比分别为15.6%和17.2%;
2/ 新冠疫情影响了 AI 学术峰会的召开,大部分会议都搬到了线上。正是因此,注册参会者的数量反而有所提升。数据显示,九大最受欢迎的 AI 顶会的总计参会者数量在2020年几乎翻了一倍;
3/ AI 科研在整个学术界业的地位也有所提升。2011年 AI 期刊论文占全年发表论文的1.3%,这个比例到2019年已经提升到了3.8%。
留学生毕业大批留美,业界比学界更受追捧
去年我们曾经报道过,保尔森基金会旗下智库 MacroPolo 的报告《全球AI 人才追踪》(The Global AI Talent Tracker) 发现,美国吸引了全球最顶尖的 AI 科研人才。
那些最终在美国院校或公司从事研究的外国人才中,绝大多数在美国完成硕士学业,其中最主要的生源国为中国。该报告还指出,如果失去了海外,特别是来自中国的人才,美国的 AI 人才优势将不复存在。
而斯坦福大学这份2021年《AI 指数报告》进一步强化了这个观念。研究者发现,北美 AI 方向的应届博士毕业生当中的国际学生比例也再创新高,在2019年已经达到了64.3%,较2018年水平提升了4.3%,比例也超过了往年留学生更为热衷的定向专业,如计算机工程、计算机科学和信息学等。
《AI 指数报告》还发现,在2019年 AI 方向应届博士毕业生当中,有高达81.8%比例选择留美工作,只有8.6%确认出国就业(另有9.6%去向未知)
其它计算机相关方向专业,如网络、软件工程、编程语言等受到了明显挤压,这些方向的博士学位授予数量有明显减少。与此同时,下图中可以看到,许多可以归到 AI 领域下的方向,如机器学习 (ML)、机器人、计算机视觉、算法等,其博士学位授予数量都有提升。
其中,AI/ML 方向和机器人/计算机视觉方向的博士学位授予的数量提升最多,占所有 AI 领域授予数量的22.8%和7.3%。在2019年全美一共授予接近300个 AI/ML 方向和近100个机器人/计算机视觉方向博士学位。
本章节中还有另一个非常有代表性的发现:在过去的十年里,AI 领域博士毕业生选择留在学术界的比例逐年降低。在2019年,博士毕业生留在学术界的比例只有23.7%,较2010年水平几乎缩减了一半;
选择前往业界将所学投入实战,或在顶尖公司的科研部门继续工作的博士毕业生比例显著提升,从2010年的44.4%提升到2019年的65.7%,增幅同样接近五成。
报告认为,这一情况主要是因为那些选择进入学术界的年轻学者数量维持稳定,而在过去十年里暴增的 AI 领域学生当中的大部分都被业界所吸收。
毕竟在这十年里 AI 在业界的应用在质和量上都有了巨大的飞跃,这些增加的人可能本身也是被那些顶尖公司所吸引,或本已带有明确的求职意向。
不仅博士毕业生更喜欢去业界,《AI 指数报告》还指出,美国大学的教职层级也在经历一次十分明显的人才外流。
2019年发表的一篇论文《人工智能、教育和创业》发现在2004年到2018年这段时间里,美国大学的 AI 领域教授离开教职前往业界的数量之多,增幅之明显,堪称一次“史无前例的人才外流”(unprecedented brain drain)。
该论文指出了一个十分值得关注的现象:AI 教授跳槽业界这件事,特别是当他们崇拜认可的终身教授跳槽,教职被本校挂职教授或排名较低学校的教授所填补的时候,对 AI 方面的博士生会带来较大的心理影响,会令他们低估继续呆在学术界的意义。
2019年,AI 教授跳槽的总体数量倒是比2018年有所下降,但情况仍然令人担心,