人工智能 · 2024年2月14日

斯坦福大学发布2022年人工智能指数,北邮、清华、字节表现出色

近日,斯坦福大学发布了《人工智能指数2022》(Artificial Intelligence Index Report 2022)报告,这是斯坦福大学连续第五年发布该类型的报告,该报告旨在成为世界上最可信、最权威的AI数据和洞察来源。今年的报告分为五个章节,包括最新的研究进展、技术、AI伦理、投资与教育、AI政策。

本文带来《人工智能指数2022》的要点翻译总结,从权威机构角度分析全球人工智能行业的最新进展。

一、研究进展

研发是推动人工智能 (AI) 快速发展的不可或缺的力量。每年学术界、工业界、政府和⺠间组织通过⼤量论⽂、期刊⽂章、人工智能会议等为AI研发做出贡献。从 2010 年到 2021 年,人工智能出版物的总数翻了⼀番,从 2010年的 162,444 篇增长到 2021 年的 334,497 篇。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年全球 AI 出版物数量

其中,2021年这些出版物的51.5% 是期刊⽂章,21.5% 是会议论⽂,17.0% 来自存储库。细分领域方面,自2015 年以来,模式识别和机器学习方⾯的出版物增加了⼀倍多。其他受深度学习影响较⼤的领域,如计算机视觉、数据挖掘和自然语言处理,增幅较小。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按研究领域的 AI 出版物数量

按论文来源的部门来分,教育机构仍是AI研究的主力,而美国和欧盟的公司参与研发的程度也很高。值得一提的是,中国是唯一一个教育比重不断上升的国家(地区)。而且,迄今为止,过去 12 年中美国和中国之间的合作数量最多,自 2010 年以来增加了五倍。其次是英国与美国和中国之间的合作,增加了自 2010 年以来增长了 3 倍多。2021 年,美国和中国之间的合作数量是英国和中国之间的 2.7 倍。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按⾏业分列的 AI 出版物(占总数的百分比)

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲美国和中国在⼈工智能出版物方面的合作,2010-21

按地区来看,2021 年,东亚和太平洋地区以 42.9%的期刊发文量领先,其次是欧洲和中亚(22.7%)和北美(15.6%)。此外,南亚、中东和北非的增⻓最为显着,在过去 12 年中,它们的 AI 期刊出版物数量分别增 长了约 12 倍和 7 倍。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按地区分列的 AI 期刊出版物(占世界总数的百分比)

按地理区域来分,中国保持领先地位,2021 年为 31.0%,其次是欧盟和英国,为 19.1%,美国为 13.7%。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按地理区域划分的 AI 期刊出版物(占世界总数的百分比)

在论⽂的被引次数上,中国的份额逐渐增加,⽽欧盟以及英国和美国的被引次数减少。这三个地理区域的总引⽤量占全球总引⽤量的 66% 以上。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按地理区域划分的 AI 期刊引⽤次数(占世界总数的百分比)

在专利方面,2021 年提交的专利数量是 2015 年的 30 倍以上,复合年增⻓率为 76.9%。中国的专利数已经占了世界⼀半,并获得约 6% 的授权。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲AI 专利申请数量,2010‒21 年

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲2010-21 年按地理区域划分的⼈⼯智能专利申请(占世界总数的百分⽐)

AI开源软件库方面,TensorFlow 仍最受欢迎的,GitHub 累计星数约为 161,000,⽐2020 年略有增加,远高于排名第二的OpenCV。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲AI LIBRARY 的 GITHUB STARS 数量(超过 40K STARS),2014‒21

二、技术表现

今年技术性能这⼀章节对AI各个⼦领域的技术进步进⾏了⽐以往更多的分析,包括计算机视觉、语⾔、强化学习等技术的趋势。

1、计算机视觉

图像分类:图像分类是指机器对图像中看到的内容进行分类的能力。 过去⼗年图像识别系统技术取得了巨⼤的进步,特别是研究⼈员已经采⽤了更多的机器学习技术。截⾄ 2021 年底,顶级图像分类系统在 Top-1 准确度上每10 次分类尝试平均产⽣ 1 个错误,相比之下, 2012 年底 每 10 次尝试平均 4 次 错误 。 2021 年,最顶级的预训练系统是 CoAtNets,由⾕歌研究⼈员制作。

图像生成:图像⽣成是⽣成与真实图像⽆法区分的图像的任务。如下图所示,2021年,AI已经可以合成非常难以区分的人脸照片。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲GAN 在⼈脸⽣成⽅⾯的进展

深度伪造检测:许多人工智能系统现在可以⽣成与真实图像⽆法区分的假图像,例如通过换脸来实现所谓的“深度伪造”。近几年,研究人员一直试图通过制作更强大的深度伪造检测算法来跟上伪造步伐。FaceForensics++ 是⼀个深度伪造检测基准测试,。2012年, 最强的AI技术可以在四个 FaceForenics++ 数据集中正确识别 69.9% 的深度伪造。 2021 年, 该数字增加到 97.7% 。

医学图像分割:医学图像分割是指AI系统在医学图像中分割感兴趣对象(例如器官、病变或肿瘤)的能⼒。目前,AI能够在 CVC-ClinicDB 数据集上以 94.2% 的正确率识别结肠镜检查息⾁,相比2015年提⾼了 11.9 个百分点。

人脸检测:虽然目前的一些面部识别算法的成功率接近100%,但因为疫情的影响,戴口罩面部识别成为了AI技术新的挑战。2021年,北京邮电⼤学的研究⼈员发布 了6000张蒙⾯⼈脸的⼈脸识别数据集,以应对⼤规模戴⼝罩带来的新识别挑战。研究⼈员在各种⾯部识别数据集上运⾏了⼀系列现有的最先进的检测算法,结果表明,与未蒙⾯相⽐,顶级⽅法在蒙⾯⾯孔上的表现要差 5 到 16 个百分点。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲北邮MLFW数据库

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲最新AI MLFW数据库检测准确性

2、语言理解

目前的英文语言理解用的最新基准测试为SuperGLUE,于2019年5月发布。在测试中,AI系统在八种不同的任务上进行测试。截至目前最先进的系统为SS-MoE模型,在SuperGLUE上的得分为91.0,已经超过了人类。

斯坦福大学:2022年人工智能指数 北邮、清华、字节表现抢眼

▲SuperGLUE得分

在另一项斯坦福问答数据集(SQuAD)中,AI最新得分为95.7和93.2,也超过了人类的表现。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册