人工智能 · 2024年2月18日

2023年斯坦福发布的人工智能(AI)指数报告(386页)

从2010年-2021年,尽管AI论文跨国合作的步伐已经放缓,但是自2010年以来,美国和中国的人工智能研究合作数量增加了大约4倍,比中国和英国合作总数多2.5倍。

然而,从2020年-2021年,中美合作的总数仅增长了2.1%,是自2010年以来的最小同比增长率。

此外,人工智能论文的总数自2010年以来翻了一番以上。从2010年的20万篇增长到2021年的近50万篇(49601)。

就AI论文发表的类型来看, 2021 年,所有已发表的AI论文中有60%是期刊文章,17%是会议论文,13%来自存储库。

虽然在过去12年中期刊和储存库论文分别增长了3倍和26.6倍,但会议论文的数量自2019年以来有所下降。

模式识别、机器学习和计算机视觉依旧是人工智能领域研究的热门话题。

中国在期刊、会议和储存库论文总量方面依旧处于领先地位。

美国在人工智能会议和储存库引用方面仍然领先,但这些领先优势正被慢慢削弱。尽管如此,世界上大多数的大型语言模型和多模态模型(2022年54%)是由美国机构产生的。

中国霸榜AI顶会,但引用量低于美国

AI期刊论文的发表,中国始终保持领先地位,2021年为39.8%,其次是欧盟和英国(15.1%),然后是美国(10.0%)。

自2010年以来,中国人工智能期刊论文被引频次占比逐步上升,欧盟、英国、美国均有所下降。中国、欧盟和英国、美国占全球总引用量的65.7%。

那么,世界顶会论文发表的情况又如何?

2021年,中国以26.15%的比例在全球AI顶会发表的论文数所占份额最大,而欧盟和英国以20.29%紧随其后,美国以17.23%位居第三。

从顶会论文引用量来看,中国虽然高产,但引用量相较于美国来说较低。美国顶会论文引用量23.9%,中国为22.02%。

从侧面可以看出,中国论文发表数量最多,但质量不如美国高。

在AI论文储存库提交方面,美国在世界居首,23.48%。中国最低,11.87%。

中国9所机构,AI论文发表赶超MIT

2021年,发表论文总量世界前十机构中,中国占了9所,不同机构发表的论文总数如下图,MIT位列第十,发表论文1745。

就计算机视觉领域(CV)来看,中国的十所机构位居世界前十,它们分别是,中国科学院、上海交通大学、中国科学院大学、清华大学、浙江大学、北京航空航天大学、武汉大学、北京理工大学、哈尔滨工业大学,以及天津大学。

在自然语言处理(NLP)领域,就有所不同了。

世界前十的机构/公司有:中国科学院、卡内基梅隆大学、微软、清华大学、卡内基梅隆大学-澳大利亚分校、谷歌、北京大学、中国科学院大学、阿里、亚马逊。

工业界领先学术界

在2022年发布的重要人工智能机器学习系统中,语言系统占最多,有23个,是多模态系统数量的6倍。

在论文产量上,工业界领先于学术界。

直到2014年,大多数重要的模型都是由学术界发布的。从那时起,工业界便逆袭翻身。到2022年,32个重要的机器学习模型都诞生在工业界,而学术界仅有3个。

由此可见,与非营利组织和学术界相比,构建最先进的人工智能系统越来越需要大量的数据、计算机能力和资金资源,而行业参与者固然有更多的资金资源去做这件事情。

2022年,美国产生了数量最多的重要机器学习系统,有16个,其次是英国(8个)和中国(3个)。

此外,自2002年以来,就创建的重要机器学习系统总数而言,美国已经超过了英国和欧盟、中国

再来看做出这些重要AI系统背后研究者国分布,美国有最多的研究者,285人,是英国的2倍多,是中国的近6倍。

LLM越来越大,算力越贵

大型语言和多模态模型,有时称为基础模型,是当前一种新兴且日益流行的AI模型类型,它在大量数据上进行训练并适用于各种下游应用程序。

ChatGPT、DALL-E 2和MakeA-Video等大型语言和多模态模型已经展示了令人印象深刻的功能,并开始在现实世界中广泛部署。

通过对这些模型作者的国家隶属关系进行了分析,这些研究人员中的大多数来自美国机构(54.2%)。

斯坦福AI指数报告还列出了大型语言和多模态模型发布的时间表。

大型语言模型正变得越来越大,也越来越昂贵。

第一个大型语言模型GPT-2于2019年发布,有15亿参数,训练成本约50000美元。谷歌PaLM是2022年推出的大型语言模型之一,有5400亿参数,成本高达800万美元。

从参数和训练成本来看,PalM比GPT-2大360倍,成本高出160倍。

不仅仅是 PalM,从整体上看,大型语言和多模态模型变得越来越大和昂贵。

例如,DeepMind于2022年5月推出的大型语言模型Chinchilla估计耗资210万美元,而BLOOM的训练大约耗资230 万美元。

随着时间的推移,GAN在人脸生成方面的进展,最后一个图像由Diffusion-GAN生成,这一模型在STL-10上取得了最新的SOTA。

斯坦福:2023年人工智能(AI)指数报告(386页)

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册