人工智能 · 2024年1月20日

2017年机器学习和数据科学调查:Kaggle

数据平台 Kaggle 近日发布了 2017 机器学习及数据科学调查报告,这也是 Kaggle 首次进行全行业调查。调查共收到超过 16000 份回复,受访内容包括最受欢迎的编程语言、不同国家数据科学家的平均年龄、不同国家的平均年薪等。

下面主要看看工具使用方面的结果。请注意,该报告包含多个国家的数据,可能存在收集不够全面的情况,仅供参考。

年龄

从全球范围来看,本次调查对象的平均年龄在 30 岁左右。当然,各个国家的数值会有差异,中国的机器学习从业者年龄的中位数是 25 岁。

Kaggle:2017机器学习及数据科学调查

全球全职工作者为 65.7% ,其中中国为 53.% ,美国占比较高,达 70.9% 。

Kaggle:2017机器学习及数据科学调查

Logistic 回归是除了军事和国安领域外,最常用的数据科学研究方法。在军事和国防安全领域,神经网络被使用更多。

Kaggle:2017机器学习及数据科学调查

在工具语言使用方面,Python是数据科学家使用最多的语言。同时,统计学家对 R 语言的忠诚度很高。

Kaggle:2017机器学习及数据科学调查

关系型数据是最常用的数据类型,学术研究者和国防安全领域则更亲睐文本和图像。

Kaggle:2017机器学习及数据科学调查

Git 是他们最常用的代码共享和托管方式。

Kaggle:2017机器学习及数据科学调查

Dirty Data (脏数据)是从业者遇到的最大障碍。此外,理解不同算法的能力不够也是困扰数据工作者的一大障碍。缺乏有效管理和资金支持,是面临的两大外在困境。

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册