机器学习领域的发展潜力巨大,但我们对它了解得还不够。根据GaRneR的预测:“2020年,有80%的人工智能项目还很神秘&Rdquo;,TRansfoRM 2019 of VentuRe Beat预测有87%的AI项目将永远不会投入生产。
为什么会这样呢?为什么这么多项目失败呢?
缺乏专业知识
首先是因为大多数人对此技术依然很陌生,大多数公司组织仍不熟悉软件工具和所需的硬件。
如今,似乎只要从事过数据分析或软件开发工作,完成了一些示例数据科学项目的人,在上过在线短期课程后都自诩数据科学家。事实上,大多数的机器学习和人工智能项目,尤其在定义成功标准以及最终部署和持续监控模型时,都需要经验更丰富的数据科学家。
数据科学与传统软件开发之间的脱节
数据科学与传统软件开发之间的脱节是另一个主要因素,传统的软件开发往往更便于预测和测量。
数据科学依然是科研与工程的结合体
数据科学研究通过多次迭代和试验向前发展。有时,由于选择的度量标准无法带动用户行为,因此整个项目将不得不从部署阶段重返计划阶段。
数据的质量与规模
众所周知,人工智能系统的数据基础越广,产生的预测就越好。除了数据量增多的直接影响外,随着数据规模的增加,还会面临许多新的挑战。
数据标注
据《麻省理工学院斯隆管理评论》称,另一个使许多机器学习项目停滞的原因是数据标注的不可用。
76%的人通过对训练数据进行标注和注释来解决这一问题,而63%的人甚至尝试构建自己的数据标注和自动化注释技术。这意味着大量数据科学家会在数据标记过程中无法运用自己的专业知识,这是有效执行人工智能项目所面临的主要挑战。
封闭化组织
数据是机器学习项目中最重要的部分。在大多数组织中,这些数据将有不同的安全性约束,并以结构化、非结构化、视频文件、音频文件、文本和图像等多种形式储存在不同位置。
缺乏合作交流
另一个主要挑战是数据科学家、数据工程师、数据管理员、商务智能专家、开发运营(DevOps)和工程等不同团队之间缺乏协作。这对于从事数据科学工程方案的团队尤其重要,他们的工作方式和使用的技术之间存在很多差异。
技术上不可行的项目
由于机器学习项目往往成本高昂,因此大多数企业倾向于以远大的“登月计划&Rdquo;为目标,试图以此完全改变公司或产品并为企业带来超额回报或投资。这样的项目会使数据科学团队无法突破极限,并且永远无法完成这样的项目。最终,企业领导者将对项目失去信心并停止投资。
技术和业务团队之间的协调问题
在机器学习项目启动时,业务团队和数据科学团队之间没有明确期望、目标和成功标准。这样的项目将永远停留在研究阶段,因为他们不清楚自己的目标,便永远不知道自己是否正在取得进展。
缺乏数据策略
根据麻省理工学院斯隆管理评论,只有50%的员工人数超过10万的大型企业最有可能采用数据策略。在开始机器学习项目之前制定可靠的数据策略至关重要。
缺乏领导支持
只要投入金钱和技术,问题就能迎刃而解。这是大众常见的误解。领导者可能没有提供正确的支持来确保已经达到成功所需的条件。有时业务主管并不看好数据科学家开发的模型。
这或许是由于业务负责人缺乏对人工智能的理解以及数据科学家无法将模型的商业价值准确传达给领导者。领导者需要了解机器学习的工作原理以及人工智能对企业的真正意义。