目前机器学习技术正在对世界各地的企业产生重大影响,但很多机构依然对在何时、何处最优的使用机器学习感到困惑。为了成功的运用这门技术,企业首先要明确,哪些问题最适合应用机器学习,并确保有评估其影响的方案。
一般来说,机器学习算法是利用数据的统计属性建立输出与输入之间的关系。当研究人员把更多的数据输入算法时,它能够不断地学习并适应。最终,算法所建立的输入和输出的关系变的足够准确,它可以用于从新的输入预测输出。企业便可以运用这些预测发现新的洞察,以及赋能商业自动化。
找出那些可以用机器学习技术解决的问题。
如何确立一个可以用机器学习去解决的业务目标呢?以下步骤可供参考。
1)目标是实质性的、可量化的、可衡量的吗?
首先,利用机器学习技术实现的目标,应该对业务非常有意义。确定这样的目标通常需要业务负责人的参与,因为他们对业务有足够的了解,可以真正评估机器学习带来的价值。
其次,预测目标应该是可量化和明确定义的。例如,在最常见的机器学习框架——监督学习中,研究人员会给算法一个X输入和一个Y输出,并要求它找到X和Y之间映射的函数 Y=F(X)。
如果你希望网站对用户的吸引力达到最大化,你优化的目标Y可能是点击率、浏览总时长或它们的组合。监督学习要求业务负责人明确的量化他们需要优化的功能。
最后,机器学习算法的输出应该是持续的可衡量的。完美的机器学习算法需要不断适应新数据,以尽量减少预测的错误率。这使系统能够不停地学习和调整算法以优化其业务目标。
2)机器学习是正确的方法吗?
从广义上理解,企业可以通过两种方式开发智能系统(AI人工智能系统):专家系统和机器学习。
在专家系统中,人们明确地基于‘如果A,那么B’规则来制定行动计划。一般情况下,这样的系统并不像机器学习算法一样对数据有需要,而是依赖开发者对于问题的理解。
机器学习技术则需通过数据来学习规则。对于那些不能用严格规则进行编码的细微问题,机器学习能发现专家系统中可能错过的某种关系。但这种灵活性是有代价的:需要数据。
3)你有所需要的数据吗?
如果机器学习是解决业务问题的可行方式,数据必不可少,且数量和质量都十分重要。历史数据可以建立一种可靠的输入和输出关系来训练模型。但除了模型训练阶段之外,也需要基础架构不断的收集新数据,以便能持续学习。
评估机器学习在业务中的价值
在确定一个机器学习项目后,评估机器学习是否对业务有更广泛的影响力是很重要的。
机器学习研究中的一个活跃领域是解释算法输出结果的原因,研究人员可以对很多算法进行分解,从而为结果提供洞察。例如,知道用户为什么流失,就可以帮助企业加强产品或者开发自动化机制以防流失。在业务中主动寻找‘为什么’,对优化机器学习技术是非常重要的。
衡量机器学习算法对更深广的业务目标的影响尤为重要。例如,Facebook信息流提高用户交互度的目标,最初可能专注于提高内容的点击。但此目标可能会造成意想不到的后果,即通过增加内容噱头来吸引用户,最终可能导致整个用户群的CLV(用户终身价值)降低。随着时间的推移,可能有必要将目标从用户交互度调整为与长期客户留存相关的量化指标。
最近一项对1000位商界领袖的调查发现,66%的组织机构在用人工智能自动完成日常工作;80%的高管们表示人工智能技术创造的机会将引导企业的未来。而想要充分抓住技术带来的商业机遇,则需要企业负责人有效识别和衡量机器学习技术的影响力。
本文来自【友盟+】编译 原作者 | Alex Holub,Vidora联合创世人及CEO