当你每次问Siri方向时,一串复杂的代码就会被激活,代码使“她”理解你的问题,搜索你想要的信息,然后以你能理解的语言回答你的问题。这在过去几年中成了现实。直到现在,我们还在与电脑以他们能理解的语言互动,而不是以我们的语言。我们已经学会了他们的语言。
但是现在,他们在学习我们的语言。
这项支撑人机关系变革的技术是自然语言处理(Natural Language Processing, NLP)。它已经在改变商业智能,这比简单的互动走得更远。不久后,商业领域会转型,仅仅通过与聊天机器人交谈即可获得改变人生的信息。
这个未来并不遥远。甚至可以说,它就在眼前。
什么是自然语言处理?
自然语言处理,也被称为计算机语言学,结合了机器学习、人工智能和允许我们和类人机器对话的语言学。
想想几年前,我们通过使用关键词结合“与、或、非”的布尔搜索术语来实现有效的谷歌搜索。为了得到你想从谷歌得到的答案,你得知道它的语言。
然后,谷歌引入了语义搜索。它的算法学习了单词之间的关联,使你能够把谷歌当作朋友一样询问问题。在计算机内部,它把这个问题翻译成计算机能理解的布尔结构化搜索——但这个过程是隐形的。
这和你问Siri“今天天气如何”或“明天去北京哪一航班最便宜”用的技术是一样的,不用将你的英文修改为计算逻辑门。
你只需要问Siri:“明天去北京哪一航班最便宜?”“她”就会回答:“理解,”然后便开始搜索从你所在的位置到北京的飞机航线,比较费用,找到最便宜的航班。Siri能理解“明天”和“最便宜”,而不需要你指出具体的日期或定义“最便宜”为最低的价格。
这些例子还相对初级。尽管让人印象深刻,它们还是会犯错。当它们犯错时,说明你的问题需要以高度整合的数据回答。而自然语言处理的目的就是,废弃用户图形界面——甚至是用户界面,让与机器互动变得与人对话一样简单。
这将是商业智能应用的巨大分支。
自然语言处理将会使数据民主化
总体而言,最大的影响将会是降低或彻底移除阻挡通入商业智能和大数据的屏障。许多商业智能领域的公司已经注意到这个趋势并取得了重大进展,确保数据正变得便于用户访问且能轻松获取。然而,这还有很长的路要走。
想像一下,未来你只需问出一个问题,就能在任何时间任何地点得到答案。把商业智能转变成与聊天机器人的对话,了解信息将简单得只需要问“过去三个季度的收入如何?”,不需要多年的经验,不需要熟悉软件,也不需要担心提出的问题机器是否能理解。
基于对用户图形界面的需求正在减退的趋势,自然语言处理将使访问变得更容易。用户可通过智能手机上的文本或语音命令进行查询,处理过程将在云端进行。
谷歌现在可能会告诉你明天天气如何,但不久后,你将能向你的私人数据聊天机器人了解到你的顾客今天感受如何,他们下周将会如何看待你的品牌等等主观问题。
自然语言处理将使商业智能更具洞察力
目前,自然语言处理趋向于建立在将自然语言转化为机器语言的基础上。然而,当这项技术成熟后——尤其是人工智能部分——电脑将会更好地“理解”需求并提供答案,而不用去搜索结果。
这要比用自然语言问问题向前走了进一步。最初,数据聊天机器人可能在回答一个问题时,如“过去三个季度的收入如何变化”,跳出几页数据让你去分析。
一旦它学会语义关系和问题推论,它将能自动筛选并组织成一个智能答案而不再是仅仅告诉你数据。
你将不会再用自然语言问问题。
自然语言处理将驾驭非结构化数据
自然语言处理通过使机器理解非结构化数据扩展了答案可能会在的范围。
情绪分析的早期尝试成效已经远远超出预期,比如,可以做到从一条关于你业务的微博中分析周围文本并决定这条微博传递的情绪是正面的,负面的,还是中立的。当语言识别技术提升后,音频和视频同样将成为更容易获得的资源。
现在还只是这项技术的初期,情绪分析目前达成的水平可从使用谷歌翻译一篇德语新闻(一个依赖于自然语言处理各个方面的过程)的准确度中略见一斑。走在语义分析前沿的国际商业机器公司的沃森系统(IBM Watson),如今仅能检测到喜悦、恐惧、悲伤、恶心和愤怒等情绪,而人类能感受更多种情感。
随着沃森公司的任务更加细化,自然语言处理开放了大量的公共多媒体,用于机器的大量分析、获取过去需要人工分析才能得到的数据,并给出量化答案、自然语言答案或是同时给出两种答案。
雇佣一个私人数据助手
这个即将实现的界面与你今日在网上所见的服务型聊天机器人类似。它能驱动你的各种应用,结合你的商业智能分析渗入你业务的方方面面,任意时刻都能提供数据驱动的处理。
想象你的商业智能聊天机器人在不远的未来就会像过去的回形针一样,随时能回答Slack聊天、Skype会议或微软日历标注的事件上的问题。
谁是你公司今年的最佳售货员?要得到这个问题的答案将不再通过问你自己,而是点击你的数据。你将能问聊天机器人任意问题并得到答案,这过程就像你求助万能的朋友圈一样简单。