麻省理工学院的科学家正打造一个可根据生理讯息、语音对话辨别人们情绪的人工智能系统,它可透过穿戴装置搜集大量生理、语音数据,提高辨识人类情绪的精准度。
麻省理工学院(MIT)的科学家们正在打造一个可根据人们谈话所使用的字汇及语气来预测对方情绪的行动程序,此一基于人工智能(AI)技术的程序主要被应用在穿戴装置上,将可望促进人们的交流。
该论文是由计算机科学暨人工智能实验室(Computer Science and Artificial Intelligence Lab,CSAIL)与医学工程暨科学学院(Institute of Medical Engineering and Science,IMES)连手进行,赞助单位为三星的策略与创新中心(Samsung Strategy and Innovation Center),准备在下周举行的美国人工智能协会(Association for the Advancement of Artificial Intelligence,AAAI)年度会议上发表。
作者之一的Tuka Alhanai表示,想象在双方的对话结束后,还能回放并观察对方感到最焦虑的时刻,现在的成果已经离实际应用不远,不久的将来,人们的口袋里就会有一个具备人工智能的社交教练。
科学家们所建置的系统能够分析声音、文字与生理上的讯号,来判断谈话过程的气氛,准确率已高达83%。 藉由深度学习技术,系统还能对谈话过程每5秒提供情绪分数。
另一名作者Mohammad Ghassemi(上方主图左)则说,这是第一个同时搜集谈话与生理数据而进行的实验,就算聊天的话题是中立的,或者是缺乏结构的,也都能实时分辨谈话时的情绪波动。
初期的实验对象是戴着三星的Simband,这是一个可侦测及纪录心率、血压、移动与皮肤温度的穿戴手环,该系统同时也能捕捉聊天时的语音数据来分析说话时所使用的词汇、语调及能量。 科学家们仍在持续改善该系统,邀请更多的用户在诸如Apple Watch等智能型手表上安装程序,并在聊天时启用它,以搜集更多的数据并强化其算法。
透过人工智能所分析的情绪结果与人们平常的观察颇为一致,例如单调的口气或是暂停太久时,通常是悲伤的表示,若是精力充沛并使用不同的语句则代表快乐的情绪,若是身体出现烦燥现象或心率加速也是悲伤所造成。
Alhanai说,目前的演算还不够可靠,下一步将会改善算法的情绪粒度,让它能够分辨更细微的情绪,包括无聊、紧张或兴奋等,而不只是大范围的正面或负面情绪。