人工智能 · 2024年2月3日

微软小冰的“能者多劳”将C与B连接

文/ 离离

来源/智能相对论(aixdlun)

一个已经从事过歌手、作曲家、诗人、记者、主持人、画家、设计师、助理等职业的十八岁少女,现在转行为金融行业及汽车产业提供服务,你会录用她吗?

大部份人可能不会,因为这实在不太正常。

但万得资讯和华尔街见闻举双手赞成。

这个少女不是一般人,而是名为小冰的人工智能框架。

11月24日,已经独立半年的小冰公司重回“娘家”怀抱,在北京宣布与微软中国达成战略合作伙伴关系,面向广大To B重点行业客户,联合推出一系列人工智能+云计算商业化解决方案。此方案将采用微软智能云Azure作为服务中国及全球市场的云计算运营平台,把人工智能交互体验融入到关键的典型应用场景中。微软和小冰共同联合推出的首批解决方案将覆盖人工智能金融、人工智能汽车及人工智能内容生产等三个垂直领域。

这好像和我们认识的聊天机器人小冰不大一样。用于社交的人工智能框架怎么会和金融扯上关系?

小冰养成记

起初,小冰的设计目标的确是成为一款能进行开放领域对话的社交聊天机器人。 和Apple Siri、Amazon Alexa、Google Assistant等应用场景有限的普通语音助理不同, 研发团队希望小冰能与用户形成长期情感联系 ,因此选择了重EQ的共情计算框架模式,让小冰能动态识别人类的情绪感受和状态、理解用户意图并响应用户需求,真正做到“不把天聊死”。

一个合格的人工智能语音助手需要具备知识数据库、记忆建模、图像和自然语言分析识别、推理、生成和预测等能力,才能满足用户在特定场景的需求及指定任务(如点播歌曲)。而想要成为一个高情商AI,小冰必须在此基础上,从对话中识别用户的情绪、检测情绪变化并理解用户的情感需求,并做出适当的回应。

除了原始的设定,小冰能通过一轮轮对话过程逐渐了解用户,形成有效的人机互动模式。研发团队将每次会话交流回合数(Conversation-turns Per Session,CPS)作为社交聊天机器人的衡量标准。指的是聊天机器人和用户在一轮会话中的平均对话次数。CPS越大,社交聊天机器人的参与度就越好。

对话中,用户的回答会触发特定的会话模式或使用功能,由分类器和内容检索引擎的组成的话题管理器 来决定是否触发功能或切换话题。如小冰提到五月天,根据用户的反应,自然而然的触发了音乐点播及演唱会购票预约等手机语音助手的功能。

为了增加CPS、提高用户的参与度,小冰会提升会话模式的多样性。 每种会话模式是由一种技能管理,能够应对特定类型的对话片段。而会话模式的选择与决策是通过对交谈内容的分析查询,根据用词及语句检测情绪,进行动态跟踪,获取数据形成个人独特标识,建立用户档案。运用移情计算 ,做到实时的上下文查询理解、用户理解及人际响应生成。藉由区分各个用户的不同背景、个人兴趣和需求,提供个性化的情绪及符合用户兴趣的适当回应,建立强大的社交能力,达到“见人说人话,见鬼说鬼话”的效果。

为了更加“拟人化”,研发团队还为小冰设定了年龄和性别,并创造出可靠、富有同情心、热情洋溢、幽默、博学、机智等“个性”。目前,根据聊天互动的系统架构,小冰已获得两百多种不同的对话技能,这些技能分为图像评论、内容创建、深度参与和指定任务。而小冰的商业化及“转行”正是依靠这些技能。

小冰变形记

以图像评论为例,小冰不仅可以正确识别图片内容,还能生成带有个人情绪、立场、态度的评论,造就曾引起话题的颜值测试。这项技能加上基于深度学习的音乐、诗歌、散文、绘画等内容创建,就完成了“看图编曲”、“看图写诗”等“特技”。

作为一个面向新交互形态的人工智能技术框架,小冰从2014年5月推出至今,一直维持着“年更”的速度。今年八月,第八代小冰带着分层知识图谱技术和篇章内容学习技术 出现在众人眼前,其引导对话完成率已达到42%,接近人类表现。

在这个过程中,小冰逐渐形成了三条产品线,三者皆具有不同的商业价值。

第一个是作为单独个体的对话式AI小冰 。如Facebook的Blender、Google的Mina等对话式人工智能系统,其技术参数、标准、性能均是以小冰作为参考,可用作网页、电话客服或手机内建自动语音助手。对话系统小冰已部署在今日头条、微博、QQ等多个平台,同时可通过华为、小米、OPPO、vivo等品牌的智能硬件设备进行召唤。除了主流App和手机品牌,小冰还与网易、米家生态链、万得资讯、罗森、万科、中国联通等B端企业达成了合作。

但是,从产品初期设定上就有别于普通智能语音助手的小冰,作为一般语音助手似乎有些“大材小用”,无法完全发挥优势。且这条赛道上已有Apple Siri、Google Assistant和Amazon Alexa等强劲对手,相对于能够与自家搜寻引擎无缝连接的Google Assistant和Amazon Alexa,以及苹果系统内置的Siri,小冰在这些应用场景上似乎并不占优势。因此,微软选择让小冰尝试不同的产品方向,开始探索不同的商业道路。

于是,第二个产品线诞生。小冰开始面向个人用户提供虚拟人类 产品线,包括虚拟歌姬、虚拟偶像等多种角色的Al beings,以及人工智能定制工具“X套件”。X套件包括X Writer、X Studio、X Presenter。

X Writer通过人工智能帮助用户进行文字编辑或文本创作, 随云端更新不断扩充各类文体。X Studio能合成人声 ,可生成面向各类公众号文章、演讲、电台节目等的主播或歌手。其中,主播应用已在商业化领域覆盖中国及日本超过50家主流电台电视台,累计制作超过8000小时高质量音频节目内容, 此次推出的产品为个人版本,目前尚未出现同类软件产品。

X Presenter则是通过AI行为自动解析及辅助视觉引导 功能,根据用户输入的演讲稿,自动合成人工智能语音,同时解析并依此生成AI虚拟人类的演讲动作、表情、还有口型。其商业版为日本LAWSON驱动的自主舞蹈人工智能,现已上线。

基于上述根据用户的不同需求设定参数、输出“客制化AI”的思路,小冰最后一条产品线就是将小冰框架中的自然语言处理、计算机视觉、计算机语音技术运用至垂直行业。 也是微软中国与小冰公司战略合作发布的重点:小冰框架赋能于金融、汽车与内容生产。

小冰冒险记

“从本地化的创新来看,即使是最了不起的技术也要和当地的数据相结合,特别是在人工智能方面, 算力+数据=生产力, 这样才可以做出更加了不起的技术。”小冰公司董事长沈向洋表示。

目前,智能语音业务已进入高速发展期,随身设备、智能家居、智能车载是智能语音服务应用较为成熟的三个领域,市场渗透率也是连年提升。近年,国内外的科技巨头纷纷推出智能音箱产品,抢占快速膨胀的智能家居市场。看着日渐拥挤的智能音箱赛道,小冰团队并没有跟风投入,而是选择“作壁上观”,转换方向,放眼于其他行业,寻找别的可能性。

小冰公司首席执行官李笛提出小冰本次To B尝试与其他人工智能公司的不同:“以往的AI落地应用更多是关注流程改造,但是只做流程对效率的提升是有上限的。小冰聚焦在行业关键岗位,是要完成只有AI才能完成的关键任务, 对上限的提升非常明显。这里面有很多经验教训,以金融领域为例,正是因为依托人工智能担任关键岗位,才实现了90%以上的机构投资人对于每天查阅全部26类金融文本摘要的需求。”

在金融业,上市公告的收集和摘取一向需要耗费大量的人力及时间成本。自2017年11月起,小冰与万得资讯、华尔街见闻等金融信息服务提供商合作,利用小冰的大数据处理及文本分析功能,实现金融专业文本摘要自动化生产。

在万得资讯,小冰化名万小冰,通过获取、分析沪深两市中标、质押、停复牌、业绩、重组、股权收购、员工持股等26类上市企业发布的全部公告,自动生成摘要。在华尔街见闻,小冰化名华小冰,结合华尔街见闻专业团队对A股市场的理解和多年积累的大数据,实现非标准化金融文本摘要快速生成,还能快速处理长达几百页的招股说明书。此外,小冰还可利用知识图谱、信息技术,为企业提供金融风控服务。

赋能于智能汽车领域的小冰,除了基本的智能驾驶,主要还需借助小冰的“本行”—高情商聊天技巧,扮演一个善解人意的随行者,同时做到跨平台启动汽车功能,还能做到多人驾乘的体验。目前,小冰已协助华人运通等汽车品牌实现基于全车级语音控制,自然而富有情感的互动场景。

在内容生产场景中的小冰则是我们最熟悉的,可基于文本、声音和视觉生产内容的歌手兼画家兼诗人小冰了。目前,设计师小冰的商业化相对成熟,已在工业设计、数字印刷图案设计、纺织服装面料设计、包装设计等领域落地,并实际应用于国内100多个领先企业。小冰与中国纺织信息中心、国家纺织产品开发中心共同推出的人工智能纺织服装图案设计平台也已投入生产。设计师小冰可稳定设计三十余种主流风格,按需创作,图案设计多样性达10的 26次方。

市面上的智能语音技术及其产品几乎是一门心思全部用于解决各行各业“自动客服”问题和不用动手的“声控”问题 ,针对现有的需求来

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册