互联网资讯 · 2024年2月20日

AIGC终端化浪潮:天猫精灵、小度、讯飞等参战

 

看起来,这可能是一副正常的黑框眼镜,你戴上去彬彬有礼、斯斯文文;

实际上,它里边还装了一个“小伙伴”,你随时可以与它交流,谈天说地或者提出各种问题接受它的帮助;你化身为了科技极客,成为科幻片里带着有超能力的“小跟班”闯荡世界的酷炫主角……

这款眼镜是天猫精灵最近爆出的一款升级了大模型的智能随身眼镜工程机版本。

从官方透露的信息看,这个新型随身终端demo内置了AIGC能力,可以通过连续的语音交互实现对用户的全天候陪伴。

从B站博主透出的视频来看,对话、记录、生活技巧……以骨传导的方式,在没有人注意到的情况下,大量的交互就已经轻松实现。

逛街时需要寻找优质餐厅时,只要问一问,答案就传到了脑子里,带上一脸疑惑的朋友,出发;

减肥大计还没成功,又疑惑美食的热量时,可以马上在耳旁获得恰当食物的推荐,不用担心热量超标;

躺在沙发上吹着空调玩着王者荣耀,想知道辅助位该怎么玩时,小伙伴已经帮你应该玩什么英雄、怎么玩都安排好了……

尽管人工智能喊了几十年,但AIGC的到来,可能还是第一次能够让普通人直接感受到技术的澎湃力量。

实际上,除了天猫精灵的智能随身眼镜,AIGC硬件过去一段时间内已经出现集中化涌现的浪潮。

百度小度全面接入文心一言,甚至借势推出面向垂直领域的智能手机产品;

科大讯飞的星火一经发布,就宣布接入旗下的学习机产品以及智能办公产品;

此外,华米在其新款Amazfit Falcon运动智能手表上上线了ChatGPT表盘,拥有众多智能终端产品的小米更是爆出要自研大模型接入其生态产品中。

在国外,苹果批准了其AppleWatch硬件产品接入AIGC能力,智能眼镜公司Innovative Eyewear宣布将推出首款支持ChatGPT的智能眼镜。

而上述天猫精灵智能眼镜在开售日当天直接登上了天猫平台同品类热销榜第一。

这些都表明,第一代AIGC硬件正迎来爆发,这种爆发也展示了AIGC垂直化下的个人化、随身化产品发展路径和价值。

大模型想离“用户”更近

ChatGPT、通义千问、文心一言、讯飞星火……

大模型产品过去一段时间集中涌现,各自都刷了一波存在感,好不热闹。

实际上,这些能够聊天交互的产品,只是厂商们用最直观的方式向业界秀出自家大模型的技术肌肉罢了。

它们背后支撑的大模型,在打出影响力后走入垂直领域实现商业化,是共同的追求。

AIGC的大时代,走在前面的企业已经在探索更多场景。

而在商业化这件事上,厂商们的倾向各不相同——直观上,分为进入B端企业提供服务以及面向C端创新产品两种路径。

到底是朝向B端还是去C端,也引发过一系列的讨论甚至争论。

这波浪潮的源头OpenAI,倾向于面向企业提供服务,收取订阅费,来快速实现数亿美元的营收目标。

这也成为不少国内厂商的选择。

而实际上,大模型的原本含义就是“预训练的大参数量算法模型”,它本质的意义体现在“预训练”上,能够经过微调就快速适应对应的场景,在不需要提供大量数据喂养的情况下就能形成一个可落地的应用,从而在提升AI能力的同时加速AI创新的速度。

但从大模型的技术落地来说,垂直化是生来就有的基因。

在企业级服务十分旺盛的欧美,OpenAI优先选择了面向企业们收订阅费。

而在中国市场,虽然随着To B数字化、智能化服务的高速发展,厂商最终也需要全面面向企业提供服务,它们还多了一项选择,那就是依靠蓬勃发展的C端市场,在各类C端产品或服务上,展现AIGC的能力。

过去已经发展了很多年的智能终端,具备商业化的三大优势:大市场容量、深度服务的价值潜力、易于通过语音助手实现AIGC能力嫁接。

简单说,市场大、潜力深、好上手,容易得到普遍选择。

这一点,也得到研究机构与厂商实践的共同证明。

中国信通院在《AIGC与ChatGPT:现状、趋势及治理》中认为,智能语音助手将是重要的AIGC应用方向;

国盛证券在其研究报告中提到,智能助理将成为下半年的超级应用,大模型让人类可以指挥搭载在智能音箱、耳机、汽车等各种设备中智能助理帮自己完成各种任务。

智能随身眼镜这类陪伴式产品,底层支撑就是智能语音助手。

此前,百度的智能音箱已经传出要搭载AIGC能力,讯飞星火大模型一经发布就直接应用到了其学习机硬件产品上,让学生用户可以直接与学习机英文聊天。

在推出智能随身眼镜前,天猫精灵也已经在4月份公开首个接入千问大模型的智能硬件demo。

过去市场上出现过的所有智能化硬件终端,都可以“再造一遍”。

音箱、耳机、汽车、手机,甚至所有的智能家居,都可以通过搭载语音助手实现“AIGC化”。

国盛证券说智能助理/AI伙伴或将是下一个超级应用,丝毫不夸张。

只不过,更进一步看,在诸多智能终端中,并不是所有产品都能快速凸显。

那些承袭“可穿戴设备”概念的随身终端们,借AIGC,或将率先落地展现出新的价值。

三大条件齐备,大模型再造智能终端

一个AIGC智能终端的落地,无非看三个方面:

产品属性是不是契合AIGC、能碰撞出最大价值,这直接决定市场接受度;

技术是不是能够跟上,这决定产品功能品质;

赛道是不是有强烈的动因去融合AIGC,这决定长远的商业化深度。

而以智能随身眼镜为代表的随身终端,在诸多智能终端中,当下无疑更贴合这些要求。

1、产品属性:声音带来更直接的价值落地

在漫威电影《钢铁侠》中,AI管家贾维斯帮助钢铁侠管理大大小小的事务。

这一设定被众多电影沿用,几乎每个科幻片,都能看到一个形影不离的设备陪伴在主角身边,提供各种帮助,甚至不执行任务只是单纯“接受倾诉”。

OpenAI的创始成员Andrej Karpathy也曾表示,他要创立一个“贾维斯”。

声音交互+全能+随身,成为“贾维斯”们共同的特点。

在所有智能终端设备中,因为种种限制,声音交互成为最常用、最便捷、最直接产生AIGC价值的方式。

而“随身”又让这种价值实现变得更加高频,让“助手”价值与日常生活更加紧密贴合。

毕竟,人们的活动范围总是在变,但随身设备一直在身边。

可以看到,虽然天猫精灵的智能随身眼镜在产品形式上更像是AR眼镜,但至少在当下,它本质上还是走的声音交互+随身的路子,是一个被“科幻化”方式隐藏的耳机。

国盛证券在其报告中也认为,在户外、旅途或者需要私密性的场景,最合适的语音智能载体是耳机,“因为人类物理条件限制,耳机在未来可见维度内都是优质入口。”

上班“摸鱼”,开会帮助录音记录会议纪要,逛街帮忙寻找吃喝玩乐好地方,甚至深夜接受倾诉、成为社恐用户的好朋友……

天猫精灵试图打造的,就是科幻片中那个形影不离的生活与工作伙伴。

2、技术供给:全链条技术已经储备完成

在每一个大模型产品的发布会现场,正常的演示过程往往都是输入文字然后AIGC创作一个答案呈现出来。

这就带来一个问题:当AIGC进入随身终端,需要声音交互的时候,除了大模型本身的能力,还需要一系列技术的支持来构成技术链条:

感知阶段,ASR技术,将听到的语音转成文本输入给大模型;

决策+创造阶段,NLP(即大模型本体),接受信息后创造内容输出;

表达阶段,TTS技术,将文本转化成自然流畅的语音传递给用户。

对智能随身眼镜来说,这还没完,要带来私密的声场,还需要配合精密的骨传导技术。

只有具备一系列技术储备的玩家,才有资格上桌,这里没有什么黑马的机会。

天猫精灵的智能随身眼镜,一方面需要搭载千问大模型的场景化应用,另一方面也离不开这些年来依靠智能音箱在ASR、NLP、TTS技术上的长期积累。

作为一款创新产品,其背后的新工程技术研发也值得关注。

比如这次用到的骨传导技术采用了所谓“振子专利技术”,优化了骨传导发声装置的连接模式,让振动响应更加稳定、更小噪音、更低失真。

而且,植入

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册