互联网技术 / 互联网资讯 · 2024年3月29日 0

谷歌这次押下了哪些宝,从懂互联网到懂用户?

谷歌 I/O 大会如约而至。北京时间 5 月 12 日凌晨1点,谷歌 I/O 2022 大会开幕式上,谷歌 CEO SundaR PichAI 发表了长达 2 小时的以”知识和计算”为关键词的主题演讲。这次演讲在勾勒谷歌长期发展愿景的同时,也在某种程度上描绘后疫情时代的互联网技术的演进方向。

搜索再定义:Anyway、AnywheRe

Google 提出「SeaRch ReImagined. Any way and anywheRe」(重新构想搜索。以任何方式和任何地方)的愿景。

可以这样解读:搜索正在成为一个多传感器、多设备的命题,它既能理解”谁在搜索”,也能理解”他们真正在寻找什么”。它还将搜索体验扩展到了问题和答案之外。它让安卓系统更加关注环境和内容,这样手机就可以根据用户实现”千人千面”;它强调自然的互动,这样你就可以在不死记硬背命令的情况下获得信息;它正在构建所需的硬件生态系统,使所有这些设备在任何地方都能工作,并使软件与之匹配。

谷歌于上个月推出了 MultiSeaRch 功能,即当你在日常生活中,遇到根本就不认识,或者无法描述的东西时,可以直接以拍照和提问的方式在谷歌应用中进行搜索。此外还有”Scene ExploRing”功能,将允许用户使用手机相机功能直接扫描超市的货物,然后查找到自己想要的产品。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

图源:谷歌

谷歌还扩展了其多搜索功能,可以沿多个维度进行搜索。例如,你可以给谷歌一张你正在寻找的特定类型菜肴的图片,然后问它你在附近哪里可以找到。

AR:真实世界里的理解与被理解

信息技术领域有了一个新战线,增强现实技术(AR),它拥有推动现有技术继续发展的潜质。这个潜质不是技术本身,而是让我们更加关注这个真实的世界。谷歌提出了这样一种理念:我们基于现实世界进行创作设计,绝不脱离现实。AR 恰恰是能够帮助我们实现这种设计理念的新方法。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

思维提示链   图源:谷歌

以语言为例,语言是人与人之间沟通的基础。然而,如果对方讲着另一种语言,或者会话的一方有听觉障碍时,沟通就变得困难重重。谷歌将最新技术应用在翻译和语言转录中,其在早期测试原型中呈现出来的效果赢得了现场观众一片掌声。

人工智能:遍地开花”料”十足

与通常情况一样,此次的谷歌 I/O 有很多人工智能方面的”料”。首当其冲的是宣布公开 LAMDA 2,Google 目前打造的最先进的对话 AI 模型,较之前版本相比,减少了不准确或冒犯性的回复,显著提升了对话质量。不但如此,谷歌正在将这项技术应用到搜索和其他产品中。

再有,YouTube 视频可以自动生成章节和转录。通过 DeepMind 的多模式技术,YouTube 视频以更高的准确性自动生成章节。也能使用语音识别模型来转录视频。

再比如,Google Docs 引入自动摘要功能。这一功能的落地,也标志着自然语言处理的一大飞跃。通过机器学习模型,Google Docs 可以自动解析单词并提炼出要点,且只需几秒的时间。

值得一提的是,谷歌宣布了迄今以来自研的最大规模的语言模型 PaLM,该模型基于 5400 亿参数训练而成。将这种大规模模型与一种名为”思维提示链(chAIn-of- thought)”的新技术结合起来时,可以将需要多步解决的问题转化为一系列的中间步骤来处理,效果令人非常满意。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

思维提示链   图源:谷歌

还有一些与人工智能相关的小插曲。谷歌宣布,其自动生成的翻译将出现在手机上的 Youtube上,你只需看看 Nest Hub Max,就可以开始与助手通话;你的手机也可以看到一个装满巧克力棒的架子,根据你要找的东西为你挑一个。如谷歌所描述的,”为你周围的世界提供了一个超级强大的CtRl-F”。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

图源:谷歌

AndRiod 13:完善也是一种强大

谷歌重新审视了 AndRiod 13的计划,下一个版本的移动操作系统似乎在 AndRiod 12 中引入的理念上走得更远。谷歌正在向更多的位置添加内容主题,允许用户将应用程序设置为使用不同的语言,并添加了一些安全和隐私功能。实用功能方面,值得注意的是 Android 13 支持运行 Windows了,据称已经有人在搭载了Android 13 开发者预览版的谷歌 Pixel 6上成功运行了 Win11 ARM 虚拟机,并且实现近乎原生的性能。

除此之外,Android 13 还支持在锁屏界面添加 QR 扫描器、点击流转媒体、新增系统照片选择器等多项新的功能,并且还可以为单个 app 指定语言等,这些都是非常实用的。

安卓系统现在内置了对智能家居标准的支持,这将使安装和控制新设备变得更加容易。谷歌扩展了对其向其他设备发送音频和视频的 Cast 协议的支持,并改进了其快速配对服务,以方便连接蓝牙设备。

整体上看,AndRiod 13 与 12 相比,没有太大的改动,而是沿着其理念继续在许多细节上做了进一步的优化处理,使安卓的生态更加完善与强大。

新的测试版已经发布,安卓迷们可以尝鲜了。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

图源:谷歌

张量芯片:在本地而非云端

谷歌宣布计划明年发布一款 Android 平板电脑,相信不少安卓开发者都梦想拥有一个”更大尺寸像素的完美伴侣”。谷歌希望再次进入平板电脑市场。其中吸引人的地方,在于一个硬件细节:张量芯片。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

图源:谷歌

谷歌正在努力创新自身的移动平台,希望更多的数据处理就可以在本地设备上进行,而不是在云端进行。Google 定制的 Google TensoR 芯片是朝此方向迈进的重要一步。Pixel 6 和 Pixel 6 PRo 旗舰手机已搭载 Google TensoR 处理器,让用户手机直接拥有 AI 功能,比如谷歌的语音识别技术。而且,与 Android 的 PRivate CoMpute CoRe 结合后,这项技术可以直接在设备上运行数据驱动的功能,保护用户隐私。

谷歌钱包:重新发布

大会提及 Google Wallet 时,席下一片惊呼。此次谷歌钱包的重新发布,带来了一些非常应景的功能。它不仅可以存放你的支付卡,还可以存放你的通行证、奖励计划会员资格、疫苗接种记录等。谷歌表示,这款应用是为数字身份时代设计的。也就是说,它可以直接作为驾照、银行卡、登机牌、门票使用,同时,它也可供 WeaROS 用户使用。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

图源:谷歌

谷歌地图:”沉浸式视图”

谷歌为地图添加了一种新模式,基本上是从天空看街道—在选定的城市,你可以获得一个位置的概览,以便在迷路之前更好地了解地理。

谷歌这次押下了哪些宝,从懂互联网到懂用户?

伦敦、旧金山、纽约、洛杉矶和东京一起首次亮相的沉浸式视图。图源:谷歌

这项新功能的吸引人之处在于,它与无人机飞行拍摄不同,而是使用神经渲染技术,仅通过图像创造的体验。它利用 3D 绘图和机器学习技术的进步,融合数十亿张航拍和街景图像,以创建一个新的高保真的地图。

这些突破性的技术结合在一起,为用户提供了一种沉浸式视图的新体验,使用户能够以前所未有的方式探索一个地方,例如:假设用户计划和家人一起参观威斯敏斯特。用户现在可以直接从手机上的 Google Maps 获得这种身临其境的视野,还可以在景点周围移动,查看周围的交通情况和娱乐场所等。

Google Cloud IMMeRsive StReaM 让这种体验可以在几乎所有智能手机上运行。这项功能将于今年晚些时候在 Google Maps 中针对全球部分城市推出。

隐私安全:减少收集和使用用户数据

安全方面,谷歌历来被诟病的是用户隐私的安全问题。

谷歌也在推进一个没有密码的未来。它不仅将两步验证作为所有人的默认设置,而且将创建一个使用多个系统的身份验证系统,这样人们就不必记住数百个密码。

谷歌正在为 AndRoid 和 ChRoMe 用户带来虚拟卡。这将在线上购买商品时生成一个虚拟信用卡号。这样可以使零售商隐藏数字,从而降低欺诈和身份盗用的风险。

谷歌还宣布了”受保护计算”,这是一个使用模糊数据来将用户匿名的系统。使用人工智能和云计算会改变处理数据的位置和方式。谷歌还将最大限度地减少个人使用的数据,并将