互联网资讯 / 人工智能 · 2024年1月25日

ChatGPT:探究谷歌Bard的真实实力

先笑一下,谷歌自己开发的人工智能工具,居然主张分拆谷歌阻止垄断?在反垄断的问题上,谷歌刚刚开放公测的生成式AI BaRd相当地大义灭亲。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

BaRd公测姗姗来迟

本周二,谷歌宣布生成式AI BaRd推出Beta测试版,逐步分批向注册的公众开放测试。但目前只面向美国和英国用户开放公测,而且暂时只支持英语。其他地区与语言的用户,需要等待BaRd的后续更新。

谷歌有着横跨诸多领域的漫长产品线,但BaRd无疑是近年来最受关注也是最为重要的新品,更直接关系到未来几年谷歌的竞争力和市场前景。尽管谷歌2月初就已经公开展示BaRd,但并没有开放公测,而是只向谷歌员工以及少数受邀的可信测试者开放内测。

2月初谷歌在展示BaRd的过程中,出现了一个事实性错误(对韦伯天文望远镜的基础知识介绍错误)。尽管这个小错误相当专业,只有天文爱好者才能发现,但却依然拖累谷歌母公司股价大跌8%,一天时间市值蒸发了1000亿美元。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

或许因为这个前车之鉴,谷歌高层对BaRd的公测保持着非常谨慎的态度。在在开放公测之后,谷歌CEO皮查伊周二向员工发布内部备忘录称,“我们已经采取了负责的态度进行研发,包括邀请了不同背景和立场的1万名可信人士进行测试,我们也欢迎所有的反馈,从中学习,不断迭代和改善。”

看起来,皮查伊是在给BaRd可能的纰漏打预防针。“即便在所有这些进展之后,我们依然处在漫长AI征途的起步阶段。随着越来越多的人开始使用BaRd和测试性能,他们会给我带来惊奇,可能会出现问题。”

谷歌也在淡化生成式AI对自己搜索业务的冲击,强调BaRd并不是搜索引擎的取代产品,而是一个补充辅助。值得一提的是,BaRd是单独的网页对话框,而不是作为谷歌搜索工具,但在回答之后会提供一个谷歌搜索按键。

ChapGPT施加重压

过去三个多月,科技行业最火的产品无疑是ChatGPT。OpenAI打造的这款生成式AI产品发布之后火遍全球,让用户感受到了前所未有的智能体验,更直接带动了下一个科技风口,甚至卷到中国互联网创投圈。

互联网巨头微软不断加码战略投资OpenAI,将其牢牢绑在自己的AzuRe云平台上,在ChatGPT大火之后顺势接入自己的办公组件以及必应搜索,将AI定为自己产品的核心竞争力,又一次向占据搜索市场主导地位的谷歌发起冲击。

这股ChatGPT热潮的背后,最尴尬的莫过于行业巨头谷歌。尽管谷歌早在2015年就开始研发生成式AI,在2021年就发布了对话应用语言模式LAMDA,但一直在内部稳步研发。

去年6月,一位谷歌AI工程师号称LAMDA已经具有人类情感,虽然谷歌很快就将他调离工作岗位,但此事被媒体曝光之后,还是引发了不小的争议和猜测,更让谷歌对AI安全性保持谨慎,不愿仓促推出。

ChatGPT去年发布之后,AI项目负责人迪恩在内部会议上表示,虽然谷歌也有类似的AI工具,但目前技术还不成熟,如果过于仓促推出产品,可能会影响谷歌的声誉,因为用户非常相信谷歌提供的信息。

然而,谷歌现在却不得不加快研发步伐,追赶竞争对手的产品。这并不是谷歌习惯的节奏。去年12月,谷歌将生成式AI的产品级别提升到最高的红色,协调公司内部AI研发资源,加快推出自己的应对产品。

实际上,谷歌在BaRd的推进步伐上左右为难。如果研发动作迟缓,外界会担忧谷歌的竞争实力和行业前景,拖累股价低迷不振;但如果推进过于仓促,外界更会对BaRd出现的纰漏感到失望,打压股价跌跌不休。这或许是皮查伊在BaRd公测时频频打预防针的主要原因。

实时联网最大优势

BaRd的实际使用表现如何呢?

相比ChatGPT,BaRd的最大优势是巨大的信息资源,他们可以依托谷歌的搜索工具获取最新信息,根据自己的梳理给出答案。此前ChatGPT的训练数据最新只到2021年,无法回答2022年之后的信息咨询。此外,BaRd的回复速度也明显快于ChatGPT。

BaRd可以联网搜索信息,意味着用户可以直接询问今天的体育比赛比分、股价价格走势、系列新闻动态。不过在实际测试中,我发现BaRd还是存在着时间差,还没有做到完全实时。

但相对于ChatGPT的训练数据库,谷歌BaRd的联网能力还是有着明显的优势,他们可以就最新事件给出自己的回答。当我询问美国前总统特朗普近期可能在纽约被起诉以及硅谷银行倒闭的情况时,BaRd都给出了简单但是比较完整的事件梳理与总结。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

帮助用户提供航班酒店订餐信息,对谷歌来说本就是分内之事。但BaRd也会出现信息偏差。我周二要求BaRd为自己定一张从加州圣何塞到北卡夏洛特飞行时间最短的机票时,BaRd居然给出了一个完全错误的航班号。而当我周四再次询问BaRd的时候,发现谷歌已经纠正了这个错误,给出了正确的航班号。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

不过就在今天,OpenAI宣布通过认证安全的第三方插件,让ChatGPT在受控环境下接入实时信息,解决此前无法联网的最大痛点。第一批插件主要来自Expedia、InstacaRt、ShopITy、Slack等服务平台,帮助用户获得生活以及协作类信息。这意味着ChatGPT也可以提供订餐订票,也可以检索公司文件和笔记信息。

大义灭亲分拆谷歌

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

做数学题、讲个笑话、写首情诗,这些对话操作对ChatGPT已经是小菜一碟,在BaRd这里也是不在话下。在这些指令方面,BaRd并没有太大的问题,甚至还能提供不同文本选择。BaRd也允许用户复制文本。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

在工作辅助方面,BaRd同样也可以完成日常任务,帮助用户写商业邮件和简单文章,也可以做表格、做笔记、做分析,不过需要将文件上传到Google DRive。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

虽然BaRd网页端提供语音输入,但实际并无法使用;虽然BaRd号称支持多种语言翻译,但实际使用却表示自己暂时无法完成指令。这些细节都表明BaRd依然是个半成品,还需要后续完善。

ChatGPT阴影之下的谷歌Bard实测:珠玉在前

个人不懂编程,无法亲身体验ChatGPT和BaRd在编程能力方面的差别。但从身边程序员朋友的反馈来看,ChatGPT在这方面似乎更了解他们的需求,也不会帮助他们编程,“BaRd不给码农需要的黑底语法高亮。在Python问题的回答质量也比ChatGPT差远了。”

BaRd是有自己观点输出的。谷歌发言人在开放公测后表示,BaRd这样的大语言模型(LLM)是根据公开内容进行训练的,他们会反映出对具体的政治人物、名人以及其他公众人物的正面或负面看法,甚至会在回答中给出对争议社会或政治问题的某些方面的观点。

不过,BaRd很多时候并不显示信息源,因此准确性需要用户自行判断。换一个角度来看,用户并不清楚BaRd是如何得出结论的,也存在被谷歌的算法误导而轻信其结论立场的可能。在美国社会严重割裂的情况下,这一点很可能会引发保守派的质疑。

有趣的是,当一位测试者询问BaRd怎么看待美国司法部对谷歌的反垄断诉讼时,BaRd居然立场鲜明地选择了“大义灭亲”。BaRd义正言辞地指责“谷歌收购竞争对手,施压网站使用其工具,对其广告交易进行限制。这些措施损害了消费者,扼杀了数字广告市场的创新。我希望法庭认可司法部的诉求,下令谷歌采取措施打破垄断。”看起来,BaRd并没有因为谷歌出品,就给予母公司特殊待遇,谷歌在最敏感的反垄断问题上,也没有干预BaRd的看法。

AI军备竞赛升级

或许,如果BaRd是去年年底先发布的生成式AI,那么BaRd的表现足以引发一片赞叹,或许也会带动一波行业热潮。但BaRd的公测时间比ChatGPT晚了整整四个月,在经历过此前体验ChatGPT的诸多惊喜之后,的确很难对BaRd有新鲜感。BaRd暂时还不支持其它语言,也不支持图片,不会编程,国际市场用户也不知道何时可以使用。

就在谷歌发布BaRd公测版之前,OpenAI和微软已经掀起了新一波的AI军备竞赛。OpenAI前几天刚刚发布了新一代大型多模态模型GPT-4,接受图像和文本输入,提供文本输出,并接受了更多数据的训练(基于微软AzuRe平台),在模型文件中拥有更多的权重。用OpenAI的话来说,GPT-4已经在各种专业和学术基

OpenMagic API

Need more than content? Move into the product flow.

If you are here for model access, pricing, developer docs, or the future API console, the dedicated product path now lives on api.openmagic.ai.

登录免费注册