5月12日消息,当地时间本周三,谷歌宣布将生成式人工智能引入搜索引擎,这可能是谷歌搜索引擎历史上最大的变化之一。但网络出版商普遍担心,全新的谷歌搜索可能会影响到他们网站的流量。
在一年一度的开发者大会上,谷歌宣布将使用人工智能模型来整合归纳互联网上的各处信息,谷歌表示,这种所谓生成式搜索体验的产品能更好响应来自用户的搜索查询。
谷歌将向一些用户展示人工智能生成的文本段落,并在搜索结果页面优先显示数个相关链接,而不是谷歌搜索结果通常显示的。
基于人工智能的新谷歌搜索正在特定用户中进行测试,目前还没有广泛使用。但不少网络出版商已经开始担心,如果这成为谷歌默认的搜索结果显示方式,会把更多用户留在谷歌网站上,从而可能会给他们网站带来更少的访问量,影响到网络出版商的收益。
这一争议也凸显出谷歌与其索引网站之间长期存在的紧张关系,人工智能新工具的出现无疑加剧了这种态势。长期以来,网络出版商一直担心谷歌会在自家网站上重新组合他们网站上的内容片段,但现在谷歌显然在使用先进的机器学习模型来“训练”人工智能,从而生成类似文本和响应结果。
专注于游戏新闻和评论内容的网站TechRapTor首席执行官拉特利奇·道格特(Rutledge DAUgette)表示,谷歌的举动根本没有考虑网络出版商的利益,谷歌的人工智能搜索相当于剽窃网站内容。
长期以来,Yelp公共政策主管路德·洛威(LutheR Lowe)一直对谷歌的搜索政策持批评态度。他说,谷歌搜索的更新是其长达数十年战略的组成部分,目的是让用户在谷歌网站上停留更长时间,而不是把他们引到最初提供信息的网站。
据密切追踪谷歌搜索引擎变化的新闻网站“搜索引擎天地”(SeaRch engine Land)透露,到目前为止,人工智能生成内容在测试中都会显示在自然搜索结果之上。此前曾有报道称,谷歌计划重新设计搜索结果页面,为的是推广人工智能生成的内容。
根据对生成式搜索体验的测试,人工智能生成内容会优先显示在谷歌搜索结果页面顶部的绿色方框中,右边有三个方框显示相关网站链接。在关于谷歌搜索结果的第一个例子中,来自三个网站的信息标题都没有显示全。
谷歌说,这些信息不是从网站上抓取的,只是用来证实链接。SeaRch engine Land表示,与谷歌的BaRd聊天机器人相比,生成式搜索体验是一种改进,也是一种“更健康”的链接方式,毕竟BaRd很少直接链接到网络出版商的网站。
一些网络出版商想知道他们是否能阻止谷歌等人工智能公司抓取他们网站上的内容来训练人工智能模型。诸如Stable DiFFUSion等人工智能公司已经面临来自数据所有者的诉讼,但如何界定人工智能抓取网络数据的行为还没有一个清晰论断。ReddIT等其他公司开始宣布计划,对访问其数据的行为收费。
IAC旗下有All RecIPe、People Magazine和DAIly Beast等多个网站。公司董事长巴里·迪勒(BaRRy DilleR)是出版界的领军人物。他在上个月的一次会议上说:“如果世界上所有的信息都能被吸进这个大锅里,然后在所谓的聊天功能中重新包装成陈述性的语句,你想要多少就有多少,那就不会有出版业了,因为这是不可能的。”
迪勒继续说道:“你所要做的就是让整个行业认可,除非能想出一个让网络出版商获得付费渠道的系统,否则就不能盗取我们的内容。”他说谷歌将面临这个问题。
迪勒表示,他认为网络出版商可以根据版权法起诉人工智能公司,目前需要重新定义“合理使用”的限制范畴。周三有报道称,以迪勒为首的一众网络出版商高管表示,“如果有必要,我们将修改版权法。”
网络出版商面临的主要挑战是如何确定他们网站上的内容正在被人工智能使用。谷歌并没有透露生成式搜索体验背后大型语言模型PaLM 2的训练来源。道格特说,虽然自己在聊天机器人BaRd上看到来自其他网站的内容被改写但没有注明归属的例子,但如果没有直接链接来源,很难判断信息是不是来自特定网站。
谷歌没有发表相关评论。谷歌研究副总裁佐宾·加赫拉马尼(ZouBIn GhahRaMani)在本周早些时候的媒体通气会上表示,“确保健康生态系统的确是我们思考如何开发产品的组成部分,创作者也是这个繁荣发展生态系统的一部分。”
道格特表示,谷歌的举动将让独立网络出版商处境艰难。
道格特说:“我认为,当很多同事被解雇时,我们不得不担心自己的辛勤工作被剽窃,这对我们行业来说真的很令人沮丧。”