互联网资讯 · 2023年11月12日 0

多家新闻机构呼吁制定人工智能训练数据新规

据报道,多家媒体组织呼吁制定规则,保护用于训练生成人工智能模型的数据的版权。

这封公开信敦促全球立法者考虑制定法规,要求培训数据集透明并在使用数据进行培训之前征得权利人的同意。他们还要求允许媒体公司与人工智能模型运营商进行谈判,识别人工智能生成的内容,并要求人工智能公司消除其服务中的偏见和错误信息。

这封信的签署者包括法新社、欧洲新闻图片社、欧洲出版商理事会、甘尼特、盖蒂图片社、国家新闻摄影师协会、国家作家联盟、新闻媒体联盟、美联社和作家协会。

签署者表示,使用媒体内容训练的基金会模型传播信息“没有考虑原始创作者,也没有向原始创作者提供报酬或归属”。

信中说:“这种做法破坏了媒体行业的核心商业模式,而这些模式是以读者群和收视率为基础的。”“除了违反版权法之外,由此产生的影响还大大减少了媒体多样性,损害了公司投资媒体报道的财务可行性,进一步减少了公众获取高质量和可信信息的机会。”

据报道,谷歌向《纽约时报》、《华盛顿邮报》和拥有《华尔街日报》的新闻集团展示了其生成式人工智能新闻写作工具 Genesis 。其他采用生成式人工智能的新闻机构在人工智能生成的文章中发现了多个错误。

新闻机构并不是唯一担心人工智能模型在受版权保护的材料上进行训练的机构——这种做法的法律地位尚未得到检验。参议院在多次听证会上讨论了这个问题,指控生成人工智能艺术平台 Midjourney 和 Stable DiFFUSion 侵犯艺术家权利的诉讼正在法庭上审理。喜剧演员 SaRah SilveRMan 和两位作者起诉 OpenAI 涉嫌侵犯版权。

这封信的签署者指出,他们相信生成式人工智能可以为组织和公众带来重大利益,同时要求参与尊重媒体公司权利的讨论。

路透社报道称,一些签署方已经达成协议,允许人工智能公司使用他们的材料进行培训。例如,美联社允许 OpenAI 许可其部分档案,并探索使用生成式人工智能进行新闻写作。