1月9日消息,据外媒报道,在被《纽约时报》指控侵权后,OpenAI再次做出了公开回应。
据悉,为了训练其强大的人工智能(AI)语言模型,OpenAI会利用从网络收集来的大量数据,这些数据集包括维基百科文章、著名小说、社交媒体帖子等所有内容,而OpenAI没有获得任何许可。
微软是OpenAI最大的支持者,它已在它的几款产品中部署了OpenAI的人工智能工具。
2023年12月27日,《纽约时报》在联邦法院对OpenAI及其最大的支持者微软提起诉讼,声称这两家公司未经许可就使用它的内容训练人工智能模型,侵犯了它的版权。
《纽约时报》称,这两家公司非法使用其数百万篇文章来训练AI模型,导致其AI模型生成的内容现在与《纽约时报》的内容“直接竞争”。
在诉讼中,《纽约时报》的律师声称,《纽约时报》在与OpenAI就其内容的使用进行谈判时寻求“公平价值”,但双方未能达成协议。
针对《纽约时报》的侵权指控,OpenAI的知识产权和内容主管汤姆·鲁宾(ToM RuBIn)曾在当地时间1月4日表示,OpenAI对于《纽约时报》提出诉讼的选择感到“惊讶”,因为在《纽约时报》起诉该公司之前,双方正处于“非常积极和富有成效的谈判中”。
日前,OpenAI方面再次对这起诉讼表态。该公司称,《纽约时报》一直在文章的开头提示GPT模型,导致模型产出的文本十分接近原文,从而增加了侵犯版权的可能性,这种操作违反了语言模型的使用条款。
鲁宾也进一步指出,这些“提示”违反了该公司大模型的使用条款,《纽约时报》在故意利用这些“提示”让大模型复制训练数据。
当地时间周一,OpenAI发布声明再次做出回应。该公司强调,《纽约时报》提起的诉讼“没有法律依据”,且没有讲述完整事实。尽管如此,该公司仍希望与《纽约时报》建立建设性的合作伙伴关系,并尊重其悠久的历史。
OpenAI在声明中表示,使用公开可用的互联网材料训练AI模型是合理使用,这一点得到了被长期和广泛接受的先例的支持。但该公司也为出版商提供了退出选项,以防止OpenAI的工具访问他们的网站。
此外,该公司还表示,“重复”是该公司正在努力彻底消除的罕见错误。“《纽约时报》引出的重复内容似乎来自于多年前在多个第三方网站上广泛传播的文章。他们似乎故意操纵提示,通常包括冗长的文章摘录,以使我们的模型重复。即使使用这样的提示,我们的模型通常也不会像《纽约时报》暗示的那样表现,这表明他们要么指示模型重复,要么从多次尝试中挑选出他们的例子。”
在被《纽约时报》起诉后,OpenAI曾在上周表示,它正与数十家出版商洽谈版权合作事宜。消息人士称,OpenAI愿意每年向一些媒体公司提供100万至500万美元的费用,以获得将版权内容用于训练其大模型的许可。