互联网资讯 / 人工智能 · 2024年2月24日 0

OpenAI面临版权问题:非法使用图书数据训练AI系统如何应对?

据报道,两名作者在美国旧金山联邦法院起诉OpenAI,他们认为OpenAI滥用其作品,用作品训练ChatGPT。

来自美国马萨诸塞州的作家Paul TReMblay和Mona Awad说,ChatGPT未经许可从大量图书中复制提取数据,侵犯了作者的版权。

训练先进的AI系统需要用到大量数据材料,这种使用方式在法律上面临诸多挑战。比如,源代码所有者将矛头指向OpenAI和微软旗下GitHub,视觉艺术家起诉StaBIlITy AI、Midjourney和DeviantARt等AI工具。被告则认为,系统合理使用了有著作权的作品。

当用户向ChatGPT给出提示语时,AI会快速回应,虽然这种回应充满争议。ChatGPT仅仅开放两个月,1月时活跃用户便达到了1亿。

ChatGPT及其它生成式AI系统会用海量数据创造内容,很多数据来自互联网。作家Paul TReMblay和Mona Awad认为书本是关键数据材料,因为它们是高质量长文写作的典范。

诉状估计,OpenAI的训练数据包含了至少30万本图书,当中有许多是没有获得许可、非法获取的有版权图书。

两名原告称ChatGPT可以对他们写的书作出非常精准的总结,也就是说他们的书被吸纳进数据库。