发产品

  • 发布供应
  • 管理供应

OpenAI:如果不使用版权内容,ChatGPT 等 AI 模型不可能开发出来

   2024-08-06 0
导读

  IT之家1月10日消息,ChatGPT开发商OpenAI近日承认,像ChatGPT这样的AI工具的开发离不开受版权保护的素材,并称如果没有这些素材,这些工具根本无法诞生。据《每日电讯报》报道,OpenAI在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。  ChatGPT和图像生成器DALL-E等AI模型之所以拥有强大的能力,主要是因为它们通过海量的内容进行训练,其中一部分是从网上公开内容抓取而来,并不总是经过版权持有人的许可(OpenAI确实会获得部分训练内容的许

   IT之家1月10日消息,ChatGPT开发商OpenAI近日承认,像ChatGPT这样的AI工具的开发离不开受版权保护的素材,并称如果没有这些素材,这些工具根本无法诞生。据《每日电讯报》报道,OpenAI在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。

微信图片_20240108084835
 
  ChatGPT和图像生成器DALL-E等AI模型之所以拥有强大的能力,主要是因为它们通过海量的内容进行训练,其中一部分是从网上公开内容抓取而来,并不总是经过版权持有人的许可(OpenAI确实会获得部分训练内容的许可)。这种“自由奔放”的抓取方式在学术机器学习研究中由来已久,但随着深度学习AI模型近期走向商业化,这种做法也受到了愈加严厉的审查。
 
  OpenAI在提交给上议院的文件中写道,“由于当前版权涵盖了几乎所有形式的人类表达方式,包括博客文章、照片、论坛帖子、软件代码片段和政府文件,如果不使用受版权保护的内容,就不可能训练当今领先的人工智能模型。”
 
  OpenAI进一步表示,如果将训练数据仅限于“一个世纪前”的公共领域书籍和图画,将无法训练出“满足当代公民需求”的AI系统。
 
  IT之家注意到,去年12月《纽约时报》对OpenAI和OpenAI重要投资者微软提起诉讼,指控他们未经许可在产品中非法使用了该报的内容。OpenAI于本周一在其网站上对此案作出了回应,称该诉讼毫无根据,并重申了其对新闻业的支持以及与新闻机构的合作关系。
 
  OpenAI的辩护主要基于“合理使用”的法律原则,该原则允许在特定情况下未经所有者许可有限使用受版权保护的内容。该公司坚称,版权法并不禁止使用此类素材训练AI模型。
 
  “使用公开可获取的互联网素材训练AI模型属于合理使用,这一观点得到了长期以来广泛接受的先例的支持,”OpenAI在其周一发布的博客文章中写道,“我们认为,这一原则对创作者是公平的,对创新者是必要的,对美国的竞争力也至关重要。”
 
  这不是OpenAI第一次就其AI训练数据提出合理使用辩护。早在去年8月份,OpenAI在回应喜剧演员Sarah Silverman的版权诉讼时,同样以合理使用为由捍卫了其使用公开可获取素材的做法。OpenAI宣称,那位喜剧演员对版权范围存在“误解”,没有考虑到“合理使用”等限制和例外条款,而正是这些条款为像大型语言模型这样的前沿人工智能创新留下了必要的发展空间。
 
免责声明
• 
本文为原创作品,作者: 。欢迎转载,转载请注明原文出处:show.php?itemid=847 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们。

入驻

企业入驻成功 可尊享多重特权

入驻热线:1801-5555-345

请手机扫码访问

客服

客服热线:1801-5555-345

小程序

小程序更便捷的查找产品

为您提供专业帮买咨询服务

请用微信扫码

公众号

微信公众号,收获商机

微信扫码关注

顶部