首页 >> 热点资讯

OpenAI被判侵犯版权,示范性意义几何?

2025-11-15 热点资讯 3 作者:zk520

德国慕尼黑一家地方法院11月11日宣判,OpenAI未经许可将音乐家创作的歌词用于模型训练,构成著作权侵权。

过去三年里,版权权利人与大模型公司之间的诉讼在世界各地接连不断但又悬而未决。慕尼黑这起案件的出炉,被外界视为具有示范性意义。

2024年11月,著作权集体管理组织——德国音乐演出和作品复制权协会(GEMA)提起了这起诉讼。案件涉及九位德国音乐家的热门歌曲。

原告指控称,这些歌词被OpenAI的大模型记忆后,当使用者输入简单提示词时,ChatGPT基本上会原样再现歌词。

OpenAI的反驳依据是,其开发的大模型并不存储或复制特定的训练数据,而仅在参数中反映了基于整个训练数据集所学到的内容。由于模型输出是用户输入的结果,因此应由各个用户而非被告对输出的内容负责。

OpenAI还援引版权法上的“文本与数据挖掘例外”作为辩护理由。这项例外由欧盟和德国当地法律创设:如果权利人没有在线上以机器可读格式的声明拒绝,可合法地对版权内容进行文本与数据挖掘使用。

对于OpenAI的说法,法院并不认同:无论是语言模型训练时对版权内容的“记忆”,还是聊天机器人在输出结果中复现歌词,均构成对著作权的侵害。

审理法院认为,当在模型训练过程中不仅从数据集中提取了信息,还在训练后形成的参数中包含了训练数据的完整复制时,就存在这种“记忆化”。通过将训练数据中包含的歌词与输出中的再现进行比对,确认了这种“记忆化”的存在。考虑到歌词的复杂性和长度,可以排除偶然因素导致其复现的可能性。这种“记忆化”构成著作权法上的复制,即争议歌词以数据形式固定在模型的参数中

按照法院的解释,虽然大模型原则上属于“文本与数据挖掘例外”的适用范围,但该规定仅涵盖数据集准备阶段进行的必要提取行为,例如将作品转换为另一种格式。背后的理念在于,这类提取仅仅是为了后续分析,不会影响到版权人的经济利益

然而,如果像OpenAI这起案件那般,不仅从训练数据中提取信息,而且复制了作品,法院则认为这并非可被豁免责任的“文本与数据挖掘”行为。这是因为,“文本与数据挖掘例外”的前提是,仅在作者利益未受损的前提下允许为分析目的进行的信息提取,而模型中的复制行为却实质损害了作品的经济利用,侵犯了权利人的正当利益。

针对模型输出相似的歌词文本,法院认为该行为构成未经授权的复制与公开传播。由于输出结果仅由简单的提示词生成,OpenAI的模型本身对输出内容有决定性影响,因此,应由OpenAI而非用户承担侵权责任。

OpenAI将因侵权行为承担赔偿责任,但法院并未具体说明赔偿金额。GEMA的法律顾问Kai Welp表示,预计将与OpenAI等就合适的许可费用进行谈判。

GEMA在一份公开声明中称,这是欧洲首次对生成式AI使用受版权保护的作品进行法律评估,并作出有利于创作者的裁决。

这起判决暂未生效,OpenAI仍可以上诉。OpenAI对外回应称:“不同意这一裁决,正在考虑下一步措施。该裁决仅涉及部分歌词,不会影响德国数百万每天使用我们技术的个人、企业和开发者。”

另一起由GEMA起诉AI音乐公司Suno的诉讼,目前正在慕尼黑地方法院审理。该案预计于2026年1月26日开庭审理。

OpenAI在美国也面临大量来自作家、新闻媒体等发起的版权侵权诉讼。今年4月,包括纽约时报起诉OpenAI在内的十余起类似案件被合并处理,交由美国纽约南区联邦地区法院统一审理,以消除重复取证,实现更高效审理,防止出现互相矛盾的裁决。在这些案件中,OpenAI通常援引“合理使用”的法律规定,作为未经同意使用版权内容的正当化依据。

采写:南都N视频记者 杨柳

tags:

关于我们

最火推荐

小编推荐

联系我们


Copyright 梦网.Some Rights Reserved.