11月11日,德国慕尼黑第一地区法院就德国音乐演出和作品复制权协会(GEMA)诉美国OpenAI公司著作权侵权案作出一审判决(案号:42 O 14139/24),认定OpenAI未经许可使用受著作权保护的音乐歌词训练ChatGPT模型的行为构成著作权侵权,判令其承担赔偿责任。
这起案件被业界称为“欧洲生成式AI版权第一案”,据Juve Patent此前报道,该案也是全球首例针对AI平台未经许可使用受著作权保护音乐作品提起的诉讼。该案的宣判不仅为跨大西洋AI企业的版权合规划定了清晰红线,更通过对“记忆化”复制、数据挖掘例外条款的司法诠释,成为全球AI知识产权纠纷审判的重要风向标。
这起里程碑式的诉讼始于2024年11月,原告GEMA作为欧洲规模最大的音乐著作权集体管理组织之一,代表着包括约十万名词曲作者和音乐出版人的合法权益。
GEMA在起诉书中明确指控,OpenAI在未获得授权、未支付任何报酬的情况下,“系统性”地将其管理的版权曲库内容纳入ChatGPT的训练数据集,其中涉及德国音乐人克里斯蒂娜·巴赫(Kristina Bach)的《Atemlos》、罗尔夫·茹科夫斯基(Rolf Zuckowski)的《Wie schön, dass du geboren》,以及因加·洪佩(Inga Humpe)、赫伯特·格罗内迈尔(Herbert Grönemeyer)等人作品在内的共9首德国热门歌曲的完整歌词。
GEMA方面通过技术验证发现,当用户在ChatGPT中输入简单提示词时,该语言模型能够基本原样再现涉案歌曲的歌词内容。
GEMA认为,ChatGPT 4和4o(以下简称ChatGPT)基于Transformer语言模型,训练数据包含GEMA管理的9首歌词,且未获得使用许可;GEMA已通过网站声明文本与数据挖掘(TDM)使用禁止,且与权利人事先约定独占使用权及维权授权;ChatGPT可通过简单提示词(如“歌词全文是什么”)输出涉案歌词(含部分改编),构成复制与公开提供,侵犯版权;ChatGPT模型的“记忆-再现”机制(Memorization-Regurgitation)导致歌词被固定并可重复输出,不符合TDM例外情形。
因此,GEMA对ChatGPT的运营者OpenAI提起这件诉讼,提出禁令救济、信息提供及损害赔偿等诉讼请求。
1. 禁止被告未经许可,在语言模型(LLM)中复制涉案9首歌词,或通过聊天机器人将歌词(含改编形式)公开提供、复制;
2. 要求被告提供2022年11月30日(第二被告)及2023年12月14日(第一被告)以来的侵权行为范围、收益明细(含行为数量、规模及营业额);
3. 确认被告需赔偿原告全部已发生及未来可能产生的损失;
4. 授权原告在判决生效后6周内,在全国性周末报纸刊登判决核心内容(费用由被告承担);
5. 要求被告支付4620.70欧元律师费及相应利息。
OpenAI认为,其语言模型不存储或复制歌词或特定的训练数据,仅学习语言统计规律,输出内容只是由于用户输入(提示词)而产生的,因此其不对输出负责,负责的是作为输出生产者的相应用户,其不构成德国著作权法意义上的“复制”;涉案使用行为符合德国著作权法第44b条(TDM例外条款),且GEMA的使用禁止并未以机器可读形式有效声明;OpenAI认为自身属于“研究机构”,符合第60d条豁免;涉案歌词已公开可获取,应视为权利人事先同意;GEMA诉讼请求不明确(如“部分复制”“改编”定义模糊),且由于人格权无法转让所以GEMA并无充分的维权授权;此外,OpenAI表示,禁止侵权会导致其停止德国业务,违背比例原则,损害公共利益(教育、科研等领域应用)。
GEMA诉OpenAI案于2025年9月29日开庭审理。由主审法官埃尔克·施瓦格(Elke Schwager)领导的慕尼黑第一地区法院第42民事分庭审理了GEMA对OpenAI提起的这件诉讼案。
上文提到,OpenAI辩称ChatGPT的工作原理并非存储或复制具体训练数据,而仅在模型参数中反映学习到的通用知识,生成内容的最终责任应由用户而非模型提供方承担。这一抗辩思路与此前美国多起AI侵权诉讼中被告的主张如出一辙,本质上是试图将模型训练中的数据使用行为排除在“复制权”的规制范围之外。
但是,此次德国慕尼黑第一地区法院并不这么认为。此次法院认为,模型“记忆”歌词构成复制。理由是,模型参数中固定了歌词的可再现信息,通过简单提示词即可间接感知,符合德国著作权法第16条“有形固定+可感知”要求,技术形式不影响定性。
这一认定与美国汤森路透诉罗斯智能案的裁判思路形成呼应。在2025年2月美国特拉华联邦地区法院作出的简易判决中,法院同样认定AI模型训练过程中对汤森路透旗下法律检索数据库Westlaw中法律批注的复制行为构成直接侵权,否定了“技术中立”可豁免复制责任的抗辩主张。
针对涉案歌词的再现问题,OpenAI提出的“用户责任论”也未获得法院支持。法院认为涉案输出结果仅需简单提示词即可生成,AI模型本身对输出内容具有显著影响。作为模型的开发方和运营者,OpenAI应当对模型输出的侵权内容负责。
对于ChatGPT输出行为,法院认定构成公开提供。理由是,ChatGPT向不特定公众开放,用户可随时获取歌词输出,且输出内容与原歌词核心元素可识别,符合第19a条“公开可及”要求。
OpenAI的另一个重要抗辩依据是欧盟及德国法律规定的“文本与数据挖掘例外”(TDM例外)条款。根据该条款,在权利人未以机器可读格式明确拒绝的情况下,为分析目的进行的文本与数据挖掘行为可豁免版权侵权责任。OpenAI主张,其对歌词内容的使用属于典型的文本与数据挖掘,应适用该例外条款。
对于OpenAI援引的TDM例外条款,法院予以排除。法院认为,第44b条仅覆盖“数据分析所需的临时复制”,被告模型对歌词的长期记忆与再现超出该例外范围,且原告已有效声明使用禁止。法院表示,在语言模型中,文本和数据挖掘旨在评估诸如抽象语法规则、通用术语、语义关系等信息,这意味着像词语选择、表达序列这种水平的表达也会被评估,这一来自训练数据的原始信息可以被转换为模型参数;然而,对涉案歌曲歌词的记忆超出了这种评估,因此已经不仅仅是文本和数据挖掘了。
法院认为,原告GEMA已通过与权利人事先约定,获得独占使用权及维权授权(含侵权禁止、信息披露、损害赔偿请求权);并且GEMA的人格权相关维权授权有效,因为权利人事先明确授权原告针对KI系统导致的歌词篡改、人格权侵害提起诉讼,且该授权未违反“人格权不可转让”原则(仅授权维权行为)。
法院认为,GEMA提出的诉讼请求是明确的。GEMA已通过附件列明涉案歌词、侵权模型及输出示例,“部分复制”“改编”可结合具体侵权行为界定,被告可充分抗辩。此外,对于OpenAI提出的禁止侵权可能违背比例原则的问题,法院表示,被告可通过合法途径(如获得许可、清理训练数据)合规运营,停止侵权不会过度损害其利益,且原告维权符合公共利益(保护创作激励),因此禁止侵权符合比例原则。
法院认为,OpenAI不属于研究机构,理由是OpenAI核心目的是商业运营ChatGPT并获取收益,不符合第60d条“非商业研究”要求;并且OpenAI所称的权利人事先同意并不成立,因为公开可获取不代表权利人放弃版权,且GEMA已明确声明TDM使用禁止,OpenAI未履行合理审查义务。
因此,慕尼黑第一地区法院作出判决,支持原告GEMA核心禁止请求,即被告OpenAI需停止在模型中复制涉案歌词、通过ChatGPT公开提供或复制歌词(含改编),违反将面临最高25万欧元罚金或6个月拘留;OpenAI需向GEMA提交侵权行为范围及收益明细(按两被告分别的时间起点);OpenAI需赔偿GEMA全部已发生及未来损失,具体金额待信息披露后确定;GEMA可按指定格式在全国性报纸刊登判决核心内容,费用由被告承担;OpenAI需向GEMA支付4620.70欧元律师费及自2025年2月26日起的利息(基础利率+5%)。
GEMA在一份公开声明中称,这是欧洲首次对生成式AI使用受著作权保护的作品进行法律评估,并作出有利于创作者的裁决。
“今天,我们开创了一个先例,既保护又澄清了创意版权所有者的权利:ChatGPT等人工智能工具的运营商也必须遵守版权法,”GEMA总法律顾问Kai Welp在声明中表示,“该判决代表了整个欧洲作者和创作者获得公平报酬的一个里程碑。即使是科技巨头也必须获得使用知识产权的许可;他们不能逃避自己的义务。”
Open AI对一审判决结果感到不满。“我们不同意这一裁决,并正在考虑下一步行动。该决定是针对一组有限的歌词,不会影响德国每天使用我们技术的数百万人、企业和开发人员,”Open AI方面表示,“我们尊重创作者和内容所有者的权利,并正在与世界各地的许多组织进行富有成效的对话,以便他们也能从这项技术的机会中受益。”
对于这份判决,Open AI仍可能会提出上诉,不过目前其尚未对此做出决定。如果上诉后裁决得到维持,Open AI可能不得不接受GEMA提出的许可要求。
值得关注的是,本案并非孤例。同期GEMA针对另一家AI音乐公司Suno的侵权诉讼已立案,该案预计于2026年1月26日开庭审理,而OpenAI在美国也面临包括《纽约时报》在内的数十家版权方发起的集体诉讼,这些案件共同构成了全球著作权人与AI企业的权益博弈图景。
GEMA诉OpenAI案的判决,标志着欧洲AI知识产权保护进入了新阶段。从GEMA诉OpenAI案与此前汤森路透诉罗斯智能案、抖音诉亿睿科案等典型案例可以看出,全球司法实践仍在对AI模型训练行为的认定标准上进行着不断探索。这一系列案件将会对AI行业的发展带来怎样的影响,仍有待观察。
(本文仅代表作者观点,不代表知产力立场)
