羊城晚报-用已出版书籍训练AI，在美国合法化？

用已出版书籍训练AI，在美国合法化？ ——将为技术创新与知识产权保护的平衡确立新判例 2025年06月27日浩源

　　近日，美国联邦法院作出了两项具有里程碑意义的裁决——Meta与Anthropic两家AI巨头在版权诉讼中双双胜诉，法官明确认定，其使用书籍训练 AI模型的行为属于“合理使用”。这一判决为深陷版权争议的AI行业的技术创新与知识产权保护的平衡确立了新判例。

　　这意味着，无需原作者同意，AI可以用已出版书籍作为训练数据了。在最新判决书中，美国联邦法院裁决允许Anthropic公司在未经作者许可的情况下，使用合法购买的已出版书籍训练AI。法院表示，他们是参考了美国版权法中的“合理使用”原则，认为AI训练属于“转化性使用”，即对原作品的新用途未取代原作市场，且有利于技术创新和公共利益。同时，将文字材料转化为“变革性技术”——AI模型的训练过程“并非简单复制”，而是“通过数据学习生成全新的智能能力”。法官特别指出：“原告未能证明这种技术创新对原作市场构成实质性损害。”

　　尽管整个审判过程中，法官表示将另案审理案件中是否存在数字盗版书籍的指控，但此次裁决已为AI企业的训练数据获取方式开辟了新的法律通道。

　　相关报道中称，Meta与Anthropic两家AI公司的胜诉，其核心逻辑均围绕 “变革性使用” 展开。Meta的律师团强调，AI模型对文本的训练是“从数百万数据点中提取抽象知识”，而非直接利用原作表达形式，这种创新符合版权法鼓励技术进步的立法精神。Anthropic 则以“手动扫描实体书”的合规操作作为辩护重点，证明其在数据获取环节的审慎态度。

　　不过，法官也特别警示：“本次裁决不代表所有未经授权的版权材料使用均属合法。”这意味着，AI企业仍需在数据获取环节建立更严格的合规体系。

　　业内人士指出，此次判决实质上是对“合理使用”四要素——使用目的、性质、数量及对市场的影响，进行了重新诠释，即在AI时代需要结合技术特性重新界定。

　　裁决公布后，AI板块股价应声上扬，OpenAI、谷歌等企业的训练数据采购策略可能因此调整。版权代理机构表示，将加强对数字文本的版权管理，推动建立“AI训练数据授权市场”。美国出版商协会已启动与科技公司的谈判，探讨建立标准化的版权授权机制。

　　值得关注的是，欧盟《人工智能法案》正在酝酿类似条款，但更强调“数据来源透明化”。这种跨法域的法律差异，可能促使大型AI企业建立分区合规体系。随着更多同类案件进入司法程序，此次判决确立的“变革性使用”标准，或将成为全球AI版权争议的重要参照。

　　这是美国联邦法院首次认可AI公司对书籍的使用权，保护人工智能公司在使用受版权保护的文本训练数据模型时不受限制，大大降低了AI训练数据的版权风险。对此，有部分网友表示：“既然人类读书并加以理解是毫无争议的，那AI读书并理解也应该合理。”这显然带来争议：AI可以和人类一概而论吗？未来创作者又该如何保护他们的知识？对此，也有网友表示：“别高兴得太早，这场战斗还远没结束。”

　　（浩源）