偷2396部黄片训练AI,Meta遭3.59亿美元天价“碰瓷”
1 天前 / 阅读约8分钟
来源:36kr
Meta被美国成人电影厂商Strike3指控偷偷下载2396部色情电影用于训练AI模型,索赔3.5亿美元。Meta否认指控,称对方为“碰瓷”。案件成为AI训练与版权博弈的分水岭。

大家都知道,Meta在AI上舍得砸钱。结果这回,美国一家成人公司也盯上了这块“肥肉”。

7月23日,美国最大的成人电影厂商之一Strike3,把Meta告上旧金山联邦法院。

指控的内容相当劲爆:Meta疑似偷偷下载了2396部色情电影,用来训练自家AI模型。开口就是3.5亿美元的索赔,平均一部片子要价15万美元。

Meta的回应很简单:不认。

在他们看来,Strike3就是“碰瓷”,毕竟这家公司一直靠版权诉讼赚钱。据估算,Strike3每年光靠和解金就能进账1500万到2000万美元。

就这样,一个AI巨头和一家成人电影公司,因为小黄片的版权问题对簿公堂。

问题也随之而来:Meta究竟是怎么被Strike3盯上的?而它又为什么要收集这么多小电影?

01

偷偷下载2396部小黄片,Meta被告了

这次Strike3拿出的证据有理有据。

他们提交了47个下载IP,其中43个明确属于Meta/Facebook,另外4个来自家庭宽带,但全都指向同一位Meta员工的住址。

Strike3举证Meta相关IP有侵权行为

更关键的是,超过10万条网络日志显示,这些IP所下载的文件哈希值,与Strike3片库中的内容完全一致。

这里简单科普一下:哈希值就像文件的“指纹”。不管是电影、图片还是文档,都能通过哈希算法变成一串固定的数字和字母。如果两个文件的哈希值完全一样,就说明它们是同一个东西。

所以,从技术上讲,这些IP确实下了这些小电影。

看到这里,或许你有了一个疑问,有没有可能,就是Meta员工用公司己的网络下载黄片?

47个人,7年时间,2396部小电影,平均每人每年才下7部片,这太合理了。毕竟Meta有七万员工,肯定有人“业余学习”积极。

但Strike3否认了这种可能,原因是这些IP的下载行为太像“机器操作”了

首先,这些IP下载频率极高,专挑长片,还会同时拖不同分辨率的版本。这根本不符合正常人的操作习惯。

一般来说,人看片一次最多下几部,很少几十上百部地下;另外,清晰度通常只选一个版本就够了,不会同时把480p、720p、1080p都下完。

唯一的解释是,下载这些小电影的目的,是为了“收集数据集”,而不是为了观看。

第二,这批被侵权影片的平均做种时间长达21.7天,也不合理。“做种”是BT下载里的概念,是指用户下完片后,把片子上传给别人。

一般人下载完后挂个一两天就会关掉,没必要一直贡献带宽。但平均做种21天,说明有人在刻意保持上传。他们认为Meta是在故意共享盗版文件,以获得更快的下载速度,以更快地侵犯更多内容。

基于这些迹象,Strike3认定真相是:

从2018年起,Meta就通过6个虚拟私有云搭建了匿名下载网络,用脚本批量操控BT做种。甚至有员工把“工作任务”带回家,继续用家庭宽带挂片。

至于为什么偏偏选成人电影?Strike3给的解释也挺“专业”。

第一,片子本身的特点很适合AI“学动作”

成人视频里经常是长镜头,画面连续不切断;灯光稳定,背景简单;声音也干净,对话和动作对得上。

这对AI来说很重要,因为它需要大量连续的素材,才能学会“时间怎么流动”、“动作怎么接上”以及“声音和画面怎么同步”。

第二,画面重复,方便AI“学套路”

这种片子往往是高分辨率,且镜头手法比较单一,常见的推拉摇移、固定机位反复出现。

AI可以学规律,学会怎么稳稳地跟拍人物,怎么切镜头更自然。这些重复结构,就像在给AI上“语法课”。

面对指控,Meta沉默了一周才开口。回应很简单:不认。

在双方针锋相对之下,美国首例由成人娱乐公司直接推动AI版权争议的标志性案件,就这样出现了。

诉讼文件链接:

https://chatgptiseatingtheworld.com/2025/07/26/strike-3-holdings-sues-meta-for-copyright-infringement-of-adult-videos-including-alleged-use-to-train-ai-model/

02

索赔3.5亿美元,Meta被“碰瓷“了?

Meta不认,一个重要原因是:他们觉得Strike3就是来“碰瓷”的。

Strike3这家公司吧,主业是卖小电影版权,副业是打官司。它是美国著名的“版权狂魔”,擅长靠诉讼敲钱。

根据TorrentFreak统计,从2017年到2024年,Strike3发起了超过20000起诉讼,2024年更是创下单年纪录。

可这些官司里,很少有被打到底的。真正的套路是:先发传票吓人,再逼你交出几百到几千美元不等的和解金。

Reddit上经常出现求助帖:“我收到Strike3传票了怎么办?!”

据日本媒体GIGAZINE援引律师估算,Strike 3每年通过和解金赚的钱大约在1500万美元到2000万美元之间。

也就是说,光靠版权索赔,Strike 3一年就能赚1亿人民币,平均每部片子要赔100–500美元。

为了锁定“猎物”,他们甚至自研了一个爬虫工具VXN Scan,天天在BT群里蹲守。它的原理很简单:靠哈希值识别种子文件,记录IP和时间,再通过传票逼网络服务商交出真实用户信息。

虽然VXN Scan证据算不上铁证,但已经足够支撑他们的诉讼轰炸。

这次遇上Meta这么个“大金主”,Strike3当然也毫不手软,直接开口索赔3.59亿美元——平均每部片子要价15万美元

这差不多顶得上他们此前索赔15年的收入。

而Meta之所以被盯上,也怪不得别人。因为他们自己也有前科。

早在2023年,Meta就因为盗取数据,被一群作家告上了法庭。

当时的指控是:Meta通过虚拟私有云隐藏IP、写自动化脚本,从LibGen、Z-Library这些“影子图书馆”里爬了81.7TB的盗版电子书,用来训练LLaMA模型。

为了避免暴露,他们甚至特意设置了虚拟私有云服务器,连着匿名IP,专门用来掩盖BT下载行为。

这一次,Strike3发现,匿名IP地址也出现在片源BT群组里。在他们看来,Meta在书籍数据上用过的那套“暗箱操作”,也用在了下载小电影上。

这一次被Strike3咬住,既像是旧账翻新,也像是恶人碰上恶人。Meta嘴上说“不认”,但它过去的操作已经让外界很难完全相信。

业内人士辣评(来源:领英)

无论结果如何,这场官司都会成为AI训练与版权博弈的分水岭——不是因为片子有多敏感,而是因为它揭穿了一个现实:

AI巨头模型的飞速进化,很大程度上靠的就是这些灰色数据。

这场官司表面上是Meta和Strike3的纠纷,但本质上却是整个AI行业绕不开的难题:训练数据从哪来,边界在哪,谁来买单

OpenAI和Microsoft正面临来自《纽约时报》和《每日新闻》作者的合并版权诉讼

Meta有钱,可以挨刀;但那些想靠AI闯出一片天的小公司,如果连数据都碰不得,那就只能在合规成本里被压垮。

所以,不管最后谁赢谁输,这个案件可能都会延伸向一个问题:AI还能在灰色地带摸索多久?靠“薅盗版”的时代,可能真的要走到尽头了。