大量新闻网站屏蔽网站时光机保存快照 原因是被AI抓取训练模型
1 天前

据WIRED报道,美国多家主流新闻网站开始屏蔽互联网档案馆的“时光机”(Wayback Machine)快照功能,禁止其抓取和存档页面内容,包括《USA Today》《纽约时报》等23家主流新闻网站,以及社交平台Reddit。《卫报》则通过限制API访问和过滤文章的方式限制存档。这些网站采取限制措施的主要原因是,担忧AI公司利用存档数据训练模型,违反版权法并形成竞争。出版商与AI公司正围绕数据使用的合法性激烈博弈,美国已有超百起AI版权诉讼聚焦这一问题。“时光机”作为公益性数字存档工具,已存档超一万亿个网页,若持续失去主流新闻来源访问权,其存档工作将受损,早期数字历史记录可能遗失,同时也不利于新闻业监督和司法体系证据引用。