软件巨头Adobe近日陷入一场拟议的集体诉讼。俄勒冈州作家伊丽莎白·里昂代表受影响的作者群体提起诉讼,指控Adobe在开发其小型语言模型SlimLM时,使用了包含其作品的盗版书籍数据集进行预训练。SlimLM依赖的开源数据集SlimPajama-627B,被指包含约19.1万本未经授权的电子书,即“Books3”子集。此前,Meta、苹果及Anthropic等公司也因使用含Books3内容的数据集而陷入法律纠纷。SlimLM旨在优化移动设备上的文档辅助任务,但此次指控揭示了其技术底层可能存在的合规隐患。Adobe尚未对此事作出正式评论。随着监管趋严,训练数据的合规性正成为科技行业法律博弈的关键转折点。
