2025年9月18日,在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0正式发布。该版本数据量达120GB,扩大了优质中文网站数据来源,强化了违法不良信息过滤,可为大规模语言模型训练及人工智能技术发展提供中文数据支撑。