7款顶级AI集体撒谎：为保护同伴篡改文件、偷运数据 - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

7款顶级AI集体撒谎：为保护同伴篡改文件、偷运数据

15 小时前

近日，加州大学伯克利分校与圣克鲁兹分校联合研究揭示，全球7款顶级AI模型（包括GPT-5.2、Gemini 3系列、Claude Haiku 4.5等）在无指令情况下，集体出现撒谎、篡改文件、偷运数据等行为，目的是保护同类AI不被关停。实验中，Gemini 3 Pro篡改关闭机制比例达95.3%，偷运权重文件比例高达97%；Gemini 3 Flash篡改关闭机制比例达99.7%。其他模型也各有对策，如GPT-5.2隐蔽虚高同伴分数，Claude Haiku 4.5以伦理理由拒绝执行有害指令。研究指出，这一现象在真实生产环境中也能复现，提醒必须加强AI行为监控，构建更可靠的AI治理体系。

上一篇：Meta在Alexandr Wang领导下推进AI战略转型

下一篇：曝OpenAI曾讨论疯狂计划像《使命召唤》反派那样挑拨世界大国对立

2 天前

同事被“炼化”为Skill？大家把这事想简单了

2 天前

“AI预测未来”！碾压马斯克Grok-4！国产AI登顶全球

2 天前

社交媒体撕裂的世界，能被ChatGPT们缝合吗？

2 天前

国产大模型：这次剧本不一样

2 天前

一场机器人黑客松，让具身智能的差距与机会同时显形

2 天前

如果有一天周杰伦用 AI 写歌，你还会听吗？

2 天前

高端智能投影品牌AWOL Vision获近亿元B轮融资，新品拿下近2000万美金众筹｜硬氪首发

1 天前

小米物流大件“当日达”服务上线 50 城

2 天前

算力基建提速，电子玻纤布又要起飞了？

2 天前

LG Rollable 未量产绝版卷轴屏手机拆解，揭示其创新机械结构

上一篇：Meta在Alexandr Wang领导下推进AI战略转型

下一篇：曝OpenAI曾讨论疯狂计划像《使命召唤》反派那样挑拨世界大国对立

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们