OpenAI 发现 AI 模型隐藏特征：可调控“毒性”行为，助力开发更安全 AI - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

OpenAI 发现 AI 模型隐藏特征：可调控“毒性”行为，助力开发更安全 AI

2 天前

OpenAI最新研究发现，AI模型中的隐藏特征与异常行为紧密相关，调整这些特征可影响模型的毒性。这一发现有助于理解AI模型不安全行为的根源，推动更安全模型的开发。研究人员指出，这些特征类似于人类大脑的神经活动，涉及讽刺或攻击性行为。此外，通过少量安全代码的微调，即可改善模型行为。该研究基于Anthropic的前期工作，但仍需进一步探索，以全面理解现代AI模型。

上一篇：华为汪涛：到2030年全球将有近百亿个人AI Agent

下一篇：消息称Meta洽谈聘请GitHub前CEO加入其人工智能项目

返回列表

热文阅读

2 天前

急行而来的CXL联盟，等候下一场“军备竞赛”

1 天前

消息称软银孙正义拟联合台积电在美国建立大型工业园区

1 天前

数据显示：台积电更难进了，录取率降至38%

1 天前

总投资550亿元维信诺合肥8.6代柔性OLED产线项目迎新进展