GPT-5.2考赢人类 OpenAI警告：大模型能力已过剩，AGI天花板不是AI - AI - JQman

Just Quick Just Quality

热门话题

白天

搜索

/

/

资讯

/

/

GPT-5.2考赢人类 OpenAI警告：大模型能力已过剩，AGI天花板不是AI

18 小时前

近日，OpenAI的GPT-5.2在ARC-AGI-2基准测试中表现超越人类基线水平，准确率达75%，刷新纪录。ARC-AGI-2是评估AI抽象、归纳和迁移推理能力的重要基准，不依赖记忆或模式匹配，要求AI具备真正的推理能力。GPT-5.2通过优化软件架构，而非单纯增加算力，实现了性能提升。然而，大模型在实际应用中仍面临挑战，如用户体验不佳、任务执行不精准等。OpenAI前首席科学家Ilya Sutskever指出，当前模型存在“高分低能”现象，即在基准测试中表现优异，但在真实场景中泛化能力不足。这一“性能悖论”反映了AI技术在应用层面的不足，模型设计需更好理解用户需求，确保与实际工作场景结合。

上一篇：xAI员工竟用Claude写代码？这回Anthropic反手拔了马斯克的网线

下一篇：OpenAI与软银SB Energy携手，投5亿扩数据中心

2 天前

比亚迪2025年在日本卖出3870辆

2 天前

穷人福音，MIT研究：不用堆显卡，抄顶级模型作业就成

1 天前

2025，蔚小理的“生死时速”

2 天前

DeepSeek 把R1论文又更新了60多页，V4呼之欲出了吧

2 天前

破千亿，MiniMax 也创造了属于自己的时刻

1 天前

半导体市场2026年将继续上演内存争夺战

1 天前

特斯拉，被一只“手”卡住脖子

2 天前

一人作弊，全组“连坐”拒稿， ICML最狠新规，华人大佬挂帅严查

2 天前

他投了MiniMax天使轮

3 天前

100美金一小时的私教，正被AI硬件批量替代｜硬氪直击CES

上一篇：xAI员工竟用Claude写代码？这回Anthropic反手拔了马斯克的网线

下一篇：OpenAI与软银SB Energy携手，投5亿扩数据中心

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们