GPT-5.2降智遭全网差评 OpenAI仍未摆脱被动局面
1 天前

2025年12月,OpenAI发布GPT-5.2系列模型,包括Instant、Thinking和Pro三个版本,旨在应对谷歌Gemini 3 Pro的竞争。GPT-5.2在多个基准测试中表现优异,尤其在专业知识型工作任务中,GPT-5.2 Thinking在70.9%的任务上胜过或打平行业专家,生成速度超人类专家11倍,成本不到1%。在数学、代码、长文档处理、视觉能力等方面,GPT-5.2也均有显著提升,幻觉率比前代减少38%。尽管GPT-5.2在多项测试中刷新纪录,但谷歌Gemini 3 Pro在部分基准测试中仍保持领先,如Humanity’s Last Exam测试中得分46.4%。OpenAI称GPT-5.2为迄今最强模型,专为创造经济价值设计,但能否夺回市场领导地位尚需时间验证。