新智元报道
编辑:编辑部
【新智元导读】GPT-5,震撼登场!距离22年11月的ChatGPT,再到23年3月的GPT-4,GPT-5竟隔了两年半之久。这次的深夜直播,国内有数万吃瓜群众在线观看。至少按OpenAI的说法,他们离AGI又近了一步。
全球用户瞩目中,GPT-5终于震撼登场了!
OpenAI用一个多小时的超长发布会,全方位展示了GPT-5的炸裂性能。
奥特曼领衔,出场人数众多,华人依旧耀眼
正值每周7亿人使用ChatGPT之际,GPT-5重磅发布了。它是对GPT-4的一次重大升级,更是标志着OpenAI在实现AGI道路上的一个重要里程碑。
OpenAI介绍说,这是我们迄今为止最优秀的AI系统,智能远超之前的所有模型,在编码、数学、写作、健康、视觉感知上都性能卓越。
这个统一的系统,包含一个能够解答大多数问题的智能高效模型、一个能够解决更复杂问题的更深层次的推理模型(GPT-5 Thinking),以及一个实时路由器。
而GPT-5、GPT-5-mini、GPT-5-nano等多版本的分层推出,意味着OpenAI正在主动构建一个以GPT-5为底层核心的通用智能操作系统。
从现在开始,GPT-5将成为ChatGPT中的默认模型,GPT-4o、o3、o4-mini、GPT-4.1和GPT-4.5都将被它取代。
与此同时,所有Plus、Pro、Team和Free用户,都可以使用GPT-5了。
如果你花钱订阅,就可以无限制访问GPT-5和GPT-5 Pro,而免费用户在达到使用限制后,会转换到GPT-5 mini。
直播后,LMArena不装了,摊牌了:GPT-5再创历史纪录,OpenAI重回AI王座!
在文本、Web开发和视觉领域排名第一
在硬提示、编程、数学、创造力、长查询等方面排名第一
在代号「summit」的测试下,GPT-5目前持有最高的竞技场分数
首测GPT-5编程写作,太顶了
在多个跨学科的学术评估中,GPT-5都超越了其他主流模型。
首先,GPT-5是最好的编码模型,在SWEBench上直接刷新了历史最高分,这表明它在现实工程场景中性能超强。
在Aider Polyglot上,它也表现强大,证明了自己的多种编程语言能力。
在MMMU上,它也刷新了纪录;甚至在AIME 2025(美国高中数学竞赛)中,它不仅远超以往模型,还接近甚至超过许多人类选手的表现。
而OpenAI这次着重强调的,就是GPT-5在真实世界中的表现——克服幻觉!把准确性和可靠性,都放在了最高优先级。
因此,他们专门构建了一套评估机制,结果显示:GPT-5是目前最可靠、最真实、最可信的模型,显著减少了错误与幻觉。
比如在健康咨询中,GPT-5的表现就尤其出色。在250名医生参与设计的临床场景评估中,它成为最值得信赖的「健康顾问级」模型。
而且,这个口袋博士团队级的模型,将免费向专业用户推出,可以连接所有工具。
GPT-5一上线,我们立即开启了一波全面的实测,不得不说,其在编程、写作领域强到离谱。
首先是,小哥想要学习法语的网站,GPT-5能够完美复刻。