美国医学会旗下期刊：现阶段 AI 难以直接应用于临床决策，早期诊断错误率达到 80% - AI

Just Quick Just Quality

热门话题

白天

搜索

资讯

美国医学会旗下期刊：现阶段 AI 难以直接应用于临床决策，早期诊断错误率达到 80%

2026-04-17 / 阅读约2分钟

来源：IT之家

JAMA Network Open发文称大型语言模型在临床推理存在短板，早期鉴别诊断错误率超80%。研究对21款主流大模型评测，AI在最终诊断和治疗管理较准，早期鉴别诊断差，难以直接用于临床决策。

IT之家 4 月 17 日消息，美国医学会旗下期刊 JAMA Network Open 发文，透露业界现有的大型语言模型（LLMs）在临床推理方面仍存在明显短板，尤其是在早期的鉴别诊断阶段，错误率普遍超过 80%。

IT之家参考论文获悉，研究团队利用 29 个标准化临床案例对 GPT-5、Claude 4.5 Opus、Gemini 3、Grok 4 等 21 款主流大模型进行评测，模拟完整医疗决策流程，覆盖鉴别诊断、检查选择、最终诊断、治疗管理及其他临床推理五个阶段。

结果显示，各大模型整体表现存在一定差异，同时在不同诊疗阶段呈现出明显不均衡。具体来看，AI 在“最终诊断”和“治疗管理”环节的准确率相对较高，“检查选择”和其他推理能力处于中等水平，而在最早期的“鉴别诊断”阶段表现最差，错误率普遍超过 80%，也就是模型通常会误判病人的具体疾病。

进一步分析认为，AI 更擅长在信息相对完整的情况下给出答案，但在信息不足、需要逐步推理的早期阶段，往往容易过早收敛到单一结论，导致当前 AI 难以直接应用于临床决策。相比之下，临床医生通常会在初期保留多种可能性，并随着检查结果和信息积累不断修正判断，最终定论患者的具体疾病。

下一篇：OpenAI彻底重构Codex，长出独立鼠标，自己排班狂卷打工人

返回列表

热文阅读

2 天前

量化从不自己发声：它是放大器，不是起火点

2 天前

马斯克：特斯拉FSD会模仿你的驾驶风格越开越像自己开

2 天前

台积电：人工智能芯片需求强劲，美国厂追加投资1000亿美元

2 天前

台积电CFO回应马斯克、英特尔竞争：不会给对手任何机会

2 天前

OpenAI首款硬件是智能音箱？原因并不复杂

2 天前

特斯拉给小孩做了辆没AI的脚蹬车：200刀，卖爆了

2 天前

工信部：我国 AI 开源大模型全球累计下载量突破 100 亿次，开源鸿蒙生态设备累计超 13.5 亿台

2 天前

存储的“新鬼故事”：美国要抢钱了？

2 天前

月之暗面Kimi称算力紧缺：暂停C端新用户订阅

2 天前

日本高纯度六氟化钨缺料减产冲击？台积电回应了

下一篇：OpenAI彻底重构Codex，长出独立鼠标，自己排班狂卷打工人

Just Quick Just Quality

发现

资讯话题

热门话题

7 x 24跟踪全球科技动态

快讯

资讯

视频

关于我们