同花顺 Logo
AIME助手
问财助手
美国医学会旗下期刊:现阶段 AI 难以直接应用于临床决策,早期诊断错误率达到 80%中性
2026-04-17 19:02:17
来源:IT之家
分享

IT之家 4 月 17 日消息,美国医学会旗下期刊 JAMA Network Open 发文,透露业界现有的大型语言模型(LLMs)在临床推理方面仍存在明显短板,尤其是在早期的鉴别诊断阶段,错误率普遍超过 80%。

IT之家参考论文获悉,研究团队利用 29 个标准化临床案例对 GPT-5、Claude 4.5 Opus、Gemini 3、Grok 4 等 21 款主流大模型进行评测,模拟完整医疗决策流程,覆盖鉴别诊断、检查选择、最终诊断、治疗管理及其他临床推理五个阶段。

结果显示,各大模型整体表现存在一定差异,同时在不同诊疗阶段呈现出明显不均衡。具体来看,AI 在“最终诊断”和“治疗管理”环节的准确率相对较高,“检查选择”和其他推理能力处于中等水平,而在最早期的“鉴别诊断”阶段表现最差,错误率普遍超过 80%,也就是模型通常会误判病人的具体疾病。

进一步分析认为,AI 更擅长在信息相对完整的情况下给出答案,但在信息不足、需要逐步推理的早期阶段,往往容易过早收敛到单一结论,导致当前 AI 难以直接应用于临床决策。相比之下,临床医生通常会在初期保留多种可能性,并随着检查结果和信息积累不断修正判断,最终定论患者的具体疾病。

免责声明:风险提示:本文内容仅供参考,不代表同花顺观点。同花顺各类信息服务基于人工智能算法,如有出入请以证监会指定上市公司信息披露平台为准。如有投资者据此操作,风险自担,同花顺对此不承担任何责任。
homeBack返回首页
不良信息举报与个人信息保护咨询专线:10100571违法和不良信息涉企侵权举报涉算法推荐举报专区涉青少年不良信息举报专区

浙江同花顺互联信息技术有限公司版权所有

网站备案号:浙ICP备18032105号-4
证券投资咨询服务提供:浙江同花顺云软件有限公司 (中国证监会核发证书编号:ZX0050)
AIME
举报举报
反馈反馈