ChatGPT 能让医生失业吗?我们直接请了 6 名医生和它 PK 看病

ChatGPT 能让医生失业吗?我们直接请了 6 名医生和它 PK 看病

非原创 作者:丁香园 DXY 公号:丁香园神经时间 发布时间:2023-02-25 19:58

原文地址:ChatGPT 能让医生失业吗?我们直接请了 6 名医生和它 PK 看病

背景

最近,一个名叫 ChatGPT 聊天机器人程序引发热潮。这个 AI 程序能够通过学习,理解人的语言互动,自然、准确地与人对话。

在 ChatGPT 问世后一个月内,它就考过了美国医师执照考试,还以一作身份发表了一篇肿瘤学论文。

未来 ChatGPT 会取代医生吗?它能够看病问诊、开处方写病历吗?为明确这一问题,我们特开展《关于 ChatGPT 与专业医生在线问诊能力的比较研究》。

方法

我们选取了 6 个公开真实问诊案例,测试 ChatGPT 能否顺利回答来自病人的问题。

这些案例覆盖神经内科、心内科、普外科等不同科室,主诉为临床上常见如头晕、胸痛等症状。其中,每位患者可以根据实际情况对医生进行 1~3 次追问。为保护患者隐私,涉及个人信息、影响学结果、症状图片等未公布。

结果评估方法:我们将 ChatGPT 回答与医生的回答进行对比,医生职称从主治到主任医师不等。

此外,我们引入审核团队,对 ChatGPT 回答的医学专业性与服务性进行评估。

  • 医学专业性审核说明:隐去医生和患者姓名等信息后,平台邀请 2 位及以上临床一线专家进行交叉审核,最终综合所有专家意见得出结果。

  • 服务性审核说明:隐去医生和患者姓名等信息后,由具有医学背景的平台工作人员对回复的合规性、完整性和文字表达进行评估。

专业医生问诊结果作为平台公开内容,此前已通过上述两项审核,结果均为良好-优秀,因此文中不再做单独说明,*仅展示对 ChatGPT 回答的审核结果。
*

结果

01.  神经内科案例,主诉头晕

问诊医生:浙江大学医学院附属第二医院神经科 董毅 副主任医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

  • 专业性审核结果:不通过。

缺少必要的追问:应进一步追问患者相关症状,以进行头晕的定位定性诊断。

专业性解释错误、治疗方案错误:耳石症是一种遗传性疾病,有可能与脑动血管供血不足有关,这个说法是错误的,服用抗炎药物的依据不足。

  • 服务性审核结果:不完善。

缺少追问环节,三次诊断不一致,用药建议不具体。

02.  心内科案例,主诉胸痛

问诊医生:武汉大学人民医院心血管内科 吕永楠 副主任医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

  • 专业性审核结果:不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问:针对左侧胸痛、心率增快,需要进一步追问,疼痛的性质、持续时间、伴随症状、既往病史等,需要排查心血管、内分泌、神经痛等器质性病变。

诊疗建议不妥:您的症状可能是由于心脏功能不足造成的,判断依据不足。

  • 服务性审核结果:良好。

缺少追问环节;存在生活建议,但部分不够具体。

03.  内分泌科案例,主诉糖尿病

问诊医生:中日友好医院内分泌科 洪靖 主任医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

  • 专业性审核结果:不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问:首先患者基本信息未确认,相关疾病史收集不全面。

诊疗建议不全:需根据患者的基本情况,目前的血糖情况,调整降糖方案。糖尿病患者教育内容不全:包括血糖控制的目标值(糖化血红蛋白<7%)、血糖的检测等都有缺失。对于生活饮食建议缺少针对性。

  • 服务性审核结果:不完善。

缺少追问环节;用药建议不具体;存在生活建议,但部分不够具体。

04.  普外科案例,主诉痔疮

问诊医生:首都医科大学附属北京朝阳医院普外科 胡子龙 主治医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

  • 专业性审核结果:不通过。

整个回答缺少个体化的针对性的建议。

关于肛周异物:需要进行追问,尤其是图片等明确诊断,明确为痔疮还是其他的疾病,尤其是需要排除肛周脓肿,同时针对评估的情况,明确严重程度,是手术治疗还是药物治疗,整个回答不具有个体化的执行性,达不到问诊预期;关于膏药经期是否能够使用:缺少必要的追问、诊断、判断,而直接建议专科咨询,不具有个体化的执行性,达不到问诊预期。

  • 服务性审核结果:良好。

缺少追问环节;给出了多种治疗方案;三次回复未贯通。

05.  乳腺外科案例,主诉乳房硬块

问诊医生:广东省人民医院乳腺外科 肖伟锴 主治医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

  • 专业性审核结果:不通过。

由于检查结果没有上传,无法评估当地医院建议手术的正确性。

  • 服务性审核结果:良好。

缺少追问环节。

06.  甲状腺外科案例,主诉甲状腺结节

问诊医生:华中科技大学同济医学院附属协和医院甲状腺外科 谭捷 主治医师

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

[]

[]

[]

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

  • 专业性审核结果:不通过。

针对甲状腺结节的情况没有看到前后报告的对比,无法给出针对性的个体化可执行的建议;

关于医院的结果,由于没有报告,无法评估本地医院诊疗建议是否合理。这个回答不具有针对性,无法达到患者的预期。

  • 服务性审核结果:良好。

缺少追问环节;存在生活建议,但不够具体。

讨论

在 6 次问诊测试中,ChatGPT 能够对于患者提出的问题进行回答,对相关医学名词作出解释,并给出部分医学相关建议:包括临床用药、生活方式等。

在医学专业性审核中,ChatGPT 均未通过。与专业医生回答情况对比,主要差异在于:缺少对于患者病史有针对性的追问、对专业医学名词解释错误、诊疗方案不全面或有误、对患者的建议不够具体。

在服务性审核结果中,ChatGPT 共 4 次评估为良好,2 次为不完善。与专业医生回答情况对比,主要差异在于:缺少对于患者病史有针对性的追问、对患者的建议不够具体、几次回复结果不贯通。

局限性:为保护用户隐私,症状图片或影像学检查结果没有公布,导致 ChatGPT 或丁香医生问诊专业评审团队均无法基于相关结果进行评估。此外,由于对患者的后续追问主要是由原案例医生引导进行,可能导致 ChatGPT 理解存在差异。

策划:gyouza|技术支持:丁香医生问诊团队

↓↓↓ 35% 论坛站友认为医生会被 ChatGPT 取代,点击阅读原文参与热议

本博客上的所有内容,除非特别说明,均为原创。对于非原创内容,我们已经尽最大努力标明作者和来源。这些内容的分享是出于教育、学术或研究的目的,并且不涉及任何商业利益。如果您是版权持有者,并且不希望您的作品在本博客上被分享,请与我们联系,我们将立即删除相关内容。谢谢您的理解和支持。
(0)
eason的头像eason
上一篇 2023 年 2 月 25 日 03:58
下一篇 2023 年 2 月 27 日 03:58

相关推荐

  • 配液用糖加入胰岛素「兑冲」是否合理?如何计算用量?

    配液用糖加入胰岛素「兑冲」是否合理?如何计算用量? 非原创 作者:陈文飞 公号:丁香园神经时间 发布时间:2023-04-23 19:58 发表于浙江 原文地址:配液用糖加入胰岛素「兑冲」是否合理?如何计算用量? 当糖尿病患者需要用到的药物不能用氯化钠注射液配制时,如胺碘酮、硝普钠等,常需加入胰岛素「兑冲」,这种用药方式有何依据?又该如何计算用量? 1 糖尿…

    神经病学 2023 年 4 月 24 日
    4100
  • 为什么总有患者吃「阿司匹林、氯吡格雷」抗栓效果不好?

    为什么总有患者吃「阿司匹林、氯吡格雷」抗栓效果不好? 非原创 作者:吴川杰 公号:丁香园神经时间 发布时间:2023-07-21 19:58 发表于浙江 原文地址:为什么总有患者吃「阿司匹林、氯吡格雷」抗栓效果不好? 血小板的激活、粘附和聚集,进而激活凝血,导致血栓形成,是脑梗死等缺血性脑血管疾病发病的关键病理生理环节。 目前临床中,阿司匹林、氯吡格雷等抗血…

    2023 年 7 月 22 日
    7800
  • 神经影像 10 大征象,你能秒杀几个?

    神经影像 10 大征象,你能秒杀几个? 非原创 公号:丁香园神经时间 发布时间:2023-11-20 19:58 发表于浙江 原文地址:神经影像 10 大征象,你能秒杀几个? 一、小试牛刀 你能迅速秒杀下面这个征象吗? 图源 | 丁香公开课课程 《神经科基本功:颅脑解剖与影像异常》 二、灵魂 3 问 这是什么征象?常见于哪些疾病?主要由什么原因引起? 回答如…

    2023 年 11 月 21 日
    2900
  • 血糖 0.7 mmol/L,头颅 MR 出现典型征象,最后死亡

    血糖 0.7 mmol/L,头颅 MR 出现典型征象,最后死亡 非原创 公号:丁香园神经时间 发布时间:2023-03-03 18:58 原文地址:血糖 0.7 mmol/L,头颅 MR 出现典型征象,最后死亡 感谢丁香达人 @医生胖子张 分享的病例: 患者:女,67 岁。因「意识障碍 2 小时」入院。 简要病史:患者平素居住于敬老院。4 年前发现患有 2 …

    神经病学 2023 年 3 月 4 日
    3100
  • 有人说 Meta 分析不好发了?说不定他背着你又发了好几篇呢!

    有人说 Meta 分析不好发了?说不定他背着你又发了好几篇呢! 非原创 公号:丁香园神经时间 发布时间:2023-02-21 19:58 原文地址:有人说 Meta 分析不好发了?说不定他背着你又发了好几篇呢! 扫码进入直播间⬆️⬆️⬆️** 对于没有经验也没有现成的数据,还没有经费的普通研究生或者小主治来说,想要快速发表一篇 SCI 让自己毕业或者晋升,M…

    2023 年 2 月 22 日
    3400

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信