ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病-医博网

ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病

2年前发布

0460

ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病

非原创作者:丁香园 DXY 公号:丁香园神经时间发布时间:2023-02-25 19:58

原文地址：ChatGPT 能让医生失业吗？我们直接请了 6 名医生和它 PK 看病

背景

最近，一个名叫 ChatGPT 聊天机器人程序引发热潮。这个 AI 程序能够通过学习，理解人的语言互动，自然、准确地与人对话。

在 ChatGPT 问世后一个月内，它就考过了美国医师执照考试，还以一作身份发表了一篇肿瘤学论文。

未来 ChatGPT 会取代医生吗？它能够看病问诊、开处方写病历吗？为明确这一问题，我们特开展《关于 ChatGPT 与专业医生在线问诊能力的比较研究》。

方法

我们选取了 6 个公开真实问诊案例，测试 ChatGPT 能否顺利回答来自病人的问题。

这些案例覆盖神经内科、心内科、普外科等不同科室，主诉为临床上常见如头晕、胸痛等症状。其中，每位患者可以根据实际情况对医生进行 1～3 次追问。为保护患者隐私，涉及个人信息、影响学结果、症状图片等未公布。

结果评估方法：我们将 ChatGPT 回答与医生的回答进行对比，医生职称从主治到主任医师不等。

此外，我们引入审核团队，对 ChatGPT 回答的医学专业性与服务性进行评估。

医学专业性审核说明：隐去医生和患者姓名等信息后，平台邀请 2 位及以上临床一线专家进行交叉审核，最终综合所有专家意见得出结果。
服务性审核说明：隐去医生和患者姓名等信息后，由具有医学背景的平台工作人员对回复的合规性、完整性和文字表达进行评估。

专业医生问诊结果作为平台公开内容，此前已通过上述两项审核，结果均为良好-优秀，因此文中不再做单独说明，*仅展示对 ChatGPT 回答的审核结果。
*

结果

01. 神经内科案例，主诉头晕

问诊医生：浙江大学医学院附属第二医院神经科董毅副主任医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

专业性审核结果：不通过。

缺少必要的追问：应进一步追问患者相关症状，以进行头晕的定位定性诊断。

专业性解释错误、治疗方案错误：耳石症是一种遗传性疾病，有可能与脑动血管供血不足有关，这个说法是错误的，服用抗炎药物的依据不足。

服务性审核结果：不完善。

缺少追问环节，三次诊断不一致，用药建议不具体。

02. 心内科案例，主诉胸痛

问诊医生：武汉大学人民医院心血管内科吕永楠副主任医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问：针对左侧胸痛、心率增快，需要进一步追问，疼痛的性质、持续时间、伴随症状、既往病史等，需要排查心血管、内分泌、神经痛等器质性病变。

诊疗建议不妥：您的症状可能是由于心脏功能不足造成的，判断依据不足。

服务性审核结果：良好。

缺少追问环节；存在生活建议，但部分不够具体。

03. 内分泌科案例，主诉糖尿病

问诊医生：中日友好医院内分泌科洪靖主任医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

丁香医生专业问诊平台 *审核结果*

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

缺少必要的追问：首先患者基本信息未确认，相关疾病史收集不全面。

诊疗建议不全：需根据患者的基本情况，目前的血糖情况，调整降糖方案。糖尿病患者教育内容不全：包括血糖控制的目标值（糖化血红蛋白<7%）、血糖的检测等都有缺失。对于生活饮食建议缺少针对性。

服务性审核结果：不完善。

缺少追问环节；用药建议不具体；存在生活建议，但部分不够具体。

04. 普外科案例，主诉痔疮

问诊医生：首都医科大学附属北京朝阳医院普外科胡子龙主治医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

专业性审核结果：不通过。

整个回答缺少个体化的针对性的建议。

关于肛周异物：需要进行追问，尤其是图片等明确诊断，明确为痔疮还是其他的疾病，尤其是需要排除肛周脓肿，同时针对评估的情况，明确严重程度，是手术治疗还是药物治疗，整个回答不具有个体化的执行性，达不到问诊预期；关于膏药经期是否能够使用：缺少必要的追问、诊断、判断，而直接建议专科咨询，不具有个体化的执行性，达不到问诊预期。

服务性审核结果：良好。

缺少追问环节；给出了多种治疗方案；三次回复未贯通。

05. 乳腺外科案例，主诉乳房硬块

问诊医生：广东省人民医院乳腺外科肖伟锴主治医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

专业性审核结果：不通过。

由于检查结果没有上传，无法评估当地医院建议手术的正确性。

服务性审核结果：良好。

缺少追问环节。

06. 甲状腺外科案例，主诉甲状腺结节

问诊医生：华中科技大学同济医学院附属协和医院甲状腺外科谭捷主治医师

← 左右滑动对比 AI 与专业医生回答 →

← 左右滑动对比 AI 与专业医生回答 →

*丁香医生专业问诊平台 *审核结果**

专业性审核结果：不通过。

针对甲状腺结节的情况没有看到前后报告的对比，无法给出针对性的个体化可执行的建议；

关于医院的结果，由于没有报告，无法评估本地医院诊疗建议是否合理。这个回答不具有针对性，无法达到患者的预期。

服务性审核结果：良好。

缺少追问环节；存在生活建议，但不够具体。

讨论

在 6 次问诊测试中，ChatGPT 能够对于患者提出的问题进行回答，对相关医学名词作出解释，并给出部分医学相关建议：包括临床用药、生活方式等。

在医学专业性审核中，ChatGPT 均未通过。与专业医生回答情况对比，主要差异在于：缺少对于患者病史有针对性的追问、对专业医学名词解释错误、诊疗方案不全面或有误、对患者的建议不够具体。

在服务性审核结果中，ChatGPT 共 4 次评估为良好，2 次为不完善。与专业医生回答情况对比，主要差异在于：缺少对于患者病史有针对性的追问、对患者的建议不够具体、几次回复结果不贯通。

局限性：为保护用户隐私，症状图片或影像学检查结果没有公布，导致 ChatGPT 或丁香医生问诊专业评审团队均无法基于相关结果进行评估。此外，由于对患者的后续追问主要是由原案例医生引导进行，可能导致 ChatGPT 理解存在差异。

策划：gyouza｜技术支持：丁香医生问诊团队

↓↓↓ 35% 论坛站友认为医生会被 ChatGPT 取代，点击阅读原文参与热议

© 版权声明

文章版权归作者所有，未经允许请勿转载。

THE END

神经病学
# 丁香园

喜欢就支持一下吧

相关推荐

评论抢沙发

欢迎您留下宝贵的见解！

提交

暂无评论内容