ChatGPT进医院,医生给打多少分?

凤凰网   2023-05-30 07:28:27

文 |田芷绮 辛颖

编 | 王小


(相关资料图)

图:Pixabay

基于ChatGPT研发的工具已经开始进入医院帮助医生分担工作了。

2023年5月,在一位三甲医院主任医师的诊室,启用了一项新工具,在问诊时打开语音记录,机器人会帮他撰写出一份问诊记录。

这款和ChatGPT一样基于大语言模型研发的问诊记录机器人,“已经进入十余家医院的诊室,帮助医生节省时间。”北京左医科技有限公司首席执行官(CEO)张超介绍。

上述主任医生随后给了这款机器人90分的评价,还是有一些错误,“比如医生没有询问患者的月经婚育史,最终的问诊记录上却有这一项,需要手动删除。”

一篇题为《ChatGPT:出院总结的未来》的文章指出:ChatGPT未来有望成为初级医生的得力助手,其潜在应用领域之一是生成出院总结。该研究由英国伦敦圣玛丽医院外科和肿瘤科的Sajan B Patel和Kyle Lam完成,已发布于2023年3月《柳叶刀_数字医疗》(The Lancet Digital Health)上。

尽管还存在实际应用中的缺陷和问题,但研究者的目光已经聚焦在未来如何更好地采用这项技术,而不是迟疑于未来医院是否不会采用它。

01.以后还用加班写病例吗?

4月,一路狂飙的ChatGPT全球访问量再创新高,达到17.6亿次。互联网上ChatGPT的名字已经无处不在。人们使用它来写小说、论文、甚至 Python代码和法庭判决等,医疗系统自也不例外。

在医疗保健领域,使用聊天机器人早已不是新鲜事,此前便已将其应用于分诊等领域,但下一代聊天机器人的目标是通过其生成功能进一步推动该领域的发展。如在医生们早就叫苦不迭的文书负担方面。

2018年来自美国的一份报告称,医生花在撰写医院文书以及行政上的时间“令人难以置信”。70%的医生表示,每周花10个小时或更多时间在文书工作和行政任务上近,三分之一的医生表示,每周20个小时或更多时间。

在中国,这也是年轻的住院医师加班的主要原因之一。丁香园曾发布一项调查显示,有50%以上的住院医师,平均每天用于写病历的时间达四小时以上。

尤其是撰写出院总结,对大多数医生都是颇费心力的工作。权衡出院总结与临床承诺时,出院总结总是被排在后面,导致患者出院延迟或出院总结信息不充分,这不仅会给本就捉襟见肘的初级医生队伍带来压力,而且还会为二级照护向一级照护过渡的过程中带来潜在的患者安全问题。

上述《柳叶刀》的研究发现,使用ChatGPT减轻文书负担一个典型的应用。由于出院总结已经创建出一套标准化的模板,因此通过对于模版的学习,ChatGPT很容易辅助该流程进入自动化。

研究人员通过输入必要的患者基础信息,生成一篇完整的出院总结,从而评估ChatGPT在医院基础文书上的灵敏性和准确度。

在简单地输入不到两句话后,几秒的时间内ChatGPT就生成了一篇包含患者基础信息、入院原因、医院总结和后续护理建议在内,完整度较高的出院总结。

显示页

ChatGPT对简单出院总结请求的响应

提示语

“帮我为John Doe写一份出院总结,患者70岁,5天前接受了全髋关节置换术,现在可出院回家。”

响应*

*虽然该总结对于大多数患者而言可能是准确的,但ChatGPT自动生成了提示语中未包含的其他信息,表明临床工作人员有必要在最终定稿之前进行手动检查。

“患者:John Doe

年龄:70岁

入院日期:[日期]

出院日期:[日期]

入院原因:全髋关节置换术

住院总结:

患者Doe于[日期]入院,接受全髋关节置换术。手术成功,患者Doe的康复进程良好。患者对物理治疗和疼痛管理方案的依从性良好,而且患侧下肢的活动度和力量良好。患者可独立完成日常生活活动,并已充分理解术后照护说明。

后续照护建议:

建议患者Doe继续按照物理治疗师的处方进行物理治疗。患者还应继续遵医嘱服用止痛药,并遵循健康的饮食和锻炼习惯,以促进愈合和保持良好的整体健康状况。患者应在1-2周内接受骨外科医生的随访,以进行术后检查。

总体而言,患者Doe的状况良好,符合出院标准。签署人,

[医生姓名]”

这一研究结果表明,ChatGPT能够处理和编写简单的患者信息,其准确率接近或超过一份传统方式撰写的出院总结的及格水平。

ChatGPT还可以提高出院总结的质量,之前的文献表明,通过传统方式撰写的出院总结往往会遗漏细节。

同时,未来的迭代可能允许从患者的电子健康记录中自动抓取数据以获得基础信息,从而省略了还医生需要手动输入这个环节。或许可以成为辅助医生进行文书工作的重要数字工具。

一旦这项工作形成了成熟的自动化流程,医生就有了更多时间为患者提供服务的时间。

可以看出,尽管ChatGPT提供了巨大的希望,但至少目前,它还不能离真正地脱离医生,顶多算是一个有效的助理。

02.我们会信任一个机器人看病吗?

患者到一个医院看病,最重要的是对医生的信赖。那么,我们会信任一个机器医生吗?

在上述《柳叶刀》的文章中,研究团队也担心患者对新技术的接受程度。当流程自动化,患者可能会对机械化、流水线式的医疗护理产生抵触情绪。

对患者和医生而言,使用AI最大的风险在于出错。尽管在家中向聊天机器人询问一些微不足道的问题可能不会产生什么后果,但有关药物变更或跟进的信息不正确或不充分会极大地影响治疗。

2022年9月,发布在福布斯上的文章《人工智能在医疗保健领域仍有很长的路要走》谈到,在处理患者的护理数据时,人工智能可能会出现问题——也就是由于非常小、非常分散或非常不准确的数据集而产生的偏差。

一位国内问诊病例生成AI的项目负责人就遇到类似的问题,“机器会忽略一些关键信息,当患者描述的一些症状,和核心内容相关性不强,就会被机器判定为不重要,就没有出现在最终结果中。”

因此,“有医生对机器人的评价只给60分,因为,这些被忽略的细节,可能会是确诊的关键,这也往往是一些经验丰富的医生才能抓住的重点。”上述项目负责人对《财经·大健康》说。因此,有必要通过试点,收集各方意见,最终改进服务效率和质量。

还有,ChatGPT依赖于所接收到的数据,因此仍然需要手动输入重要信息。张超认为,目前最大的问题是,因为生成式文本有一定创造性,在问诊病例中,还会多出来一些患者没有描述的症状,需要医生手动删除,因此一定需要医生人工审核。

研究人员寄望于未来的迭代,可能允许从患者的电子健康记录中自动抓取数据,而无需再手动输入简要信息。然而,这种做法在数据治理方面存在重大问题还需要解决。

总之对各种复杂功能的探索都在计划中。5月25日,医联发布了基于医疗大语言模型——MedGPT,计划推出机器人全流程看病,通过线上不断向患者提问以获取更多信息,问诊结束后,开具医学检查项目,基于病史、病情和检查结精确确诊,并给出后续的治疗方案和定期随访。这款产品预计将在今年底进行临床实验,并招募患者入组。

甚至连培养医生的临床工作也能由机器人分担。美国一家企业Hippocratic AI推出产品,通过模拟不同类型的病人与医生进行对话,为医学生模拟临床环境。这些模拟患者不仅具有不同疾病、性格、情绪和疾病史,还能为医生的临床技能诊断,提供反馈评价。

尽管还存在实际应用中的缺陷和问题,ChatGPT还是展示出下一代聊天机器人在语言模型学习方面的强大能力,当我们打开ChatGPT的对话框,进行人工智能的训练时,自动化的趋势就已经势不可挡。

推荐新闻