AI工具成功地对患者在电子健康记录系统中的问题进行回复
作为全国趋势的一部分,许多NYU Langone Health的患者在流行病期间开始使用电子健康记录工具向他们的医生提问、续开处方和查看检测结果。{ width=60% }
许多患者的数字查询是通过一个名为In Basket的通信工具进行的,该工具内置在NYU Langone的电子健康记录(EHR)系统EPIC中。
虽然医生总是花时间处理EHR信息,但根据NYU Langone的首席医疗信息官保罗·A·泰斯塔(Paul A. Testa)在一篇文章中的描述,最近几年每日收到的信息数量每年增长超过30%。泰斯塔写道,医生每天接收超过150条In Basket消息并不罕见。由于健康系统没有设计处理这种流量的能力,医生们不得不花费长时间在下班后整理消息。这一负担被视为导致了一半的医生报告感到枯竭。
现在,由纽约大学医学院的研究人员领导的一项新研究显示,一种人工智能工具可以像人类医疗专业人员一样准确地起草对患者的EHR查询的回复,并呈现出更大的“同情心”。“这些工具通过人类提前审查AI草案通常可以大大减轻医生的In Basket负担,同时改善他们与患者的沟通。
NYU Langone Health一直在测试生成式人工智能(genAI)的能力,其中计算机算法根据人们在互联网上如何在上下文中使用单词来开发任何句子中下一个单词的可能选项。这种下一个单词预测的结果是,genAI“聊天机器人”可以以令人信服的类人语言回答问题。纽约大学Langone在2023年授权了GPT4的“私人实例”,这是著名的chatGPT聊天机器人的最新版本,这使得医生可以在仍然遵守数据隐私规则的情况下使用真实患者数据进行实验。
发布在JAMA Network Open的新研究中,研究人员检查了GPT4生成的针对患者In Basket查询的草稿,并要求全科医生将其与针对这些消息的实际人类回应进行比较。
首席研究作者、纽约大学格罗斯曼医学院医学临床助理教授William Small博士表示:“我们的研究结果表明,聊天机器人可以通过有效、富有同情心的方式回应患者的关注,从而减少护理提供者的工作量。”他补充道:“我们发现使用患者特定数据的EHR集成AI聊天机器人可以起草出质量与人类提供者类似的消息。”
对于这项研究,十六名全科医生对344对随机分配的AI和人类对患者消息的回应进行了准确性、相关性、完整性和语气的评分,并表示他们是否会将AI回应用作第一稿,还是必须从零开始编写患者消息。医生们不知道他们审查的回应是由人类生成还是AI工具生成的(盲审研究)。
研究小组发现,生成式人工智能和人类提供者的回应在准确性、完整性和相关性方面在统计上没有差异。生成式AI回应在可理解性和语气方面优于人类提供者9.5%。此外,AI回应被认为更具同情心的可能性比人类提供者高出两倍(增加125%),并且更有可能使用传达积极性(可能与希望有关)和归属感(“我们共同努力”)的语言。
另一方面,AI回应也更长38%,并且更有可能使用复杂语言31%,因此研究人员表示需要对工具进行进一步的培训。而人类对患者查询的回应是在六年级水平上,AI在八年级水平上进行撰写,根据一种名为Flesch Kincaid得分的标准可读性测量。
研究人员认为,聊天机器人使用私人患者信息,而不是普通互联网信息,更好地近似了这种技术在实际世界中的使用方式。未来的研究将需要确认私人数据是否特别提高了AI工具的性能。
纽约大学Langone医学中心信息技术(MCIT)信息创新高级主任Devin Mann博士说:“这项工作证明了AI工具可以为患者请求构建高质量的草稿回应。有了这种医生批准,将来GenAI消息质量在质量、沟通风格和可用性方面将与人类创造的回应相等。”曼恩博士还是纽约大学人口健康学和医学系的教授。
除了Small博士和Mann博士之外,来自纽约大学Langone Health的研究作者还有Beatrix Brandfield-Harvey、Zoe Jonassen、Soumik Mandal、Elizabeth Stevens、Vincent Major、Erin Lostraglio、Adam Szerencsy、Simon Jones、Yindalon Aphinyanaphongs和Stephen Johnson。还有来自纽约大学工程科技学院的Oded Nov和纽约大学斯特恩商学院的Batia Wiesenfeld也是共同作者。
感谢阅读!如果您对AI的更多资讯感兴趣,可以查看更多AI文章:GPTNB。
AI工具成功地对患者在电子健康记录系统中的问题进行回复