10.3760/cma.j.issn.0376-2491.2023.24.102
医师和人工智能聊天机器人对于发布在公共社交媒体论坛中患者问题回答水平的比较
虚拟医疗的快速发展导致患者接收的信息量激增,伴随而来的是医疗专业人员更多的工作量及职业倦怠。人工智能(AI)助手或能协助拟定回复患者问题的草稿,并由临床医师进行审核。该研究评估了2022年11月发布的AI聊天机器人助手(ChatGPT)对患者的问题提供高质量和具有同理心回答的能力。该研究随机抽取了来自公共社交媒体论坛(Reddit’r/AskDocs)的问题数据库中2022年10月的195次会话,一名已经过认证的医师回答了患者的问题。而聊天机器人的答案是在2022年12月22和23日通过将原始问题输入新的会话框来生成的。原始问题及匿名和随机排序的医师和聊天机器人的回答由具有执照的医疗专业人员团队进行3次评估。评估人员选择“谁的回答更好”,并对“提供的信息质量”(非常差、差、可接受、好或非常好)和“提供的同理心或对患者的态度”(没有同理心、略微有同理心、中度有同理心、有同理心和非常有同理心)进行评判,并对聊天机器人和医师的回答进行比较。585个评估中78.6%(95%
CI:75.0%~81.8%)的评估者倾向于聊天机器人的回答。医师回答的平均(
IQR)单词数明显少于聊天机器人[52(17~62)比211(168~245)个单词,
t=25.4,
P<0.001]。聊天机器人的回答质量明显高于医师(
t=13.3,
P<0.001)。例如,回答质量被评为好或非常好的比例聊天机器人高于医师(聊天机器人:78.5%,95%
CI:72.3%~84.1%;医师:22.1%,95%
CI:16.4%~28.2%)。这相当于聊天机器人回答质量达到好或非常好的比例为医师的3.6倍。聊天机器人的回答相对于医师的回答更具同理心(
t=18.9,
P<0.001)。被评为有同理心或非常有同理心的回复比例聊天机器人高于医师(聊天机器人:45.1%,95%
CI:38.5%~51.8%;医师:4.6%,95%
CI:2.1%~7.7%)。这相当于聊天机器人有同理心或非常有同理心的回答比例为医师的9.8倍。在该研究中,聊天机器人对于在线论坛中关于患者问题的回答是高质量且具有同理心的。有必要在临床工作中进一步探索这项技术,例如使用聊天机器人起草回答的草稿,然后由医师进行编辑修改。随机试验可进一步评估使用AI助手是否可以改善应答,降低临床医师对于职业的倦怠,并改善患者的预后。
103
2023-07-11(万方平台首次上网日期,不代表论文的发表时间)
共1页
1812