应用大语言模型解答儿童哮喘问题的效果研究
目的 评估大语言模型解答儿童哮喘问题的表现,全面了解其提供儿童健康相关信息的质量,并识别其局限以促进模型的改进.方法 制订出60个儿童哮喘相关的常见问题,分别向2种在国内向公众开放使用的文心一言、智谱清言大语言模型提问.由3名儿科哮喘专业医师采用盲法评估大语言模型的回答质量.结果 在准确性、理解力、可靠性和逻辑性维度方面,文心一言得分较高;在安全性维度方面,智谱清言的得分较高.对比5个不同的维度的得分发现,大语言模型在理解力、可靠性、逻辑性方面得分较高,而在准确性与安全性方面相对不足.结论 大语言模型在儿童哮喘患者教育中的应用能够为儿童哮喘患者及其家长提供有益的参考.然而,当前大语言模型技术在准确性、安全性等方面仍存在一定的局限性,需要进一步改进和优化.
大语言模型、儿童哮喘、医学人工智能、智能助理、文心一言、智谱清言
28
R562.2;R494;R319(呼吸系及胸部疾病)
北京市卫生健康科技成果;适宜技术推广项目
2024-08-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
6-11,17