10.3969/j.issn.0258-8021.2022.01.003
基于社交媒体中文本信息的早期抑郁症检测
诊断抑郁症的传统方法是通过面对面的评估和交谈.但是,许多患有抑郁症的患者不愿意在早期阶段就医,从而使病情恶化.为了在早期判断抑郁症患者的情况,提出一种利用社交媒体文本信息的时间序列特征和多示例学习的检测模型,考虑到抑郁症状不会立即出现,所以时序样本的使用显得非常重要,因此使用无监督LSTM提取时间序列特征,训练分类器实现二值分类,并使用多示例学习模型来解决不平衡样本问题.首先采用朴素贝叶斯分类器、随机森林、多元社会网络学习和多式抑郁词典学习作为基准,随后利用具有无监督LSTM时间序列功能的多示例学习来更准确地检测抑郁症.在MDDL数据集的基础上,整理出200个调查对象合计7 946条推文信息,并按照训练测试比为8:2的实验得到结果如下:在准确率、精度,召回率和F1得分上分别达到75.0%、76.0%、73.0%、74.5%.结果表明,通过社交媒体中的文本数据,采用机器学习进行早期抑郁症检测是可行的.此外,通过大量的消融实验也证实,采用时间序列特征的方法要比传统的基准模型方法能够获得更好的性能.
抑郁症检测、长短时记忆、时间序列特征、社交媒体、多示例学习
41
R318(医用一般科学)
2022-04-20(万方平台首次上网日期,不代表论文的发表时间)
共10页
21-30