10.3969/j.issn.1673-629X.2023.04.023
基于随机森林的帕金森疾病诊断模型构建研究
近些年来,根据帕金森疾病(PD)患者的语音数据对该疾病做出诊断成为一种行之有效的疾病诊断方法.首先,针对语音数据集中存在非均衡数据和噪声样本的问题使用SVM SMOTE过采样技术,利用支持向量机分类器寻找支持向量并在此基础上合成新的样本以达到均衡数据集的目的;为了减少数据维度,降低学习难度,运用信息增益特征选择对所有特征属性计算数值并划分数据集以此来获得信息增益,根据信息增益的大小排序选取得到八个特征作为最优特征组合;最后,构建随机森林帕金森疾病诊断模型,并采用网格搜索和交叉验证相结合的方式进行参数调优,进一步优化模型,实现诊断模型准确率的进一步提高.实验结果表明,优化后模型的准确率、灵敏度和特异度均有提升,为别为 96.59%、94.81%和95.49%,且准确率均高于支持向量机、最邻近节点算法、朴素贝叶斯和决策树等决策模型.
SVM SMOTE、信息增益、随机森林、网格搜索、交叉验证
33
TP301(计算技术、计算机技术)
湖南省教育科学研究重点项目;湖南中医药大学中医学一流学科开放基金项目
2023-04-25(万方平台首次上网日期,不代表论文的发表时间)
共7页
154-160