多标记不完备数据的特征选择算法
多标记数据的特征选择是机器学习和数据挖掘领域的重要研究内容,当前对于多标记数据的特征选择研究大多是针对完备性数据,但在许多应用领域中,连续型数值数据较多,且由于诊测成本和隐私保护等因素导致数据往往呈现出不完备性.为解决上述问题,提出了一种面向多标记不完备数据的特征选择算法.该算法将邻域粗糙集模型应用于多标记不完备数据的特征选择,根据邻域阈值求解多标记不完备数据的邻域粒度,并基于邻域粒度给出了度量多标记不完备数据的特征重要性准则,以此设计了面向多标记不完备数据的特征选择算法.最后,通过在Mulan数据集上的实验结果验证了算法的有效性和可行性.
不完备数据、粗糙集、特征选择、属性约简
13
TP18(自动化基础理论)
The National Natural Science Foundation of China under Grant Nos. 61502213, 61662023, 71461013;the Natural Science Foundation of Jiangxi Province under Grant Nos. 20161BAB212049, 20161BAB212047
2019-11-05(万方平台首次上网日期,不代表论文的发表时间)
共13页
1768-1780