多标记不完备数据的特征选择算法

引用

摘要：

多标记数据的特征选择是机器学习和数据挖掘领域的重要研究内容,当前对于多标记数据的特征选择研究大多是针对完备性数据,但在许多应用领域中,连续型数值数据较多,且由于诊测成本和隐私保护等因素导致数据往往呈现出不完备性.为解决上述问题,提出了一种面向多标记不完备数据的特征选择算法.该算法将邻域粗糙集模型应用于多标记不完备数据的特征选择,根据邻域阈值求解多标记不完备数据的邻域粒度,并基于邻域粒度给出了度量多标记不完备数据的特征重要性准则,以此设计了面向多标记不完备数据的特征选择算法.最后,通过在Mulan数据集上的实验结果验证了算法的有效性和可行性.

关键词：不完备数据、粗糙集、特征选择、属性约简

所属期刊栏目：13

分类号：TP18(自动化基础理论)

资助基金：The National Natural Science Foundation of China under Grant Nos. 61502213, 61662023, 71461013;the Natural Science Foundation of Jiangxi Province under Grant Nos. 20161BAB212049, 20161BAB212047

在线出版日期：2019-11-05（万方平台首次上网日期，不代表论文的发表时间）

页数：共13页

页码：1768-1780

英文信息展示

期刊专题