10.11772/j.issn.1001-9081.2015.11.3122
基于类别重要度的MIMLBoost改进算法
针对多示例多标记学习算法MIMLBoost中退化过程造成的类别不平衡问题,运用人工降采样思想,引入类别重要度,提出一种改进的基于类别标记评估的退化方法.该方法通过对示例空间中的示例包进行聚类,把标记空间中的标记量化到聚类簇上,再以聚类簇为单位,利用TF-IDF算法对每个类别标记进行重要度评估和筛选,去除重要度低的标记,并将簇中的示例包与其余的类别标记拼接起来,以此来减少大类样本的出现,完成多示例多标记样本向多示例单标记样本的转化.在自然数据集上进行了实验,实验结果发现,改进算法的性能整体上优于原算法,尤其在Hamming loss、coverage、ranking loss三个评测指标上尤为明显,说明所提算法能够有效降低分类的出错率,提高算法的精度和分类效率.
多示例多标记、MIMIBoost算法、TF-IDF算法、聚类、类别不平衡
35
TP181(自动化基础理论)
江苏省产学研联合创新资金前瞻性联合研究项目BY2014028-09;国家海洋局数字海洋科学技术重点实验室开放基金资助项目KLD0201304;浙江省交通运输厅科研计划项目2014T25
2015-12-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
3122-3125