10.19678/j.issn.1000-3428.0063270
基于标签相关性的K近邻多标签学习
多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题.在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低.提出一种基于标签间相关性的多标签学习K近邻算法.充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集.针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集.在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6%和73.3%,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升.
机器学习、多标签学习、标签相关性、K近邻、频繁项集
48
TP391(计算技术、计算机技术)
国家自然科学基金62002174
2022-06-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
73-78,88