基于标签相关性的K近邻多标签学习

引用

摘要：

多标签学习是机器学习领域的一个研究热点,其能够有效解决真实世界中的多语义问题.在多标签学习任务中,样本的多个标签之间存在一定的关联关系,忽略标签间的相关性会导致模型的泛化性能降低.提出一种基于标签间相关性的多标签学习K近邻算法.充分挖掘样本多标签间的相关性,通过Fp_growth算法得到标签的频繁项集.针对频繁项和标签分别构建评分模型和阈值模型,评分模型用于衡量样本与频繁项或标签之间的关联程度,阈值模型用于求解频繁项或标签对应的判别阈值,结合评分模型和阈值模型对样本所属频繁项进行预测,进而确定样本标签集.在经典数据集Emotions和Scene上的实验结果表明,该算法的F1-Measure指标分别达到66.6％和73.3％,相比CC、LP、RAKEL、MLDF等基准方法,其F1-Measure分别平均提高3.8和2.1个百分点,该算法通过合理利用标签间的相关性使得分类性能得到有效提升.

关键词：机器学习、多标签学习、标签相关性、K近邻、频繁项集

所属期刊栏目：48

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金62002174

在线出版日期：2022-06-21（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：73-78,88

英文信息展示

期刊专题