半监督多示例分类的两层粒化与空间转换方法
多示例学习(MIL)的任务是训练一个有效的分类器,以处理具有复杂数据结构的包.一个包对应一个样本,由多个实例构成,描述了样本的信息特征.基于标准MIL假设,如果包中至少有一个正实例,则该包为正,反之为负.已有的多示例学习算法通常将包看作一个整体或基于整个实例空间进行学习.然而,数据集中通常包含噪声,将对分类结果造成一定的影响.本文提出半监督多示例分类的两层粒化与空间转换方法(TSSM).首先,在单包粒度层次上,设计基于密度与距离的去噪技术,获得特征值更为突出的包.其次,在数据集粒度层次上,设计关键包选择技术,获得更具全局代表性的关键包.最后,利用基于关键包的空间转换技术,获得新的数据嵌入,以构建更加精确的分类器.实验结果表明TSSM比大多数MIL分类算法有更高的性能.
多示例学习、半监督学习、粒化、去噪、空间转换
36
TP181(自动化基础理论)
国家自然科学基金;四川省自然科学基金资助项目;四川省青年科学技术创新团队项目;西南石油大学研究生全英文课程建设项目
2022-04-07(万方平台首次上网日期,不代表论文的发表时间)
共10页
110-119