密度峰值隶属度优化的半监督Self-Training算法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.3778/j.issn.1673-9418.2102018

密度峰值隶属度优化的半监督Self-Training算法

引用
现实中由于获取标签的成本很高,大部分的数据只含有少量标签.相比监督学习和无监督学习,半监督学习能充分利用数据集中的大量无标签数据和少量有标签数据,以较少的标签成本获得较高的学习性能.自训练算法是一种经典的半监督学习算法,在其迭代优化分类器的过程中,不断从无标签样本中选取高置信度样本并由基分类器赋予标签,再将这些样本和伪标签添加进训练集.选取高置信度样本是Self-Training算法的关键,受密度峰值聚类算法(DPC)启发,将密度峰值用于高置信度样本的选取,提出了密度峰值隶属度优化的半监督Self-Training算法(STDPM).首先,STDPM利用密度峰值发现样本的潜在空间结构信息并构造原型树.其次,搜索有标签样本在原型树上的无标签近亲结点,将无标签近亲结点的隶属于不同类簇的峰值定义为簇峰值,归一化后作为密度峰值隶属度.最后,将隶属度大于设定阈值的样本作为高置信度样本,由基分类器赋予标签后添加进训练集.STDPM充分利用密度峰值所隐含的密度和距离信息,提升了高置信度样本的选取质量,进而提升了分类性能.在8个基准数据集上进行对比实验,结果验证了STDPM算法的有效性.

密度峰值隶属度、簇峰值、原型树、近亲结点集、自训练

16

TP181(自动化基础理论)

国家自然科学基金;国家自然科学基金;甘肃省高等学校创新能力提升项目;甘肃省高等学校创新能力提升项目;兰州财经大学科研项目;兰州财经大学科研项目;甘肃省科技计划项目

2022-09-22(万方平台首次上网日期,不代表论文的发表时间)

共11页

2078-2088

相关文献
评论
暂无封面信息
查看本期封面目录

计算机科学与探索

1673-9418

11-5602/TP

16

2022,16(9)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn