10.3969/j.issn.1002-1965.2016.09.033
基于概率超图半监督学习的专利文本分类方法研究
[目的/意义]提出了一种基于概率超图半监督学习的专利文本分类方法,拓展超图理论的应用领域,丰富专利文本分类方法体系。[方法/过程]针对目前基于监督学习的专利文本分类方法存在着依赖大量的训练样本,并且训练样本的标注费时费力、需要一定技术含量等问题,将基于超图的半监督学习方法引入到专利文本分类中,提出了一种基于k近邻策略的专利文本概率超图构建方法,并在此基础上给出了基于超图学习的专利文本自动分类算法。该方法可以利用未标记样本提供的样本分布信息来提高分类精度。[结果/结论]实验结果表明,该方法能够在标记少量训练样本的情况下获得比较理想的分类精度和召回率。
概率超图、超图学习、半监督学习、专利分类、分类器
35
G254(图书馆学、图书馆事业)
教育部人文社会科学研究青年基金项目“基于超图模型的专利文本多标签分类研究”14YJC870014研究成果之一。
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
187-191,173