DOI：10.3969/j.issn.1002-1965.2016.09.033

基于概率超图半监督学习的专利文本分类方法研究

引用

摘要：

[目的/意义]提出了一种基于概率超图半监督学习的专利文本分类方法，拓展超图理论的应用领域，丰富专利文本分类方法体系。[方法/过程]针对目前基于监督学习的专利文本分类方法存在着依赖大量的训练样本，并且训练样本的标注费时费力、需要一定技术含量等问题，将基于超图的半监督学习方法引入到专利文本分类中，提出了一种基于k近邻策略的专利文本概率超图构建方法，并在此基础上给出了基于超图学习的专利文本自动分类算法。该方法可以利用未标记样本提供的样本分布信息来提高分类精度。[结果/结论]实验结果表明，该方法能够在标记少量训练样本的情况下获得比较理想的分类精度和召回率。

关键词：概率超图、超图学习、半监督学习、专利分类、分类器

所属期刊栏目：35

分类号：G254(图书馆学、图书馆事业)

资助基金：教育部人文社会科学研究青年基金项目“基于超图模型的专利文本多标签分类研究”14YJC870014研究成果之一。

在线出版日期：2016-10-14（万方平台首次上网日期，不代表论文的发表时间）

页数：共6页

页码：187-191,173

英文信息展示

期刊专题