DOI：10.3969/j.issn.1000-3428.2010.21.002

基于概念网络的短文本分类方法

引用

摘要：

针对档案领域的短文本分类,设计一种基于概念网络的自动分类方法.通过分析领域内短文本的语言特点构建领域本体,利用自然语言处理技术将短文本转化为资源描述框架表示的结构化概念网络,在此基础上定义概念网络间的语义相似度,从而实现档案的自动分类.实验结果表明,相比传统基于特征选择的短文本分类方法,该方法的分类错误率下降了24.2%,可有效改善系统性能.

关键词：短文本分类、概念网络、文档相似度、领域本体

所属期刊栏目：36

分类号：TP393(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目60535030, 60605016;国家"863"计划基金资助项目2006AA012196;北京市档案科技基金资助项目2009-13

在线出版日期：2011-01-28（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：4-6

英文信息展示

期刊专题