10.3321/j.issn:1005-3026.2005.08.006
基于领域知识的文本分类
提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能.
领域知识、文本分类、集聚计算、机器学习、朴素贝叶斯模型
26
TP391(计算技术、计算机技术)
国家自然科学基金60203019;微软亚洲研究院项目60473140;教育部科学技术研究项目104065
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共3页
733-735