10.3969/j.issn.1002-1965.2010.05.031
基于改进VSM的Web文本分类方法
Web文本自动分类技术是Web文本挖掘的关键技术之一.针对Web文档中不同标签中的文本具有不同的表达文档内容的能力,提出了改进的特征项加权计算方法.根据特征项在文档中的位置和出现频率计算其权值,并给出了具体的Web文本分类算法和评测方法.经实验验证,改进后系统的微平均查准率均大于0.8,分类性能明显好于改进前.
Web文本分类、向量空间模型、VSM、文本挖掘
29
TP391(计算技术、计算机技术)
国家自然科学基金项目"基于贝叶斯本体的Web知识发现"70971005
2010-06-30(万方平台首次上网日期,不代表论文的发表时间)
共4页
144-147