10.3969/j.issn.1008-0570.2008.06.078
文本自动分类关键技术研究
为了提高文本自动分类的准确率,本文在分析文本分类预处理阶段的中文分词、特征提取、向量空间模型、web结构挖掘技术等基础上,对相关技术进行了的改进,并设计基于支持向量机文本分类器(UJS-Classifier)实现了最终的文本分类.根据测试语料分别对中文分词模块和网页文本分类模块性能进行测试,实验结果表明UJS-Classifier在分词的歧义切分、网页分类的性能及准确率都有一定的提高.
中文分词、向量空间模型、文本分类、支持向量机
24
TP311(计算技术、计算机技术)
全国教育科学十一·五规划课题DCA060097;资源共享体系中的关键技术研究项目教育部重点
2008-04-03(万方平台首次上网日期,不代表论文的发表时间)
共3页
197-199