基于潜在语义分析和改进的HS-SVM的文本分类模型研究

引用

摘要：

为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型.该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维.针对超球重叠区域的文本分类问题,设计一种新的决策方法-基于密集度的决策策略.实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行.

关键词：文本分类、潜在语义分析、改进的超球支持向量机、重叠区域文本

所属期刊栏目：54

分类号：G350(情报学、情报工作)

资助基金：教育部人文社会科学重点研究基地重大项目08JJD870225

在线出版日期：2011-03-25（万方平台首次上网日期，不代表论文的发表时间）

页码：109-113

英文信息展示

期刊专题