10.3969/j.issn.1001-3695.2017.08.013
一种面向文本分类的特征向量优化方法
对文本进行建模的普遍方法是使用向量空间模型构建文本向量,并利用权值调整和维度调整对文本向量进行优化.提出了一种面向文本分类的特征向量优化方法.首先利用剔除近义词方法优化文本向量中的特征项;然后提出贡献率因子的概念,并利用其优化特征值.实验表明,相比朴素贝叶斯分类方法其效果提高了0.96%.因此,通过去除近义词和对提取出的特征词调整权重,可以达到优化特征向量、提高文本分类效果的目的.
机器学习、Mahout、特征向量、向量优化、文本分类
34
TP391.1(计算技术、计算机技术)
国家自然科学基金资助项目61370139;北京市教委科研计划面上项目KM201411232014;北京市属高等学校创新团队建设与教师职业发展计划项目IDHT20130519;北京信息科技大学促进高校内涵发展专项项目5111623403
2017-08-16(万方平台首次上网日期,不代表论文的发表时间)
共5页
2299-2302,2348