10.3778/j.issn.1002-8331.2011.30.032
概念语义生成与文本特征选择研究
文本特征选择是文本分类和信息提取的关键技术.针对文本分类中特征向量的高维稀疏问题,提出了非负矩阵分解和概念语义空间结合的特征抽取方法,对特征矩阵分解算法加入非负限制能够给出概念语义向量面向主题的解释,较好体现文本的局部特征.采用非负矩阵分解对全局和局部语义空间进行降维处理提高了体征提取效率,对不同概念语义空间中文本分类效果比对分析.实验结果表明基于非负矩阵分解的局部概念语义空间中文本分类精度较高.
概念语义空间、文本特征选择、非负矩阵分解
47
TP311(计算技术、计算机技术)
国家自然科学基金the National Natural Science Foundation of China under Grant 61003168;河南省重大科技攻关基金092102110274
2012-02-21(万方平台首次上网日期,不代表论文的发表时间)
共3页
116-118