DOI：10.11835/j.jssn.1000-582X.2013.08.023

结合改进非负矩阵分解的模糊网页文本分类算法

引用

摘要：

通过构建向量空间模型可以获得表征网页数据的词-文本权重矩阵,然而直接基于此高维矩阵进行分类学习效率较低,为此提出一种结合改进非负矩阵分解的模糊网页文本分类算法.首先,通过迭代的归一化压缩非负矩阵分解将高维的原数据映射到低维语义空间,以降低问题的复杂性.然后,将模糊逻辑引入分类模型,通过特征词与类别的模糊隶属度来生成文本的类别模糊集,以解决确定性矩阵难以判定语义模糊词所属类别的问题.实验结果表明,与其他方法相比,所提出的分类算法具有较高的分类准确度和较好的时间性能.

关键词：分类、非负矩阵分解、模糊逻辑、隶属函数

所属期刊栏目：36

分类号：TP391.1(计算技术、计算机技术)

资助基金：国家自然科学基金资助项目71171184;安徽省自然科学基金资助项目090412054;教育部高等学校博士学科点专项科研基金资助项目200803580024;安徽大学青年科学研究基金项目3305044;人才科研启动项目2303224

在线出版日期：2013-10-12（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：156-162

英文信息展示

期刊专题