10.3969/j.issn.1000-0135.2004.04.002
基于NMF的用户模板构造方法
文本过滤是网络安全领域的一个重要研究课题.基于内容的文本过滤关键在于建立语义层次上的用户模板.本文提出一种基于非负矩阵分解(Non-negative Matrix Factorization,NMF)的用户模板构造方法.该方法应用NMF算法分解项-文本矩阵来获取项之间的相关性.在此基础上,引入语义向量和权重向量的概念,并通过定义语义向量的类别区分度来提取用户模板.实际表明,与基于奇异值分解的潜在语义索引方法相比,该方法不仅较大地提高了过滤精度,而且具有计算速度快、占用存储空间较少的优点.
文本过滤、用户模板、非负矩阵分解、潜在语义索引、Web挖掘
23
TP3;TP1
国家自然科学基金60073012;国家自然科学基金69931040
2004-09-23(万方平台首次上网日期,不代表论文的发表时间)
共5页
394-398