10.3969/j.issn.1001-3695.2013.09.028
基于图正则化MNMF的中文垃圾邮件过滤
利用向量空间模型表示的文本邮件数据具有高维性,不利于邮件过滤模型的建立,需要对数据进行降维处理.最大间隔Semi-NMF(max-margin semi-nonnegative matrix factorization,MNMF)能够同时实现维数约减和邮件分类,而图正则化NMF能保持数据空间的几何结构.基于以上两种NMF改进模型,提出了图正则化MNMF(graph regularized MNMF,GMNMF)算法,并设计了一个迭代的求解算法.将GMNMF算法及其他相关算法用于中文垃圾邮件过滤实验,结果表明GMNMF算法构建的过滤模型要优于其他较好的算法构建的过滤模型.
向量空间模型、维数约减、最大间隔Semi-NMF、图正则化MNMF、中文垃圾邮件过滤
30
TP181(自动化基础理论)
国家自然科学基金资助项目61065003;国家教育部人文社会科学研究规划基金资助项目10YJC630379
2013-10-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
2672-2676