10.3969/j.issn.1673-629X.2009.01.024
邮件过滤中一种改进的特征选择方法研究
特征选择是基于内容的垃圾邮件过滤的重要过程,它有效地改善过滤效率和精度.文中分析了IG和CHI应用到垃圾邮件过滤中存在的不足,设计了一种改进的评价函数.而由于这种评价函数的特征选择方法只度量了特征与类的关系,忽略了特征之间依赖的关系,因此进一步用基于互信息的聚类方法来消除特征间冗余.实验结果表明该特征选择方法有效地提高了邮件过滤的性能.
邮件过滤、特征选择、信息增益、CHI统计、聚类
19
TP18(自动化基础理论)
四川省青年软件创新工程基金2007AA42;西华大学科技创新基金07226161
2009-03-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
84-87