10.3979/j.issn.1673-825X.2011.06.021
一种改进KNN个性化邮件过滤的方法
针对个性化邮件过滤中接收的邮件没有规律、正常邮件和垃圾邮件存在严重类偏移等问题,提出一种改进的k最近邻(k-nearest neighbor algorithm,KNN)个性化邮件过滤方法.该方法主要是通过建立兴趣度模型(对兴趣度计算的改进,剔除用户习惯对建立兴趣度模型带来的影响)不断改变训练集,使得训练集中的文本始终代表用户最近的兴趣.然后通过对接收邮件的无规律和类偏移问题的研究,提出一种改进的KNN算法,该算法主要是对文本在聚类中的价值重新评定,使其对邮件文本进行了较好的分类.经实际验证,改进后的KNN个性化过滤方法能较好地实现对邮件进行个性化分类.
个性化、KNN算法、邮件过滤、用户兴趣、垃圾邮件
23
TP393(计算技术、计算机技术)
国家自然科学基金60773113
2012-04-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
757-760