10.3969/j.issn.1002-137X.2012.05.041
基于组合特征的动态垃圾博客过滤算法
近几年,垃圾博客过滤成为国际上新的热点研究领域.现有的过滤算法大多基于词频特征分类,特征冗余并缺乏关联性.为了解决此问题,提出一种基于组合特征的动态垃圾博客过滤算法(CFDSD),该算法采用作者属性和自相似特征来解决特征冗余和关联性低的问题,并应用贝叶斯分类算法优化词频特征分类.实验表明,该算法能适应博客随时间变化而动态更新的特点,同时提高了过滤效率.
垃圾博客过滤、词频特征、自相似特征、组合特征、贝叶斯分类
39
TP391(计算技术、计算机技术)
国家自然科学基金项目60603047;教育部留学回国人员科研启动基金资助项目,辽宁省科技计划项目2008216014;辽宁省教育厅高等学校科研基金L2010229;大连市优秀青年科技人才基金2008J23JH026
2012-10-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
177-179,212