10.19678/j.issn.1000-3428.0047259
基于Co-Training的微博垃圾评论识别方法
微博上大量的垃圾评论对个人、社会,甚至是对国家都会造成不良影响.为对微博中的垃圾评论进行识别,提出基于协同训练的微博垃圾评论识别方法.定义一种基于规则的识别方法过滤出显式垃圾评论,剩余的评论归为相关评论,构建AdaBoost分类器和支持向量机分类器,通过Co-Training算法进行协同训练,判断其是否为垃圾评论,以提高分类精度,节省样本标注工作.实验结果表明,与基于相似度计算的垃圾评论识别方法、基于评论多特征的垃圾评论识别方法相比,该方法具有较好的识别效果.
微博垃圾评论、协同训练、同义词词林、支持向量机、相似度计算
44
TP391(计算技术、计算机技术)
国家自然科学基金61663004.61363035,61365009;广西自然科学基金2016GXNSFAA380146,2017GXNSFAA198365;广西多源信息挖掘与安全重点实验室主任基金16-A-03-02;广西学位与研究生教育改革专项课题JGY2015031
2018-11-28(万方平台首次上网日期,不代表论文的发表时间)
共7页
212-218