10.13705/j.issn.1671-6841.2016306
面向垃圾短信过滤的亚文档集成学习
针对垃圾短信过滤问题,提出了一种亚文档集成学习方法.该方法采用亚文档集成学习框架将短文本在线二值分类问题转化成若干个子分类问题,并通过线性组合多个子问题的分类结果得出最终的分类预测.利用基于串频索引的文本分类算法实现了一种有效的弱分类器.实验数据表明亚文档集成学习框架能够提高现有文本分类算法的效能,而在亚文档集成学习框架下,基于串频索引的弱分类器过滤效果最佳.
垃圾短信过滤、亚文档集成学习、串频索引、TREC评测
49
TP391.1(计算技术、计算机技术)
国家语言文字工作委员会重点项目ZDI 135-26;广东省高校特色创新项目2015KTSCX035
2017-08-09(万方平台首次上网日期,不代表论文的发表时间)
共6页
59-64