10.3969/j.issn.1000-3428.2014.05.004
基于文本内容分析的微博广告过滤模型研究
针对新浪、腾讯等微博平台出现大量广告的问题,提出一个微博广告过滤模型。通过对数据的预处理,将采集到的微博原始数据转换成干净且计算机易处理的数据。在预处理阶段,根据微博文本的特点,对停用词表进行改进,以提高查准率,然后基于支持向量机构建一个训练分类器对数据进行训练,经过不断的学习和反馈,取得较好的分类效果。实验结果表明,该模型进行广告过滤时准确率超过90%,效果优于基于关键字的方法。
微博、文本处理、向量空间模型、支持向量机、文本分类、广告过滤
TP391(计算技术、计算机技术)
上海海事大学科研基金资助项目20100093。
2014-06-25(万方平台首次上网日期,不代表论文的发表时间)
共4页
17-20