基于依存文法的垃圾短信自动识别
针对现今垃圾短信泛滥的现状,给出了一种基于依存文法的组合特征选取的中文短信过滤方法.该方法通过对短信进行句法分析,将依存关系较强的词合并处理,组合成更能代表短信内容的组合特征,并通过使用文本分类算法来对短信进行分类.基于依存文法的组合特征方法考虑了词与词之间的关系,以一种更符合人类思考问题的方式来选择短信特征,在一定程序上融合了部分语义信息.实验结果表明,基于依存文法的中文文本短信的分类方法在中文短信过滤中有更好的分类效果.
垃圾短信、短信过滤、特征提取、依存语法、支持向量机
40
TP391(计算技术、计算机技术)
2014-02-26(万方平台首次上网日期,不代表论文的发表时间)
共5页
81-85