10.16208/j.issn1000-7024.2017.07.047
模糊语法方法在犯罪文本分类中的应用
针对现有文本分类模型的表现度低且缺乏容易理解的表示形式,提出一种模糊语法方法,并将其应用到犯罪文本分类中.根据定义的语法词典,将文本转化为模糊语法;将派生语法结合为更加紧凑的语法,获取学习文本模型的一般表示;将学习的模糊语法与测试集合进行匹配,根据解析隶属度的级别进行分类.与支持向量机、朴素贝叶斯、boosting方法和k最近邻等方法相比,所提FGM算法的性能与其它机器学习方法的性能类似;学习模型发生轻微变化,不需要传统方式的重建;在有些方面更加突出,如其在对爆炸事件的分类中获取了最高的F值(83%左右)以及最高的查准度(94%左右);很容易整合到更加全面的语法系统中.
模糊语法、文本分类、派生语法、学习、隶属度
38
TP391(计算技术、计算机技术)
重庆市教委科学技术研究基金项目KJ1402002
2017-08-22(万方平台首次上网日期,不代表论文的发表时间)
共7页
1965-1971