DOI：10.16652/j.issn.1004-373x.2016.10.003

基于文本分类的维吾尔文数字取证研究

引用

摘要：

针对维吾尔文书写的数字文本的犯罪取证,提出一种基于文本分类的维吾尔文数字取证方案.首先,对维吾尔文文本进行预处理,滤除文本中非维吾尔文字符和停用词;然后,提出一种多特征空间正则化互信息(M-FNMI)算法,使用输入特征组合与类之间的互信息(MI)来代替单个特征与类之间的MI,从而提取出更准确的特征词;最后,利用支持向量机(SVM)算法来对特征进行分类.实验结果表明,该方案具有较高的分类精度,能够为犯罪取证提供判断依据.

关键词：数字取证、文本分类、维吾尔文、互信息、支持向量机

所属期刊栏目：39

分类号：TN911-34;TP391

资助基金：国家社会科学基金科研项目13CFX055;新疆维吾尔自治区自然科学基金科研项目2015211A016:新疆维吾尔自治区高校科研计划科学研究重点项目XJEDU2013134

在线出版日期：2016-07-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共5页

页码：9-13

英文信息展示

期刊专题