10.16652/j.issn.1004-373x.2016.10.003
基于文本分类的维吾尔文数字取证研究
针对维吾尔文书写的数字文本的犯罪取证,提出一种基于文本分类的维吾尔文数字取证方案.首先,对维吾尔文文本进行预处理,滤除文本中非维吾尔文字符和停用词;然后,提出一种多特征空间正则化互信息(M-FNMI)算法,使用输入特征组合与类之间的互信息(MI)来代替单个特征与类之间的MI,从而提取出更准确的特征词;最后,利用支持向量机(SVM)算法来对特征进行分类.实验结果表明,该方案具有较高的分类精度,能够为犯罪取证提供判断依据.
数字取证、文本分类、维吾尔文、互信息、支持向量机
39
TN911-34;TP391
国家社会科学基金科研项目13CFX055;新疆维吾尔自治区自然科学基金科研项目2015211A016:新疆维吾尔自治区高校科研计划科学研究重点项目XJEDU2013134
2016-07-13(万方平台首次上网日期,不代表论文的发表时间)
共5页
9-13