粗糙集规则匹配算法及其在文本分类中的应用

引用

摘要：

为提高中文文本分类的效果, 提出了一种基于粗糙集理论的规则匹配方法. 在对文本特征的提取过程中,对CHI统计方法进行了适当的改进, 并对特征项的权值进行了缩放和离散化. 结合区分矩阵实现关于粗糙集理论的属性约简和规则提取, 并采用规则预检验的方法对规则匹配的决策参数进行优化, 以提高中文文本分类的效果.实验结果表明改进后的规则匹配方法分类准确率更高, 同时在训练数据较少的情况下也可以取得不错的效果.

关键词：粗糙集、中文文本分类、属性约简、规则提取、规则匹配

所属期刊栏目：27

资助基金：国家自然科学基金11401031;北京信息科技大学2016-2017学年度"实培计划"项目

在线出版日期：2018-05-11（万方平台首次上网日期，不代表论文的发表时间）

页数：共7页

页码：131-137

英文信息展示

期刊专题