粗糙集规则匹配算法及其在文本分类中的应用
为提高中文文本分类的效果, 提出了一种基于粗糙集理论的规则匹配方法. 在对文本特征的提取过程中,对CHI统计方法进行了适当的改进, 并对特征项的权值进行了缩放和离散化. 结合区分矩阵实现关于粗糙集理论的属性约简和规则提取, 并采用规则预检验的方法对规则匹配的决策参数进行优化, 以提高中文文本分类的效果.实验结果表明改进后的规则匹配方法分类准确率更高, 同时在训练数据较少的情况下也可以取得不错的效果.
粗糙集、中文文本分类、属性约简、规则提取、规则匹配
27
国家自然科学基金11401031;北京信息科技大学2016-2017学年度"实培计划"项目
2018-05-11(万方平台首次上网日期,不代表论文的发表时间)
共7页
131-137