10.3969/j.issn.1000-3428.2012.10.018
基于关联规则和粗糙集的话题特征提取方法
针对话题分类文本训练集少、主题相似度大的特点,提出一种基于关联规则和粗糙集的话题特征提取方法.在向量空间模型的基础上,采用挖掘关联规则的方式生成规则集与文本主体,通过调节事务主体的最小支持度与最小置信度查找不同颗粒层次的话题,利用粗糙集理论对词语特征与关联特征进行属性约简.实验结果表明,该方法能提取文本集中描述的评论主题,具有较高的话题分类准确率.
关联规则、粗糙集、特征提取、话题检测与跟踪、向量空间模型、属性约简
38
TP393(计算技术、计算机技术)
海军工程大学自然科学基金资助项目HGDYDJJ10008
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
63-66