10.3969/j.issn.1007-130X.2014.05.031
一种结合关键词与共现词对的向量空间模型
提出了一种结合关键词特征和共现词对特征的向量空间模型.首先,通过分词和去除停用词提取文本中的候选关键词,利用文本频率筛选关键词特征.然后,基于获得的关键词特征两两构造候选共现词对,定义支持度和置信度筛选共现词对特征.最后,结合关键词特征和共现词对特征构建向量空间模型.文本分类实验结果表明,提出的模型具有更强的文本分类能力.
向量空间模型、共现词对、语义相关性、文本分类
36
TP391.3(计算技术、计算机技术)
十二五科技支撑课题2011BAH10B04
2014-06-20(万方平台首次上网日期,不代表论文的发表时间)
共6页
971-976