10.3969/j.issn.1000-3428.2012.02.018
信息过滤中基于统计与规则的关键词抽取研究
目前的研究大多把向量空间模型中特征项的选取与权重的计算分开,掩盖中文分词时产生的语义缺失,导致特征项区分度下降.为此,提出一种基于统计与规则的关键词抽取方法.利用句法规则提取出基本短语,以取代词袋模型中的词,考虑特征项位置、分布及语法角色等信息,综合加权计算特征项权重.实验结果表明,与现有方法相比,该方法能够更有效地进行文本信息过滤.
基本短语、合并规则、角色加权、分布加权、位置加权
38
TP393.08(计算技术、计算机技术)
国家自然科学基金资助项目60873247;山东省高新自主创新专项工程基金资助项目2008ZZ28
2012-04-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
57-59