10.3969/j.issn.1000-7024.2012.05.037
基于频繁项集与负规则的局部反馈查询扩展
针对信息检索中存在的词不匹配问题,提出了基于频繁项集和负关联规则挖掘的局部反馈查询扩展模型及其算法.该算法对前列n篇初检文档挖掘频繁项集和非频繁项集,并从频繁项集中提取关联词;从频繁项集和非频繁项集中挖掘负关联规则,提取负关联规则后件作为负关联词,计算负关联词与整个原查询词的相关性;根据相关性删除关联词库中与负关联词相同的词项,将余下的关联词项作为最终扩展词,并与原查询组合成新查询,实现查询扩展.实验结果表明,该算法能发现虚假的负关联词,有效地提高和改善信息检索性能.
频繁项集、负关联规则、局部反馈、查询扩展、信息检索
33
TP391(计算技术、计算机技术)
澳大利亚ARC基金项目DP0985456;广西高校优秀人才资助计划基金项目桂教人[2011]40号;广西教育厅科研基金项目2011061.X388;广西自然科学基金项目2012GXNSFAA053235
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共5页
1863-1866,1880