10.3969/j.issn.1000-3428.2016.10.013
实体信息集成检索的深网数据源选择
在深网集成检索中,用户通常希望仅向少量数据源提交查询即可获得高质量的检索结果,因而数据源选择成为关键问题.为提升实体信息集成检索的效率,提出一种考虑相关性和重复度的数据源选择方法.给出基于主题与情感词的深网数据源摘要构建方法,利用用户反馈识别实体信息的主题类别,根据情感词度量数据源内容之间的重复性,并结合主题相关性和内容重复度设计相应的深网数据源计分策略.实验结果表明,该方法可以基于小数据摘要获得较高的准确率与召回率,为实体信息集成检索提供有效支撑.
数据源选择、深网、实体、信息集成、用户反馈
42
TP311(计算技术、计算机技术)
国家自然科学基金资助项目61462037,61563016;江西省自然科学基金资助项目20142BAB217014,20142BAB207009;江西省研究生创新基金资助项目YC2012-B021
2016-12-07(万方平台首次上网日期,不代表论文的发表时间)
共5页
75-79