10.3772/j.issn.1000-0135.2013.08.002
一种基于加权网络和句子窗口方案的信息检索模型
经典的信息检索模型在文档表示上多采用词袋模型,与此不同,本文提出了一种基于加权网络的信息检索模型.在这一模型中,文档被表示为一个加权共词网络,词汇在文档中的重要性通过词项节点在网络中的重要性加以衡量.基于固定窗口平移和句子窗口方案,本文提出了文本游走模型Textrank的四个检索模型变种,分别是Win_Weighted_Textrank、Sent_Weighted_Textrank、Win_Weighted_Posrank和Sent_Weighted_Posrank.在Reuter RCV1上的实验证明,与无权网络模型Textrank、Posrank相比,本文提出的模型能显著地提升检索效果.
信息检索、信息检索模型、加权网络、共词网络
32
TP3;G35
教育部人文社会科学基地重大项目"面向细粒度的网络信息检索模型及框架构建研究"10JJD630014;国家自然科学基金面上项目"基于语言模型的通用实体检索建模及框架实现研究"项目71173164的研究成果之一
2013-09-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
797-804