10.3969/j.issn.1000-3428.2015.08.030
基于图模型的通用半结构化数据检索
随着用户输入查询的自由度越来越高,导致已有半结构化数据检索模型无法满足用户需求.针对该问题,提出一种新的半结构化数据检索模型.在对原始查询进行分词后,把得到的词条作为基本元素,通过特征方程给每个词条设定对应权重,使用基于朴素贝叶斯的内容属性匹配方法进行内容属性匹配概率设定,并采用基于编辑距离的字符串相似度算法改善检索质量.从某商业搜索网站的查询日志中随机抽取真实的查询记录,人工为这些查询标注正确答案,从而做性能评估.实验结果表明,与层次语言模型、半结构化数据概率检索模型相比,该模型能有效提高半结构化数据的检索性能.
半结构化数据、查询、数据检索、图模型、全局因子、特征集合
41
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61472088,61473092
2015-10-14(万方平台首次上网日期,不代表论文的发表时间)
共6页
162-167