10.11830/ISSN.1000-5013.201703022
采用相关反馈和文档相似度的维吾尔语检索词加权方法
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.
维吾尔语、文档检索、检索词加权、相关反馈、文档相似度
38
TP391(计算技术、计算机技术)
新疆维吾尔自治区自然科学基金资助项目2015211A016
2017-06-30(万方平台首次上网日期,不代表论文的发表时间)
共6页
408-413