10.3969/j.issn.1000-3428.2007.18.014
基于模糊集的主题提取和层次发现算法
从语义相关性角度分析超链归纳主题搜索(HITS)算法,发现其产生主题漂移的原因在于页面被投影到错误的语义基上,提出了一种基于模糊集的主题提取和层次发现算法(FSTH),通过用户日志扩展查询词,构造符合用户需要的个性化根集和基础集合,达到防止主题漂移的目的.FSTH采用模糊集划分方法,层次地发现与用户查询相关的主题页面集合,利用HITS算法分别计算每个主题页面集合中页面的权威值,返回与查询相关的其他主题权威页面.在14个查询上的实验结果表明,与HITS算法相比,FSTH算法不仅可以减少7%~53%的主题漂移率,而且可以发现与查询相关的多个主题.
模糊集、超链归纳主题搜索、主题提取、主题漂移、查询扩展
33
TP311(计算技术、计算机技术)
国家高技术研究发展计划863计划2001AA113182;陕西省教育厅资助项目06JK229
2007-11-05(万方平台首次上网日期,不代表论文的发表时间)
共3页
40-41,44