10.3969/j.issn.1000-1220.2005.11.019
基于查询扩展的Web链接主题提取算法
HITS(Hypertext-Induced Topic Search)算法被广泛用于Web链接结构分析,但它很容易产生主题漂移.从语义相关性角度进行分析,发现HITS算法产生主题漂移的原因在于页面被投影到错误的潜在语义基上.提出一种基于查询扩展的超链主题提取算法,利用用户查询日志扩展查询词,构造符合用户需要的个性化根集和基础集合,再利用HITS算法计算Web页面的权威值和中心值.实验结果表明,基于查询扩展的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要.
链接分析、主题提取、Web查询、资源发现
26
TP311(计算技术、计算机技术)
国家高技术研究发展计划863计划2003AA1Z2610
2005-12-01(万方平台首次上网日期,不代表论文的发表时间)
共4页
1951-1954