10.3969/j.issn.1000-7024.2007.02.016
改进的Web链接主题提取算法
HITS算法是影响相当广泛的链接分析算法.但是,深入的研究表明,它很容易产生主题漂移.而HITS算法产生主题漂移的很大一部分原因在于页面被投影到错误的潜在语义基上.提出一种基于权值调整的超链主题提取算法(weighted adjustments based hyperlinks topic distillation),先在获得根集的过程中,用改进的权值进行相似度计算,得到相对更为准确的个性化根集,再利用HITS算法计算Web页面的权威值和中心值.实验结果表明,基于权值调整的超链主题提取算法可以很好地改善HITS算法所导致的主题漂移问题,更适合于Web查询的需要.
链接分析、主题提取、向量空间模型、权值调整、资源发现
28
TP311(计算技术、计算机技术)
2007-04-02(万方平台首次上网日期,不代表论文的发表时间)
共3页
294-296