10.3969/j.issn.1000-3428.2009.15.015
面向垂直搜索引擎的主题提取算法
针对HITS算法对所有链接分配相等权重导致产生主题漂移的问题,提出基于计算链接价值度及Web页面语义丰题相似度对链接分配合理权重的HITS改进算法,突出链接重要度的差异.实验表明,该算法的乇题相关度提高了13%~42%,且较好地避免了主题漂移问题,增强了采集信息的准确性,对垂直搜索引擎的研究有重要的理论和实际应用价值.
HITS算法、垂直搜索引擎、超链接、主题漂移
35
TP301.6(计算技术、计算机技术)
陕西省自然科学基础研究计划基金资助项目2007F52
2009-08-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
44-46