基于语义的主题爬行策略
为使主题爬行能够充分利用资源的语义信息,提出基于语义的主题爬行策略.该策略利用领域本体刻画爬行主题,将本体语义映射到关键词表.通过定义断言集一致性扩展和域值关联推理任务,推演关键词间语义关系.在定义网页主题概念的基础上,结合本体推理方案提出主题概念的语义叠加效应模型.最后,利用主题概念的语义包含关系判定URLs抓取顺序.实验结果表明,该语义主题爬行策略在抓取收获率和爬行效率上优于现有同类方法,该方案有效、可行.
本体、语义Web、主题爬行、Tableau演算
22
TP181(自动化基础理论)
国家自然科学基金重大项目60496320,60496321;国家自然科学基金60873148,60973089;吉林省科技发展计划20080107;欧盟合作项目155776-EM-1-2009-1-IT-ERAMUNDUS-ECW-L12;符号计算与知识工程教育部重点实验室开放基金450060326019
2012-01-15(万方平台首次上网日期,不代表论文的发表时间)
共14页
2075-2088