一种基于网页分割的Web信息检索方法
提出一种基于网页内容分割的Web信息检索算法.该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割.在建立HTML标记树的基础上,利用内容相似性和视觉相似性进行节点的整合.在检索和排序中,根据用户的查询,充分利用区域信息来对相关的检索结果进行排序.
网页分割、信息检索、HTML标记、相似性
53
TP391(计算技术、计算机技术)
淮安市科技计划项目HAG08081
2009-04-24(万方平台首次上网日期,不代表论文的发表时间)
共4页
108-110,114