10.3969/j.issn.1002-137X.2005.08.056
基于标记树的Web页面区域划分和搜索方法
Web页面的布局可以分为:主要内容、单位标识、导航信息、交互信息和版权申明.我们在处理这些页面时往往只关心主要内容,而且可以从语义上快速定位到主要内容,但是软件系统要做到这一点就非常困难.本文提出一种基于标记树的Web页面区域划分和搜索方法,让软件系统可以忽略别的区域,快速定位到主要内容.对于大量Web页面处理而言,这种方法可以起到减少时间,缩小空间的作用,Web页面越多,效果就越显著.
Web页面布局、页面结构、页面区域、标记树、标记树模式
32
TP3(计算技术、计算机技术)
2005-10-13(万方平台首次上网日期,不代表论文的发表时间)
共4页
182-185