基于结构与内容的Web主要信息提取方法研究
Web页面的主要信息被广告、超链等无用信息包围,是Web信息自动处理所要解决的难题.传统的信息提取方法是从内容着手,或者从结构出发,很少将两者相结合,因此提出了一种Web主要信息提取方法.该方法可以从Web页面的结构和内容两方面出发,准确地将Web内容进行分块,并对分块内容进行分析处理,从而提取出Web页面的主要信息.
Web页面、内容、结构、分块、信息提取
29
TP391(计算技术、计算机技术)
2009-03-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
6210-6212