10.3969/j.issn.1004-1729.2013.01.006
基于区域分块的微内容类网页正文提取技术
通过对微内容类网页正文内容块自动填充的研究,利用网页区域分块技术与HTML的结构特征,提出了一种基于区域分块和内容块自动填充(RAF)的正文提取方法,可用于微内容类网页正文的自动提取,同时运用编程实现提取工具进行实验.结果表明,该方法能够有效、准确地提取微内容类网页的正文信息.
微内容、内容提取、HTML网页、自动填充、区域分块
31
TP391(计算技术、计算机技术)
海南大学青年基金qnjj1175;科研启动基金kyqd1232
2013-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
31-36