10.3969/j.issn.1007-130X.2012.09.032
即时定向新闻采集技术研究
互联网的迅速发展带动了信息量的爆炸性增加.如何更快地采集所需信息一直是国内外研究和开发的热点.近年来,不断增长的对特定信息(例如特定领域的新闻)的需求要求有针对性地从指定的网站即时采集相关信息.这些新闻一般具有不可预见性、更新频率较快、时效性强等特点.这要求我们必须能针对这些特点实现即时定向的采集.本文提出了一种有效抓取网页并进行分析的方法,实践表明取得了满意的效果.
新闻采集、爬虫、即时
34
TP393(计算技术、计算机技术)
2012-11-27(万方平台首次上网日期,不代表论文的发表时间)
共4页
180-183