一种可自由配置的网页采集系统原理及其实现
随着信息技术的发展,互联网已成为信息发布和获取的主要渠道,大数据环境下,信息就是资源、竞争力,如何从互联网中发现并获取有效的信息已成为各行业亟待解决的问题。该文提出了一种可自由配置的网页采集系统的原理及其实现,该系统可高效采集用户所需信息,并对网页内容进行清洗,提供多种可视化的内容展示,解决了用户获取信息的难题。
网络爬虫、内容抽取、自由配置
TP393(计算技术、计算机技术)
国家信息安全专项项目发改办高技[2015]289号
2016-04-01(万方平台首次上网日期,不代表论文的发表时间)
共3页
133-135