大数据背景下基于主题网络爬虫的档案信息采集
主题网络爬虫是针对某一特定领域进行信息采集的网络爬虫,本文提出将主题网络爬虫应用于数字档案馆的信息采集,以档案采集系统的设计目标为出发点,阐述了基于主题网络爬虫的档案信息采集系统的设计方案和该系统实现的相关技术.
大数据、主题网络爬虫、档案资源建设
G271(档案学、档案事业)
2014年度国家档案局科技项目“大数据时代档案馆服务创新与发展趋势研究”系列成果之一,项目2014-X-16
2016-09-18(万方平台首次上网日期,不代表论文的发表时间)
共2页
20-21