10.3969/j.issn.2095-0799.2016.07.011
基于Selenium的定向网络爬虫设计与实现
随着数据挖掘在银行中的推广应用,大量、多样的数据作为数据挖掘的基石变得愈发重要,它能产生更大的价值,并为业务部门的决策提供强有力的支持.中国邮政储蓄银行江苏省分行基于Selenium开发了一套定向网络爬虫,通过定义的流程自动化地采集指定网页的数据,并利用Tesseract-OCR对简单的验证码进行识别.
金融科技、数据挖掘、Selenium、定向网络爬虫、Tesseract-OCR
G25;TP3
2016-07-25(万方平台首次上网日期,不代表论文的发表时间)
共5页
35-39