10.3969/j.issn.1672-6944.2018.09.017
基于新浪微博的爬虫程序设计与实现
为了快速地获取到微博中人际关系信息,根据网址的特点,文章提出了一种基于新浪微博的爬虫程序设计方法.本方法通过模拟登录新浪微博,实现抓取微博中由指定用户出发的关注对象的名称等信息;该程序利用解析关键路径,广度遍历等技术,匹配符合规定条件的人物名称,并抓取相关内容;最后对该程序又进一步地优化与改进.实验结果表明:本程序具有针对性强,数据采集速度合理,易推广开发,稳定性强等优点,为寻求人际关系的研究者提供了寻求微博用户关注者的方法,有利于对微博的后续数据挖掘研究.
人际关系、新浪微博、模拟登录、关键路径、广度遍历
15
2018-06-19(万方平台首次上网日期,不代表论文的发表时间)
共3页
40-42