10.3969/j.issn.1673-6338.2016.02.017
基于多策略的微博位置数据获取方法研究
随着Web2.0时代发展的成熟,在以微博为代表的新社交网络平台上产生了大量含有空间位置信息和时间标识的数据,即位置数据( location data)。位置数据是大数据的一个重要组成部分,现已作为一种战略性资源被广泛应用于社会生活的多个领域,而位置数据的获取是位置数据挖掘和应用的基础。深刻分析了基于API、基于网络爬虫和基于网络数据流3种目前常用的微博数据获取方法的特点,在此基础上提出了一种基于多策略的微博位置数据获取方法,详细阐述了该方法的基本原理、基本流程和主要特点。最后通过获取新浪微博的位置数据进行实验验证,结果证实,该方法可以实现全面、高效地获取微博位置数据。
多策略、微博、位置数据、API、网络爬虫、网络数据流、新浪微博
33
P208(一般性问题)
国家自然科学基金项目41271450;国家自然科学基金青年科学基金项目41401467;国家科技支撑计划项目2012BAK12B02。
2016-07-21(万方平台首次上网日期,不代表论文的发表时间)
共7页
201-207