10.3969/j.issn.1002-1558.2021.03.013
不平行的空间:用户生成内容大数据质量探析
UGC大数据中有许多前互联网时代难以获取甚至无法获取的资料,并且避免了通过传统方法获取数据的诸多缺陷,因而被作为一种新的资源运用于社会科学研究.开展这类研究,UGC大数据的质量是必须首先考虑的问题.本文从信息生产特点、信息传播过程、信息检测识别技术等多个角度,对UGC大数据质量存在的问题及其形成原因进行探析.研究发现:UGC大数据存在自身特有的缺陷,网络信息空间并不能完美地映射社会现实空间;将UGC大数据运用于社会科学研究,难以保证数据的真实性、自然性和准确性.因此,具体研究需要对数据质量进行预判和检验,并采用与传统研究方法相结合等策略来应对.
大数据、用户生成内容、数据质量、检测识别技术
G203(信息与传播理论)
本文系2016年度国家社科基金重大项目"大数据时代计算社会科学的产生、现状与发展前景研究"项目编号:16ZDA086
2021-04-12(万方平台首次上网日期,不代表论文的发表时间)
共9页
90-98