基于Spark平台的社交网络在不同文化环境中的中心度加权算法
社交网络广泛应用于科技、商业、经济和生物等领域.社交网络一般用中心性指标来对节点的重要性进行量化,常用的中心性指标有节点中心度、接近中心度、介数中心度、三角计数等等.已有的中心度算法通常只考虑单一的度量标准,本文提出加权中心度的思想,结合不同的中心度指标来进行综合考虑.该实验使用社交网络的真实BoardEX数据库,由合作单位香港大学提供,基础数据约600 G,需借助Apache Spark处理大数据的能力来进行集群并行计算.社交网络数据分成美国、英国、欧洲和其他国家4个地区,计算各地区上市公司的首席技术官和首席信息官的个人中心度,从而得到每个地区的平均加权中心度.实验结果表明,通过调整权值,可以使不同区域的加权中心度的差异尽可能小,且由权值大小可知不同中心度度量标准对加权中心度的影响不同.基于真实数据库和处理大数据的集群计算,本文的研究成果更具有现实意义和应用前景.
社交网络、大数据、中心性、加权中心度
34
TP182(自动化基础理论)
中央高校基本科研业务费专项资金资助项目21615438;广东省自然科学基金资助项目2016A030313084, 2016A030313700, 2014A030313374;广东省科技计划项目2015B010128007
2017-07-03(万方平台首次上网日期,不代表论文的发表时间)
共7页
15-20,48