10.3969/j.issn.1001-0548.2019.06.019
基于LDA的复杂网络整体研究态势主题分析
复杂网络的研究发展非常迅速,已经对自动控制、统计物理、计算机及管理等学科产生了深刻的影响.然而,国内的主题发展态势一直缺乏系统、直观的分析.本文以2017年第十三届全国复杂网络大会的会议摘要文本为研究对象,从会议摘要主题分析的角度研究了国内复杂网络科研领域的整体发展态势.研究过程中首先对摘要文本进行预处理,通过建立自定义词典和停用词库对文本进行jieba分词,得到一个文档-词矩阵.然后用LDA主题模型对摘要主题进行挖掘,通过SVD分解确定主题数目,并基于摘要间的JS距离进行凝聚层次聚类,基于机构间的JS距离用Blondel算法对机构进行社团划分,最终得到10类会议主题和4类科研社团.实证结果不仅能分析出复杂网络宏观上的研究趋势与不同研究方向的热门程度;也能基于聚出的4类科研社团,为新进入复杂网络的研究者寻找对应研究方向的文献提供参考机构.
复杂网络、社团结构、研究态势、文本分析
48
TP393;N949(计算技术、计算机技术)
国家自然科学基金61773248, 71771152
2019-12-19(万方平台首次上网日期,不代表论文的发表时间)
共8页
931-938