10.3772/j.issn.1000-0135.2022.09.007
基金项目研究的主题挖掘与动态演化分析——以美国NSF数据中AI领域为例
本文旨在构架基金项目研究主题挖掘与动态演化分析的情报研究流程,通过对表征基金项目标题、摘要与学部的数据进行关联建模和挖掘,从项目内容层面上探究基金资助领域研究涉及的主题特点、范围侧重、发展方向及演化脉络.首先利用RAKE(rapid automatic keyword extraction)关键词抽取算法从基金数据中的标题和摘要中抽取关键词,通过术语切分等方式获得核心关键词;然后,采用Google的word2vec深度学习工具对核心关键词进行词向量建模,并使用k-means算法对生成的词向量进行聚类,挖掘相应的研究主题;进而对主题分布进行统计分析,且通过WMD(word mover's distance)算法计算主题之间的相似度,以分析研究主题演化趋势,并识别出演化主路径.实证研究发现,以美国NSF(National Science Foundation)数据中AI(artificial intelligence)领域为例,所提方法流程能够识别出AI领域的多个主题,且能识别出不同学部的主题侧重;在发展过程中,研究主题演化呈现出大量分裂与融合的复杂态势,演化路径明晰,侧重点突出,通过演化强度能够明晰研究主题演化的主路径.研究结果表明,本文方法流程能够有效揭示基金资助对相关技术的整合与推动态势,可为学术研究与政府规划提供有力的支撑.
主题挖掘、动态演化、词向量建模、美国国家科学基金、人工智能
41
TP391;G350;S
国家社会科学基金16ZDA224
2022-10-21(万方平台首次上网日期,不代表论文的发表时间)
共13页
967-979