10.3772/j.issn.1000-0135.2023.05.001
知识单元重组视角下的科学主题预测研究
准确的科学主题预测能够明确学科未来的发展方向,为科研领域的发展规划和管理决策提供参考.本文着眼于新生科学主题的预测,基于知识单元重组视角,将主题-特征词的表征关系类比为科学概念-知识单元的表征关系,提出科学主题预测方法.首先,使用LDA(latent Dirichlet allocation)主题模型获取全局主题、特征词与概率矩阵,通过转置向量空间获得特征词向量;其次,运用ARIMA(autoregressive integrated moving average model)模型预测特征词的词频并计算向量调节系数,从而获得特征词预测向量,运用t-SNE(t-distributed stochastic neighbor embed-ding)算法将预测向量降维,并使用模糊C-均值算法将低维预测向量聚类生成预测主题,实现知识单元的重组;最后,筛选出由多个原始主题聚合而来、具有全新释义的预测主题,将其视为科学主题预测结果.本文以"知识管理-知识组织-知识服务"领域为例进行实证研究,预测出智库、数字人文等在已有领域研究中尚未出现的新词与相关主题,并通过特征词直接聚合与概念集成这两种主题映射模式,获得这些新生主题的基本内涵与相关研究内容.实证结果表明,本文提出的科学主题预测方法能够准确地预测出新生主题.
知识单元、科学概念、科学主题、主题预测、向量调节
42
G202;TP391;F830.9
国家社会科学基金20ATQ006
2023-07-20(万方平台首次上网日期,不代表论文的发表时间)
共14页
511-524