10.3772/j.issn.1000-0135.2015.003.007
基于LDA主题模型和生命周期理论的科学文献主题挖掘
科学文献主题挖掘可以帮助科研人员快速准确的捕捉学科主题的脉络结构,跟踪主题演化发展,并对学科发展趋势做出预测.本文将LDA(Latent Dirichlet Allocation,潜在狄利克雷分配)主题模型与科学文献生命周期理论结合起来,提出一种挖掘学科领域生命周期语义信息的方法.为了体现学科领域研究主题的动态语义信息,将科学文献按照时问特征划分,利用文献信息增长规律刻画学科领域生命周期,在此基础上,实现学科生命周期不同阶段、不同层次的主题抽取和主题演化.在由国内新能源领域的科学文献构成的语料库上的实验结果表明,该方法能够监测和追踪新能源研究热点和发展态势,能够为科学研究和科技政策制定提供决策支持.
LDA、生命周期、理论主题、抽取主题、演化新能源
34
G25;TP3
国家自然科学基金研究项目“新研究领域科学文献传播网络生长及对传播效果影响研究”71373124
2016-03-30(万方平台首次上网日期,不代表论文的发表时间)
共14页
286-299