10.11925/infotech.2096-3467.2022.0075
基于计量指标多变量LSTM模型的新兴主题热度预测研究
[目的]识别出多源数据中蕴含的新兴主题,建立融合计量指标多变量的LSTM模型以实现新兴主题热度的预测.[方法]首先,挖掘出基金项目、期刊论文、专利文献中的研究主题;其次,根据主题新颖性、成长性和持续性筛选出研究主题中的新兴主题;最后,设计主题热度指标,并融合基金金额、基金数量、论文篇均被引、专利IPC小类数量4个计量指标,基于LSTM模型实现对新兴主题研究热度的预测.[结果]以固体氧化物燃料电池领域为例,融合计量指标的多变量LSTM预测效果优于BP、KNN、SVM、单变量LSTM模型,其MAE(16.534)、RMSE(23.494)最小,R2(0.642)最高.[局限]在输入计量指标选择中,专利被引数量等指标由于很难获取每个时间窗口下具体数据而未被纳入.[结论]计量指标多变量的纳入优化了新兴主题热度预测模型的预测效果.
多变量LSTM、新兴主题、热度预测、计量指标
6
G353;TM911(情报学、情报工作)
中国科学院战略性先导科技专项;中国科学院文献情报能力建设专项;中国科学院青年创新促进会项目
2023-01-13(万方平台首次上网日期,不代表论文的发表时间)
共11页
35-45