10.11925/infotech.2096-3467.2020.0124
学术论文的社交媒体可见性预测研究
[目的]基于学术论文的多维特征,对其在社交媒体推特上的可见性进行预测,分析影响论文社交媒体可见性的重要因素.[方法]将论文的推特总提及量作为其社交媒体可见性类别标签,从论文、作者和期刊三个方面构建学术论文特征框架,构建基于分类的论文社交媒体可见性预测模型.在糖尿病论文数据集上进行实验,对比算法性能并识别特征的重要性.[结果]LightGBM算法的性能最佳,准确率达到0.70,能够有效预测论文的社交媒体可见性.学术论文的三类特征均对其社交媒体可见性产生影响,其中期刊相关的三种特征影响较为显著,期刊年均影响因子的重要性位列第一.[局限]仅针对糖尿病相关论文在推特中的可见性进行预测,未探究其他学科领域的论文在多个社交媒体平台的可见性.[结论]集成学习的方法预测论文的社交媒体可见性是最有效的,期刊相关特征对学术论文社交媒体可见性的影响最为显著.
学术论文、社交媒体、可见性预测、特征重要性
4
G353(情报学、情报工作)
本文系国家自然科学基金重大课题“国家安全大数据综合信息集成与分析方法”;国家自然科学基金青年项目“基于学术异质网络表示学习的知识群落发现”
2020-11-12(万方平台首次上网日期,不代表论文的发表时间)
共12页
63-74