10.3772/j.issn.1000-0135.2013.10.005
基于CART分类方法的期刊操纵引用行为识别建模研究
当前,一些学术期刊在利益的驱使下,通过大量自引和结成"互引同盟"的方式快速提高被引频次和影响因子等指标,影响了引文分析的公平性.基于此,本文首先利用数据挖掘中的CART分类算法构建期刊操纵引用行为的识别模型,设计了识别操纵引用行为的4个评价指标:自引率、被引年代分布、被引密度比和引用密度比.并采用国内某引文数据库中的50本综合性社会科学期刊作为实验样本,采集该期刊群2009年的引文数据作为训练数据集,2008年的引文数据作为验证数据集.最后,运用2010年的引文数据对期刊操控行为识别模型的有效性进行验证,实验结果证明,本文构建的分类模型可以有效地对期刊引用操纵行为进行识别.
期刊引用操纵行为、CART算法、自引率、被引年代分布、被引密度比、引用密度比
32
TP3;TU9
2013-11-07(万方平台首次上网日期,不代表论文的发表时间)
共10页
1058-1067