10.3772/j.issn.1000-0135.2009.06.004
基于C-value与TF-IDF的文献簇主题识别研究
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别.
C-value、TF-IDF、CV-IDF、引文分析、主题识别
28
TP3;TP1
2009-12-22(万方平台首次上网日期,不代表论文的发表时间)
共6页
821-826