10.3772/j.issn.1000-0135.2014.010.012
融合科技文献内外部特征的主题模型发展综述
以 LDA( Latent Dirichlet Allocation)为代表的主题模型自提出以来就受到了广泛关注,并且随着研究的不断深入产生了大量有代表性的研究成果。为了满足用户多样化的检索需求,本文立足于科技情报分析工作,从融合单一外部特征和同时融合多个外部特征两个角度综述了一些典型主题模型,并对其进行了客观分析和评价。所涉及的外部特征主要包括:科研人员、时间、参考文献、母体文献以及合著关系等。经本文深入分析发现,目前融合单一外部特征的主题模型研究已经趋于成熟,而同时融合多个外部特征的主题模型研究仍处于起步阶段。缘于,模型融合的外部特征越多,能反映出的文献信息种类就越多,从而能更好地满足用户多样化的实际需求。因此,本文认为同时融合多个外部特征的主题模型研究将是科技情报分析未来的发展方向之一,应加大研发力度。
主题模型 LDA模型、内部特征、外部特征、科技情报分析
F27;TU2
国家自然科学基金项“基于论文和专利资源的技术机会发现研究项目编号71403255;中国科学技术信息研究重点工作项目“大数据环境下融合多源信息的科技文献智能分析IK务平台建设及应用示范编号ZD2014-7-1的研究成果之一'。
2015-01-23(万方平台首次上网日期,不代表论文的发表时间)
共13页
1108-1120