基于LDA主题模型的专利内容分析方法
主题模型是一种有效提取大规模文本隐含主题的建模方法.本文将Latent Dirichlet Allocation (LDA)主题模型引入专利内容分析领域,实现专利主题划分,解决以往专利主题分类过于粗泛、时效性差、缺乏科学性等问题.并在原有模型基础上构建LDA机构-主题模型,对专利知识主体和客体联合建模,实现专利主题和机构之间内在关系分析.最后,以通信产业LTE技术领域为例,验证该模型可以有效用于专利主题划分,实现各主题下专利知识主体竞争态势测度.
主题模型(LDA)、LDA机构-主题模型、专利内容分析、LTE
36
G350(情报学、情报工作)
国家自然科学基金项目“基于中文文本挖掘技术的SPIOD专利知识演化分析”61272370,2013.1-2013.12;高等学校学科点专项科研基金“基于SIPO数据库的专利知识测度体系及应用”博导类20110041110034,2012-2014.
2015-05-04(万方平台首次上网日期,不代表论文的发表时间)
111-117