10.16208/j.issn1000-7024.2016.12.024
面向专利的技术主题检测
对专利文献自身特点及TF-IDF和TextRank关键词抽取技术进行研究,提出面向专利文献标题和摘要的技术主题检测方法.通过分析专利文献标题和专利文献摘要中专利技术主题的分布特点、词长特征和位置信息,计算候选技术主题的主题度,筛选主题度最大的候选主题词作为显式技术主题;根据TF-IDF算法和TextRank算法,从专利文献内容中提取关键词作为隐式技术主题词;将所提取的关键词进行加权计算,筛选权值最大的词作为最终的专利技术主题来评测.实验结果表明,该方法是有效的,可用于进一步支撑专利技术功效矩阵的构建工作.
主题度、显式技术主题、隐式技术主题、关键词、技术主题
37
TP391(计算技术、计算机技术)
国家自然科学基金项目61271304;北京市教委科技发展计划重点项目暨北京市自然科学基金 B 类重点基金项目KZ201311232037;北京市属高等学校创新团队建设与教师职业发展计划基金项目IDHT20130519
2017-01-05(万方平台首次上网日期,不代表论文的发表时间)
共6页
3260-3265