DOI：10.3969/j.issn.1001-8972.2019.17.013

使用文本挖掘辅助专利分析

引用

摘要：

在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这样不易直接参与专利分析的非结构化数据.自然语言处理(NLP)是近年来大数据和机器学习兴起后的一项热门技术,其中,文本挖掘可以针对性的分析大量文本内容,满足很多实际需求,正适用于批量处理专利信息中的非结构化数据,从中提取出有价值的信息,也可以进一步的转换为结构化数据,作为新的维度与其他结构化数据共同分析.

在线出版日期：2019-09-10（万方平台首次上网日期，不代表论文的发表时间）

页数：共3页

页码：39-40,42

期刊专题