10.3969/j.issn.1001-8972.2019.17.013
使用文本挖掘辅助专利分析
在专利信息数据库中,既包含申请号、申请日、分类号、申请人、申请人地址、专利法律状态等结构化数据,也包含说明书摘要、权利要求书和说明书这样不易直接参与专利分析的非结构化数据.自然语言处理(NLP)是近年来大数据和机器学习兴起后的一项热门技术,其中,文本挖掘可以针对性的分析大量文本内容,满足很多实际需求,正适用于批量处理专利信息中的非结构化数据,从中提取出有价值的信息,也可以进一步的转换为结构化数据,作为新的维度与其他结构化数据共同分析.
2019-09-10(万方平台首次上网日期,不代表论文的发表时间)
共3页
39-40,42