10.3969/j.issn.1672-9722.2022.04.005
基于社区发现的专利查询扩展方法
专利检索是专利挖掘任务的重要前置子任务,而查询扩展对于提高专利检索方法的准确率和召回率有重要作用.专利文档具有高频率的非标准技术术语以及创造词的特点,传统的查询扩展方法并没有考虑这一特点,会导致专利检索子任务难以获取用户完整的查询意图;此外,在专利查询扩展过程中不可避免地会引入噪声词,出现主题漂移现象,导致查询召回率降低.为了解决这些问题,提出了一种基于社区发现的专利查询扩展方法,该方法建立以专利主题词为节点,主题词之间关系为边的专利主题词图,将专利查询扩展问题转化稠密子图搜索问题,利用社区发现算法实现问题求解.在基准数据集CLEP-IP 2010上开展实验,结果表明与现有的专利扩展查询方法相比,与基准方法相比召回率提高了约7.1%,PRES改善了近3.2%.
专利检索、查询扩展、词向量、社区发现
50
TP301.6(计算技术、计算机技术)
2022-05-16(万方平台首次上网日期,不代表论文的发表时间)
共6页
709-714