10.3969/j.issn.1000-7695.2022.13.018
融合结构数据和语义的专利技术主题识别研究——以非小细胞肺癌治疗领域为例
针对专利技术主题识别方法存在缺少语义语境、可解释性弱和主题界定模糊等问题,提出一种融合专利结构数据和文本语义的技术主题识别分析方法.该方法以专利IPC作为结构数据改进纯文本主题建模,获取由IPC和专家分类意见指导的主题词向量,并使用word2vec模型获取专利文本语义词向量,将二者结果进行向量拼接,进而获得易于解释的精准技术主题,满足细粒度分析要求.最后,以非小细胞肺癌治疗领域作为实证研究,证实该方法的科学性、有效性和实用性.
主题模型、IPC-LDA、word2vec、向量拼接、非小细胞肺癌
42
F273.1;F426.72(企业经济)
沈阳药科大学工商管理学院学科建设课题2021-sygsxk-01
2022-08-17(万方平台首次上网日期,不代表论文的发表时间)
共7页
131-137