10.11925/infotech.2096-3467.2021.0972
融合LSTM与逻辑回归的中文专利关键词抽取
[目的]构建一种能够更加准确地抽取中文专利关键词的方法,解决传统方法难以发现低频、长尾关键词的问题.[方法]提出一种融合长短期记忆神经网络和逻辑回归模型的候选关键词抽取方法,进一步构建重组过滤规则,实现目标关键词抽取.[结果]实验结果表明,所提方法在所有关键词、低频关键词、长尾关键词、低频长尾关键词的抽取准确率比其他方法分别提高了 5、24、11、26个百分点.[局限]所提方法通过设定阈值实现关键词的分类,对阈值附近点的词语划分仍不够精确.[结论]融合长短期记忆神经网络和逻辑回归模型获取候选关键词,并基于重组过滤规则提取目标关键词,能够有效发现专利文本中的低频、长字符组成的关键术语,为专利文本分析等任务提供一定的参考价值.
关键词抽取、LSTM神经网络、逻辑回归、重组过滤
6
TP393(计算技术、计算机技术)
广东省普通高校青年创新人才类项目;广东省基础与应用基础研究区域联合青年基金项目;教育部人文社会科学研究项目
2022-06-23(万方平台首次上网日期,不代表论文的发表时间)
共10页
308-317