10.3772/j.issn.1000-0135.2019.01.009
基于全字语义的摘要结构功能自动识别研究
学术文献摘要的各个结构都具有特定的功能,但是目前对学术文献摘要结构功能自动识别的研究相对较少,且存在方法较为传统、识别效果不显著的问题.以摘要文本中的字为基本语义单位,本文以基于具有序列属性的LSTM-CRF模型的深度学习方法,利用摘要中所有字所包含的语义信息,构建了期刊论文摘要结构功能自动识别模型,并与具有非序列属性的SVM模型与具有序列属性的RNN模型、CRF模型和LSTM模型进行了多个角度地对比.本文提出的模型在摘要结构功能识别的准确率、召回率和F值上均取得显著效果,F值最高达到85.47%.与RNN模型、CRF模型、LSTM模型和SVM模型相比,LSTM-CRF的平均整体性能分别提升了33.63%、39.13%、32.81%和38.33%.
全字语义、序列属性、摘要结构功能识别、LSTM-CRF
38
国家自然科学基金青年项目"基于时间感知模型的学术主题检索与演化挖掘研究"71503124;国家自然科学基金青年项目"基于CSSCI的句法级汉英平行语料库构建及知识挖掘研究"71303120
2019-02-27(万方平台首次上网日期,不代表论文的发表时间)
共10页
79-88