10.3969/j.issn.1003-0077.2023.01.014
融合高频属性信息的属性抽取研究
属性抽取是细粒度情感分析的子任务之一,其目标是从评论文本中抽取用户所评价的属性.在特定领域中,某些属性可能会频繁出现在不同的评论文本中,称之为高频属性.高频属性具有较高的领域表征能力,易被监督学习模型感知.相对地,低频属性出现频率低,可供训练的样本总量较为稀疏,使得神经网络模型难以充分学习相应的语言现象,从而使测试阶段的低频属性抽取难度较高.由于低频属性经常与高频属性同时出现在局部文字片段之中,该文根据这一特点,提出一种融合高频属性信息的属性抽取方法:跟踪和记录模型识别的高频属性,使用卷积神经网络和注意力机制编码高频属性的上下文信息,并通过门控机制融入其他词项的表示学习过程中,辅助低频属性的识别.该文在国际语义评测大会2014和2016提供的笔记本电脑及餐馆领域数据集上进行了实验,相比于基线模型,该文方法在这两个英文数据集上F1值分别提升了2.33和1.44个百分点,并且总体性能高于现有前沿技术.
属性抽取、高频属性、门控机制
37
TP391(计算技术、计算机技术)
国家自然科学基金;国家自然科学基金;国家自然科学基金
2023-03-30(万方平台首次上网日期,不代表论文的发表时间)
共12页
132-143