10.3969/j.issn.1003-0077.2019.05.011
面向文本结构的混合分层注意力网络的话题归类
针对目前话题归类模型中文本逻辑结构特征与文本组织结构特征利用不充分的问题,该文提出一种面向文本结构的混合分层注意力网络的话题归类模型(TSOHHAN).文本结构包括逻辑结构和组织结构,文本的逻辑结构包括标题和正文等信息;文本的组织结构包括字—词语—句层次.TSOHHAN模型采用竞争机制融合标题和正文以增强文本逻辑结构特征在话题归类中的作用;同时该模型采用字-词语-句层次的注意力机制增强文本组织结构特征在话题归类中的作用.在4个标准数据集上的实验结果表明,TSOHHAN模型能够提高话题归类任务的准确率.
深度学习、注意力机制、混合分层注意力网络、话题归类
33
TP391(计算技术、计算机技术)
北京市教委社科计划SM201911232003;国家自然科学基金61572079;北京市教委科技计划KM201711417004
2019-06-13(万方平台首次上网日期,不代表论文的发表时间)
共11页
93-102,112