基于多维度特征和深度学习模型的地址实体识别
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

10.11772/j.issn.1001-9081.2021050711

基于多维度特征和深度学习模型的地址实体识别

引用
地址实体识别是一项在智慧城市建设中应用极其广泛的基础性任务,而在实际的业务数据中,中文地址实体描述经常出现用字生僻、含义模糊、简称乱用等现象,导致现有的基于规则或者基于统计的识别方法,已经难以有效地解决语义层面的深层次地址实体识别问题.针对上述问题,提出了一种基于多维度特征和深度学习模型相结合的中文地址实体识别方法(Bi-LSTM-Self-Attention-CRF).首先,提取语料数据中地址实体的界限特征、词性特征、标签特征以及预先训练好的高维空间的字向量特征作为多维度特征;然后,采用双向的长短期记忆(Bi-LSTM)网络模型捕获输入的地址实体特征;接着,使用自注意力机制(Self-Attention)计算不同特征对地址实体的注意力权重,使用条件随机场(CRF)学习实体标签之间的转移概率矩阵;最后,使用维特比算法预测实体标签的最优序列.在相同的多维度特征基础上,与Bi-LSTM模型和Bi-LSTM-CRF模型相比,所提方法的识别精确率、召回率、F1值均优于对比算法,分别达到了0.891、0.880、0.885.实验结果表明,所提方法的精确率和召回率可以满足实际业务中对地址实体的识别要求.

智慧城市;地址实体识别;多维度特征;双向的长短期记忆网络;自注意力机制;条件随机场

41

TP183(自动化基础理论)

2022-03-07(万方平台首次上网日期,不代表论文的发表时间)

共6页

48-53

相关文献
评论
暂无封面信息
查看本期封面目录

计算机应用

1001-9081

51-1307/TP

41

2021,41(z2)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn