10.3969/j.issn.1672-1586.2020.05.020
规则匹配和深度学习结合的文本空间信息识别及定位
充分识别并空间化文本中蕴含的空间位置信息,对文本数据挖掘研究具有重要意义.由于文本中的空间信息存在描述不规范、形式多样和混杂方言等特点,识别难度大,提出一种规则匹配和深度学习相结合的空间信息识别及定位方法.首先根据标准地名地址制作匹配语义库,利用规则匹配法精准提取空间信息并实现空间定位;然后将其作为深度学习的样本数据,训练BERT-BiLSTM-CRF模型,实现空间信息的自动提取;再利用前后缀特征词匹配规则作为补充处理,进一步充分提取文本中的空间信息;最后利用地理编码技术实现空间定位.实验表明,本方法能有效提高空间信息识别的准确率、召回率,具有可操作性.
文本挖掘、空间信息识别、地名实体识别、自然语言处理、地理编码
27
TU2(建筑设计)
国家重点研发计划;社会民生类重点研发项目
2020-11-10(万方平台首次上网日期,不代表论文的发表时间)
共8页
121-128