10.13474/j.cnki.11-2246.2016.0050
前后缀与特征词相结合的地名地址提取
随着地理信息与计算机技术的发展,网络中的非结构化地名地址数据越来越多,逐步成为地理信息更新的重要途径之一.针对互联网中地名地址的存在方式及结构特点,本文提出了一种前后缀与特征词相结合的地名地址识别提取方法.首先利用HMM训练进行分词,接着通过地名地址前后缀词库进行候选地名切分与预提取,最后根据特征词进行匹配过滤,实现对地名地址的准确提取.试验结果证明,本文方法提高了地名地址识别的准确率和召回率,很大程度上解决了未登录地址提取问题.
前后缀、特征词、HMM分词、地名地址
P208(一般性问题)
国家863计划2012AA12A402;2013AA12A403;中国测绘科学研究院基本科研业务费7771403
2016-05-26(万方平台首次上网日期,不代表论文的发表时间)
64-68