自然语言理解的中文地址匹配算法
在分析现有3类主要的中文地址匹配算法:要素层级匹配法、全文检索法、正则表达式法的基础上,提出了基于自然语言理解的中文地址匹配算法.新算法中建立了空间关系地址模型以解决中文地址抽象问题、地址库逻辑模型以解决地址信息的空间知识表达问题.新算法的完整流程包括预处理、地址解析、地址要素标准化、推理匹配和匹配登记等5个环节,本文重点阐述了地址解析和推理匹配这两个重要环节,分别依据“自然语言理解”中的中文分词和语义推理原理,对用非结构化的中文自然语言描述的中文地址进行处理,实现自然语言理解方法与地址匹配之间的结合,从而建立完整的基于自然语言理解的中文地址匹配算法.为验证该算法,开发了中文地址智能匹配实验系统,对河南省濮阳市人口库1000条居民地址数据进行匹配,匹配率达到了95%,准确率高于93%.
自然语言理解、地址匹配、地址要素、地址解析、隐马尔科夫模型
17
P208(一般性问题)
国家高技术研究发展计划863计划2012AA12A401;National High Technology Research and Development Program of China 863 program2012AA12A401
2013-10-16(万方平台首次上网日期,不代表论文的发表时间)
共14页
788-801