10.3969/j.issn.1007-130X.2019.03.023
基于地址语义理解的中文地址识别方法
互联网中中文地址文本蕴含着丰富的空间位置信息,为了更加有效地获取文本中的地址位置信息,提出一种基于地址语义理解的地址位置信息识别方法.通过对训练语料进行词频统计,制定地址要素特征字集合和字转移概率,构造特征字转移概率矩阵,并结合字符串最大联合概率算法,设计了一种不依赖地名词典和词性标注的地址识别方法.实验结果表明,该方法对地址要素特征字突出且存在歧义的中文地址的完全匹配率为76.85%,识别准确率为93.11%.最后,与机械匹配算法和基于经验构造转移概率矩阵的方法进行对比实验,实验结果表明了该方法的可用性和有效性.
地址语义、要素特征字、转移概率、无词典
41
TP391(计算技术、计算机技术)
十三五国家重点研发计划课题2017YFB0503701;国家863计划2013AA12A202;测绘地理信息公益性行业科研专项201412014;湖北省自然科学基金2013CFA125
2019-06-12(万方平台首次上网日期,不代表论文的发表时间)
共8页
551-558