基于规则的中文地址要素解析方法
万方数据知识服务平台
应用市场
我的应用
会员HOT
万方期刊
×

点击收藏,不怕下次找不到~

@万方数据
会员HOT

期刊专题

基于规则的中文地址要素解析方法

引用
在日常生产与生活中,地址是最常见的使用自然语言描述地理位置的参考系统之一.地址地理编码技术被认为是大量业务数据的GIS实现可视化定位和空间分析的桥梁,在房地产管理、土地管理、城市规划、公安、邮政、税收、电讯和公共卫生等领域中具有十分重要的应用前景.地址要素解析是中文地址编码的核心技术之一.它是将自然语言描述的地址拆分为在某一限定区域内,可以指定某一地理范围的地址要素的过程.实际上,这个过程可以被看作是一种特定的中文分词任务.由于语言和文化的原因,中文地址描述采用连续的字符串,而且普遍存在不规范现象.目前,采用的地址解析方法在较大程度上受限于词典的更新维护和规则的不完备问题.本文以大规模地名词典和地址数据库为数据源,通过系统分析地址要素的构词特征和句法模式,构建了各类地址要素的特征字库,提出了中文地址的数字表达方法,设计了RBAI中文地址要素解析算法,开发了相应的原型系统.实验结果准确率达到92%以上,处理效率达2800条/秒.这表明该方法符合大规模数据处理的应用需求,具有重要的推广应用价值.

中文地址、语义解析、地址编码、地址表示

12

P3(地球物理学)

国家高技术研究发展计划863计划2007AA12Z221;国家自然科学基金40971231;南京师范大学校科研和教改项目2006105XGQ0051

2010-05-10(万方平台首次上网日期,不代表论文的发表时间)

共8页

9-16

相关文献
评论
暂无封面信息
查看本期封面目录

地球信息科学学报

1560-8999

11-5809/P

12

2010,12(1)

相关作者
相关机构

专业内容知识聚合服务平台

国家重点研发计划“现代服务业共性关键技术研发及应用示范”重点专项“4.8专业内容知识聚合服务技术研发与创新服务示范”

国家重点研发计划资助 课题编号:2019YFB1406304
National Key R&D Program of China Grant No. 2019YFB1406304

©天津万方数据有限公司 津ICP备20003920号-1

信息网络传播视听节目许可证 许可证号:0108284

网络出版服务许可证:(总)网出证(京)字096号

违法和不良信息举报电话:4000115888    举报邮箱:problem@wanfangdata.com.cn

举报专区:https://www.12377.cn/

客服邮箱:op@wanfangdata.com.cn