10.3969/j.issn.1673-629X.2012.05.057
基于XML语言甲骨文语料库元数据抽取的研究
计算机辅助甲骨文考释首先要解决的是以统一的数据形式来管理甲骨文信息,文中提出了一种基于XML语言的元数据抽取方法,提出了将抽取出的元数据存放到元数据库中,使用视图对元数据库进行动态地增加或删除,来弥补元数据抽取不全或错误的现象.同时通过XML Schema文档检测保存的元数据的语法格式,为以后映射到甲骨文语料库中做了语法的检测.该方法为甲骨文语料库的建设提出了一种新方案,也为后期语料信息语义化和专家系统推理打下了基础.
语料库、元数据、信息抽取、XML、XML Schema
22
TP393.01(计算技术、计算机技术)
国家自然科学基金资助项目60875081
2012-07-17(万方平台首次上网日期,不代表论文的发表时间)
共4页
216-218,222