10.3969/j.issn.1000-6125.2009.02.004
汉语语文词典的词条结构模型
词典可以认为是一种用非结构化形式表现的、具有半结构化特征的语言数据.词典的编纂、查考、典藏以及语言研究和语言工程,常常需要对文本形式的词典及其词条内容进行结构化处理.本文尝试用数据建模的方法对汉语词典及其词条进行形式化描述,采用XML Schema定义词条结构,根据词条结构的数据模型对词典文本作XML标注,描述词条中蕴含的各种语言学信息,为辞书编纂、词汇研究和语言工程提供数据资源.
汉语语文词典、语言数据建模、XML Schema、汉语词汇数据库
H16;H1
2009-05-19(万方平台首次上网日期,不代表论文的发表时间)
共10页
28-36,87