10.3969/j.issn.1002-137X.2009.05.062
HNC语义标注模型的构建
介绍一种基于HNC理论的、人机结合的汉语语料语义标注模型.首先分析了HNC语义标注的内容,在此基础上定义了标注的流程.因标注十分复杂,在流程的主要环节使用机器标注来帮助人工标注.具体地说,在语义块切分问题上采用最大熵模型,其正确率和召回率分别达到了83.78%和91.17%;在句类判断问题上采用基于实例的模型,其正确率达到了51.64%.运用此标注模型建设了HNC语义标注语料库,目前语料规模已达到40万字.
概念层次网络、语料库、最大熵模型
36
TP391(计算技术、计算机技术)
国家973项目"自然语言理解的交互引擎研究"2004CB318104;中国科学院声学研究所"所长择优基金"GS13SJJ04
2009-06-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
238-240,268