10.3969/j.issn.1003-5397.2006.02.018
信息处理用词语义项区分的原则和方法
本文探讨了面向汉语信息处理的词语义项区分应该遵守的原则和方法.先界定了作为计算机自动词义消歧对象的多义词的范围;然后指出面对大规模真实文本,词语义项区分应具有可操作性,即应具有完备性和离散性;最后论证了上下文语境是计算机区分词语意义的最终凭借,信息处理用词语义项区分的依据应主要来自词语的句法行为.
义项、多义词、词义标注、词义消歧、语料库
H0(语言学)
国家研究发展基金2004CB318102;中国博士后科学基金2004035029;高比容电子铝箔的研究开发与应用项目2001AA114210;2002AA117010
2006-08-11(万方平台首次上网日期,不代表论文的发表时间)
共8页
126-133