10.3969/j.issn.1000-1220.2004.08.018
汉语文本中交集型切分歧义的分类处理
自动分词是中文信息处理的基本问题,交集型歧义字段的切分又是中文分词的难点.本文把交集型歧义字段按其宏结构分类,再依据本文提出的4条切分原则,使用歧义字段的结构信息和语法规则对不同类型的交集字段分别处理,提高了分词的准确性.该分词方法已作为中文网页索引和检索工具被用于网络搜索引擎中.实验效果表明,这一分词系统能够处理某些其它分词系统不能正确划分的实例.
自动分词、交集型歧义字段、宏结构、类别
25
TP319(计算技术、计算机技术)
国家自然科学基金69673015,60373099;吉林省科技发展计划20000111
2004-10-21(万方平台首次上网日期,不代表论文的发表时间)
共5页
1486-1490