10.3969/j.issn.1008-0570.2008.18.069
基于词平台的中文文档实验系统的构建
文章提出一种新的中文文档实验系统,力求建立一个克服束缚中文信息处理发展的自动分词问题的实验研究平台.文章采用一种新的基于中文词的文本编码方法,对每个词进行编码,并使新编码与机内码联系起来.使用这种基于词的编码格式可以使词成为计算机中文处理中的最小信息栽体,无须再进行中文分词.文章使用该方法进行了关键词自动抽取的实验研究.结果显示,基于词编码的中文文档实验系统能很好的解决中文分词问题,并给其它中文文本分析奠定良好基础.
中文信息处理、汉字编码、词平台、自动分词
24
TP391.1(计算技术、计算机技术)
2008-09-01(万方平台首次上网日期,不代表论文的发表时间)
共3页
171-172,104