10.3969/j.issn.1672-9722.2007.07.018
一种基于三级索引词库结构的中文分词方法研究
提出一种分组并具有三级索引结构的词库组织体系,并就词库的扩充问题,考虑一种基于词频统计并具有过滤功能的关键词自动抽取和小词条添加方法.仿真实验结果表明,采用该方法可较大提高对中文文本的切词速度,保证系统具有较高的信息查全和查准率.
词库、索引结构、中文切词、全文检索
35
TP311.13(计算技术、计算机技术)
国家自然科学基金40344022
2007-08-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
47-49