10.3969/j.issn.1673-5692.2009.03.020
基于N-gram统计模型的搜索引擎中文纠错
搜索引擎中的关键词纠错是提高检索效率的一项重要辅助功能.提出了一种完全通过分析上下文统计信息的方法,根据中文语言的特点,在建立N-gram统计模型并分析比较的基础上,再通过计算TF/IDF的权重来获得最优的纠错结果,最后通过实验验证了该方法实现了搜索引擎中对输入关键词的自动检查和纠错.
搜索引擎、输入纠错、N-gram模型、TF/IDF
4
TP393(计算技术、计算机技术)
2009-12-14(万方平台首次上网日期,不代表论文的发表时间)
共4页
323-326