10.3969/j.issn.1003-0077.2003.05.006
关于"中文网页自动分类竞赛"结果的分析
在最近召开的"全国搜索引擎与网上信息挖掘学术研讨会"上,举办了一场"中文网页自动分类竞赛",共有来自全国各地的10个队参加.本文在介绍本次竞赛活动规则和过程的基础上,详细分析了竞赛的结果,从而使我们对于目前中文网页自动分类技术的现状有了一种具体的认识:目前已有分类器的性能没有呈现出明显的差距,中文网页的分类比普通文本的分类要困难的多.同时,本文还尝试推出一个标准的中文网页分类的实例样本集,希望通过不断完善,最终作为中文网页分类技术研究的基本语料.
计算机应用、中文信息处理、机器学习、中文网页自动分类、TREC评测
17
TP391(计算技术、计算机技术)
国家重点基础研究发展计划973计划G1999032706
2004-03-12(万方平台首次上网日期,不代表论文的发表时间)
共7页
34-40