Web网页信息文本分类的研究
面对海量的信息如何挖掘出有用的知识是当前研究的热点问题,对Web文本进行分类预处理,可在一定程度上解决此问题.针对Web文档的多主题特性,采用了多分类器模型,根据Web文档具有结构信息的特点,提出了系统的分类框架,对于短小文档采用Boosting和Web文档结构Bayesian分类模型,而对于长文档采用Boosting和综合Bayesian分类模型.实验结果表明,此分类框架具有较好的分类效果.
Web文本分类、多主题、多分类器、Boosting算法、综合Bayesian分类法
29
TP311.132(计算技术、计算机技术)
上海高校优秀青年教师科研专项基金项目B-8101-06-3802
2009-02-06(万方平台首次上网日期,不代表论文的发表时间)
共3页
6026-6028