10.3321/j.issn:1000-1190.2008.04.008
结合链接结构聚类的混沌粒子群网页分类规则抽取
网页分类器设计的核心是对原始分类数据集进行分类规则挖掘,本文提出了一种结合链接结构聚类的混沌粒子群网页分类规则获取算法.算法将聚类和分类结合起来进行分类规则提取:首先用基于K均值的聚类算法对一部分有代表性的链接结构数据聚类,进行类别自动标注,形成训练集;再用混沌粒子群算法对已标注类别的数据提取分类规则.实验结果表明,这种模式充分发挥了基于链接的分类方法受人为因素干扰最小的优点,减少了人工标注类别的工作量,同时提高分类的准确率和效率.
网页分类、规则抽取、混沌粒子群、链接结构聚类
42
TP311.1(计算技术、计算机技术)
国家自然科学基金资助项目60773009;国家重点基础研究发展规则"973"基金资助项目2007AA012290
2009-03-11(万方平台首次上网日期,不代表论文的发表时间)
共4页
535-538