10.3772/j.issn.1000-0135.2009.02.011
基于机器学习的文本聚类描述算法研究
传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释.标注文本集合聚类后生成的类簇被称为聚类描述问题.聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务.针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法.实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法.
聚类描述、文本聚类、支持向量机、机器学习
28
TP3;TU-
"十一五"国家科技支撑计划重点项目2006BAH03B02;南京理工大学青年科研扶持基金项目JGQN0701;南京理工大学科研启动基金项目AB41123;2006年江苏省研究生培养创新工程项目资助
2009-05-08(万方平台首次上网日期,不代表论文的发表时间)
共8页
225-232