面向信息检索的快速聚类算法

引用

摘要：

随着信息检索技术的迅猛发展,针对检索系统的改进已逐渐成为研究的热点.聚类是一种有效的改进策略,通过对检索结果进行聚类,可以使用户快速地定位到自己感兴趣的检索信息所在的类别.然而,传统的检索聚类算法要么运行效率低下,要么类别划分能力不强,使它们无法真正地用于检索系统中.针对此问题,提出了一种新颖的检索聚类算法,该算法首先通过极大极小值理论从检索返回的文档集中抽取多个聚点,并依此形成初始文档类划分结果.在此基础上,算法对初始文档类的特征集合进行细化调整以使类别的划分更加精确；同时对不满足收敛条件的文档类进行层次分裂以解决信息的分层描述问题.实验表明:此算法的时间复杂度与现有的检索聚类技术相差不多,并且由于对特征集合进行迭代调整使得类别的划分更加准确合理.

关键词：信息检索聚类技术、权值调整、极大极小理论、快速聚类、自组织映射

所属期刊栏目：50

分类号：TP391(计算技术、计算机技术)

资助基金：国家自然科学基金面上项目61073127;中央高校基本科研业务费专项基金项目HIT.NSRIF.2013066;中国博士后科学基金面上项目2013M530156;教育部-微软语言语音重点实验室开放基金

在线出版日期：2013-08-13（万方平台首次上网日期，不代表论文的发表时间）

页数：共12页

页码：1452-1463

英文信息展示

期刊专题