基于概念格的K-Means算法研究
针对现有的K-Means算法K值需要人工赋值、随机选取初始中心点、文本表示维度高且缺乏语义的缺陷,提出了一种基于概念格的K-Means算法--K-MeansBCC(K-means algorithm based on concept lattice).将文本集经预处理转化为形式背景,在此基础上生成概念格;利用概念格中的概念表示文本,根据文本中概念的权重确定K值、选取初始中心点.最后设计了文本间的概念相似度计算公式,并由K-Means算法产生聚类结果.实验结果表明,该算法提高了聚类的效率和准确性.
K-Means算法、概念格、聚类、概念相似度、初始中心点
32
TP311(计算技术、计算机技术)
国家自然科学基金项目60972090;辽宁省自然科学基金项目20072142;大连市政府IT优秀教师基金项目大信发2008-40-6
2011-06-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
656-658,662