10.3772/j.issn.1000-0135.2009.02.010
基于关键词和摘要相关度的文献聚类研究
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法.
文献聚类、相似度、关键词、摘要、最大距离
28
TP3;TP1
国家自然科学基金40771163;江苏省高校青蓝工程"优秀青年骨干教师"基金2004~2008
2009-05-08(万方平台首次上网日期,不代表论文的发表时间)
共5页
220-224