10.3969/j.issn.1007-3264.2007.05.022
基于SWN理论提取复合关键字系统的设计与实现
实现了一个利用小世界网络模型(SWN)提取中文文档的质:平均路径长度和聚类系数.本系统使用的算法首先对文档进行分词,以分词之间的相邻关系为边、以分词为节点构造文档结构图.然后计算每一个分词的平均路径长度变化量和聚类系数变化量,并且使用这两个变化量作为提取关键字的标准,最后按照一定策略合并关键字成复合关键字.本文首先详细介绍了小世界网络模型的概念和在关键字提取方面的应用,然后介绍了本系统的设计与实现,最后通过实验证明了该算法的正确性和有效性.
小世界网络、关键字提取、平均路径长度变化量、聚类系数变化量
12
TP393(计算技术、计算机技术)
2007-10-29(万方平台首次上网日期,不代表论文的发表时间)
共5页
82-86