10.3969/j.issn.1000-6125.2011.06.011
基于文本聚类的工具书查重方法研究
由于工具书编纂队伍庞大,工作流程上又多头并进,所以工具书编纂过程中难免会出现内容交叉重复问题.为了减少工具书查重的工作量,文章提出了一种基于文本聚类的查重方法.试验表明,分层聚类算法可用于大型工具书词条查重工作,它对工具书编纂中解决词条交叉重复问题是有效的.
文本聚类、特征词、交叉重复、工具书查重
H12;G25
2012-03-30(万方平台首次上网日期,不代表论文的发表时间)
共10页
94-103