10.3969/j.issn.1005-8095.2012.01.001
科技项目查重中特征词TF-IDF值计算方法的改进
针对科技项目查重的需要,利用分词的结果,将科技项目文档转换为文本向量空间模型,抽取特征词,并将特征词的位置和词的长度2个因素考虑进来,提出一种TF-IDF值的改进计算方法,并实例验证该方法有一定的改善效果.
文本特征、特征词权值、TF-IDF、算法改进、项目查重、科技项目
TP301.6(计算技术、计算机技术)
福建省公益类科研院所科研专项"基于相似性计算的科技项目查重技术研究"2010R1009-4
2012-09-29(万方平台首次上网日期,不代表论文的发表时间)
共3页
1-3