10.11772/j.issn.1001-9081.2014.11.3273
基于标题与正文匹配的科技论文可信质量评估方法
为从质量参差不齐的海量网络科技文献中准确高效地找出所需的有价值文献,基于标题与正文的一致性匹配思想,提出了基于标题与正文匹配的科技论文可信质量评估方法.该方法首先将标题与正文分别用特征向量建模,利用词相似度,对标题向量和正文向量中的每个特征词进行相似度计算,取相似度大于一定阈值的词对为匹配成功的特征词对;然后,统计所有匹配成功的词对数量及词权重,计算出一个标题的可信度;最后,通过论文标题分层树型结构,利用树的深度遍历算法,计算所有标题与其对应正文的相似匹配程度,进而评估整篇科技论文的可信度.《知网》实例分析表明:该方法实现了科技论文可信质量评估,使得读者无须阅读大量科技论文,就能挑选出可信或者具有实际的参考价值的科技论文,降低了信息搜索成本,提高了决策效率.
科技论文、标题、正文、一致性匹配、可信评估
34
TP391.1(计算技术、计算机技术)
国家863计划项目2009AA012201;国家自然科学基金资助项目61272107,61202173,61103068;上海市优秀学科带头人计划项目10XD1404400;教育部科技发展中心网络时代的科技论文快速共享专项研究资助课题20110740001;华为创新研究计划项目IRP-2013-12-03
2015-01-21(万方平台首次上网日期,不代表论文的发表时间)
共6页
3273-3278