10.3969/j.issn.1673-629X.2009.08.031
基于改进VSM的句子相似度研究
向量空间模型是以特征项权重为核心的算法,特征项权重对文本分类、检索等的效果起着至关重要的作用.文中提出了一个新的权重概念--领域权重,并利用它改进传统向量空间模型.改进后的模型综合考虑原有特征项权重和文档中特征项自身的领域权重.在特定领域FAQ的检索中作测试实验,结果表明,改进的方法提高了检索的查准率、查全率和F测试值.
向量空间模型、领域权重、频率权重
19
TP312(计算技术、计算机技术)
安徽省自然科学基金项目KJ2007B245
2009-09-09(万方平台首次上网日期,不代表论文的发表时间)
共4页
113-116