10.3969/j.issn.1000-3428.2009.15.011
一种潜在文档相似模型
提出一种潜在文档相似模型(LDSM),把每对文档看作一个二分图,把文档的潜在主题看作二分图的顶点,用主题间的加权相似度为相应边赋权值,并用二分图的最佳匹配表示文档的相似度.实验结果表明,LDSM的平均查准率和平均查全率都优于用TextTiling和二分图最佳匹配方法构建的文档相似模型.
主题、文档相似度、文档检索、信息检索
35
TP311(计算技术、计算机技术)
广东高校优秀青年创新人才培育基金资助项目LYM08074
2009-08-27(万方平台首次上网日期,不代表论文的发表时间)
共3页
32-34