10.3969/j.issn.1000-0135.2005.04.007
基于HTML文档结构的向量空间模型的改进
根据HTML文档不同标签域的分布特征和对文档内容的代表能力不同,我们提出了一种改进的向量模型(PFTF),并通过trec12的查询实验,比较了传统向量模型与PFTF模型对单个标签域以及多个文档表示结果的结合的检索性能.实验结果表明,PFTF模型对于这两个方面都有提高.
HTML文档结构、信息检索、向量空间模型、链接文本、TREC
24
TP3(计算技术、计算机技术)
国家自然科学基金60221120145
2005-09-15(万方平台首次上网日期,不代表论文的发表时间)
共5页
433-437