10.3321/j.issn:1000-565X.2004.z1.016
基于主题词迭代提取的信息检索算法
为了让用户从海量知识信息中精确、快速地获取到感兴趣的信息内容,综合考虑文档的头部信息(标题、摘要、关键词)和重点主体内容,采用基于主题词迭代提取的信息检索算法,使得主题词的提取在兼顾效率的同时准确率达到83%以上,主题信息检索的性能也随之增加.实验结果表明,在文档查询词频和倒排文档频率(TF-IDF)的基础上对候选主题词相关度权值的计算进行合理化调整,并利用所提出的主题词迭代提取算法,主题信息检索的有效性将显著增加.
迭代提取、主题词、信息检索、文档频率优化
32
TP311(计算技术、计算机技术)
2004-12-16(万方平台首次上网日期,不代表论文的发表时间)
共4页
77-80