10.3321/j.issn:1671-8836.2008.03.026
热点问题情报过滤模型与算法
针对热点问题跨越时间长以及含重复情报、过时情报和无实用价值信息量大等问题,提出了一种新的热点问题情报获取模型与分级过滤算法,以解决情报的去粗取精、去伪存真问题.首先将无序关联情报结构化,然后采用SVM(space vector model)方法,根据热点问题情报的特殊性,提出了新的特征选择方法,在特征向量的相似性计算中引入去除重复和过时情报的判别参数,达到优化情报的目的.实验结果表明,过滤算法除去原始情报库中的无关情报、重复情报和过时情报后剩余情报数约为原始情报数的59%.
热点问题、情报获取模型、分级过滤
54
TP39(计算技术、计算机技术)
国家高技术研究发展计划863项目2003AA001032, 2002AA111010
2008-08-20(万方平台首次上网日期,不代表论文的发表时间)
共4页
367-370