面向术语抽取的双阈值互信息过滤方法
为了降低互信息方法固有问题对术语过滤效果的影响,提出一种双阈值互信息过滤方法,给出了一种基于局部评价指标的阈值确定算法,通过数据抽样、统计和计算,能够快速精确地给出最优上下限阈值.相比单阈值互信息过滤方法,在不更改互信息计算公式的前提下,通过设置双阈值的方法进行候选术语过滤与抽取.实验结果表明,在相同条件下,该方法能够显著提高准确率和F-测度值.
术语抽取、术语过滤、互信息、阚值、评价指标
31
TP182(自动化基础理论)
2011-07-15(万方平台首次上网日期,不代表论文的发表时间)
共4页
1070-1073