10.3969/j.issn.1001-0645.2005.12.009
基于多示例学习的题库重复性检测研究
基于多示例学习方法对题库重复性检测算法进行了改进,其基本思想是:将包含多个子问题的试题重复性检测转化为多示例学习问题.采用基于前缀树的高频词抽取算法抽取试题的内容特征,避免了对同义词典的依赖.在此基础上,结合试题的元数据特征提出试题相似度计算方法.在真实题库基础上进行的实验结果显示,该方法简便可行,正确率和查全率分别达到91.3%和92.3%,为进一步实现题库系统的整合奠定了基础.
题库重复性检测、多示例学习、最小Hausdorff距离
25
TP391(计算技术、计算机技术)
2006-02-23(万方平台首次上网日期,不代表论文的发表时间)
共4页
1071-1074