10.3969/j.issn.1672-9722.2009.04.015
基于模板法的网页英语试卷自动抽取技术的研究
为解决在线考试系统中建立海量数据库的问题,采用基于模板法的Web信息抽取方法,提取相似网页中的正文内容.并根据包含英文试卷的网页特点,制定正文抽取规则,最终可获得完整的英语试卷及其答案.实验结果表明,该方法具有较高的准确率和提取速度.
Web、信息抽取、DOM抽取规则、模板
37
TP399(计算技术、计算机技术)
2009-05-20(万方平台首次上网日期,不代表论文的发表时间)
共3页
50-52