10.3969/j.issn.1003-6059.2011.03.012
基于遗传算法的Web信息抽取
WHISK系统是一个半自动的IE系统,对结构化、半结构化的Web文本它都能使用生成的抽取规则进行信息抽取.但是它在规则学习过程中规则不能保证以最优的方式进行扩展,且生成规则集的时间较长.文中主要针对这些问题,提出利用遗传算法改进WHISK的监督式学习算法,并采用移除法生成规则集.实验结果表明此方法在效率和召回率上都得到提高.
信息抽取、WHISK系统、遗传算法、规则学习
24
TP181(自动化基础理论)
国家自然科学基金项目60775028;吉林省信息产业发展专项资金项目吉信发[2008]40号;大连市科技局重大项目2007A14GX042
2011-12-19(万方平台首次上网日期,不代表论文的发表时间)
共6页
385-390