10.3969/j.issn.1006-7167.2011.01.018
基于领域本体的Web页面信息抽取
由于当前信息抽取系统因知识库结构和内容的不同带来的搜索质量问题,将本体引入信息抽取中,有助于信息抽取系统对领域内的概念和概念之间的联系的统一认识,为用户提供更有价值的信息.提出了基于本体的文本信息抽取算法,通过本体元素描述抽取的文本信息.最后,利用此算法对某领域样本Web页面进行抽取并分析.实验表明性能有所提高.
领域本体、Web页面、案信息抽取
30
TP311(计算技术、计算机技术)
江西省科技厅工业攻关项目赣财教[2005]132号;江西省教育厅科技计划项目GJJ08283
2011-04-29(万方平台首次上网日期,不代表论文的发表时间)
共4页
62-65