10.3969/j.issn.1000-3428.2009.18.009
基于隐马尔可夫模型的Web信息抽取
针对Web信息抽取领域中存在的"项缺失"和"项无序"问题,提出一种基于隐马尔可夫模型的Web信息抽取方法.将Web文档解析为一棵扩展的DOM树,映射待抽取的信息项为状态,映射待抽取的信息项在扩展DOM树中的路径为词汇,使用归纳算法构造隐马尔可夫模型.实验结果证明该方法可以获得更好的抽取性能.
信息抽取、隐马尔可夫模型、扩展DOM树
35
TP393(计算技术、计算机技术)
国家自然科学基金资助项目60775028;大连市科技局基金资助重大项目2007A14GX042
2009-11-17(万方平台首次上网日期,不代表论文的发表时间)
共3页
25-27