10.3969/j.issn.1000-3428.2011.05.020
基于二维混合条件随机场的Web记录抽取模型
提出一种基于混合二维条件随机场的Web记录抽取模型,以克服线性链条件随机场不能充分利用Web实体间二维依赖关系的缺点,且训练条件随机场模型时无需大量手工标注的样本数据.对当当网上的742个数据记录进行抽取,对比同等情况下的其他模型.实验结果表明,混合二维条件随机场模型在抽取TDS数据集时展现了更优越的性能.
条件随机场、混合条件随机场、信息抽取、Web记录
37
TP311(计算技术、计算机技术)
国家自然科学基金资助项目60970015;2008年江苏省重大科技支撑与自主创新基金资助项目BE2008044;江苏省基础研究计划企业博士创新基金资助项目BK2009563
2011-05-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
59-61,64