10.3969/j.issn.1000-3428.2012.23.038
Web页面中数据表的识别方法研究
为提高Web数据表识别的准确性,提出一种基于支持向量机与混合核函数的数据表识别方法.给出表格的结构特征、内容特征以及行(列)相似特征,将多项式核函数和线性核函数组成混合核函数,利用其进行Web数据表的自动识别.实验结果表明,该方法在7个站点上,准确率和召回率的平均值为95.14%和95.69%.
Web页面、数据表、特征抽取、支持向量机、核函数
38
TP391(计算技术、计算机技术)
国家自然科学基金资助项目61073139
2013-01-21(万方平台首次上网日期,不代表论文的发表时间)
共4页
154-157