10.3969/j.issn.2095-6835.2010.15.005
在线旅游业务中Web页面主体块提取方法研究
Web信息提取是在线旅游业务的重要技术.页面的主体语义块集中了最主要的信息量,它的正确提取是Web信息提取的基础.本文在对现有页面分割方案总结的基础上,提出了结合机器学习方法的Web页面主体语义块节点识别算法,并基于启发式规则对正结果集进行后续的校验,以定位最佳的主体语义块节点.通过实验,本文提出的方案达到了比较理想的准确率.
Web信息提取、支持向量机、主体语义块
26
TP393.09(计算技术、计算机技术)
基金申请人:赵志强;项目名称:国家高技术研究发展计划项目"融合型旅游在线服务业务的研究";基金颁发部门:中华人民共和国科学技术部2008AA01A307
2014-07-08(万方平台首次上网日期,不代表论文的发表时间)
共3页
11-13