10.3969/j.issn.1673-629X.2007.05.044
Deep Web查询接口的自动判定
传统搜索引擎仅可以索引浅层Web页面,然而在网络深处隐含着大量、高质量的信息,传统搜索引擎由于技术原因不能索引这些被称之为Deep Web的页面.由于查询接口是Deep Web的唯一入口,因此要获取Deep Web信息就需判定哪些网页表单是Deep Web查询接口.文中介绍了一种利用朴素贝叶斯分类算法自动判定网页表单是否为Deep Web查询接口的方法,并实验验证了该方法的有效性.
深网、网页表单、特征提取、朴素贝叶斯分类
17
TP181(自动化基础理论)
教育部科学技术研究重点项目205059;高等学校博士学科点专项科研项目20040285016;江苏省高技术研究发展计划项目BG2005019
2007-06-04(万方平台首次上网日期,不代表论文的发表时间)
共4页
148-151