10.3969/j.issn.1673-629X.2010.07.017
Deep Web数据源发现与分类模型
随着Internet的发展,Web正在不断深人人们的生活.传统搜索引擎只能检索浅层网络(Surface Web),不能直接索引到深层网络(Deep Web)的资源.为了有效利用Deep Web资源,对Deep Web数据源发现并进行领域类别的划分,已成为一个非常迫切的问题.该模型首先抽取Deep Web页面查询接口的特征,构造了一个Deep Web页面过滤器,从而能够发现Deep Web的数据源,其次在对查询接12特征进行分析后,构建了一个基于KNN的分类器,并通过该分类器对新产生的Deep Web数据源进行领域分类.试验结果表明,这种模型的平均分类准确率达到86.9%,具有良好的分类效果.
深层网络、查询接口、K近邻算法、分类
20
TP311(计算技术、计算机技术)
贵州省自然科学基金项目黔科合GY字[2008]3035
2010-09-02(万方平台首次上网日期,不代表论文的发表时间)
共4页
65-67,71