10.3969/j.issn.1000-3428.2010.08.021
基于世界知识的深网数据源增强分类模型
针对传统词袋方法在深网(Deep Web)数据源分类应用中的局限性,提出一种基于世界知识的Deep Web数据源增强分类模型,通过对外部知识库的主题分析,建立特征映射,构造基于领域概念的辅助分类器,丰富Deep Web查询表单的特征集合.基于Wikipedia百科知识库对真实Web数据进行分类.实验结果证明该模型有效.
深网、数据源分类、主题分析、特征映射、世界知识
36
TP393(计算技术、计算机技术)
国家自然科学基金资助项目60673092;江苏省科技支撑计划基金资助项目BE2008044;2006年度江苏省"六大人才高峰"基金资助项目06-E-037;2008年度江苏省高校研究生科研创新计划基金资助项目CX08B_099Z
2010-05-31(万方平台首次上网日期,不代表论文的发表时间)
共4页
60-63