10.3969/j.issn.1002-137X.2013.11.047
基于潜在语义分析的Deep Web查询接口聚类研究
集成查询接口的生成是Deep Web数据集成的重要组成环节.如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一.针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语义分析(LSA)的方法来发掘查询接口之间的语义关系,并给出了基于潜在语义分析的Deep Web查询接口聚类算法,最后采用UIUC的Web集成资源库提供的数据进行了实验.结果表明,潜在语义分析的方法提高了同一领域查询接口之间的相似度,明显改善了Deep Web查询接口聚类的质量.
潜在语义分析、奇异值分解、Deep Web、查询接口聚类
40
TP391.3(计算技术、计算机技术)
国家自然科学基金61163057;广西自然科学基金2012jjAAG0063;广西可信软件重点实验室开放基金KX201117;广西研究生科研创新项目YCSZ2012070
2013-12-06(万方平台首次上网日期,不代表论文的发表时间)
共4页
228-230,247