10.3778/j.issn.1673-9418.1403028
面向关联关系数据的分布式相似性查询方法
带有关联关系的数据在社网平台、电子商务平台、科学数据库等环境中普遍存在,对其进行相似性查询是在各种应用中常见的操作。随着社网、电子商务、云计算等技术的发展和普及,具有关联关系的数据飞速增长,对这种类型的数据进行相似性查询成为数据库领域的一个研究热点。在此应用背景下,提出了一种基于决策树的面向关联关系型数据的分布式相似性查询方法。该方法依据属性的重要度计算相似性,计算过程中达到一定的准确度时可以结束计算,从而在保证准确性的情况下减少了计算量。同时提出了两种分布式环境下面向大数据量的决策树计算方法,该方法具有较少的通信代价,并且有概率理论保证其准确度。最后通过大量的实验证明了方法的有效性。
相似性查询、关联关系型数据、决策树、分布式查询方法
TP311.133.1(计算技术、计算机技术)
The National Natural Science Foundation of China under Grant Nos.60973021,61003060;the National Basic Research Program of China under Grant No.2012CB316201国家重点基础研究发展计划973计划
2014-07-23(万方平台首次上网日期,不代表论文的发表时间)
共12页
778-789