服务器维护网站维护数据维护系统安全配置
专业定制网站企业建站一条龙、软件定制开发、系统集成
稳定虚机备案一条龙，稳定快捷通道
服务理念诚信守诺客户至上专业精神专心贯注

SQL数据库查询优化器中的JOIN算法（2）

作者：黑客防线网安SQL维护基地来源：黑客防线网安SQL维护基地浏览次数：0

　　Hash Join在本质上类似于两列都有重复值时的Sort-Merge的处理思想——分区(patitioning)。但它们也有区别：Hash Join通过哈希来分区(每一个桶就是一个分区)而Sort-Merge通过排序来分区(每一个重复值就是一个分区)。

　　值得注意的是，Hash Join与上述两种算法之间的较大区别同时也是一个较大限制是它只能应用于等值联结(equality join)，这主要是由于哈希函数及其桶的确定性及无序性所导致的。

　　算法：

　　基本的Hash Join算法由以下两步组成：

　　(1) Build Input Phase：基于JOIN字段，使用哈希函数h2为较小的S集合构建内存中(in-memory)的哈希表，相同键值的以linked list组成一个桶(bucket)

　　(2) Probe Input Phase：在较大的R集合上对哈希表进行核对以完成联结。其中核对操作包括：

　　foreach tuple r Î R do
　　hash on the joining attribute using the hash function of step 1 to find a bucket in the hash table
　　if the bucket is nonempty
　　foreach tuple s in the found bucket
　　if ri == sj then add to result

　　代价：

　　值得注意的是对于大集合R的每个元组 r ，hash bucket中对应 r 的那个bucket中的每个元组都需要与 r 进行比较，这也是算法最耗时的地方所在。

　　CPU开销是O (m + n * b) b是每个bucket的平均元组数量。

　　使用小结：

　　一般来说，查询优化器会首先考虑Nested Loop和Sort-Merge，但如果两个集合量都不小且没有合适的索引时，才会考虑使用Hash Join。

　　Hash Join也用于许多集合比较操作，inner join、left/right/full outer join、intersect、difference等等，当然了，需要保证都是等值联结。

　　另外，Hash Join的变种能够移除重复和进行分组，它只使用一个输入，兼做Build和Probe的角色。

　其实产品级的优化器一般都改进了这些基本算法，而改进过的版本的确有较大的性能提升。在这里只是给需要判断执行计划优劣或者研究查询优化器实现的兄弟提供原理方面的介绍，在实际应用中我们还得结合丰富的statistics作出准确的判断。

黑客防线网安服务器维护方案本篇连接：http://www.rongsen.com.cn/show-11218-1.html

网站维护教程更新时间:2012-03-21 03:18:23 【打印此页】【关闭】

上一篇：SQL数据库查询优化器中的JOIN算法
下一篇：SQL2005 SP4补丁安装失败安装最近应用的更新程序KB2463332失败解决方法

新闻栏目

我要申请本站：N点 | 黑客防线官网 |

专业服务器维护及网站维护手工安全搭建环境，网站安全加固服务。黑客防线网安服务器维护基地招商进行中！QQ:29769479

北京黑客防线网安工作室-黑客防线网安服务器维护基地为您提供专业的
服务器维护
,
企业网站维护
,
网站维护
服务

footer footer footer

专业服务器维护管家

SQL数据库查询优化器中的JOIN算法（2）

作者：黑客防线网安SQL维护基地 来源：黑客防线网安SQL维护基地 浏览次数：0

新闻栏目

服务器维护

企业网站维护

网站维护

作者：黑客防线网安SQL维护基地来源：黑客防线网安SQL维护基地浏览次数：0