Using join buffer (Batched Key Access)

Using join buffer (Batched Key Access)算法

錶鏈接算法數據庫

Batched Key Access(BKA)原理

MySQL 5.6版本提供了不少性能優化的特性,其中之一是關於提升表join性能的算法 --- Batched Key Access (BKA) ,本文將結合以前寫過MRR,BNL優化特性一塊兒來詳細介紹該算法。性能優化

對於多表join語句,當MySQL使用索引訪問第二個join表的時候,使用一個join buffer來收集第一個操做對象生成的相關列值。BKA構建好key後,批量傳給引擎層作索引查找。key是經過MRR接口提交給引擎的。這樣,MRR使得查詢更有效率。 oop

大體的過程以下:性能

  1. BKA使用join buffer保存由join的第一個操做產生的符合條件的數據。優化

  2. 而後BKA算法構建key來訪問被鏈接的表,並批量使用MRR接口提交keys到數據庫存儲引擎去查找查找。spa

  3. 提交keys以後,MRR使用最佳的方式來獲取行並反饋給BKA。對象

BKA使用join buffer size來肯定buffer的大小,buffer越大,訪問被join的表/內部表就越順序。排序

MRR接口有2個應用場景:索引

場景1:應用於傳統的基於磁盤的存儲引擎(innodb,myisam),對於這些引擎join buffer中keys是一次性提交到MRR,MRR經過key找到rowid,經過rowid來獲取數據

場景2:應用於遠程存儲引擎(NDB),來自join buffer上的部分key,從SQL NODE發送到DATA NODE,而後SQL NODE會收到經過相關關係匹配的行組合。而後使用這些行組合匹配出新行。而後在發送新key,直到發完爲止。


BNL和BKA,MRR的關係

BNL和BKA都是批量的提交一部分結果集給下一個被join的表(標記爲T),從而減小訪問表T的次數,那麼它們有什麼區別呢?

BNL和BKA的思想是相似的,詳情見:《nest-loop-join官方手冊》

第一 BNL比BKA出現的早,BKA直到5.6纔出現,而BNL至少在5.1裏面就存在。

第二 BNL主要用於當被join的表上無索引,

Join buffering can be used when the join is of type ALL or index (in other words, when no possible keys can be used, and a full scan is done, of either the data or index rows, respectively)

第三 BKA主要是指在被join表上有索引能夠利用,那麼就在行提交給被join的表以前,對這些行按照索引字段進行排序,所以減小了隨機IO,排序這纔是二者最大的區別,可是若是被join的表沒用索引呢?那就使用BNL了。

上面原理環境提到講了在BKA實現的過程當中就是經過傳遞keys給MRR接口,本質上仍是在MRR裏面實現,下面這幅圖則展現了它們之間的關係:

如何使用

要使用BKA,必須調整系統參數optimizer_switch的值,batched_key_access設置爲on,由於BKA使用了MRR,所以也要打開MRR,可是基於成本優化MRR算法不是特別準確官方文檔推薦關閉 

mrr_cost_based,將其設置爲off。

set optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on'

另外多表join語句 ,被join的表/非驅動表必須索引可用。

==========END==========

相關文章
相關標籤/搜索