MySQL Hash索引和B Tree索引的區別

2021-06-13 06:40:13 字數 2579 閱讀 9140

1樓:匿名使用者

而雜湊索引的示意圖則是這樣的:

(**源自網路)

簡單地說,雜湊索引就是採用一定的雜湊演算法,把鍵值換算成新的雜湊值,檢索時不需要類似b+樹那樣從根節點到葉子節點逐級查詢,只需一次雜湊演算法即可立刻定位到相應的位置,速度非常快。

從上面的圖來看,b+樹索引和雜湊索引的明顯區別是:

如果是等值查詢,那麼雜湊索引明顯有絕對優勢,因為只需要經過一次演算法即可找到相應的鍵值;當然了,這個前提是,鍵值都是唯一的。如果鍵值不是唯一的,就需要先找到該鍵所在位置,然後再根據連結串列往後掃描,直到找到相應的資料;

從示意圖中也能看到,如果是範圍查詢檢索,這時候雜湊索引就毫無用武之地了,因為原先是有序的鍵值,經過雜湊演算法後,有可能變成不連續的了,就沒辦法再利用索引完成範圍查詢檢索;

同理,雜湊索引也沒辦法利用索引完成排序,以及like 『***%』 這樣的部分模糊查詢(這種部分模糊查詢,其實本質上也是範圍查詢);

雜湊索引也不支援多列聯合索引的最左匹配規則;

b+樹索引的關鍵字檢索效率比較平均,不像b樹那樣波動幅度大,在有大量重複鍵值情況下,雜湊索引的效率也是極低的,因為存在所謂的雜湊碰撞問題。

後記在mysql中,只有heap/memory引擎表才能顯式支援雜湊索引(ndb也支援,但這個不常用),innodb引擎的自適應雜湊索引(adaptive hash index)不在此列,因為這不是建立索引時可指定的。

還需要注意到:heap/memory引擎表在mysql例項重啟後,資料會丟失。

通常,b+樹索引結構適用於絕大多數場景,像下面這種場景用雜湊索引才更有優勢:

在heap表中,如果儲存的資料重複度很低(也就是說基數很大),對該列資料以等值查詢為主,沒有範圍查詢、沒有排序的時候,特別適合採用雜湊索引

例如這種sql:

select … from t where c1 = ?; — 僅等值查詢

在大多數場景下,都會有範圍查詢、排序、分組等查詢特徵,用b+樹索引就可以了。

2樓:臺融封含景

ash索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像b-tree

索引需要從根節點到枝節點,最後才能訪問到頁節點這樣多次的io訪問,所以

hash

索引的查詢效率要遠高於

b-tree

索引。可

能很多人又有疑問了,既然

hash

索引的效率要比

b-tree

高很多,為什麼大家不都用

hash

索引而還要使用

b-tree

索引呢?任何事物都是有兩面性的,hash

索引也一樣,雖然

hash

索引效率高,但是

hash

索引本身由於其特殊性也帶來了很多限制和弊端,主要有以下這些。

(1)hash

索引僅僅能滿足"=","in"和"<=>"查詢,不能使用範圍查詢。

由於hash

索引比較的是進行

hash

運算之後的

hash

值,所以它只能用於等值的過濾,不能用於基於範圍的過濾,因為經過相應的

hash

演算法處理之後的

hash

值的大小關係,並不能保證和hash運算前完全一樣。

(2)hash

索引無法被用來避免資料的排序操作。

由於hash

索引中存放的是經過

hash

計算之後的

hash

值,而且hash值的大小關係並不一定和

hash

運算前的鍵值完全一樣,所以資料庫無法利用索引的資料來避免任何排序運算;

(3)hash

索引不能利用部分索引鍵查詢。

對於組合索引,hash

索引在計算

hash

值的時候是組合索引鍵合併後再一起計算

hash

值,而不是單獨計算

hash

值,所以通過組合索引的前面一個或幾個索引鍵進行查詢的時候,hash

索引也無法被利用。

(4)hash

索引在任何時候都不能避免表掃描。

前面已經知道,hash

索引是將索引鍵通過

hash

運算之後,將

hash運算結果的

hash

值和所對應的行指標資訊存放於一個

hash

表中,由於不同索引鍵存在相同

hash

值,所以即使取滿足某個

hash

鍵值的資料的記錄條數,也無法從

hash

索引中直接完成查詢,還是要通過訪問表中的實際資料進行相應的比較,並得到相應的結果。

(5)hash

索引遇到大量hash值相等的情況後效能並不一定就會比b-tree索引高。

對於選擇性比較低的索引鍵,如果建立

hash

索引,那麼將會存在大量記錄指標資訊存於同一個

hash

值相關聯。這樣要定位某一條記錄時就會非常麻煩,會浪費多次表資料的訪問,而造成整體效能低下。

MySQL的btree索引和hash索引的區別

hash 索引結構的特殊性,其檢索效率非常高,索引的檢索可以一次定位,不像b tree 索引需要從根節點到枝節點,最後才能訪問到頁節點這樣多次的io訪問,所以 hash 索引的查詢效率要遠高於 b tree 索引。可能很多人又有疑問了,既然 hash 索引的效率要比 b tree 高很多,為什麼大家...

MySQL B 樹索引和雜湊索引的區別

在mysql裡常用的索引資料結構有b 樹索引和雜湊索引兩種,我們來看下這兩種索引資料結構的區別及其不同的應用建議。二者區別 備註 先說下,在mysql文件裡,實際上是把b 樹索引寫成了btree 例如像下面這樣的寫法 create table t aid int unsigned not null ...

裡建立多個索引,如何使各個索引之間的索引項不相互影響

1 先設定文件中各級標題的級別。選擇 格式 段落 大綱級別 在目錄中是幾級標題就設定成幾級 2 插入 引用 索引和目錄 目錄 excel可以使用超級連結的方法來達到你的效果。在後面的表位置右鍵點選單元格,選 超連結 本文件中的位置 指向你的索引目錄表某個單元格即可。比較好的方法是先對你的索引目錄每一...