Mysql優化之建立高性能索引(三)

時間 2019-12-12

標籤 mysql 優化建立高性能索引欄目 MySQL 简体版

原文原文鏈接

聚蔟索引緩存

聚蔟索引並非一種單獨的索引類型，而是一種數據存儲方式。Innodb的聚蔟索引在同一結構保存了B-Tree索引和數據行。性能

當表有聚蔟索引時，它的數據行實際上存放在索引的葉子頁中。下圖展現了聚蔟索引中的記錄是如何存放的。注意到，葉子頁包含了行的所有數據，可是節點頁只包含了索引列。測試

彙集的數據有一些重要的優勢：優化

能夠把相關的數據保存在一塊兒。減小查找到ID後回行產生多一次的I/O
數據訪問更快。聚蔟索引把數據頁和索引保存在同一個B-Tree結構，比非聚蔟索引在查找數據時少一次回表查詢
使用覆蓋索引掃描的查詢能夠直接使用頁節點中的主鍵值

固然，聚蔟索引也有一些缺點：ui

若是數據放在內存中，聚蔟索引就沒什麼優點
插入速度嚴重依賴於插入順序。若是不是按主鍵順序加載數據，那麼加載完後最好使用OPTIMIZE TABLE 命令從新組織一下表。
更新聚蔟索引列的代價很高，由於更新的行須要移動到新的位置
基於聚蔟索引的表在插入新行或者主鍵被更新須要移動行時，會產生頁分裂的問題。頁分裂會致使表佔用更多的磁盤空間。
聚蔟索引可能會使全表掃描變慢，尤爲是行比較稀疏，或者因爲頁分裂致使數據存儲不連續的時候
二級索引(非聚蔟索引)可能比想象的要更大，由於在二級索引的葉子節點包含了引用行的主鍵列。
二級索引訪問須要兩次索引查找，而不是一次。

InnoDB和MyISAM的數據分佈對比spa

聚蔟索引和非聚蔟索引的數據分佈有區別，以及對於的主鍵索引和二級索引的數據分別以也有區別。來看看InnoDB和MyISAM是如何存儲下面這個表的：3d

CREATE TABLE layout_test(
    col1 int NOT NULL,
    col2 int NOT NULL,
           PRIMARY KEY(col1),
    KEY(col2)
);

假設該表的主鍵取值1--100001，隨機插入並使用OPTIMIZE TABLE 命令作優化。也就是說，數據在磁盤的存儲方式已經最優，但行的順序是隨機的。列col2的值是從1--100之間隨機賦值，因此有不少重複的值。版本控制

MyISAM的數據分佈比較簡單，以下圖：指針

在行的旁邊顯示了行號，從0遞增，因此MyISAM能夠從表的開頭跳過所需的字節找到所需的行。這種分佈方式很容易建立索引。下面顯示的一系列圖，所以了頁的物理細節，只顯示索引中的「節點」，索引中的每一個葉子節點包含行號。圖一爲主鍵分佈，圖二爲col2索引列分佈code

InnoDB的數據分佈。由於InnoDB支持聚蔟索引，因此用不一樣的方式存儲一樣的數據。下圖爲InnoDB表的主鍵分佈。

聚蔟索引的每個葉子節點都包含了主鍵值，事務ID，用於事務和MVCC(多版本控制)的回滾指針以及全部的剩餘列。

還有一點與MyISAM不一樣的是，InnoDB的二級索引和聚蔟索引很不相同。

這樣作的好處是減小了當出現行移動或者數據頁分裂時二級索引的維護工做。使用主鍵值看成指針會讓二級索引佔用更多的空間，換來的好處是，InnoDB在移動行是無需更新二級索引中的這個「指針」。

下圖是描述InnoDB和MyISAM如何存放表的抽象圖。

在InnoDB表中按主鍵順序插入行

最好避免隨機的聚蔟索引，特別是I/O密集型的應用。例如，從性能的角度考慮，使用UUID來做爲聚蔟索引則會很糟糕，它使得聚蔟索引的插入變得完成隨機。

爲了演示這一點，咱們作以下兩個基準測試。第一個使用整數ID插入userinfo表：

CREATE TABLE userinfo
(
    id INT UNSIGNED NOT NULL AUTO_INCREMENT,
    name varchar(64) NOT NULL DEFAULT '',
    email varchar(64) NOT NULL DEFAULT '',
    password varchar(64) NOT NULL DEFAULT '',
    dob date DEFAULT NULL,
    address varchar(255) NOT NULL DEFAULT '',
    city varchar(64) NOT NULL DEFAULT '',
    state_id tinyint unsigned NOT NULL DEFAULT '0',
    zip varchar(8) NOT NULL DEFAULT '',
    country_id smallint unsigned NOT NULL DEFAULT '0',
    gender enum('M','F') NOT NULL DEFAULT 'M',
    account_type varchar(32) NOT NULL DEFAULT '',
    verified tinyint NOT NULL DEFAULT '0',
    allow_mall tinyint unsigned NOT NULL DEFAULT '0',
    parrent_account int unsigned NOT NULL DEFAULT '0',
    closest_airport varchar(3) NOT NULL DEFAULT '',
    PRIMARY KEY(uuid),
    UNIQUE KEY email (email),
    KEY country_id (country_id),
    KEY state_id (state_id),
    KEY state_id_2 (state_id,city,address)
)ENGINE=InnoDB;