讀書筆記之-《高性能MySQL》

時間 2020-02-09

原文原文鏈接

數據庫相關的知識，看了《高性能MySQL》和《數據庫系統實現》兩本。兩本書綜合看效果更好。《高性能MySQL》從使用的角度入手，《數據庫系統實現》從原理的角度入手。之前學習數據庫相關的知識時有個執念，必定要弄明白它是怎麼實現的，就直接買了一個《MySQL內核:Innodb存儲引擎》,結果看不懂，束之高閣。程序員

數據庫的知識，我的以爲以下的順序比較合理。算法

硬盤

《數據庫系統實現》在第二章就單獨用一章的篇幅講解磁盤的存儲原理。這是由於計算機內置組件中具有持久存儲能力的只有硬盤，軟件屈從於硬件。所以理解磁盤的存儲特色才能理解軟件設計背後的邏輯。磁盤存儲有以下的特色:數據庫

特性A:相比CPU的延遲，磁盤延遲很是很是大。在《性能之巔》中有作過對比，對於3.3GHz的CPU, 一個指令週期爲0.3ns；機械硬盤一次I/O的延遲爲1～10ms。這個差距有多大，若是一個CPU指令週期爲1s, 那麼機械硬盤一次I/O的延遲爲1～12個月。真是等到花兒都謝了。數組
特性B:磁盤是塊設備，每次寫入都是按塊來的。一般一個塊爲512byte。即便用硬盤，得注意不能用輪船隻運輸一個土豆到美國。網絡
特性C:順序IO的性能遠遠高於隨機IO的性能。由於順序IO避免了尋道時間和旋轉延遲。

上述的特性不只影響了數據庫的設計，更是深入影響了操做系統的設計，例如page cache數據結構

讀寫

數據庫的操做基本上就是更高階的讀寫: select 和 delete/update 是咱們使用數據庫頻率最高的操做了。因此，數據庫解決的核心問題就是如何組織數據實現高性能的讀寫。架構

###事務
高性能無法忽略掉併發，在併發讀寫場景下，就會出現數據一致性的問題。因此事務就用來解決數據一致性的問題了。併發

默認每條SQL語句都是一個事務，能夠手動設置提交點改變這一規則負載均衡

在MySQL中，事務的隔離級別有4種。這4種其實不用死記硬背，能夠從應用場景推導出來。ide

未提交讀

事物A修改了記錄a, 沒有提交；事務B讀取表，讀取到了該事務。這就是未提交讀。若是咱們本身設計數據庫，在原數據上修改字段，若是沒有其餘手段的控制，併發狀況下就會出現這種狀況。因爲讀取到了髒數據，也稱爲髒讀。這裏咱們也能夠將事務換一個熟悉的概念：線程來理解

提交讀

針對上面未提交讀的問題，若是將改動保存在事務的做用域內部，那麼未提交的數據就不會影響其餘事務。這種隔離級別就是提交讀。也叫不可重複讀。由於失誤內部兩次執行可能獲得不同的結果。

可重複讀

提交讀面臨的不可重複讀的問題，在可重複讀隔離級別下能夠避免。它能保證一個事務屢次讀取同一條記錄不會改變。固然，若是事務內部改變了該記錄，另說。這個級別帶來的另外一個問題就是[幻讀]。這個很好理解： 2個事務。事務A 讀取記錄不存在就寫入；事務B寫入記錄。事務A有可能出現寫入失敗的狀況。

可序列化

將事務順序執行。性能最低的作法。

索引

一般查詢數據有兩種典型的場景: 等值查詢和區間查詢。即select * from table where field=a 或者 select * from table where field between a and b。若是沒有索引，惟一的作法就是全表掃描。這是一種大海撈針的作法。程序員通常關注兩個點: 問題在哪和怎麼優化。對於等值查詢，最好的優化方式就是hash了。對於區間查詢，不是hash算法的用武之地，由於它有個隱藏的邏輯: 排序。一般，具有排序功能的數據結構有: 排序後的數組，鏈表。跳躍表。AVL樹，紅黑樹，B樹，B+樹。

爲何選擇B+樹？