轉--優化臨時表使用,SQL語句性能提高100倍

轉自:http://www.51testing.com/html/01/n-867201-2.htmljavascript

【問題現象】
  線上 mysql數據庫爆出一個慢查詢,DBA觀察發現,查詢時服務器IO飆升,IO佔用率達到100%, 執行時間長達7s左右。
   SQL語句以下:
   SELECT DISTINCT g.*, cp.name AS cp_name, c.name AS category_name, t.name AS type_name FROMgm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;
   【問題分析】
  使用explain查看執行計劃,結果以下:
  這條sql語句的問題其實仍是比較明顯的:
  查詢了大量數據(包括數據條數、以及g.* ),而後使用臨時表order by,但最終又只返回了20條數據。
  DBA觀察到的IO高,是由於sql語句生成了一個巨大的臨時表,內存放不下,因而所有拷貝到磁盤,致使IO飆升。
   【優化方案】
  優化的整體思路是拆分sql,將排序操做和查詢全部信息的操做分開。
  第一條語句:查詢符合條件的數據,只須要查詢g.id便可
   SELECT DISTINCT g.id FROM gm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 ORDER BY g.modify_time DESC LIMIT 20 ;
  第二條語句:查詢符合條件的詳細數據,將第一條sql的結果使用in操做拼接到第二條的sql
   SELECT DISTINCT g.*, cp.name AS cp_name,c.name AS category_name,t.name AS type_name FROMgm_game g LEFT JOIN gm_cp cp ON cp.id = g.cp_id AND cp.deleted = 0 LEFT JOIN gm_category c ON c.id = g.category_id AND c.deleted = 0 LEFT JOIN gm_type t ON t.id = g.type_id AND t.deleted = 0 WHERE g.deleted = 0 and g.id in(…………………) ORDER BY g.modify_time DESC ;
   【實測效果】
  在SATA機器上 測試,優化前大約須要50s,優化後第一條0.3s,第二條0.1s,優化後執行速度是原來的100倍以上,IO從100%降到不到1%
  在SSD機器上測試,優化前大約須要7s,優化後第一條0.3s,第二條0.1s,優化後執行速度是原來的10倍以上,IO從100%降到不到1%
  能夠看出,優化前磁盤io是性能瓶頸,SSD的速度要比SATA明顯要快,優化後磁盤再也不是瓶頸,SSD和SATA性能沒有差異。
   【理論分析】
  MySQL在執行SQL查詢時可能會用到臨時表,通常狀況下,用到臨時表就意味着性能較低。
   臨時表存儲
  MySQL臨時表分爲「內存臨時表」和「磁盤臨時表」,其中內存臨時表使用MySQL的MEMORY存儲引擎,磁盤臨時表使用MySQL的MyISAM存儲引擎;
  通常狀況下,MySQL會先建立內存臨時表,但內存臨時表超過配置指定的值後,MySQL會將內存臨時表導出到磁盤臨時表;
   Linux平臺上缺省是/tmp目錄,/tmp目錄小的系統要注意啦。
   使用臨時表的場景
  1)ORDER BY子句和GROUP BY子句不一樣, 例如:ORDERY BY price GROUP BY name;
  2)在JOIN查詢中,ORDER BY或者GROUP BY使用了不是第一個表的列 例如:SELECT * from TableA, TableB ORDER BY TableA.price GROUP by TableB.name
  3)ORDER BY中使用了DISTINCT關鍵字 ORDERY BY DISTINCT(price)
   4)SELECT語句中指定了SQL_SMALL_RESULT關鍵字 SQL_SMALL_RESULT的意思就是告訴MySQL,結果會很小,請直接使用內存臨時表,不須要使用索引排序 SQL_SMALL_RESULT必須和GROUP BY、DISTINCT或DISTINCTROW一塊兒使用 通常狀況下,咱們沒有必要使用這個選項,讓MySQL服務器選擇便可。
直接使用磁盤臨時表的場景
  1)表包含TEXT或者BLOB列;
  2)GROUP BY 或者 DISTINCT 子句中包含長度大於512字節的列;
  3)使用UNION或者UNION ALL時,SELECT子句中包含大於512字節的列;
   臨時表相關配置
  tmp_table_size:指定系統建立的內存臨時表最大大小;
  http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html#sysvar_tmp_table_size
  max_heap_table_size: 指定用戶建立的內存表的最大大小;
  http://dev.mysql.com/doc/refman/5.1/en/server-system-variables.html#sysvar_max_heap_table_size
  注意:最終的系統建立的內存臨時表大小是取上述兩個配置值的最小值。
   表的設計原則
  使用臨時表通常都意味着性能比較低,特別是使用磁盤臨時表,性能更慢,所以咱們在實際應用中應該儘可能避免臨時表的使用。 常見的避免臨時表的方法有:
  1)建立索引:在ORDER BY或者GROUP BY的列上建立索引;
  2)分拆很長的列:通常狀況下,TEXT、BLOB,大於512字節的字符串,基本上都是爲了顯示信息,而不會用於查詢條件, 所以表設計的時候,應該將這些列獨立到另一張表。
   SQL優化
  若是表的設計已經肯定,修改比較困難,那麼也能夠經過優化SQL語句來減小臨時表的大小,以提高SQL執行效率。
  常見的優化SQL語句方法以下:
  1)拆分SQL語句
  臨時表主要是用於排序和分組,不少業務都是要求排序後再取出詳細的分頁數據,這種狀況下能夠將排序和取出詳細數據拆分紅不一樣的SQL,以下降排序或分組時臨時表的大小,提高排序和分組的效率,咱們的案例就是採用這種方法。
  2)優化業務,去掉排序分組等操做
  有時候業務其實並不須要排序或分組,僅僅是爲了好看或者閱讀方便而進行了排序,例如數據導出、數據查詢等操做,這種狀況下去掉排序和分組對業務也沒有多大影響。
   如何判斷使用了臨時表?
  使用explain查看執行計劃,Extra列看到Using temporary就意味着使用了臨時表。
相關文章
相關標籤/搜索