大數據量時 Mysql LIMIT如何正確對其進行優化(轉載)

如下的文章主要是對Mysql LIMIT簡單介紹,咱們你們都知道LIMIT子句通常是用來限制SELECT語句返回的實際行數。LIMIT取1個或是2個數字參數,若是給定的是2個參數,第一個指定要返回的第一行的偏移量,第二個指定返回行的最大數目。mysql

初始行的偏移sql

量是0(不是1)。性能優化

  1. mysql> select * from table LIMIT 6,10;  

獲得第7-16行性能

若是給定一個參數,它指出返回行的最大數目。測試

  1. mysql> select * from table LIMIT 5; 

獲得前5行優化

換句話說,LIMIT n等價於Mysql LIMIT 0,n。MYSQL的優化是很是重要的。其餘最經常使用也最須要優化的就是limit。mysql的limit給分頁帶來了極大的方便,但數據量一大的時候,limit的性能就急劇降低。一樣是取10條數據spa

  1. select * from yanxue8_visit limit 10000,10 

翻譯

  1. select * from yanxue8_visit limit 0,10 

就不是一個數量級別的。xml

網上也不少關於limit的五條優化準則,都是翻譯自mysql手冊,雖然正確但不實用。今天發現一篇文章寫了些關於limit優化的,很不錯。原文地址:http://www.zhenhua.org/article.asp?id=200(下面附有原文)htm

文中不是直接使用limit,而是首先獲取到offset的id而後直接使用Mysql limit size來獲取數據。根據他的數據,明顯要好於直接使用limit。這裏我具體使用數據分兩種狀況進行測試。(測試環境win2033+p4雙核(3GHZ) +4G內存 mysql 5.0.19)

一、offset比較小的時候。

  1. select * from yanxue8_visit limit 10,10 

屢次運行,時間保持在0.0004-0.0005之間

  1. Select * From yanxue8_visit Where vid >=(  
  2. Select vid From yanxue8_visit Order By vid limit 10,1  
  3. ) limit 10 

屢次運行,時間保持在0.0005-0.0006之間,主要是0.0006結論:偏移offset較小的時候,直接使用limit較優。這個顯然是子查詢的緣由。

二、offset大的時候

  1. select * from yanxue8_visit limit 10000,10 

屢次運行,時間保持在0.0187左右

  1. Select * From yanxue8_visit Where vid >=(  
  2. Select vid From yanxue8_visit Order By vid limit 10000,1  
  3. ) limit 10 

屢次運行,時間保持在0.0061左右,只有前者的1/3。能夠預計offset越大,後者越優。

附上原文:

select * from table LIMIT 5,10; #返回第6-15行數據

select * from table LIMIT 5; #返回前5行

select * from table LIMIT 0,5; #返回前5行

性能優化:

基於MySQL5.0中Mysql limit的高性能,我對數據分頁也從新有了新的認識.

  1. Select * From cyclopedia Where ID>=(  
  2. Select Max(ID) From (  
  3. Select ID From cyclopedia Order By ID limit 90001  
  4. ) As tmp  
  5. ) limit 100;  
  6. Select * From cyclopedia Where ID>=(  
  7. Select Max(ID) From (  
  8. Select ID From cyclopedia Order By ID limit 90000,1  
  9. ) As tmp  
  10. ) limit 100;  

一樣是取90000條後100條記錄,第1句快仍是第2句快?

第1句是先取了前90001條記錄,取其中最大一個ID值做爲起始標識,而後利用它能夠快速定位下100條記錄

第2句擇是僅僅取90000條記錄後1條,而後取ID值做起始標識定位下100條記錄

第1句執行結果.100 rows in set (0.23) sec

第2句執行結果.100 rows in set (0.19) sec

很明顯第2句勝出.看來limit好像並不徹底像我以前想象的那樣作全表掃描返回limit offset+length條記錄,這樣看來limit比起MS-SQL的Top性能仍是要提升很多的.

其實第2句徹底能夠簡化成

  1. Select * From cyclopedia Where ID>=(  
  2. Select ID From cyclopedia limit 90000,1  
  3. )limit 100; 

直接利用第90000條記錄的ID,不用通過Max運算,這樣作理論上效率因該高一些,但在實際使用中幾乎看不到效果,由於自己定位ID返回的就是1條記錄,Max幾乎不用運做就能獲得結果,但這樣寫更清淅明朗,省去了畫蛇那一足.

但是,既然MySQL有limit能夠直接控制取出記錄的位置,爲何不乾脆用Select * From cyclopedia limit 90000,1呢?豈不更簡潔?

這樣想就錯了,試了就知道,結果是:1 row in set (8.88) sec,怎麼樣,夠嚇人的吧,讓我想起了昨天在4.1中比這還有過之的"高分".Select * 最好不要隨便用,要本着用什麼,選什麼的原則, Select的字段越多,字段數據量越大,速度就越慢. 上面2種分頁方式哪一種都比單寫這1句強多了,雖然看起來好像查詢的次數更多一些,但其實是以較小的代價換取了高效的性能,是很是值得的.

第1種方案一樣可用於MS-SQL,並且多是最好的.由於靠主鍵ID來定位起始段老是最快的.

  1. Select Top 100 * From cyclopedia Where ID>=(  
  2. Select Top 90001 Max(ID) From (  
  3. Select ID From cyclopedia Order By ID  
  4. ) As tmp  
  5. )  

但不論是實現方式是存貯過程仍是直接代碼中,瓶頸始終在於MS-SQL的TOP老是要返回前N個記錄,這種狀況在數據量不大時感覺不深,但若是成百上千萬,效率確定會低下的.相比之下MySQL的Mysql limit就有優點的多,執行:

  1. Select ID From cyclopedia limit 90000  
  2. Select ID From cyclopedia limit 90000,1 


而MS-SQL只能用Select Top 90000 ID From cyclopedia 執行時間是390ms,執行一樣的操做時間也不及MySQL的360ms.

 

轉自:http://database.51cto.com/art/201005/200395.htm

相關文章
相關標籤/搜索