PHP中的數據庫1、MySQL優化策略綜述

前些天看到一篇文章說到PHP的瓶頸不少狀況下不在PHP自身,而在於數據庫。咱們都知道,PHP開發中,數據的增刪改查是核心。爲了提高PHP的運行效率,程序員不光須要寫出邏輯清晰,效率很高的代碼,還要能對query語句進行優化。雖然咱們對數據庫的讀取寫入速度上倒是無能爲力,但在一些數據庫類擴展像memcache、mongodb、redis這樣的數據存儲服務器的幫助下,PHP也能達到更快的存取速度,因此瞭解學習這些擴展也是很是必要,這一篇先說一下MySQL常見的優化策略。mysql



幾條MySQL小技巧程序員

  • 一、SQL語句中的關鍵詞最好用大寫來書寫,第一易於區分關鍵詞和操做對象,第二,SQL語句在執行時,MySQL會將其轉換爲大寫,手動寫大寫能增長查詢效率(雖然很小)。
  • 二、若是咱們們經對數據庫中的數據行進行增刪,那麼會出現數據ID過大的狀況,用ALTER TABLE tablename AUTO_INCREMENT=N,使自增ID從N開始計數。
  • 三、對int類型添加 ZEROFILL 屬性能夠對數據進行自動補0
  • 四、導入大量數據時最好先刪除索引再插入數據,再加入索引,否則,mysql會花費大量時間在更新索引上。
  • 五、建立數據庫書寫sql語句時 ,咱們能夠在IDE裏建立一個後綴爲.sql的文件,IDE會識別sql語法,更易於書寫。更重要的是,若是你的數據庫丟失了,你還能夠找到這個文件,在當前目錄下使用/path/mysql -uusername -ppassword databasename < filename.sql來執行整個文件的sql語句(注意-u和-p後緊跟用戶名密碼,無空格)。

 

數據庫設計方面優化
一、數據庫設計符合第三範式,爲了查詢方即可以有必定的數據冗餘。
二、選擇數據類型優先級 int > date,time > enum,char>varchar > blob,選擇數據類型時,能夠考慮替換,如ip地址能夠用ip2long()函數轉換爲unsign int型來進行存儲。
三、對於char(n)類型,在數據完整的狀況下儘可能較小的的n值。
四、在建表時用partition命令對單個表分區能夠大大提高查詢效率,MySQL支持RANGE,LIST,HASH,KEY分區類型,其中以RANGE最爲經常使用,分區方式爲:
  CREATE TABLE tablename{
  }ENGINE innodb/myisam CHARSET utf8 //選擇數據庫引擎和編碼
  PARTITION BY RANGE/LIST(column),//按範圍和預約義列表進行分區
  PARTITION partname VALUES LESS THAN /IN(n),//命名分區並詳細限定分區的範圍
五、選擇數據庫引擎時要注意innodb 和 myisam的區別
  存儲結構:MyISAM在磁盤上存儲成三個文件。而InnoDB全部的表都保存在同一個數據文件中,通常爲2GB
  事務支持:MyISAM不提供事務支持。InnoDB提供事務支持事務。
  表鎖差別:MyISAM只支持表級鎖。InnoDB支持事務和行級鎖。
  全文索引:MyISAM支持 FULLTEXT類型的全文索引(不適用中文,因此要用sphinx全文索引引擎)。InnoDB不支持。
  表的具體行數:MyISAM保存有表的總行數,查詢count(*)很快。InnoDB沒有保存表的總行數,須要從新計算。
  外鍵:MyISAM不支持。InnoDB支持正則表達式


 

索引方面優化
一、innodb是聚簇索引,存儲索引時必須有主鍵,若是沒有指定,引擎會自動生成一個隱藏的主鍵,生成一個主索引,索引內存放的是主鍵的物理地址,數據靠主鍵存放,每次使用索引時要先找到主索引,而後找到主索引下的數據。redis

優勢經過主鍵查找特別快,缺點是次級索引會變慢,由於須要先經過次級索引(次級索引裏是主索引的位置。)找到主索引,而後經過主索引找數據。而且若是主鍵無規律,插入新值時須要移動較多數據塊,會影響效率,因此要儘可能使用有規律遞增的int型作主鍵。還有由於數據緊跟着主鍵放,因此若是數據中有數據量特別大的列(text/blob),innodb查詢時會跳過不少數據塊,也會致使慢。算法

二、myisam的索引各個索引都相同統一指向磁盤上各個行的地址,都是輕量級的指針數據。缺點是各個索引的創建不是經過主鍵,查詢沒有聚簇索引查找主鍵快。但其由於存儲的是地址,因此在插入新值時比較方面移動改變。
三、進行多條件查詢時,對多條件分別創建索引時,執行sql查詢時,MySQL只會選擇一個最貼近的索引來使用,因此若是須要多條件查詢,要創建聯合索引,即便會形成數據冗餘。
聯合索引的BTREE創建方法:對第一個條件創建索引,在第一個索引的BTREE區域對第二個條件創建索引,以此類推,因此,在使用索引時,不用第一個條件用第二個條件也不會用到聯合索引。使用索引時要條件要有順序,有序列的使用。
四、索引長度對查詢也有很大影響,咱們應該儘可能創建短的索引長度,咱們可使用查詢列
SELECT COUNT(DISTINCT LEFT(column)) / COUNT(*) FROM tablename  來測試對column列創建索引時選取不一樣的長度,索引的覆蓋率有多大,咱們選擇一下接近飽和的n個長度來創建索引
ALTER TABLE tablename ADD INDEX (column(n));  來對某一列的前n個字符創建索引。若前n個字符相同,咱們甚至能夠對字符串進行反轉存儲,而後創建索引。
五、對於常常修改致使的索引碎片的維護方式:ALTER TABLE tablename ENGINE oldengine;即再次應用一下表存儲引擎,使其自動維護;也能夠用 OPTIMIZE tablename 命令來進行維護。sql



數據查詢方面優化
數據庫操做盡可能少查詢,有查詢時儘可能不在數據庫層面上進行數據操做,而是返回到PHP腳本中操做數據,減輕數據庫壓力。
一旦發現有數據庫性能問題,要及時解決,通常用慢查詢日誌記錄查詢很"慢"的語句,用EXPLAIN分析查詢和索引使用狀況,用PROFILE分析語句執行時的具體資源消耗。
慢查詢日誌:
一、在my.ini或my.cnf的[mysqld]下添加
slow_query_log_file=/path //設置日誌存儲路徑
long_query_time=n //設置若是語句執行時間達到n秒,就會被記錄下來
二、而後在MySQL裏設置SET slow_query_log='ON'來開啓慢查詢。
三、記錄下日誌後,咱們用/bin/目錄下的mysqldumpslow filename來查看日誌,其經常使用參數以下:
  -g pattern 使用正則表達式
  -t n返回前n條數據
  -s c/t/l/r 以記錄次數/時間/查詢時間/返回記錄數來排序mongodb

EXPLAIN語句
使用方法,在要執行的查詢語句前面加EXPLAIN
EXPLAIN SELECT * FROM user;
獲得形以下圖的結果:數據庫


下面是對每一項的解釋:
id 查詢語句的id,簡單查詢無心義,多重查詢時能夠看出執行查詢的順序
select-type 執行的查詢語句的類型,對應多重查詢,有simple/primary/union等。
tabel 查詢語句查詢的數據表
type  得到數據的類型 常見的類型效率從高到低爲 null>const>eq_ref>ref>range>index>all
possible-keys:可能使用到的索引
key 使用到的索引
key_len索引長度
ref 使用哪一個列與索引一塊兒從表中選擇。
rows  查找到數據要掃描的大概行數,可看出索引的優劣
extra  常見的有
using filesort 查詢到數據後進行文件排序,較慢,須要優化索引
using where 讀取整行數據後進行判斷過濾,是否符合where條件
using index 索引覆蓋,即在牽引中已經有這存儲了目標數據,直接讀取索引,很快。緩存

PROFILE
用SELECT @@frofiling來查看PROFILE的開啓狀態。
若是未開啓,用SET profiling=1來開啓。
開啓以後,再執行查詢語句,MySQL會自動記錄profile信息。
應用show profiles查看全部的sql信息,結果爲 Query_ID Duration Query三列結果,分別是查詢ID,用時和所用的sql語句。
咱們可使用
SHOW PFROFILE [type[,type]][FOR QUREY Query_ID][Limit rwo_count [OFFSET offset]]
type常見有ALL(所有) BLOCK IO(顯示IO相關開銷) CPU(CPU開銷) MEMORY(內存開銷)等服務器

 


大型存儲方面優化
數據庫主從複製和讀寫分離
一、master將改變記錄到二進制日誌中,slave將master的二進制拷貝到它的中繼日誌中,從新將數據返回到它本身的數據中,達到複製主服務器數據的目的。

主從複製能夠用做:數據庫負載均衡、數據庫備份、讀寫分離等功能。
二、配置主服務器master
  修改my.ini/my.conf
  [mysqld]
  log-bin=mysql-bin //啓用二進制日誌
  server-id=102 //服務器惟一ID
三、配置從服務器slave
  log-bin=mysql-bin //啓用二進制日誌
  server-id=226 //服務器惟一ID
四、在主服務器上受權從服務器
  GRANT REPLICATION SLAVE ON *.* to 'slavename'@'IP' identified by 'root'
五、在從服務器上使用
  change master to
    master_host="masterip",
    master_user="masteruser",
    master_password="masterpasswd";
六、而後使用start slave命令開始進行主從複製。
不要忘記在每次修改配置後重啓服務器,而後能夠在主從服務器上用show master/slave status查看主/從狀態。
實現數據庫的讀寫分離要依賴MySQL的中間件,如mysql_proxy,atlas等。經過配置這些中間件來對主從服務器進行讀寫分離,使從服務器承擔被讀取的責任,從而減輕主服務器的負擔。


數據庫的sharding
在數據庫中數據表中的數據量很是龐大的時候,不管是索引仍是緩存等壓力都很大,對數據庫進行sharding,使之分別以多個數據庫服務器或多個表存儲,以減輕查詢壓力。
方式有垂直切分、水平切分和聯合切分。
垂直切分:在數據表很是多的時候,把數據庫中關係緊密(如同一模塊,常常鏈接查詢)的表切分出來分別放到不一樣的主從server上。
水平切分:在表很少,而表裏的數據量很是大的時候,爲了加快查詢,能夠用哈希等算法,將一個數據表分爲幾個,分別放到不一樣的服務器上,加快查詢。水平切分和數據表分區的區別在於其存儲介質上的不一樣。
聯合切分:更多的狀況是數據表和表中的數據量都很是大,則要進行聯合切分,即同時進行垂直和水平分表,將數據庫切分爲一個分佈式的矩陣來存儲。
這些數據庫的優化方式,每一種拿出來均可以寫做一篇文章,可謂是博大精深,瞭解並記憶了這些方式,能夠在有須要的時候進行有目的的選擇優化,達到數據庫效率的高效。

接下來的博文中,我會總結一下經常使用的PHP數據庫類擴展memcache、redis和mongodb的基本使用場景和使用方式。

若是您以爲本博文對您有幫助,您能夠推薦或關注我,若是您有什麼問題,能夠在下方留言討論,謝謝。

相關文章
相關標籤/搜索