INSERT INTO ON DUPLICATE KEY UPDATE 與
REPLACE INTO,兩個命令能夠處理重複鍵值問題,在實際上它之間有什麼區別呢?
前提條件是這個表必須有一個
惟一索引或主鍵。
unique
一、REPLACE發現重複的先刪除再插入,若是記錄有多個字段,在插入的時候若是有的字段沒有賦值,那麼新插入的記錄這些字段爲空。
二、INSERT發現重複的是更新操做。在原有記錄基礎上,更新指定字段內容,其它字段內容保留。
這樣REPLACE的操做成本要大於 insert ON DUPLICATE KEY UPDATE ,按道理應該選用insert ON DUPLICATE KEY UPDATE
部分測試以下
2個 都是 影響的數據欄: 2
INSERT語法
INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
[INTO] tbl_name [(col_name,...)]
VALUES ({expr | DEFAULT},...),(...),...
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]
或:
INSERT [LOW_PRIORITY | DELAYED | HIGH_PRIORITY] [IGNORE]
[INTO] tbl_name
SET col_name={expr | DEFAULT}, ...
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]
或:
INSERT [LOW_PRIORITY | HIGH_PRIORITY] [IGNORE]
[INTO] tbl_name [(col_name,...)]
SELECT ...
[ ON DUPLICATE KEY UPDATE col_name=expr, ... ]
1、DELAYED 的使用
使用延遲插入操做
DELAYED調節符應用於INSERT和REPLACE語句。當DELAYED插入操做到達的時候,服務器把數據行放入一個隊列中,並當即給客戶端返回一個狀態信息,這樣客戶端就能夠在數據表被真正地插入記錄以前繼續進行操做了。若是讀取者從該數據表中讀取數據,隊列中的數據就會被保持着,直到沒有讀取者爲止。接着服務器開始插入延遲數據行(delayed-row)隊列中的數據行。在插入操做的同時,服務器還要檢查是否有新的讀取請求到達和等待。若是有,延遲數據行隊列就被掛起,容許讀取者繼續操做。當沒有讀取者的時候,服務器再次開始插入延遲的數據行。這個過程一直進行,直到隊列空了爲止。 php
幾點要注意事項:
· INSERT DELAYED應該僅用於指定值清單的INSERT語句。服務器忽略用於INSERT DELAYED...SELECT語句的DELAYED。
· 服務器忽略用於INSERT DELAYED...ON DUPLICATE UPDATE語句的DELAYED。
· 由於在行被插入前,語句馬上返回,因此您不能使用LAST_INSERT_ID()來獲取AUTO_INCREMENT值。AUTO_INCREMENT值可能由語句生成。
· 對於SELECT語句,DELAYED行不可見,直到這些行確實被插入了爲止。
· DELAYED在從屬複製服務器中被忽略了,由於DELAYED不會在從屬服務器中產生與主服務器不同的數據。
注意,目前在隊列中的各行只保存在存儲器中,直到它們被插入到表中爲止。這意味着,若是您強行停止了mysqld(例如,使用kill -9)或者若是mysqld意外中止,則全部沒有被寫入磁盤的行都會丟失。 mysql
2、IGNORE的使用
IGNORE是MySQL相對於標準SQL的擴展。若是在新表中有重複關鍵字,或者當STRICT模式啓動後出現警告,則使用IGNORE控制ALTER TABLE的運行。若是沒有指定IGNORE,當重複關鍵字錯誤發生時,複製操做被放棄,返回前一步驟。若是指定了IGNORE,則對於有重複關鍵字的行,只使用第一行,其它有衝突的行被刪除。而且,對錯誤值進行修正,使之儘可能接近正確值。insert ignore into tb(...) value(...)這樣不用校驗是否存在了,有則忽略,無則添加
3、ON DUPLICATE KEY UPDATE的使用
若是您指定了ON DUPLICATE KEY UPDATE,而且插入行後會致使在一個UNIQUE索引或PRIMARY KEY中出現重複值,則執行舊行UPDATE。例如,若是列a被定義爲UNIQUE,而且包含值1,則如下兩個語句具備相同的效果:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)
-> ON DUPLICATE KEY UPDATE c=c+1;
mysql> UPDATE table SET c=c+1 WHERE a=1;
若是行做爲新記錄被插入,則受影響行的值爲1;若是原有的記錄被更新,則受影響行的值爲2。
註釋:若是列b也是惟一列,則INSERT與此UPDATE語句至關:
mysql> UPDATE table SET c=c+1 WHERE a=1 OR b=2 LIMIT 1;
若是a=1 OR b=2與多個行向匹配,則只有一個行被更新。一般,您應該儘可能避免對帶有多個惟一關鍵字的表使用ON DUPLICATE KEY子句。
您能夠在UPDATE子句中使用VALUES(col_name)函數從INSERT...UPDATE語句的INSERT部分引用列值。換句話說,若是沒有發生重複關鍵字衝突,則UPDATE子句中的VALUES(col_name)能夠引用被插入的col_name的值。本函數特別適用於多行插入。VALUES()函數只在INSERT...UPDATE語句中有意義,其它時候會返回NULL。
示例:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3),(4,5,6)
-> ON DUPLICATE KEY UPDATE c=VALUES(a)+VALUES(b);
本語句與如下兩個語句做用相同:
mysql> INSERT INTO table (a,b,c) VALUES (1,2,3)
-> ON DUPLICATE KEY UPDATE c=3;
mysql> INSERT INTO table (a,b,c) VALUES (4,5,6)
-> ON DUPLICATE KEY UPDATE c=9;
當您使用ON DUPLICATE KEY UPDATE時,DELAYED選項被忽略。
總結:DELAYED 作爲快速插入,並非很關心失效性,提升插入性能。
ignore 只關注主鍵對應記錄是不存在,無則添加,有則忽略。
ON DUPLICATE KEY UPDATE 在添加時操做,關注非主鍵列,注意與ignore的區別。有則更新指定列,無則添加。 sql
insert into table values() ON DUPLICATE KEY UPDATE field1 =? ,field2 =? 逗號分隔 數據庫
實例見http://www.itpub.net/forum.php?mod=viewthread&tid=1770206 服務器
在最終實踐結果中,獲得接過以下:
在數據庫數據量不多的時候, 這兩種方式都很快,不管是直接的插入仍是有衝突時的更新,都不錯,但在數據庫表的內容數量比較大(如百萬級)的時候,兩種方式就不太同樣了, 函數
首先是直接的插入操做,兩種的插入效率都略低, 好比直接向表裏插入1000條數據(百萬級的表(innodb引擎)),兩者都差很少須要5,6甚至十幾秒。究其緣由,個人主機性能是一方面,但在向大數據表批量插入數據的時候,每次的插入都要維護索引的, 索引當然能夠提升查詢的效率,但在更新表尤爲是大表的時候,索引就成了一個不得不考慮的問題了。 性能
其次是更新表,這裏的更新的時候是帶主鍵值的(由於我是從另外一個表獲取數據再插入,要求主鍵不能變) 一樣直接更新1000條數據, replace的操做要比insert on duplicate的操做低太多太多, 當insert瞬間完成(感受)的時候,replace要7,8s, replace慢的緣由我是知道的,在更新數據的時候,要先刪除舊的,而後插入新的,在這個過程當中,還要從新維護索引,因此速度慢,但爲什麼insert on duplicate的更新卻那麼快呢。 在向老大請教後,終於知道,insert on duplicate 的更新操做雖然也會更新數據,但其對主鍵的索引卻不會有改變,也就是說,insert on duplicate 更新對主鍵索引沒有影響.所以對索引的維護成本就低了一些(若是更新的字段不包括主鍵,那就要另說了)。 測試