批量更新php
mysql更新語句很簡單,更新一條數據的某個字段,通常這樣寫:mysql
複製代碼 代碼以下:sql
UPDATE mytable SET myfield = 'value' WHERE other_field = 'other_value';性能
若是更新同一字段爲同一個值,mysql也很簡單,修改下where便可:測試
複製代碼 代碼以下:字符串
UPDATE mytable SET myfield = 'value' WHERE other_field in ('other_values');
it
這裏注意 ‘other_values' 是一個逗號(,)分隔的字符串,如:1,2,3table
那若是更新多條數據爲不一樣的值,可能不少人會這樣寫:性能分析
複製代碼 代碼以下:test
foreach ($display_order as $id => $ordinal) {
$sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
mysql_query($sql);
}
便是循環一條一條的更新記錄。一條記錄update一次,這樣性能不好,也很容易形成阻塞。
那麼能不能一條sql語句實現批量更新呢?mysql並無提供直接的方法來實現批量更新,可是能夠用點小技巧來實現。
複製代碼 代碼以下:
UPDATE mytable
SET myfield = CASE id
WHEN 1 THEN 'value'
WHEN 2 THEN 'value'
WHEN 3 THEN 'value'
END
WHERE id IN (1,2,3)
這裏使用了case when 這個小技巧來實現批量更新。
舉個例子:
複製代碼 代碼以下:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END
WHERE id IN (1,2,3)
這句sql的意思是,更新display_order 字段,若是id=1 則display_order 的值爲3,若是id=2 則 display_order 的值爲4,若是id=3 則 display_order 的值爲5。
便是將條件語句寫在了一塊兒。
這裏的where部分不影響代碼的執行,可是會提升sql執行的效率。確保sql語句僅執行須要修改的行數,這裏只有3條數據進行更新,而where子句確保只有3行數據執行。
若是更新多個值的話,只須要稍加修改:
複製代碼 代碼以下:
UPDATE categories
SET display_order = CASE id
WHEN 1 THEN 3
WHEN 2 THEN 4
WHEN 3 THEN 5
END,
title = CASE id
WHEN 1 THEN 'New Title 1'
WHEN 2 THEN 'New Title 2'
WHEN 3 THEN 'New Title 3'
END
WHERE id IN (1,2,3)
到這裏,已經完成一條mysql語句更新多條記錄了。
可是要在業務中運用,須要結合服務端語言,這裏以php爲例,構造這條mysql語句:
複製代碼 代碼以下:
$display_order = array(
1 => 4,
2 => 1,
3 => 2,
4 => 3,
5 => 9,
6 => 5,
7 => 8,
8 => 9
);
$ids = implode(',', array_keys($display_order));
$sql = "UPDATE categories SET display_order = CASE id ";
foreach ($display_order as $id => $ordinal) {
$sql .= sprintf("WHEN %d THEN %d ", $id, $ordinal);
}
$sql .= "END WHERE id IN ($ids)";
echo $sql;
這個例子,有8條記錄進行更新。代碼也很容易理解,你學會了嗎
性能分析
當我使用上萬條記錄利用mysql批量更新,發現使用最原始的批量update發現性能不好,將網上看到的總結一下一共有如下三種辦法:
1.批量update,一條記錄update一次,性能不好
複製代碼 代碼以下:
update test_tbl set dr='2' where id=1;
2.replace into 或者insert into ...on duplicate key update
複製代碼 代碼以下:
replace into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y');
或者使用
複製代碼 代碼以下:
insert into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y') on duplicate key update dr=values(dr);
3.建立臨時表,先更新臨時表,而後從臨時表中update
代碼以下 複製代碼
create temporary table tmp(id int(4) primary key,dr varchar(50));
insert into tmp values (0,'gone'), (1,'xx'),...(m,'yy');
update test_tbl, tmp set test_tbl.dr=tmp.dr where test_tbl.id=tmp.id;
注意:這種方法須要用戶有temporary 表的create 權限。
下面是上述方法update 100000條數據的性能測試結果:
逐條update
real 0m15.557s
user 0m1.684s
sys 0m1.372s
replace into
real 0m1.394s
user 0m0.060s
sys 0m0.012s
insert into on duplicate key update
real 0m1.474s
user 0m0.052s
sys 0m0.008s
create temporary table and update:
real 0m0.643s
user 0m0.064s
sys 0m0.004s
就測試結果來看,測試當時使用replace into性能較好。
replace into 和insert into on duplicate key update的不一樣在於: replace into 操做本質是對重複的記錄先delete 後insert,若是更新的字段不全會將缺失的字段置爲缺省值 insert into 則是隻update重複記錄,不會改變其它字段。