無論是平常業務數據處理中,仍是數據庫的導入導出,均可能遇到須要處理大量數據的插入。插入的方式和數據庫引擎都會對插入速度形成影響,這篇文章旨在從理論和實踐上對各類方法進行分析和比較,方便之後應用中插入方法的選擇。php
插入分析mysql
MySQL中插入一個記錄須要的時間由下列因素組成,其中的數字表示大約比例:sql
鏈接:(3)數據庫
發送查詢給服務器:(2)apache
分析查詢:(2)安全
插入記錄:(1x記錄大小)服務器
插入索引:(1x索引)性能
關閉:(1)測試
若是咱們每插入一條都執行一個SQL語句,那麼咱們須要執行除了鏈接和關閉以外的全部步驟N次,這樣是很是耗時的,優化的方式有一下幾種:優化
在每一個insert語句中寫入多行,批量插入
將全部查詢語句寫入事務中
利用Load Data導入數據
每種方式執行的性能以下。
Innodb引擎
InnoDB 給 MySQL 提供了具備事務(commit)、回滾(rollback)和崩潰修復能力(crash recovery capabilities)的事務安全(transaction-safe (ACID compliant))型表。InnoDB 提供了行鎖(locking on row level)以及外鍵約束(FOREIGN KEY constraints)。
InnoDB 的設計目標是處理大容量數據庫系統,它的 CPU 利用率是其它基於磁盤的關係數據庫引擎所不能比的。在技術上,InnoDB 是一套放在 MySQL 後臺的完整數據庫系統,InnoDB 在主內存中創建其專用的緩衝池用於高速緩衝數據和索引。
測試環境
Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16
總數100W條數據
插入完後數據庫大小38.6MB(無索引),46.8(有索引)
無索引單條插入 總耗時:229s 峯值內存:246KB
有索引單條插入 總耗時:242s 峯值內存:246KB
無索引批量插入 總耗時:10s 峯值內存:8643KB
有索引批量插入 總耗時:16s 峯值內存:8643KB
無索引事務插入 總耗時:78s 峯值內存:246KB
有索引事務插入 總耗時:82s 峯值內存:246KB
無索引Load Data插入 總耗時:12s 峯值內存:246KB
有索引Load Data插入 總耗時:11s 峯值內存:246KB
MyIASM引擎
MyISAM 是MySQL缺省存貯引擎。設計簡單,支持全文搜索。
測試環境
Macbook Air 12mid apache2.2.26 php5.5.10 mysql5.6.16
總數100W條數據
插入完後數據庫大小19.1MB(無索引),38.6(有索引)
無索引單條插入 總耗時:82s 峯值內存:246KB
有索引單條插入 總耗時:86s 峯值內存:246KB
無索引批量插入 總耗時:3s 峯值內存:8643KB
有索引批量插入 總耗時:7s 峯值內存:8643KB
無索引Load Data插入 總耗時:6s 峯值內存:246KB
有索引Load Data插入 總耗時:8s 峯值內存:246KB武漢治療精神分裂症的醫院有哪些
總結
我測試的數據量不是很大,不過能夠大概瞭解這幾種插入方式對於速度的影響,最快的必然是Load Data方式。這種方式相對比較麻煩,由於涉及到了寫文件,可是能夠兼顧內存和速度。