PHP如何對CSV大文件進行讀取並導入數據庫?
對於數百萬條數據量的CSV文件,文件大小可能達到數百M,若是簡單讀取的話極可能出現超時或者卡死的現象。
爲了成功將CSV文件裏的數據導入數據庫,分批處理是很是必要的。
下面這個函數是讀取CSV文件中指定的某幾行數據:
/** * csv_get_lines 讀取CSV文件中的某幾行數據 * @param $csvfile csv文件路徑 * @param $lines 讀取行數 * @param $offset 起始行數 * @return array * */ function csv_get_lines($csvfile, $lines, $offset = 0) { if(!$fp = fopen($csvfile, 'r')) { return false; } $i = $j = 0; while (false !== ($line = fgets($fp))) { if($i++ < $offset) { continue; } break; } $data = array(); while(($j++ < $lines) && !feof($fp)) { $data[] = fgetcsv($fp); } fclose($fp); return $data; }
調用方法:
$data = csv_get_lines('path/bigfile.csv', 10, 2000000);
print_r($data);
函數主要採用行定位的思路,經過跳過起始行數來實現文件指針定位。
至於數據如何入庫本文再也不詳細講述。
上述函數對500M之內的文件進行過測試,運行通暢,對於更大的文件未作測試,請斟酌使用或加以改進。數據庫