如何利用pandas處理大數據

翻譯自這篇文章python 當咱們須要處理大數據時,若是不對數據作任何處理,可能會帶來內存佔用過大和運行過慢的風險。git 固然對於處理大數據集,相似spark之類的專業處理工具是你們的首選,可是pandas優秀的特性和簡單明瞭的語法能極大提高數據分析的效率,所以我須要考慮如何對數據優化,使得咱們能在pandas上完成更大數據量的數據分析工做。github 在用pandas進行數據分析時,減小內存
相關文章
相關標籤/搜索