關於大數據各個級別選擇(Pandas、Hadoop)

時間 2019-12-09

標籤關於數據各個級別選擇 pandas hadoop 欄目 Hadoop 简体版

原文原文鏈接

開發者博客：www.developsearch.comnode Hadoop裏，全部計算都必須按照一個map、一個group by、一個aggregate或者這種計算序列來寫。這和穿上緊身衣同樣，多憋得慌啊。許多計算用其餘模型其實更適合。忍受緊身衣的惟一緣由就是，能夠擴展到極大極大的數據集。可你的數據集實際上極可能根本遠遠夠不上那個數量級。但是呢，由於Hadoop和大數據是熱詞，世界有一

>>阅读原文<<