關於大數據各個級別選擇(Pandas、Hadoop)

開發者博客:www.developsearch.comnode     Hadoop裏,全部計算都必須按照一個map、一個group by、一個aggregate或者這種計算序列來寫。這和穿上緊身衣同樣,多憋得慌啊。許多計算用其餘模型其實更適合。忍受緊身衣的惟一緣由就是,能夠擴展到極大極大的數據集。可你的數據集實際上極可能根本遠遠夠不上那個數量級。 但是呢,由於Hadoop和大數據是熱詞,世界有一
相關文章
相關標籤/搜索