Spark RDD彈性表現和來源

時間 2019-12-07

標籤 spark rdd 彈性表現來源欄目 Spark 简体版

原文原文鏈接

hadoop 的MapReduce是基於數據集的,位置感知，容錯負載均衡基於數據集的處理：從物理存儲上加載數據，而後操做數據，而後寫入物理存儲設備；基於數據集的操做不適應的場景： 1，不適合於大量的迭代 2，交互式查詢重點是：基於數據流的方式不可以複用曾經的結果或者中間計算結果; spark RDD是基於工做集的工做流和工做集的共同特色：位置感知，自動容錯，負載均衡等。 spark的位

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。