Spark系列(一) 認識Spark

懷念看論文的日子~/ 打算寫一個Spark系列,主要以Scala代碼實現,請賜予我力量吧!!! Spark的特點 運行速度:Spark擁有DAG執行引擎,支持在內存中對數據進行迭代計算。官方提供的數據表明,如果數據由磁盤讀取,速度是Hadoop MapReduce的10倍以上,如果數據從內存中讀取,速度可以高達100多倍。 適用性強:能夠讀取HDFS、Cassandra、HBase、S3和Tech
相關文章
相關標籤/搜索