深入理解spark之架構與原理

爲什麼80%的碼農都做不了架構師?>>>     Spark提供了一個全面、統一的框架用於管理各種有着不同性質(文本數據、圖表數據等)的數據集和數據源(批量數據或實時的流數據)的大數據處理的需求 官方資料介紹Spark可以將Hadoop集羣中的應用在內存中的運行速度提升100倍,甚至能夠將應用在磁盤上的運行速度提升10倍。 基本理念:      RDD(resillient distributed
相關文章
相關標籤/搜索