spark入門框架+python

簡介: 不能否認,spark是一種大數據框架,它的出現每每會有Hadoop的身影,其實Hadoop更多的能夠看作是大數據的基礎設施,它自己提供了HDFS文件系統用於大數據的存儲,固然還提供了MR用於大數據處理,可是MR有不少自身的缺點,針對這些缺點也已經有不少其餘的方法,類如針對MR編寫的複雜性有了Hive,針對MR的實時性差有了流處理Strom等等,spark設計也是針對MR功能的,它並無大數據
相關文章
相關標籤/搜索