Spark入門

spark歷史:伯克利實驗室研究項目,基於Hadoop的Mapreduce機制,引入內存管理機制,提高了迭代式計算和交互式中的效率。 spark組件: spark core:spark基本功能,包括任務調度,內存管理,容錯機制 內部定義了RDDs(彈性分佈式數據集),提供多個APIs調用,爲其他組件提供底層服務 spark sql:spark處理結構化數據的庫,類似Hive SQL,MySql,
相關文章
相關標籤/搜索