關於spark-①

spark概念: spark是統一的分佈式大數據分析引擎,spark能夠適應多種計算場景,spark能夠分析數據,但是沒有存儲。一般線上的spark數據來源(HDFS,hive,kafka,flume,日誌文件,關係型數據庫,nosql數據庫)。spark出口(hdfs,hive,redise,關係型數據庫,nosql數據庫)。spark一般情況是以集羣模式存在,架構:master/slaver(
相關文章
相關標籤/搜索