五年經驗大佬帶你掌握 基於Hadoop與Spark的大數據開發實戰

前言: 本書以Hadoop和Spark爲核心,闡述了基於這兩種通用大數據處理平臺的應用開發技術。 在Hadoop生態圈中,從HDFS初識分佈式存儲系統;以MapReduce詳解f分佈式計算的步驟;利用HBase分析適合非結構化數據存儲的分佈式數據庫;利用Hive分析將SQL查詢轉化爲分佈式計算的過程;並結合項目案例「音樂排行榜」練習Hadoop核心技能點的運用;同時,介紹了幾種離線處理系統中常用的
相關文章
相關標籤/搜索