本階段不須要編程,不少人聽過大數據,聽過人工智能,聽過數據挖掘。可是幾乎都有疑問:什麼是大數據?什麼是人工智能?大數據和人工智能能作什麼?等等。這一階段主要是答疑解惑,讓你們明白這些概念,至少在和高端人士茶餘飯後談論大數據和人工智能的時候能夠不須要「一臉懵逼」。 若是已經對大數據和人工智能瞭解很透徹,能夠跳過直接進入第一階段。linux
第一階段:linux 系統
這章是基礎課程,幫你們進入大數據領域打好 Linux 基礎,以便更好地學習 Hadoop, NOSQL, Oracle, MYSQL, Spark, Storm 等衆多課程。由於企業中 無一例外的是使用 Linux 來搭建或部署項目。sql
若是你想要學好大數據最好加入一個好的學習環境,能夠來這個Q羣251956502 這樣你們學習的話就比較方便,還可以共同交流和分享資料數據庫
第二階段:大型網站高併發處理
經過本章的學習你們將會了解大數據的源頭,數據從何而來,繼而更好的瞭解大數據。而且經過學習若是處理大型網站高併發問題反向更深刻的學習了 Linux 同時站在了更高的角度去觸探了架構。編程
第三階段:Hadoop 分佈式文件系統:HDFS
本階段是進入「大數據」的一個入口,須要掌握HDFS 的基本原理,知道爲何它可 以存儲海量數據,知道「百度網盤」自己是什麼?可否本身也能實現一個網盤。讓你們一開 始就進入大數據實戰狀態。架構
第四階段:Hadoop 分佈式計算框架:Mapreduce
該階段側重對MR 的原理實現,案例應用爲主線,附以源碼分析讓學生來更清晰的理解何爲分佈式計算,計算的並行、計算的向數據移動、計算的本地化數據讀取等併發
第五階段:Hadoop 離線體系:Hive
本階段介紹Hive 是基於Hadoop 的一個數據倉庫工具,能夠將結構化的數據文件映射爲一張數據庫表,並提供簡單的sql 查詢功能,能夠將sql 語句轉換爲MapReduce 任務進行運行。其優勢是學習成本低,能夠經過類SQL 語句快速實現簡單的MapReduce 統計,沒必要開發專門的MapReduce 應用,十分適合數據倉庫的統計分析。框架
共有16階段,其餘階段如圖分佈式