學會數據分析還得看這4個實戰項目!

前言:

大數據的火熱,致使大數據挖掘分析工做也異常火熱,成爲不少小夥伴的職業選擇,若是你想學會如何分析數據以及挖掘數據,那麼這4個項目可必定不要錯過。python

【ebay在線拍賣數據分析】

本節課程咱們將介紹另一個國際貿易門戶--ebay,一個致力於爲中國商家開闢海外網絡直銷渠道的平臺。咱們能夠在這個平臺上充當買家或是賣家。與淘寶不一樣的是,這個平臺不是一口價交易,而是設置一個開始競投的價格後開始拍賣。算法

這節課程咱們就是要利用ebay上的歷史拍賣數據,用機器學習的方法來訓練一個模型,以預測一項拍賣是否會成功,和成功的交易最終的成交價格。網絡

涉及知識點:

  • 學習如何用scikit-learn的機器學習算法
  • scikit-learn 作數據分析
  • 數據分析結果可視化

訓練過程截圖:

訓練過程截圖

【使用 Spark 和 D3.js 分析航班大數據】

相信不少在機場等待飛行的旅客都不肯意聽到這句話。隨着乘坐飛機這種交通方式的逐漸普及,航延延誤問題也一直困擾着咱們。航班延誤一般會形成兩種結果,一種是航班取消,另外一種是航班晚點。框架

在本課程中,咱們將經過 Spark 提供的 DataFrame、 SQL 和機器學習框架等工具,基於 D3.js 數據可視化技術,對航班起降的記錄數據進行分析,嘗試找出形成航班延誤的緣由,以及對航班延誤狀況進行預測。機器學習

涉及知識點:

  • Spark DataFrame 操做
  • Spark SQL 經常使用操做
  • Spark MLlib 機器學習框架使用

效果圖:

效果截圖

【NBA常規賽結果預測——利用Python進行比賽數據分析】

不知道你是否朋友圈被刷屏過nba的某場比賽進度或者結果?或者你就是一個nba狂熱粉,比賽中的每一個進球,搶斷或是逆轉壓哨球都能讓你熱血沸騰。除去觀賞精彩的比勝過程,咱們也一樣好奇比賽的結果會是如何。工具

所以本節課程,將給同窗們展現如何使用nba比賽的以往統計數據,判斷每一個球隊的戰鬥力,及預測某場比賽中的結果。咱們將基於2015-2016年的NBA常規賽及季後賽的比賽統計數據,預測在當下正在進行的2016-2017常規賽每場賽事的結果。學習

利用Basketball-reference.com的部分統計數據,計算每支nba比賽隊伍的Elo socre,和利用這些基本統計數據評價每支隊伍過去的比賽狀況,而且根據國際等級劃分方法Elo Score對隊伍如今的戰鬥等級進行評分,最終結合這些不一樣隊伍的特徵判斷在一場比賽中,哪支隊伍可以佔到優點。大數據

Paste_Image.png

涉及知識點:

  • nba球隊的Elo score計算
  • 特徵向量
  • 邏輯迴歸

效果圖:

效果截圖

【大數據帶你挖掘打車的祕籍】

出租車是咱們生活中常常乘坐的一種交通工具,但打車難的問題也限制了咱們更好地利用這種交通方式。在哪些地方出租車更容易打到?在何時更容易打到出租車?本課程將基於某市的出租車行駛軌跡數據,帶你學習如何應用Spark SQL和機器學習相關技巧,而且經過數據可視化手段展示分析結果。spa

涉及知識點:

  • Spark DataFrame操做
  • Spark SQL 的 API 查詢
  • Spark MLlib 的 KMeans 算法應用

效果圖:

效果截圖

效果截圖

後記

固然,要學好數據分析,只看以上4個項目是遠遠不夠的,若是感興趣,你還能夠看如下項目:3d

更多相關教程,點擊實驗樓進行查看~

相關文章
相關標籤/搜索