深刻淺出Hadoop Mahout數據挖掘實戰(算法分析、項目實戰、中文分詞技術)
適合人羣:高級
課時數量:17課時
用到技術:MapReduce並行分詞程序 Mahout
涉及項目:Hadoop綜合實戰-文本挖掘項目 Mahout數據挖掘工具
諮詢QQ:1840215592
課程介紹
本課程主要涉及如下內容的講解:
一、Mahout數據挖掘工具
二、Hadoop實現推薦系統的綜合實戰,涉及到MapReduce、Pig和Mahout的綜合實戰
課程針對人羣
一、本課程適合於有必定java基礎知識,對數據庫和sql語句有必定了解,熟練使用linux系統的技術人員,特別適合於想換工做或尋求高薪職業的人士
二、最好有Greenplum Hadoop、Hadoop2.0、YARN、Sqoop、FlumeAvro、 Mahout等大數據基礎,學習過北風課程《Greenplum 分佈式數據庫開發入門到精通》、《全面深刻Greenplum Hadoop大數據分析平臺》、《Hadoop2.0、YARN深刻淺出》、《MapReduce、Hbase進階提高》、《MapReduce、Hbase進階提高》爲最佳。
《深刻淺出Hadoop Mahout數據挖掘實戰》詳細查看:http://www.ibeifeng.com/goods-438.html
課程大綱
Mahout數據挖掘工具(10課時)
數據挖掘概念、系統組成
數據挖掘經常使用方法及算法(迴歸分析、分類、聚類等)
數據挖掘分析工具
Mahout支持的算法
Mahout起源和特色
Mahout安裝、配置及測試
實戰:Mahout K-means聚類分析
Mahout實現Canopy算法
Mahout實現分類算法
實戰:Mahout邏輯迴歸分類預測
實戰:Mahout樸素貝葉斯分類
推薦系統的概念及分類
協同過濾推薦算法概念、分類及應用
實戰:實現基於Mahout的電影推薦系統
Hadoop綜合實戰-文本挖掘項目(7課時)
文本挖掘的概念及應用場景
項目背景
項目流程
中文分詞技術
庖丁分詞器的使用
MapReduce並行分詞程序的設計與實現
Pig劃分數據集
Mahout構建樸素貝葉斯文本分類器
模型應用-計算用戶偏好類別html