數據挖掘入門 資料和步驟

最近很多朋友問到數據挖掘怎麼入門,要看什麼資料,算法

就想寫一篇文章介紹一下入門步驟和資料,基本上下面的步驟是按順序的,時間方面我的感受至少須要小几個月sql

 

基礎知識:ide

  • 線性代數
  • 統計學
  • 計算機技術

基本上這些東西不說熟悉,至少也要有點概念,或者是大學有上過對應的課程,不須要特別準備。工具

 

推薦書籍和資料:oop

視頻:學習

中文:大數據

  • 《數據挖掘概念與技術》  這本書我本身也挺喜歡的,適合初學者,涉及的面比較多,不過不夠深刻 (備選:《數據挖掘導論》)
  • 《數學之美》 介紹了一些挺有意思的東西

英文:網站

 

實踐:spa

瞭解了數據挖掘是怎麼回事之後,最好的學習辦法就是開始實戰,若是公司裏面沒有相似的項目,那麼能夠考慮去如下網站參加比賽,重在參與和學習視頻

其餘經常使用資料和網站:

  • 數據 若是你想要下載一些數據,這個網站可能會幫你
  • cos.name 這邊有一些業界案例的ppt下載(年會那些),還有一些基本資料

數據挖掘工做中可能涉及到的技能和工具:

  • 業務知識
  • 數據清理和準備 (例如說sql server)
  • 建模和分析工具 (例如說R, Weka)
    • 算法和方案
  • Demo (PPT)
  • 大數據處理 (Hadoop/Mahout)
  • Coding (無論是本身作一點處理仍是最終把產品帶上線,都須要一些coding的能力)
相關文章
相關標籤/搜索