kaggle競賽入門

我入門是看了範淼和李超的《python機器學習機實踐-----從零開始通往Kaggle競賽之路》html

這本書須要掌握python語言,並熟練使用以下python包:pandas numpy matplotlib/seaborn sklearnpython

pandas是數據處理的一個庫,經過http://www.cnblogs.com/chaosimple/p/4153083.html就能夠學會個大概算法

numpy是處理多維數組的一個庫,經過http://old.sebug.net/paper/books/scipydoc/numpy_intro.html也能學到個大概數組

matplotlib能夠用來作可視化,經過http://old.sebug.net/paper/books/scipydoc/matplotlib_intro.html也能學到大概app

我通常使用seaborn作可視化,這個庫是matplotlib的高級封裝,經過http://blog.csdn.net/qq_34264472/article/details/53814653能夠快速入門機器學習

https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations這個是seaborn作可視化很是好的例子學習

sklearn的總體性入門,我的以爲看 範淼和李超的《python機器學習機實踐-----從零開始通往Kaggle競賽之路》就能夠了spa

固然,上面這些都只是入門,要學會融會貫通,查看官網進行系統性學習是必須的;另外就是開始作項目,在看別人的代碼,寫本身的代碼中熟悉各類語法和操做.net

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------htm

我學習東西,通常的思路都是先去找學習路徑,常常上知乎。。

http://www.cnblogs.com/zhizhan/p/5826089.html這篇文章很是的好

總結下重點,

1,特徵工程 

目前的機器學習通常把大多數時間都花費在數據處理上(包括特徵工程);

數據處理前須要先了解數據的大概,因此須要可視化

https://mp.weixin.qq.com/s/Nt9xKQQZLyWBmU_bMEsbtg這個是講的比較好的一個例子

2,模型融合

模型融合簡單來講就是博採衆長,分爲bagging boosting stacking等

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

有了上面的基礎就算大概入門了,而後找幾個kaggle的例子進行練手,同時看看別人都是怎麼玩的

https://www.kaggle.com/kernels這裏都是大神,按照各類類別或者本身喜歡的領域邊看邊寫代碼

看到下面的神圖

參考自http://www.sv-europe.com/crisp-dm-methodology/ 

拜讀起來!!!

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

個人機器學習之旅,學了spark ml,看了幾本理論(差很少忘了),看了公開課(吳恩達的),看了無數的文章,學會了大多數的調優

慢慢的有一種感受,這玩意還不成熟,總有一天會有一個大一統的模型出來,能夠經過網頁配置進行特徵工程和機器學習調優,最終造成一個平臺。

後來,果真看到了一個相似的http://blog.kaggle.com/2016/07/21/approaching-almost-any-machine-learning-problem-abhishek-thakur/

忽然感受,哪天是否是要失業了。。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

深度學習貌似注重算法一些,爲了避免失業,感受得不斷豐富本身的武器庫。加油加油!!

相關文章
相關標籤/搜索