-----------------------------------------------------------------------------------------html
和機器學習結緣,是由於知乎上一項回答:爲何最近有不少名人,好比比爾蓋茨,馬斯克、霍金等,讓人們警戒人工智能?,回答中關於人工智能的探討、人類命運的終極思索,深深地觸動了我。因而我就想從機器學習爲切入點,來系統的研究 AI 這個無限寬廣的題目。python
我計劃將我學習過程當中遇到的各類問題、思路和一些有價值的資料分享出來,做爲此係列文章的主題內容。本系列文章初步計劃分爲:工具篇、理論篇和實戰篇三大部分,每部分會分別討論若干相關論題。git
不積跬步,無以致千里!github
下面就將目前蒐集到的學習資料羅列以下,但願對你們有所幫助:web
書籍:算法
Pattern Recognition And Machine Learning編程
統計學習方法網絡
機器學習框架
機器學習實戰dom
公開課:
http://ml.memect.com/article/machine-learning-guide.html
https://www.zhihu.com/question/20691338
機器學習 機器學習是近20多年興起的一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機能夠自動「學習」的算法。機器學習算法是一類從數據中自動分析得到規律,並利用規律對未知數據進行預測的算法。由於學習算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤其密切,也被稱爲統計學習理論。算法設計方面,機器學習理論關注能夠實現的,行之有效的學習算法。
下面從微觀到宏觀試着梳理一下機器學習的範疇:一個具體的算法,領域進一步細分,實戰應用場景,與其餘領域的關係。
圖1: 機器學習的例子:NLTK監督學習的工做流程圖 (source: http://www.nltk.org/book/ch06.html)
圖2: 機器學習概要圖 by Yaser Abu-Mostafa (Caltech) (source: http://work.caltech.edu/library/181.html)
圖3: 機器學習實戰:在python scikit learn 中選擇機器學習算法 by Nishant Chandra (source: http://n-chandra.blogspot.com/2013/01/picking-machine-learning-algorithm.html)
圖4: 機器學習和其餘學科的關係: 數據科學的地鐵圖 by Swami Chandrasekaran (source: http://nirvacana.com/thoughts/becoming-a-data-scientist/)
大體分三類: 起步體悟,實戰筆記,行家導讀
機器學習入門者學習指南 @果殼網 (2013) 做者 白馬 -- [起步體悟] 研究生型入門者的親身經歷
有沒有作機器學習的哥們?可否介紹一下是如何起步的 @ourcoders -- [起步體悟] 研究生型入門者的親身經歷,尤爲要看reyoung的建議
tornadomeet 機器學習 筆記 (2013) -- [實戰筆記] 學霸的學習筆記,看看小夥伴是怎樣一步一步地掌握「機器學習」
Machine Learning Roadmap: Your Self-Study Guide to Machine Learning (2014) Jason Brownlee -- [行家導讀] 雖然是英文版,但很是容易讀懂。對Beginner,Novice,Intermediate,Advanced讀者都有覆蓋。
門主的幾個建議
Tom Mitchell 和 Andrew Ng 的課都很適合入門
英文原版視頻與課件PDF 他的《機器學習》在不少課程上被選作教材,有中文版。
英文原版視頻 這就是針對自學而設計的,免費還有修課認證。「老師講的是深刻淺出,不用太擔憂數學方面的東西。並且做業也很是適合入門者,都是設計好的程序框架,有做業指南,根據做業指南填寫該完成的部分就行。」(參見白馬同窗的入門攻略)"推薦報名,跟着上課,作課後習題和期末考試。(由於只看不幹,啥都學不會)。" (參見reyoung的建議)
2013年Yaser Abu-Mostafa (Caltech) Learning from Data -- 內容更適合進階 課程視頻,課件PDF@Caltech
2014年 林軒田(國立臺灣大學) 機器學習基石 (Machine Learning Foundations) -- 內容更適合進階,華文的教學講解 課程主頁
When Can Machines Learn? [何時可使用機器學習] The Learning Problem [機器學習問題] -- Learning to Answer Yes/No [二元分類] -- Types of Learning [各式機器學習問題] -- Feasibility of Learning [機器學習的可行性]
Why Can Machines Learn? [為什麼機器能夠學習] -- Training versus Testing [訓練與測試] -- Theory of Generalization [舉一反三的通常化理論] -- The VC Dimension [VC 維度] -- Noise and Error [雜訊一錯誤]
How Can Machines Learn? [機器能夠怎麼樣學習] -- Linear Regression [線性迴歸] -- Linear `Soft' Classification [軟性的線性分類] -- Linear Classification beyond Yes/No [二元分類之外的分類問題] -- Nonlinear Transformation [非線性轉換]
How Can Machines Learn Better? [機器能夠怎麼樣學得更好] -- Hazard of Overfitting [過度訓練的危險] -- Preventing Overfitting I: Regularization [避免過度訓練一:控制調適] -- Preventing Overfitting II: Validation [避免過度訓練二:自我檢測] -- Three Learning Principles [三個機器學習的重要原則]
2008年Andrew Ng CS229 機器學習 -- 這組視頻有些年頭了,主講人這兩年也高大上了.固然基本方法沒有太大變化,因此課件PDF可下載是優勢。 中文字幕視頻@網易公開課 | 英文版視頻@youtube | 課件PDF@Stanford
第1集.機器學習的動機與應用 第2集.監督學習應用.梯度降低 第3集.欠擬合與過擬合的概念 第4集.牛頓方法 第5集.生成學習算法 第6集.樸素貝葉斯算法 第7集.最優間隔分類器問題 第8集.順序最小優化算法 第9集.經驗風險最小化 第10集.特徵選擇 第11集.貝葉斯統計正則化 第12集.K-means算法 第13集.高斯混合模型 第14集.主成分分析法 第15集.奇異值分解 第16集.馬爾可夫決策過程 第17集.離散與維數災難 第18集.線性二次型調節控制 第19集.微分動態規劃 第20集.策略搜索
2012年餘凱(百度)張潼(Rutgers) 機器學習公開課 -- 內容更適合進階 課程主頁@百度文庫 | 課件PDF@龍星計劃
第1節Introduction to ML and review of linear algebra, probability, statistics (kai) 第2節linear model (tong) 第3節overfitting and regularization(tong) 第4節linear classification (kai) 第5節basis expansion and kernelmethods (kai) 第6節model selection and evaluation(kai) 第7節model combination (tong) 第8節boosting and bagging (tong) 第9節overview of learning theory(tong) 第10節optimization in machinelearning (tong) 第11節online learning (tong) 第12節sparsity models (tong) 第13節introduction to graphicalmodels (kai) 第14節structured learning (kai) 第15節feature learning and deeplearning (kai) 第16節transfer learning and semi supervised learning (kai) 第17節matrix factorization and recommendations (kai) 第18節learning on images (kai) 第19節learning on the web (tong)
http://www.52ml.net/ 我愛機器學習
http://www.mitbbs.com/bbsdoc/DataSciences.html MITBBS- 電腦網絡 - 數據科學版
http://www.guokr.com/group/262/ 果殼 > 機器學習小組
http://cos.name/cn/forum/22 統計之都 » 統計學世界 » 數據挖掘和機器學習
http://bbs.byr.cn/#!board/ML_DM 北郵人論壇 >> 學術科技 >> 機器學習與數據挖掘
https://github.com/josephmisiti/awesome-machine-learning 機器學習資源大全
http://work.caltech.edu/library/ Caltech 機器學習視頻教程庫,每一個課題一個視頻
http://www.kdnuggets.com/ 數據挖掘名站
http://www.datasciencecentral.com/ 數據科學中心網站
一些好東西,入門前未必看得懂,要等學有小成時再看才能體會。
Dan Levin, What is the difference between statistics, machine learning, AI and data mining?
幾篇高屋建瓴的機器學習領域概論, 參見原文
幾本好書