生於數據的時代——記公開課數據分析的極限

博客中的文章均爲meelo原創,請務必以連接形式註明本文地址html

公開課:數據分析的極限算法

The Analytics Edgeapp

https://www.edx.org/course/analytics-edge-mitx-15-071x-2機器學習

The Analytics Edge的中文名稱應該叫作《數據分析的極限》,來自麻省理工學院(MIT)。這門課最大的特色就是經過各類實際應用,介紹經典的機器學習和優化的方法,使用的是統計學專用的語言R。機器學習中,監督學習的算法介紹了線性迴歸、邏輯迴歸、決策樹與隨機森林,非監督學習的算法介紹了分級聚類和K均值聚類;優化的方法介紹了線性優化和整數優化。ide

課程中不多有數學公式,幾乎沒有介紹各類方法的原理。若是絲絕不瞭解機器學習的話能夠有點難以接受,適合對機器學習有必定了解的人學習。即使我已經熟悉機器學習,我仍是被課程中介紹的各類應用驚歎道,原來如此簡單的算法能夠有如此豐富多彩的應用。post

這門課的做業能夠叫作很是多,每一週有三個應用的做業,就是使用R創建模型而後進行預測和分析,一個做業一不當心就要花1個小時。作完三個做業就會被數據中的各類變量搞暈了。學習

還有一個很是精彩的地方是,在課程上到一半的時候會在Kaggle上組織一場競賽,競爭可謂很是激烈啊,相差零點幾的分數就會差好幾百人。最後實在不想爲了那麼一丁點提高而絞盡腦汁,在2000餘人中,最終排名500多,因爲是第一次我自認爲仍是不錯了。優化

下面是課程中每一章所涉及的應用:url

相關文章
相關標籤/搜索