Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課

本文由 「AI前線」原創,原文連接: Kaggle推出免費線上課程,覆蓋機器學習、深度學習等四門課
線索編輯|Tina
撰稿編輯|Natalie,Debra

AI 前線導讀:」Kaggle 是機器學習和數據科學領域比較權威的數據建模和數據分析競賽平臺,近日 Kaggle 發佈了免費的線上學習項目 Kaggle Learn,這對於想要學習機器學習和數據科學的人來講無疑是個福音。該課程更重視代碼實踐,相比閱讀代碼,用戶須要花更多的時間本身編寫代碼。據官網介紹,「 使用者將得到所需的理論知識,以便作出更好的建模決策,但無需將時間浪費在那些對成爲一名實踐型數據科學家毫無幫助的理論和歷史背景的學習上。」 該課程共包含機器學習、R 語言、數據可視化和深度學習四門課。」算法


Kaggle 是目前世界上最大的數據科學家、機器學習開發者的社區,用戶量達到幾十萬,是行業中比較權威的平臺。編程

2017 年 3 月 8 日,Stanford 人工智能實驗室主任兼谷歌雲首席科學家李飛飛主導了 Google 收購 Kaggle 的案子。大約在一年前,李飛飛就說過:「Kaggle 是搜尋、分析公共數據集,開發機器學習模型和提升數據科學專業水平的最佳場所。」這是對 Kaggle 在機器學習、人工智能領域的地位的高度承認,也爲今年的收購行爲作出了一個合理的解釋。機器學習

對於 Kaggle 而言,在加持了 Google Cloud 服務後,社區將擁有更好的獲取、儲存大型數據集的能力;而社區成員將可以享用最早進的雲機器學習開發環境。這一合做無疑將會對 Kaggle 社區的發展起到很大的推進做用,所以將來 Kaggle 在 ML 和 AI 領域的地位只會更加穩固。(來自知乎用戶 a2Mia 姐,連接:www.zhihu.com/question/32…性能

做爲一個機器學習和數據科學平臺,企業和研究者可在 Kaggle 上發佈數據,該平臺的競賽也吸引了不少統計學者和數據挖掘專家,其中一項獎項 Heritage Health Prize 獎金高達 300 萬美金,參加該比賽對於競賽者來講是一次學習和實踐鍛鍊的機會,由於只有佼佼者才能得到最終第一名的獎金,競賽成績也會成爲簡歷中一項很是亮眼的經歷。學習


Kaggle Learn 項目總覽測試

Kaggle Learn 項目全部課程均爲在線免費課程,據項目官網介紹,該項目旨在幫助有意參加競賽的人或幫助數據科學學習者在建模以前瞭解理論知識,以提升解決實際問題的能力。大數據

該項目由四門課程組成,分別爲機器學習、R 語言、數據可視化和深度學習,每門課程又根據難度分爲 Level一、Level2 不等,講授知識由淺入深,內容涵蓋人工智能、數據科學等熱門領域。優化

  • 機器學習:這是數據科學中最熱門的領域,此課程可讓你迅速入門機器學習。
  • R 語言:這是專門爲數據分析而設計的語言。此係列課程包括數據設置、機器學習和數據可視化。
  • 數據可視化:可視化是數據科學中最具備活力的技術,經過可視、美麗的圖像展示數據集。
  • 深度學習:經過本課程學習 TensorFlow 的使用方法,從而使機器學習更進一步,這項新的技能將會帶給你更多驚喜。

該項目的四門課程具有如下特色:基於項目學習,可以很方便地關注學習進度,由全球最大的數據科學社區提供支持,能夠將項目經驗寫入我的履歷。網站

Kaggle Learn 項目目前共有三名講師:人工智能

  • Dan Becker,數據科學家,曾爲「財富」100 強中的 6 家公司提供數據科學技術的諮詢服務,是 Keras 深度學習庫的代碼貢獻者。他擁有計量經濟學博士學位。目前主要負責機器學習和深度學習兩門課程。
  • Racheal Tatman,多年來一直是 R 語言的活躍用戶和講師。她曾擔任 Software Carpenty 和 She Codes Now 講習班的講師,擁有語言學博士學位。目前主要負責 R 語言課程。
  • Aleksey Bilogur,他是一位數據專家和 Python 開源項目貢獻者。他爲紐約市長辦公室和紐約大學 CUSP 工做,擁有數學學士學位。目前主要負責數據可視化課程。


Kaggle Learn 課程詳細介紹

機器學習

機器學習課程分爲 Level一、Level2,機器學習新手能夠從入門課程開始,一步步學習從原理到數據上傳、設置計算環境、建模等所有過程,每節課均附有學習筆記可供查閱學習。

課程連接:

www.kaggle.com/learn/machi…

Level 1 共包含 8 節課:

  1. 模型工做原理:新手入門機器學習第一步
  2. 創建本身的機器學習項目:上傳數據,親自動手設置項目所需的計算環境
  3. 用 Pandas 篩選過濾數據:爲建模作數據準備
  4. 運行你的第一個模型
  5. 驗證模型:測試模型性能,必要時用其餘模型替換
  6. 欠擬合、過擬合以及模型優化:調整模型以提升性能
  7. 隨機森林:使用更加複雜的機器學習算法
  8. 提交參加競賽:爲你作到的感到自豪吧,並關注你的項目在競賽中的進展

Level 2 共包含 7 節課,涵蓋了機器學習中會遇到的各類問題,如處理丟失數據、使用分類數據等。

R 語言

課程連接:

www.kaggle.com/learn/r

目前這門課程僅開放了 Level 1,共包含 6 節課:

  1. 用 R 語言學數據科學(學習讀取數據和創建機器學習模型的基本知識)
  2. 用 Tidyverse 操做數據(這個被普遍採用的強大的庫將大大提升效率
  3. 用 ggplot2 進行數據可視化:雖然數據可視化庫衆多,但大多數專家認爲 ggplot2 功能最爲強大
  4. 用 R 寫 NLP:主題模型
  5. XGBoost(R)機器學習
  6. 選擇帶有補字符的最佳模型(模型自動篩選,讓機器學習更輕鬆、更有效)

數據可視化

課程連接:

www.kaggle.com/learn/data-…

一樣僅開放了 Level 1,共 10 節課,從入門基本知識到高級操做均涵蓋其中。

深度學習

課程連接:

www.kaggle.com/learn/deep-…

一樣僅開放了 Level 1,共 6 節課,包括:

  1. 深度學習和計算機視覺入門:簡單介紹模型圖像處理的原理

本課結束後,你將會對卷積有所瞭解,卷積是計算機視覺(和許多其餘應用)深度學習模型的基本構建塊。接下來你就能夠學習使用世界級的深度學習模型了。

  1. 創建卷積模型

學完本課後,你將會了解卷積是如何發揮做用,在計算機視覺上達到人類難以企及的水平。

  1. 用 TensorFlow 和 Keras 編程

學完本課後,你就可使用 TensorFlow 和 Keras 編程編程計算機視覺領域最好用的模型之一了。

  1. 遷移學習

學完本課後,你將可以在缺少數據的強況下,根據顧客的需求,使用遷移學習創建精準的計算機視覺模型。

  1. 數據加強

學會使用數據加強後,達到的效果會遠高於你只是擁有數據所能得到的效果,而且能夠創建更好的模型。

  1. 進一步瞭解深度學習

在這節課結束時,你將瞭解如何使用隨機梯度降低和反向傳播來設置深度學習模型中的權重。雖然這些話題很複雜,但許多專家認爲這是深度學習中最重要的思想。

以上就是對 Kaggle 最新推出的免費線上課程的介紹,全部課程的代碼編寫和運行均能在 Kaggle 網站上直接進行,無需在本身的電腦上安裝環境和插件。 若是你對這一系列線上課程感興趣,能夠訪問 Kaggle 官網(www.kaggle.com/learn/overv…) 動手嘗試,學完歡迎回來與 AI 前線分享你的學習經驗和體會!

更多幹貨內容,可關注AI前線,ID:ai-front,後臺回覆「AI」、「TF」、「大數據」可得到《AI前線》系列PDF迷你書和技能圖譜。

相關文章
相關標籤/搜索