谷歌今日上線基於TensorFlow的機器學習速成課程(免費中文版)

隨着機器學習愈來愈受到公衆的關注,不少初學者但願能快速瞭解機器學習及前沿技術。而今天谷歌上線了基於 TensorFlow 的機器學習速成課程,它包含 40 多項練習、25 節課程以及 15 個小時的緊湊學習內容。谷歌官方描述爲機器學習熱愛者的自學指南,且課程資料都是中文書寫,課程視頻都由機器學習技術轉述爲中文音頻。這對於中文讀者來講將會有很大的幫助,固然咱們也能選擇英文語音以更精確地學習內容。此外,據機器之心瞭解,這曾是谷歌內部培訓工程師的課程,有近萬名谷歌員工參與並將學到的東西用在產品的優化和加強上。編程

課程地址:developers.google.cn/machine-lea…網絡


按照該課程所述,讀者可能須要初級代數知識,如變量與係數、線性方程組和函數曲線等以理解基本的機器學習模型。此外,讀者也須要一些 Python 編程經驗,但通常只須要最基礎的函數定義、列表/字典、循環和條件表達式等。本課程的實現是基於 Python 和 TensorFlow,不過讀者在學習前並不須要任何 TensorFlow 知識。數據結構

除了前面所述的兩個基本要求外,讀者可能還須要準備一些基礎知識,固然等真正遇到再去查資料也徹底沒問題。其實準備工做主要分爲數學基礎、編程基礎和函數庫三個部分,咱們給各位讀者提供機器之心的資源文章合集,以便查閱相關問題。框架

在數學方面,代數相關的變量、係數、線性方程、對數和 Sigmoid 函數有助於讀者瞭解模型最基本的表達,包括怎麼定義的推斷過程、如何構建的損失函數以及激活函數等。線性代數相關的矩陣和張量等知識有助於讀者理解模型在計算過程當中到底表明了什麼意思,例如矩陣乘法這種仿射變換在神經網絡中表明瞭神經元的線性組合或全鏈接。機率論與統計學也是有要求的,不過本課程僅僅須要能知道均值、方差等概念就行。對於微積分,咱們只須要了解導數、偏導數和鏈式法則的基本概念就行,雖然最優化方法須要很是多的數學知識才能明確地推導出流行的優化器表達式,但在基礎階段只須要調用工具就好了。機器學習

在 Python 編程與常見第三方庫等方面,該課程也只有很是少的要求,掌握基本的操做就行。例如 Python 的列表、字典和元組三大數據結構,還有循環和條件等基本表達式。而須要瞭解的第三方庫也是科學計算方面表明,如 NumPy、Pandas 和 Matplotlib 等。如下是 2017 年機器之心發過的教程,它基本上能夠爲讀者提供足夠的學習資料。函數

靈魂追問 | 教程那麼多,你……看完了嗎?工具


目錄學習

簡介:測試

  • 前提條件和準備工做大數據

機器學習概念:

  • 框架處理(15 分鐘)機器學習中的監督學習

  • 深刻了解機器學習(20 分鐘)什麼是損失函數,權重和 bias 是什麼

  • 下降損失(60 分鐘)兩種梯度降低,及對學習率的實驗

  • 使用 TensorFlow 基本步驟(60 分鐘)不能不懂的 TensorFlow

  • 泛化(15 分鐘)什麼是過擬合,怎樣評價一個模型的好壞,把數據集分紅測試和訓練兩部分

  • 訓練及測試集(25 分鐘)驗證把數據集分紅兩部分的好處

  • 驗證(40 分鐘)擔憂過擬合?在測試和訓練集外多弄一個驗證集

  • 表示法(65 分鐘)特徵工程,75% 機器學習工程師的時間都在乾的事

  • 特徵組合(70 分鐘)明白什麼是特徵組合,怎麼用 TensorFlow 實現

  • 正則化:簡單性(40 分鐘)L2 正則化,學習複雜化和廣泛化的取捨

  • 邏輯迴歸(20 分鐘)理解邏輯迴歸,探索損失函數和正則化

  • 分類(90 分鐘)評估一個邏輯迴歸模型的正確性和精度

  • 正則化:稀鬆性(45 分鐘)L2 的其餘種類

  • 介紹神經網絡(40 分鐘)隱藏層,激活函數

  • 訓練神經網絡(40 分鐘)反向傳播

  • 多種類神經網絡(50 分鐘)理解多類分類器問題,Softmax,在 TensorFlow 中實現 Softmax 結果。

  • 嵌入(80 分鐘)什麼是嵌入,這是幹什麼的,怎樣用好。

工程:

  • 生產 ML 系統(3 分鐘)ML 生產中的寬度

  • 靜態 vs. 動態訓練(7 分鐘)靜態和動態訓練的優缺點

  • 靜態 vs. 動態推斷(7 分鐘)靜態和動態推斷的優缺點

  • 數據依賴(14 分鐘)理解 ML 中的數據依賴

生活中實際的 ML 例子:

  • 預測癌症(5 分鐘)

  • 18 世紀文獻(5 分鐘)

  • 真實世界方針(2 分鐘)

結論:

  • 下一步要學習的內容,推薦了 TensorFlow,Google 的課程深度學習,及 Kaggle 比賽等。

練習題:

  • 大部分練習題的數據是用的 California housing data set 。

  • 測試分紅三種,編程練習,檢查你的理解和 Playground。


課程特色

這一機器學習速成課程最大的特色是它有完整的中文資料、中文語音和字幕以及中文測試題,它爲機器學習初學者提供了最實用的的資料。

以下所示,該課程提供的課件很是適合於國內初學者:


以下所示,該課程提供了不少中文練習,包括編程練習和文本理解的選擇題,這很是有助於各位讀者檢驗在視頻和資料中學習到的知識。



以下展現了機器學習術語,這一部分分紅全面的介紹了機器學習中的術語的含義,很是好懂。


最後,該課程還提供了很是多的中文學習資料或技術博客,這些文本資料一樣也是擴展讀者知識並從原理上學習新技術的重要保證。

相關文章
相關標籤/搜索