李沐等人開源中文書《動手學深度學習》預覽版上線

機器之心報道,參與:李澤南、張倩。html

得到這本實體書最好的方法就是成爲貢獻者。前端

近日,由 Aston Zhang、李沐等人所著圖書《動手學深度學習》放出了在線預覽版,以供讀者自由閱讀。這是一本面向在校學生、工程師和研究人員的交互式深度學習書籍。git

這本書是亞馬遜 MXNet 零基礎深度學習課程的重要組成部分。課程內容推薦使用 Apache MXNet 的前端工具 Gluon 進行開發,可指導你在動手實踐的過程當中學會使用簡單易讀的代碼,寫出產品級的應用。編程

值得一提的是,該書以 Jupyter 記事本的形式呈現,讀者能夠操做其中的代碼和超參數來獲取及時反饋,以此提升學習效率。網絡

貢獻者

本書的貢獻者包括多位供職於亞馬遜的科學家:異步

李沐:亞馬遜首席科學家,美國卡內基梅隆大學計算機系博士。工具

阿斯頓·張:亞馬遜應用科學家,美國伊利諾伊大學香檳分校計算機科學博士。性能

扎卡里 C. 立頓:亞馬遜應用科學家,美國卡內基梅隆大學助理教授,加州大學聖迭戈分校計算機科學博士。

亞歷山大 J. 斯莫拉:亞馬遜 ML 總監,德國柏林工業大學計算機科學博士。

此外,本書在開源社區還有 100 餘位貢獻者。做者表示,這一在線書「項目」仍然在不斷髮展當中,成爲貢獻者將能夠得到專享版贈書,並被致謝。

交互:Jupyter 記事本+活躍的社區支持

每一小節都是能夠運行的 Jupyter 記事本,你能夠自由修改代碼和超參數來獲取及時反饋,從而積累深度學習的實戰經驗。

https://v.qq.com/x/page/b13531to52r.html

本書還有活躍的社區支持,能夠經過每一個章節最後的連接來同社區的數千名小夥伴一塊兒討論學習。

https://v.qq.com/x/page/s13530z3c2m.html

結構:公式 + 圖示 + 代碼

本書不只結合文字、公式和圖示來闡明深度學習裏經常使用的模型和算法,還提供代碼來演示如何從零開始實現它們,並使用真實數據來提供一個交互式的學習體驗。

這三種展現方法能相互補充,不少算法能夠經過圖示加深對結構的理解,而如上圖所示的 LSTM 等算法卻須要公式才能理解具體結構。此外,不管是表達式仍是圖例,它們都不能包含完整的細節,不少具體細節不用代碼是展現不出來的。

目錄

引言

  • 前言

  • 深度學習簡介

  • 如何使用本書

預備知識

  • 獲取和運行本書代碼

  • 數據操做

  • 自動求梯度

  • 查閱 MXNet 文檔

深度學習基礎

  • 線性迴歸

  • 線性迴歸的從零開始實現

  • 線性迴歸的 Gluon 實現

  • Softmax 迴歸

  • 圖像分類數據集(Fashion-MNIST)

  • Softmax 迴歸的從零開始實現

  • Softmax 迴歸的 Gluon 實現

  • 多層感知機

  • 多層感知機的從零開始實現

  • 多層感知機的 Gluon 實現

  • 模型選擇、欠擬合和過擬合

  • 權重衰減

  • 丟棄法

  • 正向傳播、反向傳播和計算圖

  • 數值穩定性和模型初始化

  • 實戰 Kaggle 比賽:房價預測

深度學習計算

  • 模型構造

  • 模型參數的訪問、初始化和共享

  • 模型參數的延後初始化

  • 自定義層

  • 讀取和存儲

  • GPU 計算

卷積神經網絡

  • 二維卷積層

  • 填充和步幅

  • 多輸入通道和多輸出通道

  • 池化層

  • 卷積神經網絡(LeNet)

  • 深度卷積神經網絡(AlexNet)

  • 使用重複元素的網絡(VGG)

  • 網絡中的網絡(NiN)

  • 含並行連結的網絡(GoogLeNet)

  • 批量歸一化

  • 殘差網絡(ResNet)

  • 稠密鏈接網絡(DenseNet)

循環神經網絡

  • 語言模型

  • 循環神經網絡

  • 語言模型數據集(周杰倫專輯歌詞)

  • 循環神經網絡的從零開始實現

  • 循環神經網絡的 Gluon 實現

  • 經過時間反向傳播

  • 門控循環單元(GRU)

  • 長短時間記憶(LSTM)

  • 深度循環神經網絡

  • 雙向循環神經網絡

優化算法

  • 優化與深度學習

  • 梯度降低和隨機梯度降低

  • 小批量隨機梯度降低

  • 動量法

  • Adagrad

  • RMSProp

  • Adadelta

  • Adam

計算性能

  • 命令式和符號式混合編程

  • 異步計算

  • 自動並行計算

  • 多 GPU 計算

  • 多 GPU 計算的 Gluon 實現

計算機視覺

  • 圖像增廣

  • 微調

  • 目標檢測和邊界框

  • 錨框

  • 多尺度目標檢測

  • 目標檢測數據集(皮卡丘)

  • 單發多框檢測(SSD)

  • 區域卷積神經網絡(R-CNN)系列

  • 語義分割和數據集

  • 全卷積網絡(FCN)

  • 樣式遷移

  • 實戰 Kaggle 比賽:圖像分類(CIFAR-10)

  • 實戰 Kaggle 比賽:狗的品種識別 (ImageNet Dogs)

天然語言處理

  • 詞嵌入(word2vec)

  • 近似訓練

  • Word2vec 的實現

  • 子詞嵌入(fastText)

  • 全局向量的詞嵌入(GloVe)

  • 求近義詞和類比詞

  • 文本情感分類:使用循環神經網絡

  • 文本情感分類:使用卷積神經網絡(textCNN)

  • 編碼器—解碼器(seq2seq)

  • 束搜索

  • 注意力機制

  • 機器翻譯

附錄

  • 主要符號一覽

  • 數學基礎

  • 使用 Jupyter 筆記本

  • 使用 AWS 運行代碼

  • GPU 購買指南

  • 如何爲本書貢獻

  • gluonbook 包索引

在本書上線以前,李沐等人還推出了《動手學深度學習》系列視頻,這門課程的第一季已經於今年 2 月份結束,共 19 課。李沐博士對此係列視頻進行了整理,有需求的同窗可經過如下視頻學習。

相關文章
相關標籤/搜索