線性代數與數據學習:MIT教授Gilbert Strang幫你打下堅實的數學基礎

機器之心編輯,做者:思源、劉曉坤。算法

MIT 教授 Gilbert Strang 最新書籍《線性代數與數據學習》(Linear Algebra and Learning from Data)將在 1 月中旬發行。這一本書爲機器學習提供了不少數學基礎,它同時也提供了深度學習一些基本概念。能夠說藉助這本書,咱們能從數學的角度來理解流行的模型。網絡

書籍主頁:math.mit.edu/~gs/learnin…架構

這本書的目的是解釋數據科學和機器學習所依賴的數學:線性代數最優化、機率論和統計學。由於在機器學習中,學習函數中的權重會以矩陣形式表示,這些權重經過隨機梯度降低優化,而「隨機」一詞提示訓練收斂是機率性的。此外,機率論中的大數定律被擴展到了大函數定律:若是架構設計良好而且參數計算良好,則有很高的機率能成功收斂。機器學習

請注意這不是一本關於計算或編碼或軟件的書。已經有不少書籍對這些方面作了很好的介紹,好比《Hands-On Machine Learning》;還有不少 TensorFlow、Keras、MathWorks 和 Caffe 等的在線資源,也能提供不少幫助。函數

線性代數有衆多美妙的矩陣變體:對稱矩陣、正交矩陣、三角矩陣、Banded 矩陣、轉置矩陣和正定矩陣等等。在 Gilbert 的教學經驗中,他認爲正定對稱矩陣 S 是很是美妙的東西。它們有正的特徵值λ和正交的特徵向量 q,它們的線性組合能夠將秩爲 1 的簡單映射 qq^T 與對應特徵值重構爲正定矩陣 S,即:學習

若是 λ_1>=λ_2>=...,那麼上式特徵值λ_1 以及對應的特徵向量組成的第一個份量就是 S 最具信息的部分。對於一個簡單的協方差矩陣,這一部分就對應着對大的方差,這也是降維算法 PCA 最核心的思想。優化

此外,在書籍主頁中,做者還提供了試讀的樣章,包括深度學習、書籍前言、目錄、矩陣初等變換、矩陣乘法和其它一些從矩陣看卷積網絡等新知識。做者代表書籍主頁會持續更新,包括印刷計劃和全本開放閱讀等。編碼

William Gilbert Strang架構設計

William Gilbert Strang,美國數學家,在有限元理論、變分法、小波分析和線性代數等方面皆有研究貢獻。他對數學教育作出了許多貢獻,包括出版七本數學教科書和專著。斯特朗現任麻省理工學院數學系 MathWorks 講座教授。主要講授課程爲線性代數入門(Introduction to Linear Algebra,18.06)和計算科學與工程(Computational Science and Engineering,18.085),這些課程均可在麻省理工學院開放式課程中免費學習。設計

如下是這本書的目錄:

相關文章
相關標籤/搜索