線性代數與數據學習：MIT教授Gilbert Strang幫你打下堅實的數學基礎

時間 2019-11-30

標籤線性代數數據學習 mit 教授 gilbert strang 幫你打下堅實數學基礎欄目應用數學简体版

原文原文鏈接

機器之心編輯，做者：思源、劉曉坤。算法

MIT 教授 Gilbert Strang 最新書籍《線性代數與數據學習》（Linear Algebra and Learning from Data）將在 1 月中旬發行。這一本書爲機器學習提供了不少數學基礎，它同時也提供了深度學習一些基本概念。能夠說藉助這本書，咱們能從數學的角度來理解流行的模型。網絡

書籍主頁：math.mit.edu/~gs/learnin…架構

這本書的目的是解釋數據科學和機器學習所依賴的數學：線性代數、最優化、機率論和統計學。由於在機器學習中，學習函數中的權重會以矩陣形式表示，這些權重經過隨機梯度降低優化，而「隨機」一詞提示訓練收斂是機率性的。此外，機率論中的大數定律被擴展到了大函數定律：若是架構設計良好而且參數計算良好，則有很高的機率能成功收斂。機器學習

請注意這不是一本關於計算或編碼或軟件的書。已經有不少書籍對這些方面作了很好的介紹，好比《Hands-On Machine Learning》；還有不少 TensorFlow、Keras、MathWorks 和 Caffe 等的在線資源，也能提供不少幫助。函數

線性代數有衆多美妙的矩陣變體：對稱矩陣、正交矩陣、三角矩陣、Banded 矩陣、轉置矩陣和正定矩陣等等。在 Gilbert 的教學經驗中，他認爲正定對稱矩陣 S 是很是美妙的東西。它們有正的特徵值λ和正交的特徵向量 q，它們的線性組合能夠將秩爲 1 的簡單映射 qq^T 與對應特徵值重構爲正定矩陣 S，即：學習

若是 λ_1>=λ_2>=...，那麼上式特徵值λ_1 以及對應的特徵向量組成的第一個份量就是 S 最具信息的部分。對於一個簡單的協方差矩陣，這一部分就對應着對大的方差，這也是降維算法 PCA 最核心的思想。優化

此外，在書籍主頁中，做者還提供了試讀的樣章，包括深度學習、書籍前言、目錄、矩陣初等變換、矩陣乘法和其它一些從矩陣看卷積網絡等新知識。做者代表書籍主頁會持續更新，包括印刷計劃和全本開放閱讀等。編碼

William Gilbert Strang架構設計

William Gilbert Strang，美國數學家，在有限元理論、變分法、小波分析和線性代數等方面皆有研究貢獻。他對數學教育作出了許多貢獻，包括出版七本數學教科書和專著。斯特朗現任麻省理工學院數學系 MathWorks 講座教授。主要講授課程爲線性代數入門（Introduction to Linear Algebra，18.06）和計算科學與工程（Computational Science and Engineering，18.085），這些課程均可在麻省理工學院開放式課程中免費學習。設計

如下是這本書的目錄：