本文是根據 Stefan Kojouharov 發表在 Medium 上的文章整理而成的一份人工智能、神經網絡、機器學習、深度學習和大數據方面的速查表。爲了便於查找與使用,本文對每一個主題進行了分類,但願能夠對各位的工做有所幫助。編程
01 神經網絡後端
02 神經網絡圖數組
圖 3a:神經網絡相關概念速查表(上)網絡
圖 3b:神經網絡相關概念速查表(下)數據結構
03 機器學習概覽框架
04 機器學習:Scikit-learn 算法機器學習
若是在你的項目中出現了一些未知問題,那麼這份機器學習速查表能夠幫助你快速地找到出問題的那部分。下面這個流程圖能夠幫助你快速的瀏覽文檔並快速導航,這能夠幫助你更深刻的理解問題的緣由,同時爲你提供對應的解決方案。編程語言
圖 5:機器學習速查表函數
05 Scikit-Learn
Scikit-learn(原 scikits.learn) 是基於 Python 的一款免費機器學習庫。它涵蓋了不少 分類、迴歸 以及 聚類 算法,包括 支持向量機、隨機森林、梯度加速、k-means 聚類 以及 DBSGAN 聚類算法。該庫能夠與 Python 的科學計算庫 Numpy 以及 SciPy 互操做。
圖 6:Scikit-Learn 速查表
06 機器學習:算法速查表
這份來自微軟 Azure 的機器學習速查表能夠幫助你在解決方案的預分析過程當中快速選擇合適的機器學習算法。使用這份速查表時,你能夠根據本身的目的和數據特徵快速地選擇對應的算法。
圖 7:機器學習速查表
07 Python 的數據科學相關功能
圖 8:Python 數據科學速查表
圖 9:大數據速查表
08 TensorFlow
2017 年 5 月,Google 發佈了第二代 TPU(張量計算單元),同時在 谷歌計算引擎 上提供了 TPU 集羣。第二代 TPU 提供了高達每秒 180 萬億次的浮點數運算能力,由 64 個 TPU 組成的集羣能夠提供每秒 1.15 億億次的浮點數運算能力。
圖 10:TensoFlow 速查表
09 Keras
2017 年,Google 的 TensorFlow 團隊決定在 TensorFlow 的核心庫中添加 Keras 支持。
Ghollet 解釋說,Keras 是按接口來設計的,而不是一個端到端的機器學習框架。它表明着更高級、更直觀的使用方式,這使得配置神經網絡變得更爲簡單,用戶不須要再去了解複雜的後端科學計算庫。
圖 11:Keras 速查表
10 Numpy
Numpy 旨在做爲 Python 的 CPython 參考實現,它是一個非優化的字節碼解釋器。針對這個 Python 版本編寫的一些數學算法一般比相同代碼的編譯版本慢一些。
Numpy 經過提供多維數組和函數,以及在數組上的高效運算符來解決運算緩慢的問題,這須要須要重寫一些代碼,主要是使用 NumPy 的一些內循環。
圖 12:Numpy 速查表
11 Pandas
"Pandas" 這個名稱來源於術語 "面板數據", 這是多維結構化數據集的一個計量經濟學術語。
圖 13:Pandas 速查表
12 數據清洗
「數據清洗」正逐漸滲入流行文化。在 2017 年的電影《金剛:骷髏島》中,由 Marc Evan Jackson 扮演的角色 Steve Woodward 就是一位數據清洗師。
圖 14:數據清洗速查表
圖 15:Pandas 數據清洗速查表
13 使用 dplyr 和 tidyr 進行數據清洗
圖 16a:基於 dplyr 和 tidyr 的數據清洗速查表
圖 16b:基於 dplyr 和 tidyr 的數據清洗速查表
14 Scipy
Scipy 是基於 Numpy 數組對象的一個科學計算庫,它是 NumPy 全家桶(包括 Matplotlib、Pandas、SymPy 等工具包)的一部分,也是科學計算庫的一個擴展集。
這個 Numpy 全家桶與其餘應用程序(如 MATLAB、GNU Octave 和 Scilab)有不少共同的用戶。NumPy 全家桶有時也被稱爲 SciPy 全家桶。
圖 17:Scipy 速查表
15 Matplotlib
Matplotlib 是一個面向 Python 編程語言及其數學計算庫 NumPy 的繪圖工具庫。Matplotlib 提供了面向對象的 API,它使用通用的 GUI 工具包(例如 Tkinter、wxPython、Qt 或者 GTK+)。
雖然也有基於狀態機的程序接口「pylab「(像 OpenGL),其設計與 MATLAB 很是類似,可是你們卻不提倡使用它。SciPy 使用了 matplotlib。
pyplot 是 matplotlib 中的一個模塊,提供相似 MATLAB 的接口。按照設計,Matplotlib 能夠跟 MATLAB 同樣使用,你能夠在 Python 中使用它,而且是免費的。
圖 18:Matplotlib 速查表
16 數據可視化
圖 19:數據可視化速查表
圖 20:ggplot 速查表
17 PySpark
圖 21:Pyspark 速查表
18 Big-O(時間複雜度)
圖 22:Big-O 算法速查表
圖 23:Big-O 算法複雜度表
圖 24:不一樣數據結構實現算法的時間複雜度
圖 25:不一樣的數組排序算法時間複雜度
關於做者:Stefan 是 Chatbot's Life 的創始人,這是一家聊天機器人媒體和諮詢公司。到目前爲止,Chatbot's Life 每個月的瀏覽量超過了 150k,成了在線學習 Bots&AI 的優質資源。同時,Chatbot's Life 還爲多家頂級機器人企業提供諮詢工做,例如 Swelly、Instavest、OutBrain 和 NearGrop。
原文:https://becominghuman.ai/cheat-sheets-for-ai-neural-networks-machine-learning-deep-learning-big-data-678c51b4b463