AI技術大盤點: 神經網絡/機器學習/深度學習/大數據…你想知道的都在這些圖裏了

時間 2019-11-30

標籤技術盤點神經網絡機器學習深度數據想知道都在這些简体版

原文原文鏈接

在過去的幾個月裏，我一直在專一於整理概括AI的各種小要點。在被愈來愈多的朋友同事問及時，我決定將這些總結和心得的完整版分享給你們。爲了增長內容的趣味性和可讀性，我也在每一個主題下面加了些註解，但願對大家有用

機器學習算法

Scikit-learn 算法編程

這張圖能夠幫助你找到正確的估計器，這應該是機器學習彙總最難的部分。下面的流程圖能夠幫助快速查找文檔，並對每種估計器作了大體的介紹，有助你更快了解問題並找到解決方案。後端

Scikit-learn(學名scikits.learn)是一個免費的機器學習Python編程語言庫。包括了各種分類、迴歸與聚類算法，並支持向量機、隨機森林、梯度提高、 K-means和DBSCAN。它還能夠與Python NumPy和SciPy進行交互。數組

Microsoft Azure 算法網絡

這個微軟Azure的機器學習表能夠幫助你爲預測分析方案選擇合適的機器學習算法。首先根據數據的性質，匹配最佳算法。框架

用於數據科學的Python機器學習

TensorFlow編程語言

今年5月，Google宣佈在第二代TPU和Google計算引擎中加入對TPU的支持。第二代TPU擁有高達180 teraflops的性能。當 64個TPU組合在一塊兒時，能夠提供高達11.5千萬億次的浮點運算性能。函數

Keras工具

今年，Google也在TensorFlow的核心庫中支持Keras。Chollet認爲比起端到端的機器學習框架，Keras更應做爲一個接口。它提供的是更高級別、更直觀的抽象集，使得不管後端科學計算庫是什麼，均可以輕鬆地配置神經網絡。

Numpy

NumPy 是針對Python中的一個非優化的字節碼解釋器——CPython的參考實現。針對這一版本的Python編寫數學算法的運行速度相對較慢的問題，Numpy 使用的是多維數組和函數與運算符來改寫部分代碼，從而提升運行的效率。

Pandas

「Pandas」的名字源於「Panel Data」，是多維結構化數據集的計量經濟學術語。

數據預處理

數據預處理（data wrangler）一詞已經開始滲透進了流行文化中。今年的電影「金剛·」中，演員Marc Evan Jackson飾演的角色Steve Woodward正是被介紹爲——咱們的數據處理者。

用 Dplyr 與 Tidyr 進行數據預處理

SciPy

SciPy 是基於NumPy數組對象構建的，是NumPy堆棧的一部分，包括 Matplotlib，pandas和SymPy 等工具，以及擴展的科學計算庫集。該NumPy 堆棧與其餘應用程序（好比MATLAB，GNU Octave 和 Scilab）用戶差很少。NumPy堆棧有時也被稱爲SciPy堆棧。

Matplotlib

Matplotlib是Python編程語言及其數學數學擴展NumPy的繪圖庫，提供了面向對象的API，用於使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包將圖形嵌入到應用程序中。還有一個基於狀態機（如OpenGL）的程序「pylab」接口，很像MATLAB，但不鼓勵使用。

Pyplot 是matplotlib的一個模塊，提供了一個相似MATLAB的界面。Pyplot 跟MATLAB同樣容易上手，兼容Pyhton仍是免費的~

數據可視化