AI技術大盤點: 神經網絡/機器學習/深度學習/大數據…你想知道的都在這些圖裏了

 

在過去的幾個月裏,我一直在專一於整理概括AI的各種小要點。在被愈來愈多的朋友同事問及時,我決定將這些總結和心得的完整版分享給你們。爲了增長內容的趣味性和可讀性,我也在每一個主題下面加了些註解,但願對大家有用

 

機器學習算法

Scikit-learn 算法編程

這張圖能夠幫助你找到正確的估計器,這應該是機器學習彙總最難的部分。下面的流程圖能夠幫助快速查找文檔,並對每種估計器作了大體的介紹,有助你更快了解問題並找到解決方案。後端

 

Scikit-learn(學名scikits.learn)是一個免費的機器學習Python編程語言庫。包括了各種分類、迴歸與聚類算法,並支持向量機、隨機森林、梯度提高、 K-means和DBSCAN。它還能夠與Python NumPy和SciPy進行交互。數組

 

Microsoft Azure 算法網絡

這個微軟Azure的機器學習表能夠幫助你爲預測分析方案選擇合適的機器學習算法。首先根據數據的性質,匹配最佳算法。框架

 

用於數據科學的Python機器學習

 

TensorFlow編程語言

今年5月,Google宣佈在第二代TPU和Google計算引擎中加入對TPU的支持。第二代TPU擁有高達180 teraflops的性能。當 64個TPU組合在一塊兒時,能夠提供高達11.5千萬億次的浮點運算性能。函數

 

Keras工具

今年,Google也在TensorFlow的核心庫中支持Keras。Chollet認爲比起端到端的機器學習框架,Keras更應做爲一個接口。它提供的是更高級別、更直觀的抽象集,使得不管後端科學計算庫是什麼,均可以輕鬆地配置神經網絡。

 

Numpy

NumPy 是針對Python中的一個非優化的字節碼解釋器——CPython的參考實現。針對這一版本的Python編寫數學算法的運行速度相對較慢的問題,Numpy 使用的是多維數組和函數與運算符來改寫部分代碼,從而提升運行的效率。

 

Pandas

「Pandas」的名字源於「Panel Data」,是多維結構化數據集的計量經濟學術語。

 

數據預處理

數據預處理(data wrangler)一詞已經開始滲透進了流行文化中。今年的電影「金剛·」中,演員Marc Evan Jackson飾演的角色Steve Woodward正是被介紹爲——咱們的數據處理者。

用 Dplyr 與 Tidyr 進行數據預處理

 

SciPy

SciPy 是基於NumPy數組對象構建的,是NumPy堆棧的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及擴展的科學計算庫集。該NumPy 堆棧與其餘應用程序(好比MATLAB,GNU Octave 和 Scilab)用戶差很少。NumPy堆棧有時也被稱爲SciPy堆棧。

 

Matplotlib

Matplotlib是Python編程語言及其數學數學擴展NumPy的繪圖庫,提供了面向對象的API,用於使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包將圖形嵌入到應用程序中。還有一個基於狀態機(如OpenGL)的程序 「pylab」接口,很像MATLAB,但不鼓勵使用。

Pyplot 是matplotlib的一個模塊,提供了一個相似MATLAB的界面。Pyplot 跟MATLAB同樣容易上手,兼容Pyhton仍是免費的~

 

數據可視化

相關文章
相關標籤/搜索