機器學習算法
Scikit-learn 算法編程
這張圖能夠幫助你找到正確的估計器,這應該是機器學習彙總最難的部分。下面的流程圖能夠幫助快速查找文檔,並對每種估計器作了大體的介紹,有助你更快了解問題並找到解決方案。後端
Scikit-learn(學名scikits.learn)是一個免費的機器學習Python編程語言庫。包括了各種分類、迴歸與聚類算法,並支持向量機、隨機森林、梯度提高、 K-means和DBSCAN。它還能夠與Python NumPy和SciPy進行交互。數組
Microsoft Azure 算法網絡
這個微軟Azure的機器學習表能夠幫助你爲預測分析方案選擇合適的機器學習算法。首先根據數據的性質,匹配最佳算法。框架
用於數據科學的Python機器學習
TensorFlow編程語言
今年5月,Google宣佈在第二代TPU和Google計算引擎中加入對TPU的支持。第二代TPU擁有高達180 teraflops的性能。當 64個TPU組合在一塊兒時,能夠提供高達11.5千萬億次的浮點運算性能。函數
Keras工具
今年,Google也在TensorFlow的核心庫中支持Keras。Chollet認爲比起端到端的機器學習框架,Keras更應做爲一個接口。它提供的是更高級別、更直觀的抽象集,使得不管後端科學計算庫是什麼,均可以輕鬆地配置神經網絡。
Numpy
NumPy 是針對Python中的一個非優化的字節碼解釋器——CPython的參考實現。針對這一版本的Python編寫數學算法的運行速度相對較慢的問題,Numpy 使用的是多維數組和函數與運算符來改寫部分代碼,從而提升運行的效率。
Pandas
「Pandas」的名字源於「Panel Data」,是多維結構化數據集的計量經濟學術語。
數據預處理
數據預處理(data wrangler)一詞已經開始滲透進了流行文化中。今年的電影「金剛·」中,演員Marc Evan Jackson飾演的角色Steve Woodward正是被介紹爲——咱們的數據處理者。
用 Dplyr 與 Tidyr 進行數據預處理
SciPy
SciPy 是基於NumPy數組對象構建的,是NumPy堆棧的一部分,包括 Matplotlib,pandas和SymPy 等工具,以及擴展的科學計算庫集。該NumPy 堆棧與其餘應用程序(好比MATLAB,GNU Octave 和 Scilab)用戶差很少。NumPy堆棧有時也被稱爲SciPy堆棧。
Matplotlib
Matplotlib是Python編程語言及其數學數學擴展NumPy的繪圖庫,提供了面向對象的API,用於使用 Tkinter、wxPython、Qt或GTK +等通用GUI工具包將圖形嵌入到應用程序中。還有一個基於狀態機(如OpenGL)的程序 「pylab」接口,很像MATLAB,但不鼓勵使用。
Pyplot 是matplotlib的一個模塊,提供了一個相似MATLAB的界面。Pyplot 跟MATLAB同樣容易上手,兼容Pyhton仍是免費的~
數據可視化