Python裏的黃金庫,學會了你的工資至少翻一倍

做者:[已重置]
連接:https://zhuanlan.zhihu.com/p/26054228
來源:知乎
著做權歸做者全部。商業轉載請聯繫做者得到受權,非商業轉載請註明出處。

web

閱讀本文大概須要5分鐘正則表達式

Python之因此這麼流行,這麼好用,就是由於Python提供了大量的第三方的庫,開箱即用,很是方便,並且還免費哦,那麼Python中到底有哪些黃金般的庫呢,今天咱們就來給你們講一講,學會了這些庫不只對提升你的功力大有裨益,並且還能漲工資無論你信不信,反正我是信了~~哈哈算法

一: 數據分析

學Python的同窗裏估計有30%以上是爲了作數據分析師或者數據挖掘,因此數據分析相關的庫,你必定要知道(也許有同窗會問數據分析的工具不少有R,MATLAB,SAS,Stata,爲啥要用Python,這個問題回答估計要說一壺,我年後講數據分析的時候,會詳細講解)shell

1.NumPy

NumPy是Python科學計算的基礎包,它提供:數據庫

1).快速高效的多維數組對象ndarray;編程

2).直接對數組執行數學運算及對數組執行元素級計算的函數;數組

3).用於讀寫硬盤上基於數組的數據集的工具緩存

4).線性代數運算、傅里葉變換,以及隨機數生成服務器

2.Pandas

  • 大名鼎鼎的Pandas能夠說只要作數據分析的,無人不知無人不曉,由於它過重要了.Pandas庫提供了咱們不少函數,可以快速的方便的,處理結構化的大型數據,不誇張的說,Pandas是讓Python成爲強大的數據分析工具的很是重要的一個因素.框架

  • 並且對於金融行業,好比基金股票的分析師來講,pandas提供了高性能的時間序列功能和一系列的工具,能夠自由的靈活的處理數據,一次使用你就會愛上它.

3.Matplotlib

matplotlib是最流行的用於繪製數據圖表的Python庫,它和下面咱們要講的 IPython結合的很爽,絕對是好基友,提供了一種很是好用的交互式的數據繪圖環境.

4.IPython

  • IPython是Python科學計算標準工具集的組成部分,它能夠把不少東西聯繫到一塊兒,有點相似一個加強版的Python shell.

  • 目的是爲了提升編程,測試和調試Python代碼的速度,好像不少國外的大學教授,還有Google大牛都很喜歡用IPython,確實很方便,至少我在分析數據的時候,也是用這個工具的,並且不用print,回車就能打印

二: 機器學習

如今人工智能很是火爆,機器學習應該算是人工智能裏面的一個子領域,而其中有一塊是對文本進行分析,對數據進行深刻的挖掘提取一些特徵值,而後用一些算法去學習,訓練,分析,甚至還能預測.

打個比方吧,你們都知道瑞雪兆豐年,其實下雪和豐收沒有什麼聯繫,可是經過大量的數據分析,發現只要有瑞雪,來年豐收的機率就很是大,因而就用了瑞雪兆豐年的諺語.扯遠了,咱們回來繼續說:

5.NLTK

天然語言處理裏面赫赫有名的就是NLTK全稱叫天然語言工具包(Natural Language Tookit),裏面包含了大量的函數模塊,能夠獲取語料庫,字符串的處理,詞性的解析,分類,語義解釋,機率分析還有評估.

6.scikit-learn

  • Python社區裏面機器學習模塊sklearn,內置了不少算法,幾乎實現了全部基本機器學習的算法。

  • 它主要包括6個方面:分類,迴歸,聚類,數據降維,模型選擇,數據預處理.補充說一句裏面的大量的算法都和數據有關,若數學基礎很差的,可能會有一些吃力.

三: 爬蟲與Web

這一塊基本都和網頁打交道,不管是你本身搭建一個網站仍是爬別人的網站,下面幾個庫是必需要知道的

7.爬蟲庫

beautifulsoup4,urllib2,lxml,requests

上面幾個庫能夠說是學習Python爬蟲必備的庫,必需要掌握,固然有的同窗說我爬網頁不是也能夠用正則表達式嗎,確實能夠可是會很不方便,由於bs4和lxml都有便捷的接口,通常咱們都是和正則結合使用,若是對速度有要求的話,建議用lmxp,它比bs4 速度要快不少


8.Scrapy

  • 爬蟲的世界裏面有沒有懶人專用的框架~~固然有啦,scrapy就是其中比較有名的,能夠快速,高層次的web抓取網頁,並從web站點的頁面中提取結構化的數據

  • Scrapy用途普遍,能夠用於數據挖掘、監測和自動化測試.最爽的就是它是一個框架,任何人均可以根據需求方便的修改,裏面有不少類型爬蟲的基類,如BaseSpider、sitemap爬蟲等

9.web框架

  • Django算是Python web框架裏重量級的選手,主要是由於它提供了一站式的解決方案,包括緩存,ORM,後臺管理,驗證,表單等等,是的開發複雜的數據庫驅動的網站變的很簡單,並且有很是齊備的官方文檔

  • Flask設計的理念跟Django徹底相反,它是輕量級Web應用框架的表明.它只保留核心的功能,其餘的功能都是能夠變更,能夠擴展的,你能夠更加直接的需求靈活搭配

  • Tornado全稱叫Tornado Web Server,目前是Facebook開源的一個版本,它和其餘主流的框架有一個很是明顯的區別:就是非阻塞式服務器,速度很是快.特別對於長輪詢,WebSocket等實時要求高的web服務來講是一個福音,基本能夠和Node.js一決高下.

好了Python的黃金庫就講到這裏啦,我以爲雖然庫的學習當然很重要,可是最重要的是你須要知道本身爲何要學這些庫,你到底要解決哪一個領域的事情,由問題驅動去學習是比較好的方法(我的建議僅供參考)

相關文章
相關標籤/搜索