python庫安裝方法和經常使用庫

庫安裝方法

windows下html

方法一:setpu.pypython

1.下載庫壓縮包,解壓,記錄下路徑:*:/**/……/mysql

2.運行cmd,切換到*:/**/……/目錄下linux

3.運行setup.py buildgit

4.而後輸入python,進入python模塊,驗證是否安裝成功github

方法二:正則表達式

1.Win + R 打開運行窗口,輸入cmd回車算法

2.找到pip安裝路徑——x:\Python xx\Scriptssql

3. 在命令行中切換至該目錄cd x:\Python xx\Scripts數據庫

4.輸入 pip install ***(庫名稱)

linux下

(後續補充)

 

經常使用庫大全:

1.os——經過python實現操做系統中的功能:新建文件夾、指定路徑等

2.爬取網頁

2.1 urllib——爬取網頁

  urllib.request

2.2 bs4——對網頁按照標籤提取信息(需下載)

2.3 re——(Regular Expression 正則表達式)

2.4 Requests 庫——擅長處理那些複雜的HTTP 請求、cookie、header(響應頭和請求頭)等內容的Python 第三方庫(https://github.com/kennethreitz/requests/tarball/master) 

2.5 smtplib——收發郵件

2.6 Selenium 庫是一個在WebDriver 上調用的API。WebDriver 有點兒像能夠加載網站的瀏覽器,可是它也能夠像BeautifulSoup 對象同樣用來查找頁面元素,與頁面上的元素進行交互

(發送文本、點擊等),以及執行其餘動做來運行網絡爬蟲。

2.7 collections ——數據結構

2.8 import random

 

PhantomJS 是一個「無頭」(headless)瀏覽器。它會把網站加載到內存並執行頁面上的JavaScript,可是它不會向用戶展現網頁的圖形界面。把Selenium 和PhantomJS 結合在一

起,就能夠運行一個很是強大的網絡爬蟲了,能夠處理cookie、JavaScrip、header,以及任何你須要作的事情。

 

3.數據存儲

3.1 pymysql——python存儲數據至mysql數據庫

3.2 xlrd,xlwt——將數據寫入excel的操做

 

4.文件讀取

4.1 PDFMiner3K——取PDF 文件   https://pypi.python.org/pypi/pdfminer3k

4.2 ython-docx 庫——持建立新文檔和讀取一些基本的文件數據,如文件大小和文件標題,不支持正文讀取。

 

5.算法

5.1 NLTK——天然語言處理     www.nltk.org  統計分析、詞義分析——書籍:Natural Language Processing with Python

5.2 Pillow 和Tesseract——圖像識別與文字處理

  (http://pillow.readthedocs.org/)

  Tesseract 是目前公認最優秀、最精確的開源OCR 系統。Tesseract 是一個Python 的命令行工具,不是經過import語句導入的庫。安裝以後,要用tesseract 命令在Python 的外面運行。在Windows 系統上,下載方便的可執行安裝文件(https://code.google.com/p/tesseract-ocr/downloads/list)安裝便可。Tesseract 最大的缺點是對漸變背景色的處理。

  建立圖片定位文件:每一個字符是什麼,以及每一個字符的具體位置——在線工具Tesseract OCR Chopper(http://pp19dd.com/tesseract-ocr-chopper/),由於它不須要安裝,也沒有其餘依賴,只要有瀏覽器就能夠運行,並且用法很簡單:上傳圖片,若是要增長新矩形就單擊「add」按鈕,還能夠根據須要調整矩形的尺寸,最後把新生成的矩形定位文件複製到一個新文件裏就能夠了。

  若是你對Tesseract 的其餘訓練方法感興趣,甚至打算創建本身的驗證碼訓練文件庫,或者想和全世界的Tesseract 愛好者分享本身對一種新字體的識別成果,那麼我推薦你仔細閱讀Tesseract的文檔(https://github.com/tesseract-ocr/tesseract/wiki)。

5.3 NumPy——由於NumPy 能夠用數學方法把圖片表示成巨大的像素數組,因此它能夠流暢地配合Tesseract 完成任務。

 

 

6.JavaScript庫

6.1 jQuery 

6.2 Google Analytics

 

7.GUI庫

7.1 tkinter——python3

 

初學python,讀取excel,搜索搜到的文章

 

大部分摘自這裏

https://www.cnblogs.com/yrm1160029237/p/6295988.html

相關文章
相關標籤/搜索