學習筆記:python3,PIP安裝第三方庫(2017)

https://pip.pypa.io/en/latest/quickstart/    pip的使用文檔html

 

http://www.lfd.uci.edu/~gohlke/pythonlibs/      .whl文件 到這個網站下載   (一般狀況下是用pip install安裝,有些庫安裝遇到困難後,就要到這個站點,下載.whl 文件再安裝)html5

https://pypi.python.org/pypi   PyPI - Python包索引 。是Python編程語言的軟件倉庫。java

 

https://pypi.douban.com/simple/  豆瓣的庫  (安裝命令:pip install -i https://pypi.douban.com/simple/  scrapy )node

https://docs.python.org/3/py-modindex.html  Python Module Index  2017-10-4python

https://wiki.python.org/moin/UsefulModulesmysql

https://www.zhihu.com/question/24590883  哪些 Python 庫讓你相見恨晚?(能夠看看)  2017-10-4ios

https://www.zhihu.com/question/28530832  怎麼用最短期高效而踏實地學習 Python?(有一些可笑的蛇狀圖)c++

https://segmentfault.com/a/1190000011568813  《流暢的python》閱讀筆記  2017-10-21git

https://baike.baidu.com/item/RESTful/4406165  Restful,一種軟件架構風格github

 


 

 

第三方庫的文檔:

https://www.w3cschool.cn/tensorflow_python/  TensorFlow官方文檔

http://www.tensorfly.cn/tfdoc/get_started/introduction.html  TensorFlow中文社區

https://github.com/jobbole/awesome-python-cn  Python 資源大全中文版

https://zhuanlan.zhihu.com/p/30435576  2017 年最流行的 15 個數據科學 Python 庫

 


正文:

當前環境:win7,python3.6.0,pyCharm4.5。  python目錄是:c:/python3/

安裝完的庫,都被保存在這裏:  C:\Python3\Lib\site-packages

pip 之於 python,  猶如 npm 之於 node.js,  亦猶如 package control 之於 Sublime Text 

 

pip經常使用命令:  某個庫(例如是bs4),查看、安裝、更新、卸載:  2017-10-18

python -m pip install --upgrade pip             # 升級pip(python3.4以後的版本都自帶了PIP,可是須要升級以後才能使用)
python -m pip install --upgrade setuptools      # 升級 setuptools

pip install --force-reinstall --upgrade pip     # 從新安裝pip
pip list                        # 查看已安裝的庫
pip list --format=columns                       # 按列顯示

pip show   bs4               # 查看bs4
pip install   bs4            # 安裝bs4
pip install -U   bs4         # 更新bs4
pip uninstall    bs4         # 卸載bs4

 

若是系統路徑沒裝對的話,用下面命令:

cd C:\Python3\scripts\
C:\Python3\scripts\>  python pip.exe list             # 查看已安裝的庫

C:\Python3\scripts\>  python pip.exe show   bs4          # 查看bs4
C:\Python3\scripts\>  python pip.exe install   bs4       # 安裝bs4
C:\Python3\scripts\>  python pip.exe install -U   bs4    # 更新bs4
C:\Python3\scripts\>  python pip.exe uninstall   bs4     # 卸載bs4

 

 

PIP安裝其它的庫 (win7機子)

pip install requests                  # 能夠直接安裝
pip install requests‑2.18.4‑py2.py3‑none‑any.whl  # http://www.lfd.uci.edu/~gohlke/pythonlibs/ 也能夠到這裏去找.whl文件,下載後安裝

第一種方法,直接安裝:

cd C:\Python3\scripts\
pip install arrow ———— 時間 arrow 0.10.0
pip install bs4 ———— BeautifulSoup4(4.6.0)  HTML 解析器
pip install beautifulsoup4
pip install html5lib ———— html5解析器,BeautifulSoup要用到
pip install lxml ———— lxml4.1.0 解析器,BeautifulSoup要用到
pip install cookies ———— cookies2.2.1
pip install Django ———— Django1.11.6 網站
pip install flask ———— flask0.12.2 網站
pip install jieba ———— jieba0.39 中文分詞,詞頻統計
pip install matplotlib ———— matplotlib2.1.0 2D繪圖庫
pip install numpy ———— numpy1.13.3 開源的數值計算擴展。這種工具可用來存儲和處理大型矩陣
pip install pdfkit ———— pdfkit0.6.1 操做pdf
pip install pillow ———— pillow4.3.0 因爲PIL僅支持到Python 2.7,加上年久失修,因而一羣志願者在PIL的基礎上建立了兼容的版本,名字叫Pillow,支持最新Python 3.x,又加入了許多新特性,所以,咱們能夠直接安裝使用Pillow
pip install pymysql ———— pymysql0.7.10,數據庫鏈接庫,鏈接mysql的
pip install pymongo ———— pymongo3.5.1,數據庫鏈接庫,鏈接mongo的
pip install pytesseract ———— pytesseract0.1.7 ,Tesseract-OCR(識別圖像中的文字,還得另外安裝其它的。詳見博客中的文章)
pip install pyquery ———— pyquery1.3.0
pip install requests ———— requests2.18.4 優雅,簡單,人性化的 HTTP 庫
pip install urllib3 ———— urllib3 1.22
pip install wheel ———— wheel0.30.0
pip install wordcloud ———— wordcloud 1.3.1 詞雲圖
pip install xlrd ———— xlrd (1.1.0) 讀excel
pip install xlwt ———— xlwt (1.3.0) 寫excel
pip install setuptools ———— setuptools36.6.0
pip install pymouse ———— 模擬鼠標操做
pip install PyAotuGUI ———— PyAotuGUI0.9.36,模擬鼠標鍵盤操做
pip install selenium ———— selenium3.3.1 ,selenium + python自動化測試環境搭建
pip install scrapy ———— 這個安裝比較麻煩,有不少依賴的庫(主要是各類依賴裝完了就好,Twisted、vc++等)。最好弄個docker已經裝好的鏡像來作。
pip install cx_Oracle ———— cx_Oracle6.0.2 oracle數據庫

 

第二種方法,使用.whl安裝:

windows下那些不能直接安裝的庫,通常都是由於缺乏依賴之類的。解決方法有幾種:

  • 用.whl安裝
  • 升級python3到最新版本
  • 另行安裝依賴

http://www.lfd.uci.edu/~gohlke/pythonlibs/   到這個網站下載.whl文件

不要管它是 win32.whl ,仍是  win_amd64.whl,一個不行就試另外一個。(若是這樣仍是裝不上,又搞不清楚缺了什麼依賴的。咱就別費勁了,docker上找個鏡像,在遠程試試就得了。)

pip  install  wordcloud‑1.3.2‑cp36‑cp36m‑win32.whl   ————  詞雲 1.3.2

 

第三種方法,用文本文件的安裝:

pip install –r aaa.txt  # 從文本中安裝,文本中爲包名,一行一個 
pip freeze > aaa.txt  # 導出當前已經安裝包 

 

 


還沒試用的庫:

urllib3  一個具備線程安全鏈接池,支持文件 post,清晰友好的 HTTP 庫。(Python HTTP庫,安全鏈接池、支持文件post、可用性高)

  https://github.com/shazow/urllib3 官網

  http://www.cnblogs.com/KGoing/p/6146999.html  下次看看

pyquery – 一個解析 HTML 的庫,相似 jQuery。https://github.com/gawel/pyquery

matplotlib  Matplotlib 可以建立多數類型的圖表,如條形圖,散點圖,條形圖,餅圖,堆疊圖,3D 圖和地圖圖表。  http://matplotlib.sourceforge.net/

      http://www.jianshu.com/p/aa4150cf6c7f  matplotlib教程

Tenacity  Exception Retry 今後無比簡單  https://kingname.info/2017/06/18/easy-retry/

TensorFlow  TensorFlow 是一個使用數據流圖(data flow graphs)的數值計算庫  https://www.tensorflow.org/

 

py2exe  (把代碼直接編譯成executable,全部人能運行)

simplejson(更快)

 

 


爬蟲:

除了基礎的 requests 包(http://docs.python-requests.org/en/master/user/quickstart/)之外,python用於抓取頁面和網站的最經常使用和重要的6個庫以下:

# Selenium
api文檔:http://seleniumhq.github.io/selenium/docs/api/py/
文檔: http://selenium-python.readthedocs.io/
抓取網站指導: http://thiagomarzagao.com/2013/11/12/webscraping-with-selenium-part-1/
抓取旅館價格的代碼示例: https://www.scrapehero.com/tutorial-web-scraping-hotel-prices-using-selenium-and-python/

# Beautiful Soup 4
中文文檔:https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
http://beautifulsoup.readthedocs.io/zh_CN/latest/
簡單例子:https://gist.github.com/bradmontgomery/1872970

# pyspider
github文檔:https://github.com/binux/pyspider

# scrapy
官網文檔:https://scrapy.org/
抓取一個電商網站的例子:https://medium.com/@kaismh/extracting-data-from-websites-using-scrapy-e1e1e357651a#.sw7c9ycio
Scrapinghub:雲基的爬蟲服務 https://scrapinghub.com/

# lxml
官網文檔:http://lxml.de/index.html#introduction
一個更通俗易懂的抓取頁面示例的教程:http://docs.python-guide.org/en/latest/scenarios/scrape/

# MechanicalSoup
github文檔:https://github.com/MechanicalSoup/MechanicalSoup
詳細文檔:https://mechanicalsoup.readthedocs.io/en/latest/


 

目前Python主要應用領域:

  • 雲計算:       雲計算最火的語言, 典型應用OpenStack
  • WEB開發:     衆多優秀的WEB框架,衆多大型網站均爲Python開發,Youtube, Dropbox, 豆瓣。。。, 典型WEB框架有Django
  • 科學運算、人工智能:   典型庫NumPy, SciPy, Matplotlib, Enthought librarys,pandas
  • 系統運維:       運維人員必備語言
  • 金融:      量化交易,金融分析,在金融工程領域,Python不但在用,且用的最多,並且重要性逐年提升。緣由:做爲動態語言的Python,語言結構清晰簡單,庫豐富,成熟穩定,科學計算和統計分析都很牛逼,生產效率遠遠高於c,c++,java,尤爲擅長策略回測
  • 圖形GUI:       PyQT, WxPython,TkInter

 


 

一些python模塊

functools, itertools, operator是Python標準庫爲咱們提供的支持函數式編程的三大模塊

 

 

...

相關文章
相關標籤/搜索