Python數據分析必備:php
Anaconda是一個用於科學計算的Python發行版,支持 Linux, Mac, Windows系統,提供了包管理與環境管理的功能,能夠很方便地解決多版本python並存、切換以及各類第三方包安裝問題。Anaconda利用工具/命令conda
來進行package和environment的管理,而且已經包含了Python和相關的配套工具。python
conda
能夠理解爲一個工具,也是一個可執行命令,其核心功能是包管理與環境管理。包管理與pip的使用相似,環境管理則容許用戶方便地安裝不一樣版本的python並能夠快速切換。Anaconda則是一個打包的集合,裏面預裝好了conda、某個版本的python、衆多packages、科學計算工具等等,因此也稱爲Python的一種發行版。nginx
首先應該設置本地存放數據目錄爲工做目錄,這樣能夠加載本地數據集到內存中web
import os os.chdir("D:/BigData/Workspace/testdata/") #設置當前路徑爲工做路徑 os.getcwd() #獲取當前工做路徑
摘錄自官網:sql
What is Graphviz?數據庫
Graphviz is open source graph visualization software. Graph visualization is a way of representing structural information as diagrams of abstract graphs and networks. It has important applications in networking, bioinformatics, software engineering, database and web design, machine learning, and in visual interfaces for other technical domains.vim
什麼是Graphviz?瀏覽器
Graphviz是開源圖形可視化軟件。 圖形可視化是將結構信息表示爲抽象圖形和網絡圖。 它在網絡,生物信息學,軟件工程,數據庫和網頁設計,機器學習和其餘技術領域的視覺界面中具備重要的應用。網絡
網址:app
http://www.graphviz.org/ 或 http://www.graphviz.org/Download..php #安裝
命令:dot -Tpdf iris.dot -o output.pdf 可將dot文件轉化爲已轉化爲圖形的pdf文件
打開ipython notebook方式:
3.1在cmd中輸入~
3.2 默認瀏覽器會打開http://localhost:8888/tree
3.3 運行當前行並換行shift+enter
運行當前行:ctrl+enter
3.4 conda版本查看
conda 安裝全部的包
查看有幾個python環境
conda create --name snowflake biopython
這條命令將會給biopython包建立一個新的環境,位置在/envs/snowflakes
小技巧:不少跟在--後邊經常使用的命令選項,能夠被略寫爲一個短線加命令首字母。因此--name選項和-n的做用是同樣的。經過conda -h或conda –-help來看大量的縮寫。
Linux,OS X:: source activate snowflakes Windows:: activate snowflake`
小技巧:新的開發環境會被默認安裝在你conda目錄下的envs文件目錄下。
此次讓咱們來建立並命名一個新環境,而後安裝另外一個版本的python以及兩個包 Astroid 和 Babel。
conda create -n bunnies python=3 Astroid Babel
這將建立第二個基於python3 ,包含Astroid 和 Babel 包,稱爲bunnies的新環境,在/envs/bunnies文件夾裏。
小技巧:在此同時安裝你想在這個環境中運行的包,
小提示:在你建立環境的同時安裝好全部你想要的包,在後來依次安裝可能會致使依賴性問題
經過克隆來複制一個環境。這兒將經過克隆snowfllakes來建立一個稱爲flowers的副本。
conda create -n flowers --clone snowflakes
經過conda info –-envs來檢查環境
你如今應該能夠看到一個環境列表:flowers, bunnies, and snowflakes.
若是你不想要這個名爲flowers的環境,就按照以下方法移除該環境:
conda remove -n flowers --all
爲了肯定這個名爲flowers的環境已經被移除,輸入如下命令:
conda info -e
flowers 已經再也不在你的環境列表裏了,因此咱們知道它被刪除了。
首先讓咱們檢查那個版本的python能夠被安裝:
conda search --full --name python
你可使用conda search python來看到全部名字中含有「python」的包或者加上--full --name
命令選項來列出徹底與「python」匹配的包。
爲了確保snakes環境已經被安裝了,鍵入以下命令:
conda info -e
conda會顯示環境列表,當前活動的環境會被括號括起來(snakes)
爲了使用不一樣版本的python,你能夠切換環境,經過簡單的激活它就能夠,看看如何返回默認2.7
·Linux,OS X: source activate snowflakes ·Windows:activate snowflakes
當你完成了在snowflakes環境中的工做室,註銷掉該環境並轉換你的路徑到先前的狀態:
·Linux,OS X:source deactivate
·Windows:deactivate
4.12
查找一個包首先讓咱們來檢查咱們須要的這個包是否能夠經過conda來安裝:
conda search beautifulsoup4
它展現了這個包,因此咱們知道它是可用的。
若是一個包不能使用conda安裝,咱們接下來將在Anaconda.org網站查找。Anaconda.org向公開和私有包倉庫提供包管理服務。Anaconda.org是一個連續分析產品。
提示:你在Anaconda.org下載東西的時候不強制要求註冊。
爲了從Anaconda.org下載到當前的環境中,咱們須要經過指定Anaconda.org爲一個特定通道,經過輸入這個包的完整路徑來實現。
在瀏覽器中,去 http://anaconda.org 網站。咱們查找一個叫「bottleneck」的包,因此在左上角的叫「Search Anaconda Cloud」搜索框中輸入「bottleneck」並點擊search按鈕。
Anaconda.org上會有超過一打的bottleneck包的版本可用,可是咱們想要那個被下載最頻繁的版本。因此你能夠經過下載量來排序,經過點擊Download欄。
點擊包的名字來選擇最常被下載的包。它會連接到Anaconda.org詳情頁顯示下載的具體命令:
conda install --channel https://conda .anaconda.ort/pandas bottleneck
5.2
經過pip命令來安裝包對於那些沒法經過conda安裝或者從Anaconda.org得到的包,咱們一般能夠用pip(「pip install packages」的簡稱)來安裝包。
提示: pip只是一個包管理器,因此它不能爲你管理環境。pip甚至不能升級python,由於它不像conda同樣把python當作包來處理。可是它能夠安裝一些conda安裝不了的包,和vice versa(此處不會翻譯)。pip和conda都集成在Anaconda或miniconda裏邊。
咱們激活咱們想放置程序的環境,而後經過pip安裝一個叫「See」的程序。
·Linux,OS X: source activate bunnies ·Windows:activate bunnies 全部平臺: pip install see
5.3
檢查pip安裝檢查See是否被安裝:
conda list
5.4安裝商業包安裝商業包與你安裝其餘的包的過程異常。舉個例子,讓咱們安裝並刪除一個更新的商業包的免費試用 IOPro,能夠加速你的python處理速度:
conda install iopro
5.5 移除包、環境、或者conda若是你願意的話。讓咱們經過移除一個或多個試驗包、環境以及conda來結束此次測試指導。
假設你決定再也不使用商業包IOPro。你能夠在bunnies環境中移除它。
conda remove -n bunnies iopro
5.7確認包已經被移除使用conda list命令來確認IOPro已經被移除了
conda list
5.8移除環境咱們再也不須要snakes環境了,因此輸入如下命令:
conda remove -n snakes --all
爲了確認snakes環境已經被移除了,輸入如下命令:
conda info --envis
snakes再也不顯示在環境列表裏了,因此咱們知道它已經被刪除了
rm -rf ~/miniconda OR rm -rf ~/anaconda
<end>