不能錯過!超全Anaconda(Python整合包)導修(圖文詳解)

全文共2653字,預計學習時長10分鐘python

圖源:Pexels程序員

Anaconda是一個供數據科學家、IT專家,和商業領袖使用的數據科學平臺,是Python、R語言等的一個發行版。針對數據科學,它有超過300個軟件包,所以它迅速攀升爲最好的數據平臺之一。本篇導修將會探討如何運用Anaconda幫助Python編程。如下是本文要探討的主題:
算法

  • Anaconda介紹
  • 安裝和啓動
  • 如何將Python庫導入Anaconda
  • AnacondaNavigator
  • 使用場景:

○ Python基礎數據庫

○ 數據分析編程

○ 機器學習和人工智能數組

*CDH:Cloudera’s Distribution Including Apache Hadoop.微信

Cloudera包括Apache Hadoop的發行版本。機器學習

Anaconda介紹編程語言

Anaconda是Python和R的開源發行版本。它可以用於數據科學,機器學習,深度學習等領域。它可以讓用戶接觸到超過300個數據庫,所以對於任何程序員而言,Anaconda都是數據科學研究的上選。函數

Anaconda可以幫助簡化軟件包的管理和部署,它還匹配了多種工具,可使用各類機器學習和人工智能算法輕鬆地從不一樣的來源收集數據。Anaconda還可使用戶得到一個易於管理的環境設置——用戶只需點擊按鈕就能夠部署任何項目。

相信大家對Anaconda已經有了一個基本概念,接下來了解如何安裝它,並設置一個可以在系統上工做的環境。

安裝和啓動

想要安裝Anaconda,能夠進入這個網站。

下載頁面

選擇一個適合的版本而後點擊下載。完成下載後,打開啓動頁面。

Anaconda啓動

遵循啓動頁中的指令,記得點擊添加Anaconda到路徑環境變量裏。安裝完成後,你會看到一個和下圖同樣的窗口:

安裝完成

安裝完成後,打開Anaconda prompt並輸入jupyternotebook*。

*Jupyter Notebook: 是一個基於Web的交互式計算環境,用於建立jupyter notebook文檔。

Anaconda prompt

你會看到一個和下圖同樣的窗口:

Jupyter Notebook文件查找器

如今,已經知道如何將anaconda應用到python裏了,繼續研究如何在anaconda裏爲不一樣的項目導入數據庫。

導入Python庫至Anaconda

打開Anaconda prompt,檢查數據庫是否已經安裝。

檢查NumPy*是否安裝

*NumPy是Python語言的一個擴展程序庫,支持高端大量的維度數組與矩陣運算,此外也針對數組運算提供大量的數學函數庫。

由於沒有名爲numpy的模塊存在,咱們要運行如下指令來安裝numpy。

安裝NumPy中

安裝完成,就會出現這樣一個窗口:

NumPy安裝完成

安裝完一個數據庫後,儘可能再次導入模塊以驗證安裝是否成功。

導入NumPy

如上圖所示,這一步沒有出現錯誤。這就是在Anaconda中安裝不一樣數據庫的方法。

Anaconda Navigator

Anaconda Navigator

Anaconda Navigator是Anaconda發行版附帶的桌面圖形用戶界面(GUI),它可以讓用戶在不使用命令行的狀況下啓動應用程序,並管理conda軟件包和環境。

Python基礎

變量和數據類型

變量和數據類型是全部編程語言的基本組成部分。基於不一樣數據的屬性,Python共有六種數據類型。其中,列表(list),字典(dictionary),集合(set),還有元組(tuple)是Python中的集合數據類型。

下面是變量和數據類型在Python中應用的例子:

#variable declaration

name = "Edureka"

f = 1991

print("python wasfounded in" , f)

#data types

a = [1,2,3,4,5,6,7]

b = {1 : 'edureka' , 2: 'python'}

c = (1,2,3,4,5)

d = {1,2,3,4,5}

print("the listis" , a)

print("thedictionary is" ,b)

print("the tupleis" , c)

print("the set is" , d)

操做符(Operators)

Python 中的操做符用於值或變量之間的操做。Python中有七種類型的操做符:

  • 賦值操做符(AssignmentOperator)。
  • 算術運算符(ArithmeticOperator)。
  • 邏輯運算符(LogicalOperator)。
  • 比較操做符(ComparisonOperator)。
  • 位操做符(Bit-wiseOperator)。
  • 會員操做符(MembershipOperator)。
  • 身份識別操做符(Identity Operator)。

下面是在Python中使用操做符的一個例子:

a = 10

b = 15

#arithmetic operator

print(a + b)

print(a - b)

print(a * b)

#assignment operator

a += 10

print(a)

#comparison operator

#a != 10

#b == a

#logical operator

a > b and a > 10

#this will return true if both the statements are true.

控制語句

諸如使用if, else, break和continue等的語句被用做控制語句,以得到對執行過程的控制,從而取得最佳結果。能夠在 Python 的循環中使用這些語句來控制結果。下面的示例演示如何使用控制(control)條件(conditional)語句。

name = 'edureka'

for i in name:

if i == 'a':

break

else:

print(i)

函數

Python函數以一種高效的方式使代碼的重複使用性提升,爲問題語句編寫邏輯,並運行一些參數以得到最佳解決方案。下面是如何在python中使用函數的示例。

deffunc(a):

return a ** a

res = func(10)

print(res)

類以及對象

由於Python支持面向對象的程序設計,因此也可使用類和對象。下面是如何使用python中的類和對象的示例。

classParent:

deffunc(self):

print('this is parent')

classChild(Parent):

deffunc1(self):

print('this is child')

ob = new Child()

ob.func()

以上Python的一些基本概念。接下來,看看Anaconda更大的軟件包支持,咱們能夠從許多庫中得到資料。如今來探究如何使用 python anaconda進行數據分析。

分析

數據挖掘和分析工做流

上面是數據分析中涉及的某些步驟。來看看在anaconda中數據分析是如何進行數據分析的,以及其中可使用的各類庫。

收集數據

數據的收集就像在程序中加載 CSV 文件同樣簡單。能夠利用相關數據來分析數據中的特定實例或條目。下面是加載程序中CSV數據的代碼:

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

df = pd.read_csv('filename.csv')

print(df.head(5))

前五行數據組

交叉分析

在加載程序中的數據集以後,還須要對數據進行一些更改過濾,即消除空值和可能形成分析不肯定性的沒必要要字段。

下面是如何根據需求篩選數據的示例:

print(df.isnull().sum())

#this will give the sum of all the null values in thedataset.

df1 = df.dropna(axis=0 , how= 'any')

#this will drop rows with null values

找到每列空值的總數

固然也能夠刪除空值。

刪除空值的所在行

箱線圖(box plot)

sns.boxplot(x=df['Salary Range From'])

sns.boxplot(x=df['Salary Range To'])

薪資範圍箱線圖

薪資範圍箱線圖

散點圖(scatter plot)

import matplotlib.pyplot as plt

fig, ax = plt.subplots(figsize=(16,8))

ax.scatter(df['Salary Range From'] , df['Salary Range To'])

ax.set_xlabel('Salary Range From')

ax.set_ylabel('Salary Range TO')

plt.show()

薪資範圍散點圖

可視化

一旦根據需求改變了數據,就有必要分析這些數據,方式之一就是將結果可視化。更好的可視化表示有助於對數據投影進行最優分析。

下面是一個數據可視化的例子:

全職&兼職工做者的柱狀圖

全職&兼職工做者及工資結算方式柱狀圖

薪資範圍直方圖

薪資範圍直方圖

import matplotlib.pyplot as plt

fig = plt.figure(figsize = (10,10))

ax = fig.gca()

sns.heatmap(df1.corr(), annot=True, fmt=".2f")

plt.title("Correlation",fontsize=5)

plt.show()

用matplotlib繪製的熱圖

分析

完成可視化後,能夠藉助各類圖表來進行分析。假設咱們正在處理做業數據,經過查看某個區域中特定做業的可視化表示,即可以肯定特定域中做業的數量。

根據上文的分析,能夠假設下列結果:

  • 和全職工做相比,數據集裏兼職工做的數量很是少。
  • 兼職工做只有不到500個,但全職工做的總數超過了2500個。
  • 基於這一分析,能夠創建一個預測模型。

若是還有其餘問題,在評論區裏踊躍發言喲,小芯將第一時間與你聯繫。

留言 點贊 關注

咱們一塊兒分享AI學習與發展的乾貨
歡迎關注全平臺AI垂類自媒體 「讀芯術」


(添加小編微信:dxsxbb,加入讀者圈,一塊兒討論最新鮮的人工智能科技哦~)

相關文章
相關標籤/搜索