本文正在參加「Python主題月」,詳情查看 活動連接python
在當今世界,天天都會產生大量數據。有時爲了分析某些趨勢的數據,若是數據是原始格式,模式可能會變得困難。爲了克服這種數據可視化發揮做用。數據可視化提供了良好的、有組織的數據圖形表示,使其更易於理解、觀察和分析。在本系列教程中,咱們將討論如何使用 Python 可視化數據。面試
咱們將一一討論這些庫,並繪製一些最經常使用的圖形。 數據庫
注意: 若是您想了解有關這些庫的深刻信息,能夠按照他們的完整教程進行操做。編程
在深刻研究這些庫以前,首先,咱們須要一個數據庫來繪製數據。咱們將在本完整教程中使用tips database。讓咱們討論一下這個數據庫的簡介。數組
tips 數據庫是20世紀90年代初期顧客在餐廳的兩個半月的小費記錄。它包含 6 列,例如 total_bill、tip、sex、smoker、day、time、size。markdown
您能夠從這裏下載 tips 數據庫。多線程
例子:svn
import pandas as pd
# 讀取數據庫
data = pd.read_csv("tips.csv")
# 打印前 10 行
print(data.head(10))
複製代碼
輸出:函數
Matplotlib 是一個易於使用的低級數據可視化庫,它構建在 NumPy 數組上。它由散點圖、線圖、直方圖等各類圖組成。 Matplotlib 提供了很大的靈活性。oop
要安裝此庫,請在終端中輸入如下命令。
pip install matplotlib
複製代碼
安裝 Matplotlib 後,讓咱們看看使用這個庫最經常使用的繪圖。
散點圖用於觀察變量之間的關係,並用點來表示它們之間的關係。matplotlib 庫中的scatter()方法用於繪製散點圖。
例子:
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數據庫
data = pd.read_csv("tips.csv")
# day 對 tip 的散點圖
plt.scatter(data['day'], data['tip'])
# 爲 Plot 添加標題
plt.title("Scatter Plot")
# 設置 X 和 Y 標籤
plt.xlabel('Day')
plt.ylabel('Tip')
plt.show()
複製代碼
輸出:
若是咱們能夠添加顏色並更改點的大小,則此圖會更有意義。咱們能夠經過分別使用 scatter 函數的c 和 s參數來作到這一點。咱們還可使用colorbar()方法顯示顏色條。
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數據庫
data = pd.read_csv("tips.csv")
# day對tip的散點圖
plt.scatter(data['day'], data['tip'], c=data['size'],
s=data['total_bill'])
# 爲Plot添加標題
plt.title("Scatter Plot")
# 設置 X 和 Y 標籤
plt.xlabel('Day')
plt.ylabel('Tip')
plt.colorbar()
plt.show()
複製代碼
折線圖用於表示不一樣軸上兩個數據 X 和 Y 之間的關係。它是使用plot() 函數繪製的。讓咱們看看下面的例子。
例子:
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數據庫
data = pd.read_csv("tips.csv")
# day對tip的折線圖
plt.plot(data['tip'])
plt.plot(data['size'])
# 爲Plot添加標題
plt.title("Scatter Plot")
# 設置 X 和 Y 標籤
plt.xlabel('Day')
plt.ylabel('Tip')
plt.show()
複製代碼
輸出:
柱狀圖或叫條形圖是表示與長度和高度的矩形條數據的類別是正比於它們所表明的值的圖。它可使用bar()方法建立。
例子:
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數據庫
data = pd.read_csv("tips.csv")
# day對tip的條形圖
plt.bar(data['day'], data['tip'])
plt.title("Bar Chart")
# 設置 X 和 Y 標籤
plt.xlabel('Day')
plt.ylabel('Tip')
# 添加圖例
plt.show()
複製代碼
輸出:
直方圖基本上是用來在一些基團的形式來表示數據。它是一種條形圖,其中 X 軸表示 bin 範圍,而 Y 軸提供有關頻率的信息。的HIST()函數用於計算和建立直方圖。在直方圖中,若是咱們傳遞分類數據,那麼它將自動計算該數據的頻率,即每一個值出現的頻率。
例子:
import pandas as pd
import matplotlib.pyplot as plt
# 讀取數據庫
data = pd.read_csv("tips.csv")
# total_bill直方圖
plt.hist(data['total_bill'])
plt.title("Histogram")
# 添加圖例
plt.show()
複製代碼
輸出:
以上是關於 Matplotlib 使用 Python 進行數據可視化的所有示例,下一節咱們來談談 Seaborn
🍰 往日優秀文章推薦:
若是你真的從這篇文章中學到了一些新東西,喜歡它,收藏它並與你的小夥伴分享。🤗最後,不要忘了❤或📑支持一下哦