數據可視化【從編程小白到畫圖大拿】:2.折線圖那點事

參考來源:Vitu.AIpython

上一篇中你已經熟悉了編程環境,接下來是時候來畫個真格的折線圖了編程

咱們仍是老樣子在開頭先設置一下學習

設置你的Notebook

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
print("設置完成")

選擇數據集

本篇使用的數據集是著名流媒體音樂網站Spotify的每日播放次數,咱們主要關心如下從2017到2018年的5首流行歌曲:網站

1."Shape of You", by Ed Sheeran
2."Despacito", by Luis Fonzi
3."Something Just Like This", by The Chainsmokers and Coldplay
4."HUMBLE.", by Kendrick Lamar
5."Unforgettable", by French Montana ui

點擊這裏 下載 數據集spa

用excel打開以下:3d

my picture

這裏咱們注意到第一個數據點是2017年1月6日,這是The Shape of You的首發日,你能夠看到在全球首日被播放了12,287,078次。其餘行在這一天是缺失值是由於還沒發佈excel

咱們再把csv文件上傳到vitu的數據集空間裏code

my picture

接下來咱們用pandas來加載這個文件:blog

# Path of the file to read
spotify_filepath = "spotify.csv"

# Read the file into a variable spotify_data
spotify_data = pd.read_csv(spotify_filepath, index_col="Date", parse_dates=True)

是時候來檢驗一下數據了

咱們接下來會打印一下數據集的前5行,和上一篇裏同樣

# Print the first 5 rows of the data
spotify_data.head()

能夠看到和excel中打開看到的同樣,第一行裏都是缺失值NaN(Not a Number)

咱們能夠在看看最後的5行,此次只要把head改成tail。

# Print the last five rows of the data
spotify_data.tail()

終於,缺失值都沒有了,咱們能夠來畫圖了

畫圖的環節來了

數據都在前面的cell里加載到notebook了,因此咱們很容易一行代碼就把圖給畫了

# Line chart showing daily global streams of each song 
sns.lineplot(data=spotify_data)

在這一行代碼裏

sns.lineplot告訴notebook說我想要畫一個折線圖,若是sns.barplot則表明柱狀圖,sns.heatmap表明熱力圖

data=spotify_data則表明數據集咱們選擇的是spotify_data

有時候咱們想改變一些畫圖的細節,好比圖的大小或者設置title,這時能夠這樣設置

# Set the width and height of the figure
plt.figure(figsize=(14,6))

# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")

# Line chart showing daily global streams of each song 
sns.lineplot(data=spotify_data)

Screenshot 2019-12-20 at 14.42.59.png

畫子數據集的數據

到目前爲止咱們學會了畫數據集中全部列的數據,在這個環節咱們將學習如何畫某些列的數據

首先咱們先看看全部的列:

list(spotify_data.columns)

在接下來的代碼裏咱們來畫一下前兩個列的數據

# Set the width and height of the figure
plt.figure(figsize=(14,6))

# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")

# Line chart showing daily global streams of 'Shape of You'
sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You")

# Line chart showing daily global streams of 'Despacito'
sns.lineplot(data=spotify_data['Despacito'], label="Despacito")

# Add label for horizontal axis
plt.xlabel("Date")

Screenshot 2019-12-20 at 14.41.41.png

原文地址:數據可視化【從編程小白到畫圖大拿】:2.折線圖那點事

相關文章
相關標籤/搜索