參考來源:Vitu.AIpython
上一篇中你已經熟悉了編程環境,接下來是時候來畫個真格的折線圖了編程
咱們仍是老樣子在開頭先設置一下學習
import pandas as pd import matplotlib.pyplot as plt import seaborn as sns print("設置完成")
本篇使用的數據集是著名流媒體音樂網站Spotify的每日播放次數,咱們主要關心如下從2017到2018年的5首流行歌曲:網站
1."Shape of You", by Ed Sheeran
2."Despacito", by Luis Fonzi
3."Something Just Like This", by The Chainsmokers and Coldplay
4."HUMBLE.", by Kendrick Lamar
5."Unforgettable", by French Montana ui
點擊這裏 下載 數據集spa
用excel打開以下:3d
這裏咱們注意到第一個數據點是2017年1月6日,這是The Shape of You的首發日,你能夠看到在全球首日被播放了12,287,078次。其餘行在這一天是缺失值是由於還沒發佈excel
咱們再把csv文件上傳到vitu的數據集空間裏code
接下來咱們用pandas來加載這個文件:blog
# Path of the file to read spotify_filepath = "spotify.csv" # Read the file into a variable spotify_data spotify_data = pd.read_csv(spotify_filepath, index_col="Date", parse_dates=True)
咱們接下來會打印一下數據集的前5行,和上一篇裏同樣
# Print the first 5 rows of the data spotify_data.head()
能夠看到和excel中打開看到的同樣,第一行裏都是缺失值NaN(Not a Number)
咱們能夠在看看最後的5行,此次只要把head改成tail。
# Print the last five rows of the data spotify_data.tail()
終於,缺失值都沒有了,咱們能夠來畫圖了
數據都在前面的cell里加載到notebook了,因此咱們很容易一行代碼就把圖給畫了
# Line chart showing daily global streams of each song sns.lineplot(data=spotify_data)
在這一行代碼裏
sns.lineplot告訴notebook說我想要畫一個折線圖,若是sns.barplot則表明柱狀圖,sns.heatmap表明熱力圖
data=spotify_data則表明數據集咱們選擇的是spotify_data
有時候咱們想改變一些畫圖的細節,好比圖的大小或者設置title,這時能夠這樣設置
# Set the width and height of the figure plt.figure(figsize=(14,6)) # Add title plt.title("Daily Global Streams of Popular Songs in 2017-2018") # Line chart showing daily global streams of each song sns.lineplot(data=spotify_data)
到目前爲止咱們學會了畫數據集中全部列的數據,在這個環節咱們將學習如何畫某些列的數據
首先咱們先看看全部的列:
list(spotify_data.columns)
在接下來的代碼裏咱們來畫一下前兩個列的數據
# Set the width and height of the figure plt.figure(figsize=(14,6)) # Add title plt.title("Daily Global Streams of Popular Songs in 2017-2018") # Line chart showing daily global streams of 'Shape of You' sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You") # Line chart showing daily global streams of 'Despacito' sns.lineplot(data=spotify_data['Despacito'], label="Despacito") # Add label for horizontal axis plt.xlabel("Date")