川建國用推特攻擊了誰?我們用Python分析一下,可視化顯示數據

前言

本文的文字及圖片來源於網絡,僅供學習、交流使用,不具備任何商業用途,若有問題請及時聯繫咱們以做處理。網絡

如下文章源於蘿蔔大雜燴echarts

做者:周蘿蔔ide

Python爬蟲、數據分析、網站開發等案例教程視頻免費在線觀看學習

https://space.bilibili.com/523606542

數據簡單處理

數據數據紐約時報,因爲正常狀況下咱們沒法訪問該網站,因此數據的提取過程就不展現了,總之咱們獲得了一份以下數據,因爲某些空值和重複值,咱們進行簡單的處理
紐約時報數據網站

 

import pandas as pd
df = pd.read_csv('trump.csv')
df.drop_duplicates(inplace=True)
df.fillna('unkown',inplace=True)
df['date']=pd.to_datetime(df['date'])
df['year'] = df['date'].dt.year

 

咱們最終獲得的數據以下spa

 

數據分析

被攻擊最多3d

首先咱們看下,是誰被川神攻擊的最多code

from pyecharts.charts import Bar,Map,Line,Page,Scatter
from pyecharts import options as opts
from pyecharts.globals import SymbolType,ThemeType
from pyecharts.charts import Grid

result = df['target'].value_counts()[:10].sort_values()
x_data = result.index.tolist()
y_data = result.values.tolist()

b = (Bar()
     .add_xaxis(x_data)
     .add_yaxis('',y_data)
     .set_global_opts(title_opts = opts.TitleOpts(title='被侮辱次數前十'))
     .set_series_opts(label_opts=opts.LabelOpts(is_show=True,position='right'))
     .reversal_axis()
)
grid = Grid(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
grid.add(b, grid_opts=opts.GridOpts(pos_left="20%"))
grid.render_notebook()

 

 

 

能夠看到,the-media是被攻擊最多的,固然了,這有多是媒體的統稱,畢竟川神的攻擊,可都是無差別攻擊啊視頻

而高居第二的就是民主dang,嗯,攻擊zhengdi是提高本身的最好方式!blog

固然榜單裏也少不了Joe Biden呀,絕對的「生死」對頭

媒體狀況

做爲被diss最多的第三方,咱們來看看media的狀況
不一樣年份,川神diss的狀況

result = df[df['target'] == 'the-media']
result1 = result.groupby('year').year.count()
x_data = result1.index.tolist()
y_data = result1.values.tolist()

b = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        '',
        y_data,
        label_opts=opts.LabelOpts(is_show=True),
    )
    .set_global_opts(title_opts = opts.TitleOpts(title='侮辱the-media推特數量的變化'))

)
b.render_notebook()

 

 

 

能夠看到2019年和2020年是川神瘋狂diss the media的時候,真的是懟天懟地啊尤爲是2019年,居然有361次,這是天天懟一次也不爲過啊

再來看看懟媒體的時候,都用了某種侮辱

from wordcloud import WordCloud,STOPWORDS
import matplotlib.pyplot as plt
from imageio import imread

# result = df[df['target'] == 'the-media']
media_text = " ".join(df[df.target=="the-media"].insult)
mask = imread('1.jpg')
wordcloud = WordCloud(background_color = 'white',mask=mask,width=1200,height=1200).generate(media_text)
plt.figure(figsize=(16,8))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

 

 

 

再來看看懟Joe Biden的狀況

 

 

每一年侮辱推特數量

接下來是每一年侮辱性推特的發佈數量

result1 = df.groupby('year').year.count()
x_data = result1.index.tolist()
y_data = result1.values.tolist()

b = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        '',
        y_data,
        label_opts=opts.LabelOpts(is_show=True),
    )
    .set_global_opts(title_opts = opts.TitleOpts(title='侮辱推特數量的變化'))

)
b.render_notebook()

 

 

 

真的是勤奮啊,一年發了上千的欺詐性推特,尤爲是近兩年時間,都發了兩千多推特,真的是推特治國呀!

天天發推特數量

發推特數量日期前前十

 

數量最多的一天,發了45條,真是瘋狂啊,這是把推特當成筆記來用了嗎?

再來看下發推特數量前三中,分別都是diss某種

2020-10-12

 

Joe Biden絕對是被針對的第一人,一天罵了14次,哈哈哈

2020-10-07

 

2020-09-02

 

此處,求Joe Biden的心理陰影面積

最後咱們再看幾個詞雲,看看川神的癖好

diss目標詞雲

 

diss用語詞雲

 

diss Joe Biden用語詞雲

相關文章
相關標籤/搜索