使用Spark GraphX對B站視頻進行熱度分析

1、前言 在文章的開始,須要先介紹下這個項目的需求。在這個小程序中,咱們首先爬取了b站部分的視頻信息,篩選掉罕見的標籤(能夠將它們當作髒數據),再利用以前寫的WordCount程序獲得熱詞,經過聚類分析得出幾類較爲經常使用的標籤,定義爲類別,最後經過Spark GraphX圖計算和可視化軟件整理數據,分析出在B站哪一類視頻熱度較高,而且容易出現火爆現象,以及各種別中哪一個視頻比較火。小程序 2、項
相關文章
相關標籤/搜索