豆瓣一連,500熱評真得具有代表性嗎?

上次寫了一篇關於《北靈少年志之大主宰》的短評分析鏈接1,用熱評500是在無法取得完整短評下不得已爲之的結果,現在咱們來重申一個問題,豆娘放出來的短評top500,真的是能代表全體的意見領袖嗎? 考慮用統計模型進行驗證。 豆瓣數據爬蟲 首先是樣本影視名錄,選取熱榜300條(實際用到的50+),Python爬蟲可參考鏈接2,整理後如圖: 然後爬取每篇文章的豆瓣短評,超過500的按500爬,不足500的
相關文章
相關標籤/搜索