Python爬取B站彈幕的思路和流程

作nlp項目,除了各大電商評論和微博數據,彈幕分析對於輿論和該視頻的推廣都是有幫助的,下面主要說說這麼從B站爬取彈幕。html 過程很簡單,咱們來看看:python 1. 首先,bilibili的彈幕是在xml文件裏,每一個視頻都有其對應的cid和aid,咱們取到cid中的數字放入http://comment.bilibili.com/+cid+.xml,便可獲得該視頻對應的cid。瀏覽器 好比:
相關文章
相關標籤/搜索