<p>帶着一幫兄弟搭建一個輿情繫統。在這裏創建這個博客,主要是爲了記錄項目中的技術選型和具體實現。咱們選用主流和成熟的技術,可是具體的實現和處理上可能會考慮欠周到,暴露出智商不足、經驗不夠、體力不支等問題。還望前輩、同輩若是有緣看到,可以多多指點。</p> <p>今天先記錄一下項目的主要任務,下期再給出項目的架構規劃和實現週期。</p> <p>咱們指望可以從微博、微信,等sns站點,視頻站點,網易、新浪等主流和非主流媒體站點抓取到熱點趨勢,蒐集整理熱門的文字、圖片、音視頻素材,挖掘文章涉及到了客戶用戶所關心的實體,並進一步識別這些資訊的類別、話題、傾向性等標籤。</p> <p>後續,對輿情數據,按照標籤維度,按照素材維度等多種不一樣維度進行統計和可視化展示。</p> <p>項目第一期的工期三個月,時間緊,人手緊:除了皮帶愈來愈鬆,其餘都愈來愈緊……</p>微信