原文 http://tecdat.cn/?p=3956 編程
Twitter是一個流行的社交網絡,這裏有大量的數據等着咱們分析。Twitter R包是對twitter數據進行文本挖掘的好工具。本文是關於如何使用Twitter R包獲取twitter數據並將其導入R,而後對它進行一些有趣的數據分析。json
第一步是註冊一個你的應用程序。網絡
爲了可以訪問Twitter數據編程,咱們須要建立一個與Twitter的API交互的應用程序。函數
註冊後你將收到一個密鑰和密碼:工具
獲取密鑰和密碼後即可以在R裏面受權咱們的應用程序以表明咱們訪問Twitter:測試
根據不一樣的搜索詞,咱們能夠在幾分鐘以內收集到成千上萬的tweet。這裏咱們測試一個關鍵詞 littlecaesars的twitter結果:大數據
抓取最新的1000條相關twitterspa
因爲默認的抓取結果是json格式,所以使用twlisttodf函數將其轉換成數據框3d
而後咱們作一些簡單的文本清理blog
從獲得的數據裏,咱們能夠看到有twitter發表時間,內容,經緯度等信息
在清理數據以後,咱們對twitter內容進行分詞,以便進行數據可視化
分詞以後能夠獲得相關twitter的高頻詞彙,而後將其可視化
除此以外,還能夠結合數據中的時間戳數據和地理數據進行可視化分析
若是你一直在考慮對一些文本數據應用情感分析,你可能會發現使用R比你想象的更容易!