原文連接:http://tecdat.cn/r語言對twitter數據進行挖掘/編程
Twitter is a popular social network, where a lot of data waiting for our analysis. Twitter R package is a good tool for text mining of twitter data. This article is about how to use Twitter R package to get twitter data and import it into R, and then make some interesting data analysis.json
第一步是註冊一個你的應用程序。函數
爲了可以訪問Twitter數據編程,咱們須要建立一個與Twitter的API交互的應用程序。測試
註冊後你將收到一個密鑰和密碼:大數據
獲取密鑰和密碼後即可以在R裏面受權咱們的應用程序以表明咱們訪問Twitter:spa
根據不一樣的搜索詞,咱們能夠在幾分鐘以內收集到成千上萬的tweet。這裏咱們測試一個關鍵詞 littlecaesars的twitter結果:3d
抓取最新的1000條相關twitterrest
因爲默認的抓取結果是json格式,所以使用twlisttodf函數將其轉換成數據框blog
而後咱們作一些簡單的文本清理ci
從獲得的數據裏,咱們能夠看到有twitter發表時間,內容,經緯度等信息
在清理數據以後,咱們對twitter內容進行分詞,以便進行數據可視化
分詞以後能夠獲得相關twitter的高頻詞彙,而後將其可視化
除此以外,還能夠結合數據中的時間戳數據和地理數據進行可視化分析
若是你一直在考慮對一些文本數據應用情感分析,你可能會發現使用R比你想象的更容易!