r語言對twitter推特數據進行挖掘

原文連接:http://tecdat.cn/r語言對twitter數據進行挖掘/編程

Twitter is a popular social network, where a lot of data waiting for our analysis. Twitter R package is a good tool for text mining of twitter data. This article is about how to use Twitter R package to get twitter data and import it into R, and then make some interesting data analysis.json

r語言對twitter推特數據進行挖掘

第一步是註冊一個你的應用程序。函數

爲了可以訪問Twitter數據編程,咱們須要建立一個與Twitter的API交互的應用程序。測試

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

註冊後你將收到一個密鑰和密碼:大數據

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

獲取密鑰和密碼後即可以在R裏面受權咱們的應用程序以表明咱們訪問Twitter:spa

r語言對twitter推特數據進行挖掘

根據不一樣的搜索詞,咱們能夠在幾分鐘以內收集到成千上萬的tweet。這裏咱們測試一個關鍵詞 littlecaesars的twitter結果:3d

抓取最新的1000條相關twitterrest

因爲默認的抓取結果是json格式,所以使用twlisttodf函數將其轉換成數據框blog

r語言對twitter推特數據進行挖掘

而後咱們作一些簡單的文本清理ci

從獲得的數據裏,咱們能夠看到有twitter發表時間,內容,經緯度等信息

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

在清理數據以後,咱們對twitter內容進行分詞,以便進行數據可視化

r語言對twitter推特數據進行挖掘

分詞以後能夠獲得相關twitter的高頻詞彙,而後將其可視化

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

除此以外,還能夠結合數據中的時間戳數據和地理數據進行可視化分析

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

r語言對twitter推特數據進行挖掘

若是你一直在考慮對一些文本數據應用情感分析,你可能會發現使用R比你想象的更容易!

原文出處:http://tecdat.cn/category/大數據部落/

相關文章
相關標籤/搜索