-------------------------------------------------------------------------------------- git
版權全部:超圖研究所(www.supermap.com)
數據庫
Blog: http://blog.csdn.net/chinagissoft windows
QQ羣:16403743 工具
宗旨:專一於"GIS+"前沿技術的研究與交流,將雲計算技術、大數據技術、容器技術、物聯網與GIS進行深度融合,探討"GIS+"技術和行業解決方案 學習
轉載說明:文章容許轉載,但必須以連接方式註明源地址,不然追究法律責任! 大數據
-------------------------------------------------------------------------------------- 優化
題記 雲計算
對於大數據的理解,仁者見仁智者見智,可是最起碼須要一個量級的限制,例如若是你在將你的大數據有多麼牛叉,可是演示的數據量在幾百萬條記錄,幾千萬條記錄等,其實並無什麼說服力,能夠說,一個傳統意義的關係型數據庫均可以輕鬆管理上億條記錄,那麼若是再進行相關的優化,幾十億條記錄進行操做也沒有問題,因此咱們在學習或者實踐咱們的大數據,最起碼在量級方面須要讓你們信服。 spa
這裏面咱們在互聯網找到了一些關於大數據量及的數據,但願可以分享給各位,也但願這些數據可以爲各位在大數據的研究和實踐過程當中提供數據支持。 .net
元數據描述
數據介紹:來自美國紐約的出租車數據,包括空間位置信息,時間信息等屬性信息。
數據格式:csv
數據字段描述:
數據量:11GB的文本數據
數據下載地址:http://pan.baidu.com/s/1i3QR8O1
illumidata工具是一個不錯的選擇:http://pan.baidu.com/s/1i4xvCVF