基於GIScript和GeoIP進行訪問網址的地理定位分析

    經過網頁訪問日誌分析使用者的地址,而後將其放到地圖上,分析訪問來源的熱區從而獲得用戶的地圖分佈,是否是頗有用、也很酷?這裏介紹個使用GIScript和GeoIP來進行訪問網址的地理定位的例子。數據庫

    這個功能雖然看起來簡單,但其實要分爲不少個環節的。下面詳述:服務器

  •     一、首先是獲取IP地址,這個很少說了。在Web服務器的RequestHeaders中都有,也能夠經過日誌進行提取。從文件中提取能夠批量處理,而從訪問信息中提取而後直接發送到消息總線或NoSQL之類的高效率存儲系統能夠實現實時的處理。網絡

  •     二、使用GeoIP講域名或IP地址解析爲地名。GeoIP是MaxMind開發的用於IP到地址的解析工具,包括軟件和IP數據庫。免費版的定位較粗,而付費版的能夠實現較高精度的定位。併發

  •     三、將地名經過地理編碼(Geocoding)功能轉換爲空間座標或空間幾何對象,須要軟件和地圖數據的共同支持。這個之前是專業GIS纔有的功能,如今google/百度都提供在線服務接口。可是由於在線的有不少限制(網絡帶寬、併發控制、帳號等等),這裏使用GIScript這個工具來作。由於與GeoIP都有Python庫,很容易集成到一塊兒。若是須要大批量的處理,再假設一個Celery進行並行處理就OK了。工具

  •     四、統計空間數據庫中的數據樣本的頻度和其它屬性,生成專題圖或中間結果,能夠輸出圖件或者將數據傳送到R中繼續進行高級分析,產生統計圖表。google

  •     五、R分析的結果可使用GIScript反向保存回空間數據庫,進一步進行高級專題圖的製做。編碼

    這個流程能夠用到不少應用場景中,好比用戶分析、反欺詐、搜索分析、市場分析等等。日誌

    後面進行具體的攻略研究,未完待續。
對象

相關文章
相關標籤/搜索