Java使用純真IP庫獲取IP對應省份和城市

原文:http://blog.csdn.net/chwshuang/article/details/78027873?locationNum=10&fps=1php

Java使用純真IP庫獲取IP對應省份和城市

項目上接到一個需求,按照用戶IP地址判斷用戶省份、城市,來展現不一樣的內容。在網上進行選型的時候,有幾個選擇java

開源免費的IP庫選型


  1. GeoIP2 GeoLite2開源免費的數據庫數據庫

    MaxMind做爲一傢俬營企業,總部設於美國馬薩諸塞州的沃爾瑟姆。MaxMind公司成立於2002年,是領先業界的IP智能與在線欺詐檢測工具供應商。有興趣的能夠訪問官方網站瞭解。數組

    這個IP庫的特色是免費,全球支持比較好,國外的IP應該比較全,國內的IP地址獲取率不高,獲取後的準確率也不高,公司網站上使用過一段時間,我統計過,國內地址獲取率80%左右,而這80%裏與淘寶的IP進行對比的準確率只有60%~80%,因此,總體的成功率只有65%如下,因此上線一段時間就沒有用了。緩存

    這裏寫圖片描述

  2. 淘寶IP庫安全

    淘寶IP庫只能經過Http方式查詢IP,沒有提供本地庫的方式,遇到實時處理系統,確定是不行,解決方案是建一個緩存和一個隊列,若是緩存中沒有的IP,就放到隊列,而後用一個線程單獨去隊列中把要查詢地址的IP經過Http的方式獲取。markdown

    淘寶IP庫的特色是準確,官方宣稱的省級準確率達到99.14%。缺點就是隻提供線上的Rest API,並且線上的Rest API有請求限制,若是你寫個程序一直請求,每一個請求返回的間隔是30秒!因此不適合實時的場景用。網絡

    這裏寫圖片描述

  3. 純真IP庫多線程

    純真IP庫是國人開源的一個IP庫,支持多語言的,它的格式是公開的,因此,你能夠將它用在目前主流的開發語言的項目中。純真IP庫的獲取率是99.99%,除非是本地內網IP,好比以192.168開頭的一些IP會不認,而這個是沒有影響的。而淘寶IP庫比較有意思的是會返回本地IP這個地區描述。純真庫還有一個最大的好處,就是它在按期更新,且比較頻繁,最新更新時間是幾天前2017年9月15號。使用過程當中庫更新也比較方便,直接更新項目上的庫文件,而後重啓服務便可。固然,你也可讓程序手動或者自動定時觸發更新。併發

    純真IP庫須要在Window的操做系統上安裝程序,而後在安裝目錄(默認是 ?\cz88.net\ip\)找到qqwry.dat這個文件, 這個就是壓縮後的IP本地庫

    這裏寫圖片描述



.

純真IP庫使用


上面純真IP介紹裏已經說過怎麼獲取IP庫文件,下面再說如何使用

  1. 建立一個本地對象
public class IPLocation { /** * 國家 */ private String country; /** * 區域 - 省份 + 城市 */ private String area; public IPLocation() { country = area = ""; } public synchronized IPLocation getCopy() { IPLocation ret = new IPLocation(); ret.country = country; ret.area = area; return ret; } public String getCountry() { return country; } public String getCity() { String city = ""; if(country != null){ String[] array = country.split("省"); if(array != null && array.length > 1){ city = array[1]; } else { city = country; } if(city.length() > 3){ city.replace("內蒙古", ""); } } return city; } public void setCountry(String country) { this.country = country; } public String getArea() { return area; } public void setArea(String area) { //若是爲局域網,純真IP地址庫的地區會顯示CZ88.NET,這裏把它去掉 if(area.trim().equals("CZ88.NET")){ this.area="本機或本網絡"; }else{ this.area = area; } } } 

 

 

  1. 建立工具類
import org.slf4j.Logger; import org.slf4j.LoggerFactory; import java.io.UnsupportedEncodingException; import java.util.StringTokenizer; /** * 工具類,提供IP字符串轉數組的方法 */ public class Util { private static final Logger log = LoggerFactory.getLogger(CZIPUtils.class); private static StringBuilder sb = new StringBuilder(); /** * 從ip的字符串形式獲得字節數組形式 * * @param ip 字符串形式的ip * @return 字節數組形式的ip */ public static byte[] getIpByteArrayFromString(String ip) { byte[] ret = new byte[4]; StringTokenizer st = new StringTokenizer(ip, "."); try { ret[0] = (byte) (Integer.parseInt(st.nextToken()) & 0xFF); ret[1] = (byte) (Integer.parseInt(st.nextToken()) & 0xFF); ret[2] = (byte) (Integer.parseInt(st.nextToken()) & 0xFF); ret[3] = (byte) (Integer.parseInt(st.nextToken()) & 0xFF); } catch (Exception e) { log.error("從ip的字符串形式獲得字節數組形式報錯" + e.getMessage(), e); } return ret; } /** * 字節數組IP轉String * @param ip ip的字節數組形式 * @return 字符串形式的ip */ public static String getIpStringFromBytes(byte[] ip) { sb.delete(0, sb.length()); sb.append(ip[0] & 0xFF); sb.append('.'); sb.append(ip[1] & 0xFF); sb.append('.'); sb.append(ip[2] & 0xFF); sb.append('.'); sb.append(ip[3] & 0xFF); return sb.toString(); } /** * 根據某種編碼方式將字節數組轉換成字符串 * * @param b 字節數組 * @param offset 要轉換的起始位置 * @param len 要轉換的長度 * @param encoding 編碼方式 * @return 若是encoding不支持,返回一個缺省編碼的字符串 */ public static String getString(byte[] b, int offset, int len, String encoding) { try { return new String(b, offset, len, encoding); } catch (UnsupportedEncodingException e) { return new String(b, offset, len); } } } 

 

  1. 建立工具類
import org.slf4j.Logger; import org.slf4j.LoggerFactory; import java.io.File; import java.io.FileNotFoundException; import java.io.IOException; import java.io.RandomAccessFile; import java.nio.MappedByteBuffer; import java.util.Map; import java.util.concurrent.ConcurrentHashMap; /** * IP地址服務 */ public class IPAddressUtils { private static Logger log = LoggerFactory.getLogger(IPAddressUtils.class); /** * 純真IP數據庫名 */ private String IP_FILE="qqwry.dat"; /** * 純真IP數據庫保存的文件夾 */ private String INSTALL_DIR="/test/"; /** * 常量,好比記錄長度等等 */ private static final int IP_RECORD_LENGTH = 7; /** * 常量,讀取模式1 */ private static final byte REDIRECT_MODE_1 = 0x01; /** * 常量,讀取模式2 */ private static final byte REDIRECT_MODE_2 = 0x02; /** * 緩存,查詢IP時首先查詢緩存,以減小沒必要要的重複查找 */ private Map<String, IPLocation> ipCache; /** * 隨機文件訪問類 */ private RandomAccessFile ipFile; /** * 內存映射文件 */ private MappedByteBuffer mbb; /** * 起始地區的開始和結束的絕對偏移 */ private long ipBegin, ipEnd; /** * 爲提升效率而採用的臨時變量 */ private IPLocation loc; /** * 爲提升效率而採用的臨時變量 */ private byte[] buf; /** * 爲提升效率而採用的臨時變量 */ private byte[] b4; /** * 爲提升效率而採用的臨時變量 */ private byte[] b3; /** * IP地址庫文件錯誤 */ private static final String BAD_IP_FILE = "IP地址庫文件錯誤"; /** * 未知國家 */ private static final String UNKNOWN_COUNTRY = "未知國家"; /** * 未知地區 */ private static final String UNKNOWN_AREA = "未知地區"; public void init() { try { // 緩存必定要用ConcurrentHashMap, 避免多線程下獲取爲空 ipCache = new ConcurrentHashMap<>(); loc = new IPLocation(); buf = new byte[100]; b4 = new byte[4]; b3 = new byte[3]; try { ipFile = new RandomAccessFile(IP_FILE, "r"); } catch (FileNotFoundException e) { // 若是找不到這個文件,再嘗試再當前目錄下搜索,此次所有改用小寫文件名 // 由於有些系統可能區分大小寫致使找不到ip地址信息文件 String filename = new File(IP_FILE).getName().toLowerCase(); File[] files = new File(INSTALL_DIR).listFiles(); for(int i = 0; i < files.length; i++) { if(files[i].isFile()) { if(files[i].getName().toLowerCase().equals(filename)) { try { ipFile = new RandomAccessFile(files[i], "r"); } catch (FileNotFoundException e1) { log.error("IP地址信息文件沒有找到,IP顯示功能將沒法使用:{}" + e1.getMessage(), e1); ipFile = null; } break; } } } } // 若是打開文件成功,讀取文件頭信息 if(ipFile != null) { try { ipBegin = readLong4(0); ipEnd = readLong4(4); if(ipBegin == -1 || ipEnd == -1) { ipFile.close(); ipFile = null; } } catch (IOException e) { log.error("IP地址信息文件格式有錯誤,IP顯示功能將沒法使用"+ e.getMessage(), e); ipFile = null; } } } catch (Exception e) { log.error("IP地址服務初始化異常:" + e.getMessage(), e); } } /** * 查詢IP地址位置 - synchronized的做用是避免多線程時獲取區域信息爲空 * @param ip * @return */ public synchronized IPLocation getIPLocation(final String ip) { IPLocation location = new IPLocation(); location.setArea(this.getArea(ip)); location.setCountry(this.getCountry(ip)); return location; } /** * 從內存映射文件的offset位置開始的3個字節讀取一個int * @param offset * @return */ private int readInt3(int offset) { mbb.position(offset); return mbb.getInt() & 0x00FFFFFF; } /** * 從內存映射文件的當前位置開始的3個字節讀取一個int * @return */ private int readInt3() { return mbb.getInt() & 0x00FFFFFF; } /** * 根據IP獲得國家名 * @param ip ip的字節數組形式 * @return 國家名字符串 */ public String getCountry(byte[] ip) { // 檢查ip地址文件是否正常 if(ipFile == null) return BAD_IP_FILE; // 保存ip,轉換ip字節數組爲字符串形式 String ipStr = Util.getIpStringFromBytes(ip); // 先檢查cache中是否已經包含有這個ip的結果,沒有再搜索文件 if(ipCache.containsKey(ipStr)) { IPLocation ipLoc = ipCache.get(ipStr); return ipLoc.getCountry(); } else { IPLocation ipLoc = getIPLocation(ip); ipCache.put(ipStr, ipLoc.getCopy()); return ipLoc.getCountry(); } } /** * 根據IP獲得國家名 * @param ip IP的字符串形式 * @return 國家名字符串 */ public String getCountry(String ip) { return getCountry(Util.getIpByteArrayFromString(ip)); } /** * 根據IP獲得地區名 * @param ip ip的字節數組形式 * @return 地區名字符串 */ public String getArea(final byte[] ip) { // 檢查ip地址文件是否正常 if(ipFile == null) return BAD_IP_FILE; // 保存ip,轉換ip字節數組爲字符串形式 String ipStr = Util.getIpStringFromBytes(ip); // 先檢查cache中是否已經包含有這個ip的結果,沒有再搜索文件 if(ipCache.containsKey(ipStr)) { IPLocation ipLoc = ipCache.get(ipStr); return ipLoc.getArea(); } else { IPLocation ipLoc = getIPLocation(ip); ipCache.put(ipStr, ipLoc.getCopy()); return ipLoc.getArea(); } } /** * 根據IP獲得地區名 * @param ip IP的字符串形式 * @return 地區名字符串 */ public String getArea(final String ip) { return getArea(Util.getIpByteArrayFromString(ip)); } /** * 根據ip搜索ip信息文件,獲得IPLocation結構,所搜索的ip參數從類成員ip中獲得 * @param ip 要查詢的IP * @return IPLocation結構 */ private IPLocation getIPLocation(final byte[] ip) { IPLocation info = null; long offset = locateIP(ip); if(offset != -1) info = getIPLocation(offset); if(info == null) { info = new IPLocation(); info.setCountry ( UNKNOWN_COUNTRY); info.setArea(UNKNOWN_AREA); } return info; } /** * 從offset位置讀取4個字節爲一個long,由於java爲big-endian格式,因此沒辦法 * 用了這麼一個函數來作轉換 * @param offset * @return 讀取的long值,返回-1表示讀取文件失敗 */ private long readLong4(long offset) { long ret = 0; try { ipFile.seek(offset); ret |= (ipFile.readByte() & 0xFF); ret |= ((ipFile.readByte() << 8) & 0xFF00); ret |= ((ipFile.readByte() << 16) & 0xFF0000); ret |= ((ipFile.readByte() << 24) & 0xFF000000); return ret; } catch (IOException e) { return -1; } } /** * 從offset位置讀取3個字節爲一個long,由於java爲big-endian格式,因此沒辦法 * 用了這麼一個函數來作轉換 * @param offset 整數的起始偏移 * @return 讀取的long值,返回-1表示讀取文件失敗 */ private long readLong3(long offset) { long ret = 0; try { ipFile.seek(offset); ipFile.readFully(b3); ret |= (b3[0] & 0xFF); ret |= ((b3[1] << 8) & 0xFF00); ret |= ((b3[2] << 16) & 0xFF0000); return ret; } catch (IOException e) { return -1; } } /** * 從當前位置讀取3個字節轉換成long * @return 讀取的long值,返回-1表示讀取文件失敗 */ private long readLong3() { long ret = 0; try { ipFile.readFully(b3); ret |= (b3[0] & 0xFF); ret |= ((b3[1] << 8) & 0xFF00); ret |= ((b3[2] << 16) & 0xFF0000); return ret; } catch (IOException e) { return -1; } } /** * 從offset位置讀取四個字節的ip地址放入ip數組中,讀取後的ip爲big-endian格式,可是 * 文件中是little-endian形式,將會進行轉換 * @param offset * @param ip */ private void readIP(long offset, byte[] ip) { try { ipFile.seek(offset); ipFile.readFully(ip); byte temp = ip[0]; ip[0] = ip[3]; ip[3] = temp; temp = ip[1]; ip[1] = ip[2]; ip[2] = temp; } catch (IOException e) { log.error(e.getMessage(), e); } } /** * 從offset位置讀取四個字節的ip地址放入ip數組中,讀取後的ip爲big-endian格式,可是 * 文件中是little-endian形式,將會進行轉換 * @param offset * @param ip */ private void readIP(int offset, byte[] ip) { mbb.position(offset); mbb.get(ip); byte temp = ip[0]; ip[0] = ip[3]; ip[3] = temp; temp = ip[1]; ip[1] = ip[2]; ip[2] = temp; } /** * 把類成員ip和beginIp比較,注意這個beginIp是big-endian的 * @param ip 要查詢的IP * @param beginIp 和被查詢IP相比較的IP * @return 相等返回0,ip大於beginIp則返回1,小於返回-1。 */ private int compareIP(byte[] ip, byte[] beginIp) { for(int i = 0; i < 4; i++) { int r = compareByte(ip[i], beginIp[i]); if(r != 0) return r; } return 0; } /** * 把兩個byte看成無符號數進行比較 * @param b1 * @param b2 * @return 若b1大於b2則返回1,相等返回0,小於返回-1 */ private int compareByte(byte b1, byte b2) { if((b1 & 0xFF) > (b2 & 0xFF)) // 比較是否大於 return 1; else if((b1 ^ b2) == 0)// 判斷是否相等 return 0; else return -1; } /** * 這個方法將根據ip的內容,定位到包含這個ip國家地區的記錄處,返回一個絕對偏移 * 方法使用二分法查找。 * @param ip 要查詢的IP * @return 若是找到了,返回結束IP的偏移,若是沒有找到,返回-1 */ private long locateIP(byte[] ip) { long m = 0; int r; // 比較第一個ip項 readIP(ipBegin, b4); r = compareIP(ip, b4); if(r == 0) return ipBegin; else if(r < 0) return -1; // 開始二分搜索 for(long i = ipBegin, j = ipEnd; i < j; ) { m = getMiddleOffset(i, j); readIP(m, b4); r = compareIP(ip, b4); // log.debug(Utils.getIpStringFromBytes(b)); if(r > 0) i = m; else if(r < 0) { if(m == j) { j -= IP_RECORD_LENGTH; m = j; } else j = m; } else return readLong3(m + 4); } // 若是循環結束了,那麼i和j一定是相等的,這個記錄爲最可能的記錄,可是並不是 // 確定就是,還要檢查一下,若是是,就返回結束地址區的絕對偏移 m = readLong3(m + 4); readIP(m, b4); r = compareIP(ip, b4); if(r <= 0) return m; else return -1; } /** * 獲得begin偏移和end偏移中間位置記錄的偏移 * @param begin * @param end * @return */ private long getMiddleOffset(long begin, long end) { long records = (end - begin) / IP_RECORD_LENGTH; records >>= 1; if(records == 0) records = 1; return begin + records * IP_RECORD_LENGTH; } /** * 給定一個ip國家地區記錄的偏移,返回一個IPLocation結構 * @param offset 國家記錄的起始偏移 * @return IPLocation對象 */ private IPLocation getIPLocation(long offset) { try { // 跳過4字節ip ipFile.seek(offset + 4); // 讀取第一個字節判斷是否標誌字節 byte b = ipFile.readByte(); if(b == REDIRECT_MODE_1) { // 讀取國家偏移 long countryOffset = readLong3(); // 跳轉至偏移處 ipFile.seek(countryOffset); // 再檢查一次標誌字節,由於這個時候這個地方仍然多是個重定向 b = ipFile.readByte(); if(b == REDIRECT_MODE_2) { loc.setCountry ( readString(readLong3())); ipFile.seek(countryOffset + 4); } else loc.setCountry ( readString(countryOffset)); // 讀取地區標誌 loc.setArea( readArea(ipFile.getFilePointer())); } else if(b == REDIRECT_MODE_2) { loc.setCountry ( readString(readLong3())); loc.setArea( readArea(offset + 8)); } else { loc.setCountry ( readString(ipFile.getFilePointer() - 1)); loc.setArea( readArea(ipFile.getFilePointer())); } return loc; } catch (IOException e) { return null; } } /** * 給定一個ip國家地區記錄的偏移,返回一個IPLocation結構,此方法應用與內存映射文件方式 * @param offset 國家記錄的起始偏移 * @return IPLocation對象 */ private IPLocation getIPLocation(int offset) { // 跳過4字節ip mbb.position(offset + 4); // 讀取第一個字節判斷是否標誌字節 byte b = mbb.get(); if(b == REDIRECT_MODE_1) { // 讀取國家偏移 int countryOffset = readInt3(); // 跳轉至偏移處 mbb.position(countryOffset); // 再檢查一次標誌字節,由於這個時候這個地方仍然多是個重定向 b = mbb.get(); if(b == REDIRECT_MODE_2) { loc.setCountry ( readString(readInt3())); mbb.position(countryOffset + 4); } else loc.setCountry ( readString(countryOffset)); // 讀取地區標誌 loc.setArea(readArea(mbb.position())); } else if(b == REDIRECT_MODE_2) { loc.setCountry ( readString(readInt3())); loc.setArea(readArea(offset + 8)); } else { loc.setCountry ( readString(mbb.position() - 1)); loc.setArea(readArea(mbb.position())); } return loc; } /** * 從offset偏移開始解析後面的字節,讀出一個地區名 * @param offset 地區記錄的起始偏移 * @return 地區名字符串 * @throws IOException */ private String readArea(long offset) throws IOException { ipFile.seek(offset); byte b = ipFile.readByte(); if(b == REDIRECT_MODE_1 || b == REDIRECT_MODE_2) { long areaOffset = readLong3(offset + 1); if(areaOffset == 0) return UNKNOWN_AREA; else return readString(areaOffset); } else return readString(offset); } /** * @param offset 地區記錄的起始偏移 * @return 地區名字符串 */ private String readArea(int offset) { mbb.position(offset); byte b = mbb.get(); if(b == REDIRECT_MODE_1 || b == REDIRECT_MODE_2) { int areaOffset = readInt3(); if(areaOffset == 0) return UNKNOWN_AREA; else return readString(areaOffset); } else return readString(offset); } /** * 從offset偏移處讀取一個以0結束的字符串 * @param offset 字符串起始偏移 * @return 讀取的字符串,出錯返回空字符串 */ private String readString(long offset) { try { ipFile.seek(offset); int i; for(i = 0, buf[i] = ipFile.readByte(); buf[i] != 0; buf[++i] = ipFile.readByte()); if(i != 0) return Util.getString(buf, 0, i, "GBK"); } catch (IOException e) { log.error(e.getMessage(), e); } return ""; } /** * 從內存映射文件的offset位置獲得一個0結尾字符串 * @param offset 字符串起始偏移 * @return 讀取的字符串,出錯返回空字符串 */ private String readString(int offset) { try { mbb.position(offset); int i; for(i = 0, buf[i] = mbb.get(); buf[i] != 0; buf[++i] = mbb.get()); if(i != 0) return Util.getString(buf, 0, i, "GBK"); } catch (IllegalArgumentException e) { log.error(e.getMessage(), e); } return ""; } public String getCity(final String ipAddress){ try { if(ipAddress.startsWith("192.168.")){ log.error("此IP[{}]段不進行處理!", ipAddress); return null; } return getIPLocation(ipAddress).getCity(); }catch (Exception e){ log.error("根據IP[{}]獲取省份失敗:{}", ipAddress, e.getMessage()); return null; } } public static void main(String[] args){ IPAddressUtils ip = new IPAddressUtils(); ip.init(); String address = "112.225.35.70"; System.out.println("IP地址["+address + "]獲取到的區域信息:" + ip.getIPLocation(address).getCountry() + ", 獲取到的城市:" + ip.getIPLocation(address).getCity() + ", 運營商:"+ip.getIPLocation(address).getArea()); } }

總結

其實我也是從網絡上找的解析純真庫代碼[http://blog.csdn.net/rockstar541/article/details/7161505] , 固然,個人代碼是在他的基礎上進行優化的,主要的在高併發的狀況下,會出現獲取城市爲空的狀況,因此在如下幾個地方有改進:

  • (1)ipCache初始化的時候使用併發Map
ipCache = new HashMap<>(); 替換爲 ipCache = new ConcurrentHashMap<>();
  • (2)獲取IPLocation對象時進行同步處理,我嘗試過將synchronized關鍵字加到更深或者更淺的方法上,在getIPLocation(String ip) 上加目前最安全,最高效
public IPLocation getIPLocation(String ip) { IPLocation location = new IPLocation(); location.setArea(this.getArea(ip)); location.setCountry(this.getCountry(ip)); return location; } 替換爲 public synchronized IPLocation getIPLocation(final String ip) { IPLocation location = new IPLocation(); location.setArea(this.getArea(ip)); location.setCountry(this.getCountry(ip)); return location; }
相關文章
相關標籤/搜索