分享到 發表於 2013-07-24 04:55 - 0條評論 867 次瀏覽 所屬分類:PHPphp
咱們統計流量的時候須要能夠獲取用戶ip,根據用戶ip以後能夠經過純ip真數據庫QQWry.dat,獲取出用戶IP 所在的地理位置,這樣能夠作出更有意義的統計信息. QQWry.dat請自行搜索下載.html
下面看下如何解析QQWry.dat文件:web
1、文件結構
文件主要分三個結構
一、文件頭,8個字節;
二、數據記錄區,不定長度;
三、索引區,長度爲 7 的整數倍;數據庫
2、文件頭
文件頭的8個字節分兩部分,每一個部分4個字節,分別指定了索引區的開始地址和結束地址。因此能夠經過兩個地址的差值 除 7 後 加 1 能夠計算出總的記錄數。函數
2、記錄區
記錄區的數據須要經過索引區的數據來得到各個數據的起始位置;本區數據記錄了IP地址的結束地址和地區字符串;全部地區字符串都以 0×00 爲結束。post
3、索引區
檢索IP對應的地區,關鍵就是找到IP起始地址對應的索引內容。一個IP索引數據包含7個字節,前4個字節是IP地址起始值,後3個字節是對應的IP數據 記錄在文件內的偏移地址;IP數據記錄中,前 4 個字節是IP結束地址;緊跟的數據有兩種模式: 0×01 模式 和 0×02 模式。this
0×01模式,即在IP數據的第5個字節是 0×01,則在後面的 3 個字節是國家地區數據的偏移地址;國家地區數據包括國家和地區這兩個字符串。即
—————————————————————
4字節 | 3字節 重定向 0x NN NN NN -> 國家地區數據的文件偏移地址
—————————————————————編碼
0×02模式,即在IP數據的第5個字節是 0×02,則在後面的 3 個字節是國家數據的偏移地址,地區數據是再日後的字符串,以 0×00 截至。即
—————————————————————————–
4字節 | 3字節 重定向 0x NN NN NN -> 國家數據的文件偏移地址 | 地區字符串 | 0×00
—————————————————————————–spa
對於 0×01 模式所獲得的 國家地區數據中,它可能又帶有一個重定向結構,即
————————————–
國家字符串 | 0×00 | 地區字符串 | 0×00
————————————–
或
————————————————————————-
國家字符串 | 0×00 | 0×02 | 3字節 0x NN NN NN -> 地區字符串的文件偏移地址
————————————————————————-.net
對於前一種狀況,比較簡單,直接讀出兩個字符串數據就能夠了;對於後一種狀況,須要再次重定向到地區字符串的偏移地址,而後讀取到 0×00 爲字符串結尾。
對於這種採起地址映射實際字符串值的方式,主要做用是避免重複記錄字符串值。在整個IP地址庫文件中,有太多相同字符串記錄了,採用 3 字節的映射地址要比重複記錄字符串值節省太多空間了。
<?php
/**
* IP 地理位置查詢類
*
* @author 馬秉堯
* @version 1.5
* @copyright 2005 CoolCode.CN
*/
class IpLocation {
/**
* QQWry.Dat文件指針
* @var resource
*/
var $fp;
/**
* 第一條IP記錄的偏移地址
* @var int
*/
var $firstip;
/**
* 最後一條IP記錄的偏移地址
* @var int
*/
var $lastip;
/**
* IP記錄的總條數(不包含版本信息記錄)
* @var int
*/
var $totalip;
/**
* 構造函數,打開 QQWry.Dat 文件並初始化類中的信息
* @param string $filename
* @return IpLocation
*/
function __construct($filename = "qqwry.dat") {
$this->fp = 0;
if (($this->fp = @fopen($filename, 'rb')) !== false) {
$this->firstip = $this->getlong();
$this->lastip = $this->getlong();
$this->totalip = ($this->lastip - $this->firstip) / 7;
//註冊析構函數,使其在程序執行結束時執行
register_shutdown_function(array(&$this, '__construct'));
}
}
/**
* 返回讀取的長整型數
* @access private
* @return int
*/
function getlong() {
//將讀取的little-endian編碼的4個字節轉化爲長整型數
$result = unpack('Vlong', fread($this->fp, 4));
return $result['long'];
}
/**
* 返回讀取的3個字節的長整型數
*
* @access private
* @return int
*/
function getlong3() {
//將讀取的little-endian編碼的3個字節轉化爲長整型數
$result = unpack('Vlong', fread($this->fp, 3).chr(0));
return $result['long'];
}
/**
* 返回壓縮後可進行比較的IP地址
*
* @access private
* @param string $ip
* @return string
*/
function packip($ip) {
// 將IP地址轉化爲長整型數,若是在PHP5中,IP地址錯誤,則返回False,
// 這時intval將Flase轉化爲整數-1,以後壓縮成big-endian編碼的字符串
return pack('N', intval(ip2long($ip)));
}
/**
* 返回讀取的字符串
*
* @access private
* @param string $data
* @return string
*/
function getstring($data = "") {
$char = fread($this->fp, 1);
while (ord($char) > 0) { // 字符串按照C格式保存,以結束
$data .= $char; // 將讀取的字符鏈接到給定字符串以後
$char = fread($this->fp, 1);
}
return $data;
}
/**
* 返回地區信息
*
* @access private
* @return string
*/
function getarea() {
$byte = fread($this->fp, 1); // 標誌字節
switch (ord($byte)) {
case 0: // 沒有區域信息
$area = "";
break;
case 1:
case 2: // 標誌字節爲1或2,表示區域信息被重定向
fseek($this->fp, $this->getlong3());
$area = $this->getstring();
break;
default: // 不然,表示區域信息沒有被重定向
$area = $this->getstring($byte);
break;
}
return $area;
}
/**
* 根據所給 IP 地址或域名返回所在地區信息
* @access public
* @param string $ip
* @return array
*/
function getlocation($ip) {
if (!$this->fp) return null; // 若是數據文件沒有被正確打開,則直接返回空
$location['ip'] = gethostbyname($ip); // 將輸入的域名轉化爲IP地址
$ip = $this->packip($location['ip']); // 將輸入的IP地址轉化爲可比較的IP地址
// 不合法的IP地址會被轉化爲255.255.255.255
// 對分搜索
$l = 0; // 搜索的下邊界
$u = $this->totalip; // 搜索的上邊界
$findip = $this->lastip; // 若是沒有找到就返回最後一條IP記錄(QQWry.Dat的版本信息)
while ($l <= $u) { // 當上邊界小於下邊界時,查找失敗
$i = floor(($l + $u) / 2); // 計算近似中間記錄
fseek($this->fp, $this->firstip + $i * 7);
$beginip = strrev(fread($this->fp, 4)); // 獲取中間記錄的開始IP地址
// strrev函數在這裏的做用是將little-endian的壓縮IP地址轉化爲big-endian的格式
// 以便用於比較,後面相同。
if ($ip < $beginip) { // 用戶的IP小於中間記錄的開始IP地址時
$u = $i - 1; // 將搜索的上邊界修改成中間記錄減一
}
else {
fseek($this->fp, $this->getlong3());
$endip = strrev(fread($this->fp, 4)); // 獲取中間記錄的結束IP地址
if ($ip > $endip) { // 用戶的IP大於中間記錄的結束IP地址時
$l = $i + 1; // 將搜索的下邊界修改成中間記錄加一
}
else { // 用戶的IP在中間記錄的IP範圍內時
$findip = $this->firstip + $i * 7;
break; // 則表示找到結果,退出循環
}
}
}
//獲取查找到的IP地理位置信息
fseek($this->fp, $findip);
$location['beginip'] = long2ip($this->getlong()); // 用戶IP所在範圍的開始地址
$offset = $this->getlong3();
fseek($this->fp, $offset);
$location['endip'] = long2ip($this->getlong()); // 用戶IP所在範圍的結束地址
$byte = fread($this->fp, 1); // 標誌字節
switch (ord($byte)) {
case 1: // 標誌字節爲1,表示國家和區域信息都被同時重定向
$countryOffset = $this->getlong3(); // 重定向地址
fseek($this->fp, $countryOffset);
$byte = fread($this->fp, 1); // 標誌字節
switch (ord($byte)) {
case 2: // 標誌字節爲2,表示國家信息又被重定向
fseek($this->fp, $this->getlong3());
$location['country'] = $this->getstring();
fseek($this->fp, $countryOffset + 4);
$location['area'] = $this->getarea();
break;
default: // 不然,表示國家信息沒有被重定向
$location['country'] = $this->getstring($byte);
$location['area'] = $this->getarea();
break;
}
break;
case 2: // 標誌字節爲2,表示國家信息被重定向
fseek($this->fp, $this->getlong3());
$location['country'] = $this->getstring();
fseek($this->fp, $offset + 8);
$location['area'] = $this->getarea();
break;
default: // 不然,表示國家信息沒有被重定向
$location['country'] = $this->getstring($byte);
$location['area'] = $this->getarea();
break;
}
if ($location['country'] == " CZ88.NET") { // CZ88.NET表示沒有有效信息
$location['country'] = "未知";
}
if ($location['area'] == " CZ88.NET") {
$location['area'] = "";
}
return $location;
}
/**
* 析構函數,用於在頁面執行結束後自動關閉打開的文件。
*
*/
function __desctruct() {
if ($this->fp) {
fclose($this->fp);
}
$this->fp = 0;
}
}