PHP,Mysql-根據一個給定經緯度的點,進行附近地點查詢–合理利用算法,效率提升2125倍

目前的工做是須要對用戶的一些數據進行分析,每一個用戶都有若干條記錄,每條記錄中有用戶的一個位置,是用經度和緯度表示的。
還有一個給定的數據庫,存儲的是一些已知地點以及他們的經緯度,內有43W多條的數據。
如今須要拿用戶的經緯度和已知地點進行距離匹配,若是它們之間的距離小於必定的數據,好比說500米,就認爲用戶是在這個地點。
MYSQL自己是支持空間索引的,可是在5.x的版本中,取消了對Distance()和Related()的支持,參考這裏:MySQL 5.1參考手冊 :: 19. 中的空間擴展 19.5.6. 測試幾何類之間空間關係的函數, 沒法使用空間的距離函數去直接去查詢距離在必定範圍內的點。因此,我首先想到的是,對每條記錄,去進行遍歷,跟數據庫中的每個點進行距離計算,當距離小 於500米時,認爲匹配。這樣作確實可以獲得結果,可是效率極其低下,由於每條記錄都要去循環匹配40W條數據,其消耗的時間可想而知。通過記錄,發現每 條記錄處理的時間消耗達到1700ms,針對天天上億的數據量,這樣一個處理速度,讓人情何以堪啊。。。
我本身也有個想法,就是找到每條記錄所在點的經緯度周圍的一個大概範圍,比方說正方形的四個點,而後使用mysql的空間計算,使用MBR去得出點在這個矩形內的已知記錄,而後進行匹配。惋惜,本身沒想出能計算到四個點經緯度的方法。
意外的,查詢到了一個關於這個計算附近地點搜索初探,裏面使用python實現了這個想法。
因此參考了一下原文中的算法,使用PHP進行了實現。
實現原理也是很類似的,先算出該點周圍的矩形的四個點,而後使用經緯度去直接匹配數據庫中的記錄。
php

紅色部分爲要求的搜索範圍,綠色部分咱們能間接獲得的結果範圍

紅色部分爲要求的搜索範圍,綠色部分咱們能間接獲得的結果範圍html

 

參考wiki百科上的一些球面計算公式:python

假設已知點的經緯度分別爲$lng, $lat
先實現經度範圍的查詢,
在haversin公式中令φ1 = φ2,可得:

用PHP進行計算,就是:mysql

Example
1
2
3
//$lat 已知點的緯度
$dlng =  2 * asin(sin( $distance / (2 * EARTH_RADIUS)) / cos ( deg2rad ( $lat )));
$dlng = rad2deg( $dlng ); //轉換弧度

而後是緯度範圍的查詢,
在haversin公式中令 Δλ = 0,可得

在PHP中進行計算,就是:算法

Example
1
2
$dlat = $distance /EARTH_RADIUS; //EARTH_RADIUS地球半徑
$dlat = rad2deg( $dlat ); //轉換弧度

最後,就能夠得出四個點的座標:
left-top : (lat + dlat, lng – dlng)
right-top : (lat + dlat, lng + dlng)
left-bottom : (lat – dlat, lng – dlng)
right-bottom: (lat – dlat, lng + dlng)sql

我把以上方法寫成了一個函數,綜合起來就是:數據庫

Example
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
define(EARTH_RADIUS, 6371); //地球半徑,平均半徑爲6371km
  /**
  *計算某個經緯度的周圍某段距離的正方形的四個點
  *
  *@param lng float 經度
  *@param lat float 緯度
  *@param distance float 該點所在圓的半徑,該圓與此正方形內切,默認值爲0.5公里
  *@return array 正方形的四個點的經緯度座標
  */
  function returnSquarePoint( $lng , $lat , $distance = 0.5){
 
     $dlng =  2 * asin(sin( $distance / (2 * EARTH_RADIUS)) / cos ( deg2rad ( $lat )));
     $dlng = rad2deg( $dlng );
     
     $dlat = $distance /EARTH_RADIUS;
     $dlat = rad2deg( $dlat );
     
     return array (
                 'left-top' => array ( 'lat' => $lat + $dlat , 'lng' => $lng - $dlng ),
                 'right-top' => array ( 'lat' => $lat + $dlat , 'lng' => $lng + $dlng ),
                 'left-bottom' => array ( 'lat' => $lat - $dlat , 'lng' => $lng - $dlng ),
                 'right-bottom' => array ( 'lat' => $lat - $dlat , 'lng' => $lng + $dlng )
                 );
  }
//使用此函數計算獲得結果後,帶入sql查詢。
$squares = returnSquarePoint( $lng , $lat );
$info_sql = "select id,locateinfo,lat,lng from `lbs_info` where lat<>0 and lat>{$squares['right-bottom']['lat']} and lat<{$squares['left-top']['lat']} and lng>{$squares['left-top']['lng']} and lng<{$squares['right-bottom']['lng']} " ;

在lat和lng上創建一個聯合索引後,使用此項查詢,每條記錄的查詢消耗平均爲0.8毫秒,相比之前的1700ms,真的是天壤之別啊。效率真真的是之前的2125倍~~函數

總結:這應該也不是效率最好的辦法,可是效率比之前確實有明顯的提高。請記住,總有辦法更好的。測試

原文連接:http://digdeeply.org/archives/06152067.htmlspa

相關文章
相關標籤/搜索