本文轉載自 http://hai0378.iteye.com/blog/2213829html
如今不少手機軟件都用附近搜索功能,但具體是怎麼實現的呢?
在網上查了不少資料,mysql空間數據庫、矩形算法、geohash我都用過了,當數據上了百萬以後mysql空間數據庫方法是最強最精確的(查詢前100條數據只需5秒左右)。
接下來推出一個原創計算方法,查詢速度是mysql空間數據庫算法的2倍
$lng是你的經度,$lat是你的緯度java
SELECT lng,lat,
(POWER(MOD(ABS(lng - $lng),360),2) + POWER(ABS(lat - $lat),2)) AS distance
FROM `user_location`
ORDER BY distance LIMIT 100
經測試,在100萬數據中取前100條數據只需2.5秒左右。
####################################
另外的幾種算法仍是在這裏展現一下:python
1、距形算法mysql
define(EARTH_RADIUS, 6371);//地球半徑,平均半徑爲6371km
/**
*計算某個經緯度的周圍某段距離的正方形的四個點
*
*@param lng float 經度
*@param lat float 緯度
*@param distance float 該點所在圓的半徑,該圓與此正方形內切,默認值爲0.5公里
*@return array 正方形的四個點的經緯度座標
*/
function returnSquarePoint($lng, $lat,$distance = 0.5){
$dlng = 2 * asin(sin($distance / (2 * EARTH_RADIUS)) / cos(deg2rad($lat)));
$dlng = rad2deg($dlng);
$dlat = $distance/EARTH_RADIUS;
$dlat = rad2deg($dlat);
return array(
'left-top'=>array('lat'=>$lat + $dlat,'lng'=>$lng-$dlng),
'right-top'=>array('lat'=>$lat + $dlat, 'lng'=>$lng + $dlng),
'left-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng - $dlng),
'right-bottom'=>array('lat'=>$lat - $dlat, 'lng'=>$lng + $dlng)
);
}
//使用此函數計算獲得結果後,帶入sql查詢。
$squares = returnSquarePoint($lng, $lat);
$info_sql = "select id,locateinfo,lat,lng from `lbs_info` where lat<>0 and lat>{$squares['right-bottom']['lat']} and lat<{$squares['left-top']['lat']} and lng>{$squares['left-top']['lng']} and lng<{$squares['right-bottom']['lng']} ";
java代碼以下:git
/** * 默認地球半徑 */
private static double EARTH_RADIUS = 6371; /** * 計算經緯度點對應正方形4個點的座標 * * @param longitude * @param latitude * @param distance * @return
*/
public static Map<String, double[]> returnLLSquarePoint(double longitude, double latitude, double distance) { Map<String, double[]> squareMap = new HashMap<String, double[]>(); // 計算經度弧度,從弧度轉換爲角度
double dLongitude = 2 * (Math.asin(Math.sin(distance / (2 * EARTH_RADIUS)) / Math.cos(Math.toRadians(latitude)))); dLongitude = Math.toDegrees(dLongitude); // 計算緯度角度
double dLatitude = distance / EARTH_RADIUS; dLatitude = Math.toDegrees(dLatitude); // 正方形
double[] leftTopPoint = { latitude + dLatitude, longitude - dLongitude }; double[] rightTopPoint = { latitude + dLatitude, longitude + dLongitude }; double[] leftBottomPoint = { latitude - dLatitude, longitude - dLongitude }; double[] rightBottomPoint = { latitude - dLatitude, longitude + dLongitude }; squareMap.put("leftTopPoint", leftTopPoint); squareMap.put("rightTopPoint", rightTopPoint); squareMap.put("leftBottomPoint", leftBottomPoint); squareMap.put("rightBottomPoint", rightBottomPoint); return squareMap; }
2、 空間數據庫算法redis
如下location字段是跟據經緯度來生成的空間數據,如:
location字段的type設爲point
"update feed set location=GEOMFROMTEXT('point({$lat} {$lng})') where id='{$id}'"
mysql空間數據查詢算法
SET @center = GEOMFROMTEXT('POINT(35.801559 -10.501577)'); SET @radius = 4000; SET @bbox = CONCAT('POLYGON((', X(@center) - @radius, ' ', Y(@center) - @radius, ',', X(@center) + @radius, ' ', Y(@center) - @radius, ',', X(@center) + @radius, ' ', Y(@center) + @radius, ',', X(@center) - @radius, ' ', Y(@center) + @radius, ',', X(@center) - @radius, ' ', Y(@center) - @radius, '))' ); SELECT id,lng,lat, SQRT(POW( ABS( X(location) - X(@center)), 2) + POW( ABS(Y(location) - Y(@center)), 2 )) AS distance FROM `user_location` WHERE 1=1
AND INTERSECTS( location, GEOMFROMTEXT(@bbox) ) AND SQRT(POW( ABS( X(location) - X(@center)), 2) + POW( ABS(Y(location) - Y(@center)), 2 )) < @radius
ORDER BY distance LIMIT 20
3、GEO算法sql
參考文檔:
http://blog.csdn.net/wangxiafghj/article/details/9014363geohash 算法原理及實現方式
http://blog.charlee.li/geohash-intro/ geohash:用字符串實現附近地點搜索
http://blog.sina.com.cn/s/blog_7c05385f0101eofb.html 查找附近點--Geohash方案討論
http://www.wubiao.info/372 查找附近的xxx 球面距離以及Geohash方案探討
http://en.wikipedia.org/wiki/Haversine_formula Haversine formula球面距離公式
http://www.codecodex.com/wiki/Calculate_Distance_Between_Two_Points_on_a_Globe 球面距離公式代碼實現
http://developer.baidu.com/map/jsdemo.htm#a6_1 球面距離公式驗證
http://www.wubiao.info/470 Mysql or Mongodb LBS快速實現方案
geohash有如下幾個特色:
首先,geohash用一個字符串表示經度和緯度兩個座標。某些狀況下沒法在兩列上同時應用索引 (例如MySQL 4以前的版本,Google App Engine的數據層等),利用geohash,只需在一列上應用索引便可。
其次,geohash表示的並非一個點,而是一個矩形區域。好比編碼wx4g0ec19,它表示的是一個矩形區域。 使用者能夠發佈地址編碼,既能代表本身位於北海公園附近,又不至於暴露本身的精確座標,有助於隱私保護。
第三,編碼的前綴能夠表示更大的區域。例如wx4g0ec1,它的前綴wx4g0e表示包含編碼wx4g0ec1在內的更大範圍。 這個特性能夠用於附近地點搜索。首先根據用戶當前座標計算geohash(例如wx4g0ec1)而後取其前綴進行查詢 (SELECT * FROM place WHERE geohash LIKE 'wx4g0e%'),便可查詢附近的全部地點。mongodb
Geohash比直接用經緯度的高效不少。
Geohash算法實現(Java版本)數據庫
package com.DistTest; import java.util.BitSet; import java.util.HashMap; public class Geohash { private static int numbits = 6 * 5; final static char[] digits = { '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'j', 'k', 'm', 'n', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z' }; final static HashMap<Character, Integer> lookup = new HashMap<Character, Integer>(); static { int i = 0; for (char c : digits) lookup.put(c, i++); } public double[] decode(String geohash) { StringBuilder buffer = new StringBuilder(); for (char c : geohash.toCharArray()) { int i = lookup.get(c) + 32; buffer.append( Integer.toString(i, 2).substring(1) ); } BitSet lonset = new BitSet(); BitSet latset = new BitSet(); //even bits int j =0; for (int i=0; i< numbits*2;i+=2) { boolean isSet = false; if ( i < buffer.length() ) isSet = buffer.charAt(i) == '1'; lonset.set(j++, isSet); } //odd bits j=0; for (int i=1; i< numbits*2;i+=2) { boolean isSet = false; if ( i < buffer.length() ) isSet = buffer.charAt(i) == '1'; latset.set(j++, isSet); } //中國地理座標:東經73°至東經135°,北緯4°至北緯53° double lon = decode(lonset, 70, 140); double lat = decode(latset, 0, 60); return new double[] {lat, lon}; } private double decode(BitSet bs, double floor, double ceiling) { double mid = 0; for (int i=0; i<bs.length(); i++) { mid = (floor + ceiling) / 2; if (bs.get(i)) floor = mid; else ceiling = mid; } return mid; } public String encode(double lat, double lon) { BitSet latbits = getBits(lat, 0, 60); BitSet lonbits = getBits(lon, 70, 140); StringBuilder buffer = new StringBuilder(); for (int i = 0; i < numbits; i++) { buffer.append( (lonbits.get(i))?'1':'0'); buffer.append( (latbits.get(i))?'1':'0'); } return base32(Long.parseLong(buffer.toString(), 2)); } private BitSet getBits(double lat, double floor, double ceiling) { BitSet buffer = new BitSet(numbits); for (int i = 0; i < numbits; i++) { double mid = (floor + ceiling) / 2; if (lat >= mid) { buffer.set(i); floor = mid; } else { ceiling = mid; } } return buffer; } public static String base32(long i) { char[] buf = new char[65]; int charPos = 64; boolean negative = (i < 0); if (!negative) i = -i; while (i <= -32) { buf[charPos--] = digits[(int) (-(i % 32))]; i /= 32; } buf[charPos] = digits[(int) (-i)]; if (negative) buf[--charPos] = '-'; return new String(buf, charPos, (65 - charPos)); } }
package com.DistTest; public class Test{ private static final double EARTH_RADIUS = 6371000;//赤道半徑(單位m) /** * 轉化爲弧度(rad) * */ private static double rad(double d) { return d * Math.PI / 180.0; } /** * 基於googleMap中的算法獲得兩經緯度之間的距離,計算精度與谷歌地圖的距離精度差很少,相差範圍在0.2米如下 * @param lon1 第一點的精度 * @param lat1 第一點的緯度 * @param lon2 第二點的精度 * @param lat3 第二點的緯度 * @return 返回的距離,單位m * */ public static double GetDistance(double lon1,double lat1,double lon2, double lat2) { double radLat1 = rad(lat1); double radLat2 = rad(lat2); double a = radLat1 - radLat2; double b = rad(lon1) - rad(lon2); double s = 2 * Math.asin(Math.sqrt(Math.pow(Math.sin(a/2),2)+Math.cos(radLat1)*Math.cos(radLat2)*Math.pow(Math.sin(b/2),2))); s = s * EARTH_RADIUS; s = Math.round(s * 10000) / 10000; return s; } public static void main(String []args){ double lon1=109.0145193757; double lat1=34.236080797698; double lon2=108.9644583556; double lat2=34.286439088548; double dist; String geocode; dist=Test.GetDistance(lon1, lat1, lon2, lat2); System.out.println("兩點相距:" + dist + " 米"); Geohash geohash = new Geohash(); geocode=geohash.encode(lat1, lon1); System.out.println("當前位置編碼:" + geocode); geocode=geohash.encode(lat2, lon2); System.out.println("遠方位置編碼:" + geocode); } //wqj7j37sfu03h2xb2q97 /* 永相逢超市 108.83457500177 34.256981052624 wqj6us6cmkj5bbfj6qdg s6q08ubhhuq7 */ }
package com.DistTest; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Connection; import java.sql.Statement; public class sqlTest { public static void main(String[] args) throws Exception { Connection conn = null; String sql; String url = "jdbc:mysql://132.97.**.**/test?" + "user=***&password=****&useUnicode=true&characterEncoding=UTF8"; try { Class.forName("com.mysql.jdbc.Driver");// 動態加載mysql驅動 // System.out.println("成功加載MySQL驅動程序"); // 一個Connection表明一個數據庫鏈接 conn = DriverManager.getConnection(url); // Statement裏面帶有不少方法,好比executeUpdate能夠實現插入,更新和刪除等 Statement stmt = conn.createStatement(); sql = "select * from retailersinfotable limit 1,10"; ResultSet rs = stmt.executeQuery(sql);// executeQuery會返回結果的集合,不然返回空值 double lon1=109.0145193757; double lat1=34.236080797698; System.out.println("當前位置:"); int i=0; String[][] array = new String[10][3]; while (rs.next()){ //從數據庫取出地理座標 double lon2=Double.parseDouble(rs.getString("Longitude")); double lat2=Double.parseDouble(rs.getString("Latitude")); //根據地理座標,生成geohash編碼 Geohash geohash = new Geohash(); String geocode=geohash.encode(lat2, lon2).substring(0, 9); //計算兩點間的距離 int dist=(int) Test.GetDistance(lon1, lat1, lon2, lat2); array[i][0]=String.valueOf(i); array[i][1]=geocode; array[i][2]=Integer.toString(dist); i++; // System.out.println(lon2+"---"+lat2+"---"+geocode+"---"+dist); } array=sqlTest.getOrder(array); //二維數組排序 sqlTest.showArray(array); //打印數組 } catch (SQLException e) { System.out.println("MySQL操做錯誤"); e.printStackTrace(); } finally { conn.close(); } } /* * 二維數組排序,比較array[][2]的值,返回二維數組 * */ public static String[][] getOrder(String[][] array){ for (int j = 0; j < array.length ; j++) { for (int bb = 0; bb < array.length - 1; bb++) { String[] ss; int a1=Integer.valueOf(array[bb][2]); //轉化成int型比較大小 int a2=Integer.valueOf(array[bb+1][2]); if (a1>a2) { ss = array[bb]; array[bb] = array[bb + 1]; array[bb + 1] = ss; } } } return array; } /*打印數組*/ public static void showArray(String[][] array){ for(int a=0;a<array.length;a++){ for(int j=0;j<array[0].length;j++) System.out.print(array[a][j]+" "); System.out.println(); } } }
一直在琢磨LBS,期待能夠發現更好的方案。如今糾結了。
簡單列舉一下已經瞭解到的方案:
1.sphinx geo索引
2.mongodb geo索引
3.mysql sql查詢
4.mysql+geohash
5.redis+geohash
而後列舉一下需求:
1.實時性要高,有頻繁的更新和讀取
2.可按距離排序支持分頁
3.支持多條件篩選(一個經緯度數據還包含其餘屬性,好比社交系統的性別、年齡)
方案簡單介紹:
1.sphinx geo索引
支持按照距離排序,並支持分頁。可是嘗試mva+geo失敗,還在找緣由。
沒法知足高實時性需求。(多是不瞭解實時增量索引配置有誤)
資源佔用小,速度快
2.mongodb geo索引
支持按照距離排序,並支持分頁。支持多條件篩選。
可知足實時性需求。
資源佔用大,數據量達到百萬級請流量在10w左右查詢速度明顯降低。
3.mysql+geohash/ mysql sql查詢
不支持按照距離排序(代價太大)。支持分頁。支持多條件篩選。
可知足實時性需求。
資源佔用中等,查詢速度不及mongodb。
且geohash按照區塊將球面轉化平面並切割。暫時沒有找到跨區塊查詢方法(不太瞭解)。
4.redis+geohash
geohash缺點再也不贅述
不支持距離排序。支持分頁查詢。不支持多條件篩選。
可知足實時性需求。
資源佔用最小。查詢速度很快。
------update補充一下測試機配置:1TB SATA硬盤。8GB RAM。I3 2350 雙核四線程。