昨天一位粉絲和我討論了一道面試題,我的以爲比較有意義,這裏整理了一下分享給你們,願小夥伴們面試路上少踩坑。面試題目比較簡單:「讓你實現一個附近的人功能,你有什麼方案?」,這道題其實主要仍是考察你們對於技術的廣度,本文介紹幾種方案,給你們一點思路,避免在面試過程當中語塞而影響面試結果,若有不嚴謹之處,還望親人們溫柔指正!mysql
「附近的人」 功能生活中是比較經常使用的,像外賣app附近的餐廳,共享單車app裏附近的車輛。既然經常使用面試被問的機率就很大,因此下邊依次來分析基於mysql數據庫、Redis、 MongoDB實現的 「附近的人」 功能。 科普:世界上標識一個位置,通用的作法就使用經、緯度。經度的範圍在 (-180, 180],緯度的範圍 在(-90, 90],緯度正負以赤道爲界,北正南負,經度正負以本初子午線 (英國格林尼治天文臺) 爲界,東正西負。好比:望京摩托羅拉大廈的經、緯度(116.49141,40.01229)全是正數,就是由於我國位於東北半球。git
「附近的人」 也就是常說的 LBS (Location Based Services,基於位置服務),它圍繞用戶當前地理位置數據而展開的服務,爲用戶提供精準的增值服務。面試
「附近的人」 核心思想以下:redis
以 「我」 爲中心,搜索附近的用戶算法
以 「我」 當前的地理位置爲準,計算出別人和 「我」 之間的距離spring
按 「我」 與別人距離的遠近排序,篩選出離我最近的用戶或者商店等 sql
在說 「附近的人」 功能的具體實現以前,先來認識一下GeoHash 算法,由於後邊會一直和它打交道。定位一個位置最好的辦法就是用經、緯度標識,但經、緯度它是二維的,在進行位置計算的時候仍是很麻煩,若是能經過某種方法將二維的經、緯度數據轉換成一維的數據,那麼比較起來就要容易的多,所以GeoHash算法應運而生。數據庫
GeoHash算法將二維的經、緯度轉換成一個字符串,例如:下圖中9個GeoHash字符串表明了9個區域,每個字符串表明了一矩形區域。而這個矩形區域內其餘的點(經、緯度)都用同一個GeoHash字符串表示。json
好比:WX4ER區域內的用戶搜索附近的餐廳數據,因爲這區域內用戶的GeoHash字符串都是WX4ER,故能夠把WX4ER看成key,餐廳信息做爲value進行緩存;而若是不使用GeoHash算法,區域內的用戶請求餐廳數據,用戶傳來的經、緯度都是不一樣的,這樣緩存不只麻煩且數據量巨大。緩存
GeoHash字符串越長,表示的位置越精確,字符串長度越長表明在距離上的偏差越小。下圖geohash碼精度表:
geohash碼長度 | 寬度 | 高度 |
---|---|---|
1 | 5,009.4km | 4,992.6km |
2 | 1,252.3km | 624.1km |
3 | 156.5km | 156km |
4 | 39.1km | 19.5km |
5 | 4.9km | 4.9km |
6 | 1.2km | 609.4m |
7 | 152.9m | 152.4m |
8 | 38.2m | 19m |
9 | 4.8m | 4.8m |
10 | 1.2m | 59.5cm |
11 | 14.9cm | 14.9cm |
12 | 3.7cm | 1.9cm |
並且字符串越類似表示距離越相近,字符串前綴匹配越多的距離越近。好比:下邊的經、緯度就表明了三家距離相近的餐廳。
商戶 | 經緯度 | Geohash字符串 |
---|---|---|
串串香 | 116.402843,39.999375 | wx4er9v |
火鍋 | 116.3967,39.99932 | wx4ertk |
烤肉 | 116.40382,39.918118 | wx4erfe |
讓你們簡單瞭解什麼是GeoHash算法,方便後邊內容展開,GeoHash算法內容比較高深,感興趣的小夥伴自行深耕一下,這裏不佔用過多篇幅(實際上是我懂得太膚淺,哭唧唧~)。
此種方式是純基於mysql實現的,未使用GeoHash算法。
以用戶爲中心,假設給定一個500米的距離做爲半徑畫一個圓,這個圓型區域內的全部用戶就是符合用戶要求的 「附近的人」。但有一個問題是圓形有弧度啊,直接搜索圓形區域難度太大,根本沒法用經、緯度直接搜索。
但若是在圓形外套上一個正方形,經過獲取用戶經、緯度的最大最小值(經、緯度 + 距離),再根據最大最小值做爲篩選條件,就很容易將正方形內的用戶信息搜索出來。
那麼問題又來了,多出來一些面積腫麼辦?
咱們來分析一下,多出來的這部分區域內的用戶,到圓點的距離必定比圓的半徑要大,那麼咱們就計算用戶中心點與正方形內全部用戶的距離,篩選出全部距離小於等於半徑的用戶,圓形區域內的所用戶即符合要求的「附近的人」。
純基於 mysql 實現 「附近的人」,優勢顯而易見就是簡單,只要建一張表存下用戶的經、緯度信息便可。缺點也很明顯,須要大量的計算兩個點之間的距離,很是影響性能。
建立一個簡單的表用來存放用戶的經、緯度屬性。
CREATE TABLE `nearby_user` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(255) DEFAULT NULL COMMENT '名稱', `longitude` double DEFAULT NULL COMMENT '經度', `latitude` double DEFAULT NULL COMMENT '緯度', `create_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '建立時間', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
計算兩個點之間的距離,用了一個三方的類庫,畢竟本身造的輪子不是特別圓,還有多是方的,啊哈哈哈~
<dependency> <groupId>com.spatial4j</groupId> <artifactId>spatial4j</artifactId> <version>0.5</version> </dependency>
獲取到外接正方形後,以正方形的最大最小經、緯度值搜索正方形區域內的用戶,再剔除超過指定距離的用戶,就是最終的附近的人。
private SpatialContext spatialContext = SpatialContext.GEO; /** * 獲取附近 x 米的人 * * @param distance 搜索距離範圍 單位km * @param userLng 當前用戶的經度 * @param userLat 當前用戶的緯度 */ @GetMapping("/nearby") public String nearBySearch(@RequestParam("distance") double distance, @RequestParam("userLng") double userLng, @RequestParam("userLat") double userLat) { //1.獲取外接正方形 Rectangle rectangle = getRectangle(distance, userLng, userLat); //2.獲取位置在正方形內的全部用戶 List<User> users = userMapper.selectUser(rectangle.getMinX(), rectangle.getMaxX(), rectangle.getMinY(), rectangle.getMaxY()); //3.剔除半徑超過指定距離的多餘用戶 users = users.stream() .filter(a -> getDistance(a.getLongitude(), a.getLatitude(), userLng, userLat) <= distance) .collect(Collectors.toList()); return JSON.toJSONString(users); } private Rectangle getRectangle(double distance, double userLng, double userLat) { return spatialContext.getDistCalc() .calcBoxByDistFromPt(spatialContext.makePoint(userLng, userLat), distance * DistanceUtils.KM_TO_DEG, spatialContext, null); }
因爲用戶間距離的排序是在業務代碼中實現的,能夠看到SQL語句也很是的簡單。
<select id="selectUser" resultMap="BaseResultMap"> SELECT * FROM user WHERE 1=1 and (longitude BETWEEN ${minlng} AND ${maxlng}) and (latitude BETWEEN ${minlat} AND ${maxlat}) </select>
這種方式的設計思路更簡單,在存用戶位置信息時,根據用戶經、緯度屬性計算出相應的geohash字符串。注意:在計算geohash字符串時,須要指定geohash字符串的精度,也就是geohash字符串的長度,參考上邊的geohash精度表。
當須要獲取附近的人,只需用當前用戶geohash字符串,數據庫經過WHERE geohash Like 'geocode%' 來查詢geohash字符串類似的用戶,而後計算當前用戶與搜索出的用戶距離,篩選出全部距離小於等於指定距離(附近500米)的,即附近的人。
利用 GeoHash算法實現「附近的人」有一個問題,因爲geohash算法將地圖分爲一個個矩形,對每一個矩形進行編碼,獲得geohash字符串。可我當前的點與鄰近的點很近,但剛好咱們分別在兩個區域,明明就在眼前的點恰恰搜不到,實實在在的燈下黑。
如何解決這一問題?
爲了不相似鄰近兩點在不一樣區域內,咱們就須要同時獲取當前點(WX4G0)所在區域附近 8個區域的geohash碼,一併進行篩選比較。
一樣要設計一張表存用戶的經、緯度信息,但區別是要多一個geo_code字段,存放geohash字符串,此字段經過用戶經、緯度屬性計算出。使用頻繁的字段建議加上索引。
CREATE TABLE `nearby_user_geohash` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(255) DEFAULT NULL COMMENT '名稱', `longitude` double DEFAULT NULL COMMENT '經度', `latitude` double DEFAULT NULL COMMENT '緯度', `geo_code` varchar(64) DEFAULT NULL COMMENT '經緯度所計算的geohash碼', `create_time` datetime DEFAULT NULL ON UPDATE CURRENT_TIMESTAMP COMMENT '建立時間', PRIMARY KEY (`id`), KEY `index_geo_hash` (`geo_code`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;
首先根據用戶經、緯度信息,在指定精度後計算用戶座標的geoHash碼,再獲取到用戶周邊8個方位的geoHash碼在數據庫中搜索用戶,最後過濾掉超出給定距離(500米內)的用戶。
private SpatialContext spatialContext = SpatialContext.GEO; /*** * 添加用戶 * @return */ @PostMapping("/addUser") public boolean add(@RequestBody UserGeohash user) { //默認精度12位 String geoHashCode = GeohashUtils.encodeLatLon(user.getLatitude(),user.getLongitude()); return userGeohashService.save(user.setGeoCode(geoHashCode).setCreateTime(LocalDateTime.now())); } /** * 獲取附近指定範圍的人 * * @param distance 距離範圍(附近多遠的用戶) 單位km * @param len geoHash的精度(幾位的字符串) * @param userLng 當前用戶的經度 * @param userLat 當前用戶的緯度 * @return json */ @GetMapping("/nearby") public String nearBySearch(@RequestParam("distance") double distance, @RequestParam("len") int len, @RequestParam("userLng") double userLng, @RequestParam("userLat") double userLat) { //1.根據要求的範圍,肯定geoHash碼的精度,獲取到當前用戶座標的geoHash碼 GeoHash geoHash = GeoHash.withCharacterPrecision(userLat, userLng, len); //2.獲取到用戶周邊8個方位的geoHash碼 GeoHash[] adjacent = geoHash.getAdjacent(); QueryWrapper<UserGeohash> queryWrapper = new QueryWrapper<UserGeohash>() .likeRight("geo_code",geoHash.toBase32()); Stream.of(adjacent).forEach(a -> queryWrapper.or().likeRight("geo_code",a.toBase32())); //3.匹配指定精度的geoHash碼 List<UserGeohash> users = userGeohashService.list(queryWrapper); //4.過濾超出距離的 users = users.stream() .filter(a ->getDistance(a.getLongitude(),a.getLatitude(),userLng,userLat)<= distance) .collect(Collectors.toList()); return JSON.toJSONString(users); } /*** * 球面中,兩點間的距離 * @param longitude 經度1 * @param latitude 緯度1 * @param userLng 經度2 * @param userLat 緯度2 * @return 返回距離,單位km */ private double getDistance(Double longitude, Double latitude, double userLng, double userLat) { return spatialContext.calcDistance(spatialContext.makePoint(userLng, userLat), spatialContext.makePoint(longitude, latitude)) * DistanceUtils.DEG_TO_KM; }
Redis 3.2版本之後,基於geohash和數據結構Zset提供了地理位置相關功能。經過上邊兩種mysql的實現方式發現,附近的人功能是明顯的讀多寫少場景,因此用redis性能更會有很大的提高。
redis 實現附近的人功能主要經過Geo模塊的六個命令。
以GEOADD 命令和GEORADIUS 命令簡單舉例:
GEOADD key longitude latitude member [longitude latitude member ...]
其中,key爲集合名稱,member爲該經緯度所對應的對象。
GEOADD 添加多個商戶「火鍋店」位置信息:
GEOADD hotel 119.98866180732716 30.27465803229662 火鍋店
GEORADIUS 根據給定的經緯度爲中心,獲取目標集合中與中心的距離不超過給定最大距離(500米內)的全部位置對象,也就是「附近的人」。
GEORADIUS key longitude latitude radius m|km|ft|mi [WITHCOORD] [WITHDIST] [WITHHASH] [ASC|DESC] [COUNT count] [STORE key] [STORedisT key]
範圍單位:m | km | ft | mi --> 米 | 公里 | 英尺 | 英里。
例以下邊命令:獲取當前位置周邊500米內的全部飯店。
GEORADIUS hotel 119.98866180732716 30.27465803229662 500 m WITHCOORD
Redis內部使用有序集合(zset)保存用戶的位置信息,zset中每一個元素都是一個帶位置的對象,元素的score值爲經過經、緯度計算出的52位geohash值。
redis實現附近的人效率比較高,集成也比較簡單,並且還支持對距離排序。不過,結果存在必定的偏差,要想讓結果更加精確,還須要手動將用戶中心位置與其餘用戶位置計算距離後,再一次進行篩選。
如下就是Java redis實現版本,代碼很是的簡潔。
@Autowired private RedisTemplate<String, Object> redisTemplate; //GEO相關命令用到的KEY private final static String KEY = "user_info"; public boolean save(User user) { Long flag = redisTemplate.opsForGeo().add(KEY, new RedisGeoCommands.GeoLocation<>( user.getName(), new Point(user.getLongitude(), user.getLatitude())) ); return flag != null && flag > 0; } /** * 根據當前位置獲取附近指定範圍內的用戶 * @param distance 指定範圍 單位km ,可根據{@link org.springframework.data.geo.Metrics} 進行設置 * @param userLng 用戶經度 * @param userLat 用戶緯度 * @return */ public String nearBySearch(double distance, double userLng, double userLat) { List<User> users = new ArrayList<>(); // 1.GEORADIUS獲取附近範圍內的信息 GeoResults<RedisGeoCommands.GeoLocation<Object>> reslut = redisTemplate.opsForGeo().radius(KEY, new Circle(new Point(userLng, userLat), new Distance(distance, Metrics.KILOMETERS)), RedisGeoCommands.GeoRadiusCommandArgs.newGeoRadiusArgs() .includeDistance() .includeCoordinates().sortAscending()); //2.收集信息,存入list List<GeoResult<RedisGeoCommands.GeoLocation<Object>>> content = reslut.getContent(); //3.過濾掉超過距離的數據 content.forEach(a-> users.add( new User().setDistance(a.getDistance().getValue()) .setLatitude(a.getContent().getPoint().getX()) .setLongitude(a.getContent().getPoint().getY()))); return JSON.toJSONString(users); }
MongoDB實現附近的人,主要是經過它的兩種地理空間索引 2dsphere 和 2d。 兩種索引的底層依然是基於Geohash來進行構建的。但與國際通用的Geohash還有一些不一樣,具體參考官方文檔。
2dsphere 索引僅支持球形表面的幾何形狀查詢。
2d 索引支持平面幾何形狀和一些球形查詢。雖然2d 索引支持某些球形查詢,但 2d 索引對這些球形查詢時,可能會出錯。因此球形查詢儘可能選擇 2dsphere索引。
儘管兩種索引的方式不一樣,但只要座標跨度不太大,這兩個索引計算出的距離相差幾乎能夠忽略不計。
首先插入一批位置數據到MongoDB, collection爲起名 hotel,至關於MySQL的表名。兩個字段name名稱,location 爲經、緯度數據對。
db.hotel.insertMany([ {'name':'hotel1', location:[115.993121,28.676436]}, {'name':'hotel2', location:[116.000093,28.679402]}, {'name':'hotel3', location:[115.999967,28.679743]}, {'name':'hotel4', location:[115.995593,28.681632]}, {'name':'hotel5', location:[115.975543,28.679509]}, {'name':'hotel6', location:[115.968428,28.669368]}, {'name':'hotel7', location:[116.035262,28.677037]}, {'name':'hotel8', location:[116.024770,28.68667]}, {'name':'hotel9', location:[116.002384,28.683865]}, {'name':'hotel10', location:[116.000821,28.68129]}, ])
接下來咱們給 location 字段建立一個2d索引,索引的精度經過bits來指定,bits越大,索引的精度就越高。
db.coll.createIndex({'location':"2d"}, {"bits":11111})
用geoNear 命令測試一下, near 當前座標(經、緯度),spherical 是否計算球面距離,distanceMultiplier地球半徑,單位是米,默認6378137, maxDistance 過濾條件(指定距離內的用戶),開啓弧度需除distanceMultiplier,distanceField 計算出的兩點間距離,字段別名(隨意取名)。
db.hotel.aggregate({ $geoNear:{ near: [115.999567,28.681813], // 當前座標 spherical: true, // 計算球面距離 distanceMultiplier: 6378137, // 地球半徑,單位是米,那麼的除的記錄也是米 maxDistance: 2000/6378137, // 過濾條件2000米內,須要弧度 distanceField: "distance" // 距離字段別名 } })
看到結果中有符合條件的數據,還多出一個字段distance 剛纔設置的別名,表明兩點間的距離。
{ "_id" : ObjectId("5e96a5c91b8d4ce765381e58"), "name" : "hotel10", "location" : [ 116.000821, 28.68129 ], "distance" : 135.60095397487655 } { "_id" : ObjectId("5e96a5c91b8d4ce765381e51"), "name" : "hotel3", "location" : [ 115.999967, 28.679743 ], "distance" : 233.71915803517447 } { "_id" : ObjectId("5e96a5c91b8d4ce765381e50"), "name" : "hotel2", "location" : [ 116.000093, 28.679402 ], "distance" : 273.26317035334176 } { "_id" : ObjectId("5e96a5c91b8d4ce765381e57"), "name" : "hotel9", "location" : [ 116.002384, 28.683865 ], "distance" : 357.5791936927476 } { "_id" : ObjectId("5e96a5c91b8d4ce765381e52"), "name" : "hotel4", "location" : [ 115.995593, 28.681632 ], "distance" : 388.62555058249967 } { "_id" : ObjectId("5e96a5c91b8d4ce765381e4f"), "name" : "hotel1", "location" : [ 115.993121, 28.676436 ], "distance" : 868.6740526419927 }
本文重點並非在具體實現,旨在給你們提供一些設計思路,面試中可能你對某一項技術瞭解的並不深刻,但若是你的知識面寬,能夠從多方面說出多種設計的思路,可以侃侃而談,那麼會給面試官極大的好感度,拿到offer的機率就會高不少。並且「附近的人」 功能使用的場景比較多,尤爲是像電商平臺應用更爲普遍,因此想要進大廠的同窗,這類的知識點仍是應該有所瞭解的。