軌跡系列8——記某真實項目中軌跡展現查詢效率優化方案一(初步設計)

文章版權由做者李曉暉和博客園共有,若轉載請於明顯處標明出處:http://www.cnblogs.com/naaoveGIS/redis

1.    背景

         準確說,該項目的跡展現涉及到兩個方面,一個是軌跡查詢展現,一個是軌跡信息挖掘展現。隨着軌跡表數據的增長,以及軌跡信息挖掘涉及到的案卷表數據的增長,項目上目前出現了比較明顯的軌跡展現性能問題。數據庫

       這裏,我嘗試從代碼流程邏輯、GPS採集優化、數據庫經常使用優化(軌跡歷史數據遷移和索引創建)、表結構重構,Redis緩存的引用五個方面來進行優化。緩存

2.    代碼流程邏輯優化

2.1公有數據的合理複用

         在最初設計流程時,軌跡展現和軌跡信息挖掘是兩個相對獨立部分,一個負責地圖端的軌跡展現、一個負責提供給業務端(MIS和手機)來調用展現軌跡挖掘信息,因此導致兩個功能成爲了各自獨立的接口。微信

       可是隨着歷史軌跡表數據的激增,這種分離方式出現了明顯的性能弊端——即軌跡查詢結果的複用。性能

       軌跡信息挖掘流程的第一步,須要獲取到待挖掘的全部軌跡點。而這些點在軌跡展現時,就已經獲取到了。以以前的兩個業務獨立的邏輯,將會致使軌跡獲取的重複查詢。測試

       這裏,我建議將流程稍做修改,以下圖所示:優化

   

    

2.2軌跡信息挖掘的查詢瘦身

         在最初的軌跡信息與案卷關聯的挖掘中,咱們最開始查詢四張表:案卷表(dlmis.to_rec)、覈查覈實表(dlmis.to_mi_patrol_task)、歷史案卷表(dlhist.to_his_rec)、歷史覈查覈實表(dlhist.to_his_mi_patrol_task)。可是,通過測試發現歷史案卷表和歷史覈查表每每很大,是查詢的瓶頸所在。因此咱們增長了一個參數(histrec)來進行表的查詢控制。spa

       當histrec值爲false時,查詢案卷表和核查覈實表這一組;當爲ture時,查詢歷史案卷表和歷史覈查覈實表那一組。設計

       因爲系統默認是展現當天軌跡信息挖掘,因此histrec參數爲true,從而避免了初始查詢時對歷史案卷那一組的查詢。blog

3.GPS採集優化

       在GPS採集源頭,經過對行爲者的狀態分析(停留、行走、跑步等),實現對GPS採集頻率的控制。而且經過對GPS信號、位置精度等附加信息分析,過濾掉無效GPS以及室內GPS數據。從而增長有效GPS的同時,實現GPS採集存儲量的減負。

4.數據庫經常使用優化

4.1歷史軌跡遷移

       從業務層面分析,得出針對一個月前的軌跡查詢在業務上來說基本是無做用的(一個月前的績效已考覈、工資已發放)。甚至在該項目現場,七天前的軌跡,也不是業主所關心的。因此這裏採用一個定時任務,在天天深夜(避免遷徙中對正在上傳的軌跡形成影響)進行軌跡的遷徙,軌跡表中只保留最近七天的軌跡,而每個當天的軌跡均移至歷史軌跡表中。據目前初步統計,七天的軌跡量大概在80W條上下,數量獲得很好的控制。

4.2軌跡表上創建索引

       GIS端的軌跡查詢語句爲:

select aa.coordinate_x as coordinatex,aa.coordinate_y as coordinatey,to_char(aa.update_time, 'YYYY-MM-DD HH24:MI:SS') as logtime  from dlmis.tr_log_patrol_pos aa where aa.update_time>= ?  and aa.update_time <? and aa.patrol_id = ? and revised_coord_y<>-1 and aa.coordinate_x>0 and aa.coordinate_y >0 order  by  aa.update_time

       以patrol_id和update_time分別創建索引:

 

5.表結構重構

       針對軌跡遷徙方案,依然存在隱患,即若是真出現須要對一個月前的歷史軌跡查詢時,效率問題沒法迴避。這裏以大表改小表的思路進行發散,在暫時不考慮某些項目上可能形成的影響,提出兩種表結構重構的方案。

5.1分表方案(方案一)

         假設,咱們每隔一週(以一週爲例)創建一個軌跡表,表中只存放該周的軌跡,那麼每週軌跡表中的數據量將大大減小。表的命名以年_周,好比(2017_18,表示2017年18周),在查詢軌跡時,算出查詢時間所對應的軌跡表,進行查詢便可。

5.2軌跡摘要表的運用(方案二)

       提出該方案的設想是,咱們以下降數據冗餘、減小磁盤讀操做,在分析業務的基礎上進行設計。如下爲目前的軌跡表:

 

       咱們觀察歷史軌跡表,能夠發現一我的一天能夠出現一千條數據。這些數據中,人員ID爲重複信息,人員的速度、角度、道路等等均是軌跡查詢中不須要的字段。針對這種現象,咱們提出一個軌跡摘要表的概念,我將該表設計爲以下:

 

Id(流水號)

patrolID(監督員編號)

Date(日期,單位天)

報文(blob二進制)

       其中最核心的是報文,報文中咱們將以(x,y,createtime)的格式,轉換成二進制方式存儲當天的全部有效軌跡。

       這樣,軌跡摘要中針對某個監督員的軌跡信息,將只有一條記錄了。若是要查詢某天的軌跡,咱們只須要date和partolid進行過濾便可得到報文,而後解析報文。同時查詢的效率會大大提升,假設一我的以前一天有1000條數據,那麼如今只有一條數據。以前3個月1000W條數據,那麼如今將只有1W條數據。

       這裏,涉及到報文內容的實時更新,如何能有效實現報文的追加更新呢?這裏,引出咱們的另外一個優化,Redis緩存的應用。

6.Redis的運用

       軌跡的寫入,不管是針對軌跡摘要表,仍是針對原來的軌跡表,均是一個不斷產生開銷的操做。並且針對軌跡表,查詢最高的應該是當天軌跡查詢。因此,針對當天不斷上報的軌跡,咱們能夠將其都先存入redis中,在經過定時任務,於深夜同步寫入至軌跡表中。

       一樣,查詢軌跡時,針對當天軌跡的查詢,也優先從redis中獲取。

7.總結

       該項目的軌跡優化方案,建議以三步走戰略來進行:

       a.先完成代碼邏輯、數據庫經常使用優化,而後觀察效果。

       b.若是效果通常,再進行Redis運用的改造。

       c.最後,代價最大的表結構重構,我的以爲效果會很好,可是極有可能對現有業務等形成影響。

 

                          -----歡迎轉載,但保留版權,請於明顯處標明出處:http://www.cnblogs.com/naaoveGIS/

                                                                            若是您以爲本文確實幫助了您,能夠微信掃一掃,進行小額的打賞和鼓勵,謝謝 ^_^

                                        

相關文章
相關標籤/搜索