數據庫訪問性能優化(四)

時間 2019-11-08

標籤數據庫訪問性能優化欄目 SQL 简体版

原文原文鏈接

4.2、合理使用排序

Oracle的排序算法一直在優化，可是整體時間複雜度約等於nLog(n)。普通OLTP系統排序操做通常都是在內存裏進行的，對於數據庫來講是一種CPU的消耗，曾在PC機作過測試，單核普通CPU在1秒鐘能夠完成100萬條記錄的全內存排序操做，因此說因爲如今CPU的性能加強，對於普通的幾十條或上百條記錄排序對系統的影響也不會很大。可是當你的記錄集增長到上萬條以上時，你須要注意是否必定要這麼作了，大記錄集排序不只增長了CPU開銷，並且可能會因爲內存不足發生硬盤排序的現象，當發生硬盤排序時性能會急劇降低，這種需求須要與DBA溝通再決定，取決於你的需求和數據，因此只有你本身最清楚，而不要被別人說排序很慢就嚇倒。算法

如下列出了可能會發生排序操做的SQL語法：數據庫

Order by緩存

Group by性能優化

Distinct服務器

Exists子查詢網絡

Not Exists子查詢架構

In子查詢併發

Not In子查詢ide

Union（並集），Union All也是一種並集操做，可是不會發生排序，若是你確認兩個數據集不須要執行去除重複數據操做，那請使用Union All 代替Union。函數

Minus（差集）

Intersect（交集）

Create Index

Merge Join，這是一種兩個錶鏈接的內部算法，執行時會把兩個表先排序好再鏈接，應用於兩個大表鏈接的操做。若是你的兩個錶鏈接的條件都是等值運算，那能夠採用Hash Join來提升性能，由於Hash Join使用Hash 運算來代替排序的操做。具體原理及設置參考SQL執行計劃優化專題。

4.3、減小比較操做

咱們SQL的業務邏輯常常會包含一些比較操做，如a=b，a之類的操做，對於這些比較操做數據庫都體現得很好，可是若是有如下操做，咱們須要保持警戒：

Like模糊查詢，以下所示：

a like ‘c%’

Like模糊查詢對於數據庫來講不是很擅長，特別是你須要模糊檢查的記錄有上萬條以上時，性能比較糟糕，這種狀況通常能夠採用專用Search或者採用全文索引方案來提升性能。

不能使用索引定位的大量In List，以下所示：

a in (:1,:2,:3,…,:n) ----n>20

若是這裏的a字段不能經過索引比較，那數據庫會將字段與in裏面的每一個值都進行比較運算，若是記錄數有上萬以上，會明顯感受到SQL的CPU開銷加大，這個狀況有兩種解決方式：

a、將in列表裏面的數據放入一張中間小表，採用兩個表Hash Join關聯的方式處理；

b、採用str2varList方法將字段串列表轉換一個臨時表處理，關於str2varList方法能夠在網上直接查詢，這裏不詳細介紹。

以上兩種解決方案都須要與中間表Hash Join的方式才能提升性能，若是採用了Nested Loop的鏈接方式性能會更差。

若是發現咱們的系統IO沒問題可是CPU負載很高，就有多是上面的緣由，這種狀況不太常見，若是遇到了最好能和DBA溝通並確認準確的緣由。

4.4、大量複雜運算在客戶端處理

什麼是複雜運算，通常我認爲是一秒鐘CPU只能作10萬次之內的運算。如含小數的對數及指數運算、三角函數、3DES及BASE64數據加密算法等等。

若是有大量這類函數運算，儘可能放在客戶端處理，通常CPU每秒中也只能處理1萬-10萬次這樣的函數運算，放在數據庫內不利於高併發處理。

5、利用更多的資源

5.1、客戶端多進程並行訪問

多進程並行訪問是指在客戶端建立多個進程(線程)，每一個進程創建一個與數據庫的鏈接，而後同時向數據庫提交訪問請求。當數據庫主機資源有空閒時，咱們能夠採用客戶端多進程並行訪問的方法來提升性能。若是數據庫主機已經很忙時，採用多進程並行訪問性能不會提升，反而可能會更慢。因此使用這種方式最好與DBA或系統管理員進行溝通後再決定是否採用。

例如：

咱們有10000個產品ID，如今須要根據ID取出產品的詳細信息，若是單線程訪問，按每一個IO要5ms計算，忽略主機CPU運算及網絡傳輸時間，咱們須要50s才能完成任務。若是採用5個並行訪問，每一個進程訪問2000個ID，那麼10s就有可能完成任務。