「今天咱們見證了數據的爆炸式增加:社交媒體數據、系統數據、CRM數據以及大量網絡數據。然而, 在大多數狀況下,這些數據告訴了咱們用戶行爲的常見模式。 數據的異常變化多是咱們系統中的故障或用戶流失的「癥結」所在。算法
如何識別數據海洋中的「暗礁」是用戶行爲異常行爲分析所要探討的問題。網絡
▼網站
▍什麼是異常檢測?spa
異常檢測是在數據中找到不符合「正常」的行爲模式的過程。在時間序列數據中檢測到與預期行爲有誤差的數據對於確保系統的正常運行很是重要。blog
通常來講,異常能夠分紅兩種:it
▍全局異常/局部異常class
局部異常方法
不少時候咱們能夠看到數據的潛在趨勢,看起來像一個「波浪」:早上的活動不足,白天很高,晚上很低。 局部異常發生在這種狀況下。 例如:晚上的高活動意味着異常。im
全局異常總結
這是咱們最熟悉的那種異常現象。 這是一個隨機出如今日常時間的異常現象。 通常使用95%分位數就能夠檢測到。
▍異常檢測方法
咱們使用歷史數據來構建由每一個被監測的數據的估計值。將實時數據與這些值進行比較,並分配一個分數。
基於從最近的數據觀察獲得的閾值,決定實時數據是否爲異常。這種方法的優勢是閾值不是靜態的,而是實時的。
檢測場景:
tecdat的解決方案從收集網站的行爲數據開始。衡量趨勢的三個主要組成部分,即固定趨勢、週期趨勢和季節性數據,分別進行了總結,該算法查找到數據中的異常,向用戶發送自動實時警報。
經過實時的異常數據監測,咱們能夠清楚地看到網站流量的差別,在發生異常情況時迅速進行故障排除和修復,減小網站停機,減小潛在客戶的流失。