Pattern Evaluation

對相關性patten質量的經常使用分析指標有如下這些blog

其中,X^2 跟 lift不是null-invariant的,也就是說當~A~B項較多時,這兩個指標不是很可靠。io

據Jiawei Han所言,Kulczynski這個指標是比較穩定而好用的,同時還要輔助觀察imbalance ratio來看評價結果的爭議程度im

一個具體使用例子爲:d3

最後總結一下:總結

咱們進行Patten Mining,主要是爲了找到一塊兒出現的可能性足夠高且爭議不大的「組」。img

那麼,咱們追求的即是:ant

1. Kulczynski值足夠大(接近1)co

2. IR相對小(接近0)d3

相關文章
相關標籤/搜索