克服長尾挑戰 (Overcoming the Long Tail Challenge)

       意義:數據挖掘中的用戶行爲數據也遵循着冪律分佈            1. 冪律分佈無處不在                自然和社會中,許多事物的特徵,其發生頻率遵循冪律分佈(power law distribution)。冪律分佈的密度函數是如圖所示的冪函數。冪律分佈的特點是,20%的高頻特徵的頻率大約佔整體的80%,稱爲頭部(head,圖中淺綠色部分);另一方面,低頻特徵的頻率
相關文章
相關標籤/搜索