動態網絡社團檢測學習筆記 --- 隨機塊模型小結之簡介

網絡科學起源於18世紀,著名的哥尼斯堡七橋問題就是複雜網絡學科的起源,因此歐拉能夠說是複雜網絡研究的鼻祖(扯遠了)。而複雜網絡也是一門交叉學科,其研究者所在領域包括機率統計學科,計算生物學科以及計算機學科等。算法

在複雜網絡分析中,社團檢測(community detection)就是其重要的任務之一。廣泛意義上的社團結構就是網絡中一組鏈接緊密的節點所組成的團體,其內部連邊緊密,與外部的連邊相對稀疏。而社團檢測就是利用各類方法將這些聯繫緊密的節點找出來,其應用很是普遍,例如針對社交網絡能夠利用社團檢測找到社交圈,針對蛋白質網絡能夠找到蛋白質的特定功能模塊等。社團檢測任務包括靜態網絡社團檢測以及動態網絡社團檢測。靜態網絡社團檢測(dynamic community detection)須要考慮網絡數據的特性對連接緊密的節點進行有監督或者無監督的聚類,廣泛的方法包括機器學習中的非監督聚類方法、基於模塊度的方法、譜方法、隱空間模型方法、機率模型方法等。而動態網絡社團檢測不只須要考慮每一個時間快照(snapshot)的節點連接緊密程度,還要考慮每一個社團隨時間的演化(community evolution)。社團演化也是動態網絡中一個比較熱門的研究課題,這裏不過多贅述。而在動態網絡社團檢測中,主要方法包括,兩步法(two-step approach)、隱空間模型(latent space model)、增量聚類(incremental clustering)以及基於模型的方法(model-based method)。兩步法在每一個時間快照中執行靜態網絡社團檢測方法,而後對每一個時間快照的社團進行匹配,這種方法將社團檢測和社團演化徹底割裂開來,這使得一旦數據噪聲過多,其方法效果將會變得不好;隱空間模型將每一個節點映射到某個隱空間中,也就是用一條向量表示節點,並在改隱空間中進行聚類以及演化分析等。增量聚類認爲社團的演化是不會發生突變的,因此在時刻t進行社團檢測時會利用t-1時刻的社團檢測結果進行社團檢測任務。而基於模型的方法則是經過推測動態網絡中節點的鏈接機制以及演化機制利用機率模型對整個網絡進行建模,並利用MAP、EM算法、置信度傳播算法等方法對模型進行求解。而隨機塊模型就是基於模型的方法中應用比較普遍的模型之一。網絡

相關文章
相關標籤/搜索