複雜網絡的統計描述

啦啦啦~過來填坑啦,今天終於出太陽了,開森~算法

將從如下五個方面進行展開(參考書籍《基於複雜網絡的機器學習方法》):網絡

1.度和度相關性機器學習

2.距離和路徑模塊化

3.網絡結構學習

4.網絡中心性ci

5.複雜網絡度量方法的分類效率

 

1.度和度相關性學習方法

   密度:衡量網絡中各個節點間的鏈接強度。將密度接近0的網絡稱爲稀疏網絡。書籍

   網絡同配性:網絡同配性主要是根據網絡中節點的度,從網絡結構的角度考慮網絡中節點相連的可能性。同配係數r是一種基於度的皮爾遜相關係數。循環

         r是正值時,表示度大的節點傾向於鏈接度大的節點;   r是負值時,表示度大的節點傾向於鏈接度小的節點。

         r=+1時,表示網絡具備很好的同配性;      r=+1時,表示網絡具備很好的異配性。

        社交網絡就表現出很明顯的同配性;而科技網絡,生物網絡以及金融網絡則表現出很強的異配性。

   局部同配性:每一個節點在整個網絡同配性中所佔的比例。

   非歸一化富人俱樂部係數:只關注節點與超過必定度數的節點相連的可能性。

   歸一化富人俱樂部係數:消除了相同度分佈下由結構所引發的差別,更能體現富人俱樂部效應的重要性。

 

2.距離和路徑

直徑:節點間的最大路徑長度稱爲網絡的直徑。

節點偏愛率:表示網絡中其餘節點與其距離最長的路徑。

半徑:偏愛率最小的節點間的距離。

維納指數:全部節點間距離的和。

網絡全局效率:網絡中信息傳播效率記爲GE,它與網絡中節點間的距離成反比。

網絡平均一致估計:網絡全局效率的倒數稱爲網絡的平均一致估計。

 

3.網絡結構

局部聚類係數:量化了局部積聚的能力。

網絡聚類係數:用於度量網絡的積聚狀況。若是CC=1,說明網絡中全部點都是相連的,若是CC趨近於0,說明網絡的鏈接較爲鬆散。

循環係數:描述了複雜網絡中的流通度。

網絡全局循環係數:網絡中全部節點的循環係數的平均值稱爲網絡的全局循環係數。

模塊化係數:用來度量網絡中某一特定聚類的可能性,即度量網絡中聚類的強度。其取值區間爲【0,1】.當模塊性接近0時,代表網絡中不存在社團結構,即網絡中的節點是隨          意相連的;隨着模塊化係數的增長,社團結構愈來愈清晰。模塊化係數定義了每一個節點屬於某一社團的可能性,在網絡造成時根據模塊化係數肯定節點是否屬於某一社團。

        模塊化係數反映了模塊中節點的集中程度,而不是全部模塊之間的隨機分佈。

拓撲重疊指數:度量網絡中大體處於相同社團的兩個點的鏈接程度。

 

4.網絡中心性

    具備較大度數的節點是網絡的中心,而較小度數的節點一般是外圍或者末端的節點。度數較大的節點一般被稱爲關鍵節點。

   基於距離的網絡中心性:

   極小極大準則:像醫院等急救場所的選址問題,肯定一個使最大反應時間最小化的位置。

   極小求和準則:例如購物中心等服務設施的選址,目標是儘可能使總的路程時間最小。

在社交網絡分析中,基於這一律唸的網絡中心性指標稱爲親密度。

  基於路徑的網絡中心性:主要考慮經過節點的路徑數量。

介數中心性:主要度量網絡中每對節點位於最短路徑上的程度。因爲信息以相同的機率經過每個節點,每條信息傳播中經過的節點數量只與節點所處的最短路徑的節點數量成比例。這一路徑上節點的數量爲網絡的介數中心度數。

連通度:從節點p到節點q經過最短路徑和不一樣長度的隨機遊走而進行信息傳遞的能力稱爲連通度。

基於特徵向量的網絡中心性:在定義中,當某一節點具備較大的特徵向量中心性指數時,它的鄰域節點更重要,爲關鍵節點。

Bonacich特徵向量中心性算法:利用鄰接矩陣特徵向量計算網絡中心性。

Katz指數:該指數用來肯定個體在網絡中的重要性或狀態。

PagRank算法:谷歌用於網頁排名的著名算法。能夠模擬用戶瀏覽網頁的行爲。

特徵向量中心性算法:節點的重要性取決於它的鄰域節點的重要性。

 

5.複雜網絡度量方法的分類

嚴格局部計算:度,強度等

混合計算:如局部聚類係數,拓撲重疊指數等

全局計算:如網絡全局效率,半徑等

相關文章
相關標籤/搜索