二分圖的最大匹配、完美匹配和匈牙利算法

時間 2019-12-07

原文原文鏈接

這篇文章講無權二分圖（unweighted bipartite graph）的最大匹配（maximum matching）和完美匹配（perfect matching），以及用於求解匹配的匈牙利算法（Hungarian Algorithm）；不講帶權二分圖的最佳匹配。html

二分圖：簡單來講，若是圖中點能夠被分爲兩組，而且使得全部邊都跨越組的邊界，則這就是一個二分圖。準確地說：把一個圖的頂點劃分爲兩個不相交集 node

匹配：在圖論中，一個「匹配」（matching）是一個邊的集合，其中任意兩條邊都沒有公共頂點。例如，圖三、圖 4 中紅色的邊就是圖 2 的匹配。算法

咱們定義匹配點、匹配邊、未匹配點、非匹配邊，它們的含義很是顯然。例如圖 3 中一、四、五、7 爲匹配點，其餘頂點爲未匹配點；1-五、4-7爲匹配邊，其餘邊爲非匹配邊。數組

最大匹配：一個圖全部匹配中，所含匹配邊數最多的匹配，稱爲這個圖的最大匹配。圖 4 是一個最大匹配，它包含 4 條匹配邊。函數

完美匹配：若是一個圖的某個匹配中，全部的頂點都是匹配點，那麼它就是一個完美匹配。圖 4 是一個完美匹配。顯然，完美匹配必定是最大匹配（完美匹配的任何一個點都已經匹配，添加一條新的匹配邊必定會與已有的匹配邊衝突）。但並不是每一個圖都存在完美匹配。性能

舉例來講：以下圖所示，若是在某一對男孩和女孩之間存在相連的邊，就意味着他們彼此喜歡。是否可能讓全部男孩和女孩兩兩配對，使得每對兒都互相喜歡呢？圖論中，這就是完美匹配問題。若是換一個說法：最多有多少互相喜歡的男孩/女孩能夠配對兒？這就是最大匹配問題。測試

基本概念講完了。求解最大匹配問題的一個算法是匈牙利算法，下面講的概念都爲這個算法服務。atom

交替路：從一個未匹配點出發，依次通過非匹配邊、匹配邊、非匹配邊…造成的路徑叫交替路。spa

增廣路：從一個未匹配點出發，走交替路，若是途徑另外一個未匹配點（出發的點不算），則這條交替路稱爲增廣路（agumenting path）。例如，圖 5 中的一條增廣路如圖 6 所示（圖中的匹配點均用紅色標出）：.net

增廣路有一個重要特色：非匹配邊比匹配邊多一條。所以，研究增廣路的意義是改進匹配。只要把增廣路中的匹配邊和非匹配邊的身份交換便可。因爲中間的匹配節點不存在其餘相連的匹配邊，因此這樣作不會破壞匹配的性質。交換後，圖中的匹配邊數目比原來多了 1 條。

咱們能夠經過不停地找增廣路來增長匹配中的匹配邊和匹配點。找不到增廣路時，達到最大匹配（這是增廣路定理）。匈牙利算法正是這麼作的。在給出匈牙利算法 DFS 和 BFS 版本的代碼以前，先講一下匈牙利樹。

匈牙利樹通常由 BFS 構造（相似於 BFS 樹）。從一個未匹配點出發運行 BFS（惟一的限制是，必須走交替路），直到不能再擴展爲止。例如，由圖 7，能夠獲得如圖 8 的一棵 BFS 樹：

這棵樹存在一個葉子節點爲非匹配點（7 號），可是匈牙利樹要求全部葉子節點均爲匹配點，所以這不是一棵匈牙利樹。若是原圖中根本不含 7 號節點，那麼從 2 號節點出發就會獲得一棵匈牙利樹。這種狀況如圖 9 所示（順便說一句，圖 8 中根節點 2 到非匹配葉子節點 7 顯然是一條增廣路，沿這條增廣路擴充後將獲得一個完美匹配）。

下面給出匈牙利算法的 DFS 和 BFS 版本的代碼：

// 頂點、邊的編號均從 0 開始
// 鄰接表儲存

struct Edge
{
    int from;
    int to;
    int weight;

    Edge(int f, int t, int w):from(f), to(t), weight(w) {}
};

vector<int> G[__maxNodes]; /* G[i] 存儲頂點 i 出發的邊的編號 */
vector<Edge> edges;
typedef vector<int>::iterator iterator_t;
int num_nodes;
int num_left;
int num_right;
int num_edges;
int matching[__maxNodes]; /* 存儲求解結果 */
int check[__maxNodes];

bool dfs(int u)
{
    for (iterator_t i = G[u].begin(); i != G[u].end(); ++i) { // 對 u 的每一個鄰接點
        int v = edges[*i].to;
        if (!check[v]) {     // 要求不在交替路中
            check[v] = true; // 放入交替路
            if (matching[v] == -1 || dfs(matching[v])) {
                // 若是是未蓋點，說明交替路爲增廣路，則交換路徑，並返回成功
                matching[v] = u;
                matching[u] = v;
                return true;
            }
        }
    }
    return false; // 不存在增廣路，返回失敗
}

int hungarian()
{
    int ans = 0;
    memset(matching, -1, sizeof(matching));
    for (int u=0; u < num_left; ++u) {
        if (matching[u] == -1) {
            memset(check, 0, sizeof(check));
            if (dfs(u))
                ++ans;
        }
    }
    return ans;
}
queue<int> Q;
int prev[__maxNodes];
int Hungarian()
{
    int ans = 0;
    memset(matching, -1, sizeof(matching));
    memset(check, -1, sizeof(check));
    for (int i=0; i<num_left; ++i) {
        if (matching[i] == -1) {
            while (!Q.empty()) Q.pop();
            Q.push(i);
            prev[i] = -1; // 設 i 爲路徑起點
            bool flag = false; // 還沒有找到增廣路
            while (!Q.empty() && !flag) {
                int u = Q.front();
                for (iterator_t ix = G[u].begin(); ix != G[u].end() && !flag; ++ix) {
                    int v = edges[*ix].to;
                    if (check[v] != i) {
                        check[v] = i;
                        Q.push(matching[v]);
                        if (matching[v] >= 0) { // 此點爲匹配點
                            prev[matching[v]] = u;
                        } else { // 找到未匹配點，交替路變爲增廣路
                            flag = true;
                            int d=u, e=v;
                            while (d != -1) {
                                int t = matching[d];
                                matching[d] = e;
                                matching[e] = d;
                                d = prev[d];
                                e = t;
                            }
                        }
                    }
                }
                Q.pop();
            }
            if (matching[i] != -1) ++ans;
        }
    }
    return ans;
}

匈牙利算法的要點以下

從左邊第 1 個頂點開始，挑選未匹配點進行搜索，尋找增廣路。
1. 若是通過一個未匹配點，說明尋找成功。更新路徑信息，匹配邊數 +1，中止搜索。
2. 若是一直沒有找到增廣路，則再也不從這個點開始搜索。事實上，此時搜索後會造成一棵匈牙利樹。咱們能夠永久性地把它從圖中刪去，而不影響結果。
因爲找到增廣路以後須要沿着路徑更新匹配，因此咱們須要一個結構來記錄路徑上的點。DFS 版本經過函數調用隱式地使用一個棧，而 BFS 版本使用 prev 數組。

性能比較

兩個版本的時間複雜度均爲

補充定義和定理：

最大匹配數：最大匹配的匹配邊的數目

最小點覆蓋數：選取最少的點，使任意一條邊至少有一個端點被選擇

最大獨立數：選取最多的點，使任意所選兩點均不相連

最小路徑覆蓋數：對於一個 DAG（有向無環圖），選取最少條路徑，使得每一個頂點屬於且僅屬於一條路徑。路徑長能夠爲 0（即單個點）。

定理1：最大匹配數 = 最小點覆蓋數（這是 Konig 定理）

定理2：最大匹配數 = 最大獨立數

定理3：最小路徑覆蓋數 = 頂點數 - 最大匹配數

文章轉自：https://www.renfei.org/blog/bipartite-matching.html

參考：http://blog.csdn.net/dark_scope/article/details/8880547