最近工做中碰到一個需求:咱們的數據表有多個維度,任意多個維度組合後進行 group by 可能會產生一些」奇妙」的反應,因爲不肯定怎麼組合,就須要將全部的組合都列出來進行嘗試。html
抽象一下就是從一個集合中取出任意元素,造成惟一的組合。如 [a,b,c]
可組合爲 [a]、[b]、[c]、[ab]、[bc]、[ac]、[abc]
。java
要求以下:git
看到這裏,就應該想到高中所學習的排列組合了,一樣是從集合中取出元素造成一個另外一個集合,若是集合內元素位置隨意,就是組合
,從 b 個元素中取 a 個元素的組合有 種。而若是要求元素順序不一樣也視爲不一樣集合的話,就是排列
,從 m 個元素取 n 個元素的排列有 種。github
我遇到的這個需求就是典型的組合,用公式來表示就是從元素個數爲 n 的集合中列出 種組合。算法
轉載隨意,文章會持續修訂,請註明來源地址:https://zhenbianshu.github.io 。數組
文中算法用 Java 實現。ide
對於這種需求,首先想到的固然是窮舉。因爲排列的要求較少,實現更簡單一些,若是我先找出全部排列,再剔除因爲位置不一樣而重複的元素,便可實現需求。假設須要從 [A B C D E] 五個元素中取出全部組合,那麼咱們先找出全部元素的全排列,而後再將相似 [A B] 和 [B A] 兩種集合去重便可。學習
咱們又知道 ,那麼咱們先考慮一種狀況 ,假設是 ,從 5 個元素中選出三個進行全排列。fetch
被選取的三個元素,每個均可以是 ABCDE 之一,而後再排除掉造成的集合中有重複元素的,就是 5 選 3 的全排列了。編碼
代碼是這樣:
private static Set<Set<String>> exhaustion() { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); Set<Set<String>> result = new HashSet<>(); int count = 3; for (int a = 1; a < m.size(); a++) { for (int b = 0; b < m.size(); b++) { for (int c = 0; c < m.size(); c++) { Set<String> tempCollection = new HashSet<>(); tempCollection.add(m.get(a)); tempCollection.add(m.get(b)); tempCollection.add(m.get(c)); // 若是三個元素中有重複的會被 Set 排重,致使 Set 的大小不爲 3 if (tempCollection.size() == count) { result.add(tempCollection); } } } } return result; }
對於結果組合的排重,我借用了 Java 中 HashSet 的兩個特性:
能夠注意獲得,上面程序中 count 參數是寫死的,若是須要取出 4 個元素的話就須要四層循環嵌套了,若是取的元素個取是可變的話,普通的編碼方式就不適合了。
注: 可變層數的循環能夠用 遞歸
來實現。
窮舉畢竟太過暴力,咱們來經過分治思想來從新考慮一下這個問題:
分治的思想總的來講就是」大事化小,小事化了」,它將複雜的問題往簡單劃分,直到劃分爲可直接解決的問題,再從這個直接能夠解決的問題向上聚合,最後解決問題。
從 M 個元素中取出 N 個元素整個問題很複雜,用分治思想就能夠理解爲:
仍是從 5 個元素中取 3 個元素的示例:
用代碼實現以下:
public class Combination { public static void main(String[] args) { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); int n = 5; Set<Set<String>> combinationAll = new HashSet<>(); // 先將問題分解成 五取1、五取二... 等的全排列 for (int c = 1; c <= n; c++) { combinationAll.addAll(combination(m, new ArrayList<>(), c)); } System.out.println(combinationAll); } private static Set<Set<String>> combination(List<String> remainEle, List<String> tempCollection, int fetchCount) { if (fetchCount == 1) { Set<Set<String>> eligibleCollections = new HashSet<>(); // 在只差一個元素的狀況下,遍歷剩餘元素爲每一個臨時集合生成多個知足條件的集合 for (String ele : remainEle) { Set<String> collection = new HashSet<>(tempCollection); collection.add(ele); eligibleCollections.add(collection); } return eligibleCollections; } fetchCount--; Set<Set<String>> result = new HashSet<>(); // 差多個元素時,從剩餘元素中取出一個,產生多個臨時集合,還須要取 count-- 個元素。 for (int i = 0; i < remainEle.size(); i++) { List<String> collection = new ArrayList<>(tempCollection); List<String> tempRemain = new ArrayList<>(remainEle); collection.add(tempRemain.remove(i)); result.addAll(combination(tempRemain, collection, fetchCount)); } return result;