我須要一個從集合N中隨機選擇M個子元素的算法。 固然最好的辦法是將集合打亂順序,而後從中選擇前M個元素便可。 Java中現成的API可使用:java
java.util.Collections.shuffle(List<?>)
此算法很是簡單,循環N次,每次長度減小1,隨機獲取其中一個元素,而後交換其對稱元素。算法
public static void shuffle(List<?> list, Random rnd) { int size = list.size(); if (size < SHUFFLE_THRESHOLD || list instanceof RandomAccess) { for (int i=size; i>1; i--) swap(list, i-1, rnd.nextInt(i)); } else { Object arr[] = list.toArray(); // Shuffle array for (int i=size; i>1; i--) swap(arr, i-1, rnd.nextInt(i)); // Dump array back into list ListIterator it = list.listIterator(); for (int i=0; i<arr.length; i++) { it.next(); it.set(arr[i]); } } }
有點意思的swap函數安全
public static void swap(List<?> list, int i, int j) { final List l = list; l.set(i, l.set(j, l.get(i))); }
其實咱們的需求很簡單,在基本不變的集合中,屢次重複隨機獲取其子集,至於子集是否有序或者隨機不重要的, 重要的是原集合中的每一個元素都有類似的機率出如今子集合中。多線程
考慮到性能以及併發訪問(多線程)的須要,我想到了一個簡單的算法:併發
給定N個元素集合,從中選擇M(0<M<=N)個元素的辦法是, (1) 隨機選擇索引K(0<=K<N), i=0, 空子集 (2) 取有效元素N(k-i),N(k+i) 加入未滿子集M (3) i+=1, 重複(2) 直到子集M已滿 (4) 終止
這樣取出來的元素雖然和原始集順序有必定的關係,可是每一個元素在子集裏出現的機率至關,知足結果要求。 最後生成的算法以下:dom
public static <T> List<T> randomList(List<T> views, int max) { final int size = views.size(); int index = RandomUtils.nextInt(size); // List<T> ret = new ArrayList<T>(max); int low = index - 1, high = index; while (max > 0 && (low >= 0 || high < size)) { if (low >= 0 && max-- > 0) { ret.add(views.get(low)); } if (high < size && max-- > 0) { ret.add(views.get(high)); } low--; high++; } return ret; }
此算法知足以下特色:函數
另外,stackoverflow上也有一些參考連接:性能