分享幾種 Java8 中經過 Stream 對列表進行去重的方法

幾種列表去重的方法

在這裏我來分享幾種列表去重的方法,算是一次整理吧,若有紕漏,請不吝賜教。java

1. Stream 的distinct()方法

distinct()是Java 8 中 Stream 提供的方法,返回的是由該流中不一樣元素組成的流。distinct()使用 hashCode()eqauls() 方法來獲取不一樣的元素。所以,須要去重的類必須實現 hashCode()equals() 方法。換句話講,咱們能夠經過重寫定製的 hashCode()equals() 方法來達到某些特殊需求的去重。git

distinct() 方法聲明以下:github

Stream<T> distinct();
複製代碼

1.1 對於 String 列表的去重

由於 String 類已經覆寫了 equals()hashCode() 方法,因此能夠去重成功。bash

@Test
public void listDistinctByStreamDistinct() {
  // 1. 對於 String 列表去重
  List<String> stringList = new ArrayList<String>() {{
    add("A");
    add("A");
    add("B");
    add("B");
    add("C");
  }};
  out.print("去重前:");
  for (String s : stringList) {
    out.print(s);
  }
  out.println();
  stringList = stringList.stream().distinct().collect(Collectors.toList());
  out.print("去重後:");
  for (String s : stringList) {
    out.print(s);
  }
  out.println();
}
複製代碼

結果以下:app

去重前:AABBC
去重後:ABC
複製代碼

1.2 對於實體類列表的去重

注:代碼中咱們使用了 Lombok 插件的 @Data註解,可自動覆寫 equals() 以及 hashCode() 方法。性能

/** * 定義一個實體類 */ 
@Data
public class Student {
  private String stuNo;
  private String name;
}
複製代碼
@Test
public void listDistinctByStreamDistinct() throws JsonProcessingException {
    ObjectMapper objectMapper = new ObjectMapper();
    // 1. 對於 Student 列表去重
    List<Student> studentList = getStudentList();
    out.print("去重前:");
    out.println(objectMapper.writeValueAsString(studentList));
    studentList = studentList.stream().distinct().collect(Collectors.toList());
    out.print("去重後:");
    out.println(objectMapper.writeValueAsString(studentList));
  }
複製代碼

結果以下:spa

去重前:[{"stuNo":"001","name":"Tom"},{"stuNo":"002","name":"Mike"},{"stuNo":"001","name":"Tom"}]
去重後:[{"stuNo":"001","name":"Tom"},{"stuNo":"002","name":"Mike"}]
複製代碼

2. 根據 List<Object>Object 某個屬性去重

2.1 新建一個列表出來

@Test
  public void distinctByProperty1() throws JsonProcessingException {
    // 這裏第一種方法咱們經過新建立一個只有不一樣元素列表來實現根據對象某個屬性去重
    ObjectMapper objectMapper = new ObjectMapper();
    List<Student> studentList = getStudentList();

    out.print("去重前 :");
    out.println(objectMapper.writeValueAsString(studentList));
    studentList = studentList.stream().distinct().collect(Collectors.toList());
    out.print("distinct去重後:");
    out.println(objectMapper.writeValueAsString(studentList));
    // 這裏咱們引入了兩個靜態方法,以及經過 TreeSet<> 來達到獲取不一樣元素的效果
    // 1. import static java.util.stream.Collectors.collectingAndThen;
    // 2. import static java.util.stream.Collectors.toCollection;
    studentList = studentList.stream().collect(
      collectingAndThen(
        toCollection(() -> new TreeSet<>(Comparator.comparing(Student::getName))), ArrayList::new)
    );
    out.print("根據名字去重後 :");
    out.println(objectMapper.writeValueAsString(studentList));
  }
複製代碼

結果以下:插件

去重前        :[{"stuNo":"001","name":"Tom"},{"stuNo":"001","name":"Tom"},{"stuNo":"003","name":"Tom"}]
distinct去重後:[{"stuNo":"001","name":"Tom"},{"stuNo":"003","name":"Tom"}]
根據名字去重後 :[{"stuNo":"001","name":"Tom"}]
複製代碼

2.2 經過 filter() 方法

咱們首先建立一個方法做爲 Stream.filter() 的參數,其返回類型爲 Predicate,原理就是判斷一個元素可否加入到 Set 中去,代碼以下:code

private static <T> Predicate<T> distinctByKey(Function<? super T, ?> keyExtractor) {
    Set<Object> seen = ConcurrentHashMap.newKeySet();
    return t -> seen.add(keyExtractor.apply(t));
}
複製代碼

使用以下:對象

@Test
  public void distinctByProperty2() throws JsonProcessingException {
    // 這裏第二種方法咱們經過過濾來實現根據對象某個屬性去重
    ObjectMapper objectMapper = new ObjectMapper();
    List<Student> studentList = getStudentList();

    out.print("去重前 :");
    out.println(objectMapper.writeValueAsString(studentList));
    studentList = studentList.stream().distinct().collect(Collectors.toList());
    out.print("distinct去重後:");
    out.println(objectMapper.writeValueAsString(studentList));
    // 這裏咱們將 distinctByKey() 方法做爲 filter() 的參數,過濾掉那些不能加入到 set 的元素
    studentList = studentList.stream().filter(distinctByKey(Student::getName)).collect(Collectors.toList());
    out.print("根據名字去重後 :");
    out.println(objectMapper.writeValueAsString(studentList));
  }
複製代碼

結果以下:

去重前        :[{"stuNo":"001","name":"Tom"},{"stuNo":"001","name":"Tom"},{"stuNo":"003","name":"Tom"}]
distinct去重後:[{"stuNo":"001","name":"Tom"},{"stuNo":"003","name":"Tom"}]
根據名字去重後 :[{"stuNo":"001","name":"Tom"}]
複製代碼

3. 總結

以上即是我要分享的幾種關於列表去重的方法,固然這裏沒有進行更爲詳盡的性能分析,但願之後會深刻底層再從新分析一下。若有紕漏,還望不吝賜教。

代碼地址:github

相關文章
相關標籤/搜索