[置顶] JAVA 集合框架优化之list.removeAll大数据量优化

时间:2020-12-15 19:21:10

今天在公司做项目需要求两个集合的补集,考虑到collection类有removeAll方法,决定采用这种方式;结果程序一直卡在那儿不动了;

数据量是两个集合的数据差不多都有60万,直接导致程序处于假死状态(程序当然是还在运行);

出现问题始终要解决的,我又给程序修改为先用retainAll求交集,然后再removeAll的方式,效果不明显(事实是也假死了),我的应用场景还要求实时性,没办法只能从其他方面找寻思路了;

  • 既然removeAll执行效率低,我就改成循环remove试试看,结果是效率上有了一定的提升(在此需要注意list要倒序循环,因为remove是删除了下标,删除了之后后边的元素会前移),但是效果仍然不明显;
  • 另外一种是采用Iterator迭代器,这种方式我们仅需要对iterator进行循环,然后对需要删除的元素执行iterator.remove(iterator.next()),而无需关注下标的问题;

结合list的特性,LinkedList插入更新效率高,ArrayList查询效率高,对这里的使用场景我们显然需要将集合转换成LinkedList

以下是我对list的优化工具类,执行结果较其他方法不是一个数量级的提升!,代码如下

package com.wyg.collection;

import java.util.List;
import java.util.LinkedList;
import java.util.HashSet;
import java.util.Iterator;


public class RemoveAllProfile{
public static List removeAll(List src,List oth){
LinkedList result = new LinkedList(src);//大集合用linkedlist
HashSet othHash = new HashSet(oth);//小集合用hashset
Iterator iter = result.iterator();//采用Iterator迭代器进行数据的操作
while(iter.hasNext()){
if(othHash.contains(iter.next())){
iter.remove();
}
}
return result;
}
}