一、快速报错机制(fail-fast)
这是《Java编程思想》中关于快速报错机制的描述
Java容器有一种保护机制,能够防止多个进程同时修改同一个容器的内容。如果在你迭代遍历容器的过程中,另一个进程介入其中,并且插入、删除或者修改此容器内的某个对象,那么就会出现问题:也许迭代过程中已经处理过容器中的该元素了,也许还没处理,也许在调用size()之后容器的尺寸收缩了——还有许多灾难情景。Java容器类类库采用快速报错(fail-fast)机制。它会探查容器上的任何除了你的进程所进行的操作以外的所有变化,一旦它发现其它进程修改了容器,就会立刻抛出ConcurrentModificationException异常。这就是“快速报错”的意思——即,不是使用复杂的算法在事后来检查问题。
——from《Java编程思想》p517
二、ArrayList中的快速报错机制分析
快速报错机制在容器中使用非常广泛,我们最常用的ArrayList就用到了快速报错机制。下面是ArrayList的迭代器源码。
#ArrayList的Iterator源码分析 public Iterator<E> iterator() {
return new Itr();
} /**
* An optimized version of AbstractList.Itr
*
* 覆盖了父类中AbstractList.Itr的实现(优化版)
*/
private class Itr implements Iterator<E> {
//下一个要返回元素的索引
int cursor; // index of next element to return
//最后一个要返回元素的索引,-1表示不存在
int lastRet = -1; // index of last element returned; -1 if no such
//记录期望的修改次数(用于保证迭代器在遍历过程中不会有对集合的修改操作(迭代器的自身的remove方法除外))
int expectedModCount = modCount; public boolean hasNext() {
return cursor != size;
} @SuppressWarnings("unchecked")
public E next() {
//每次获取元素前进行修改检查
checkForComodification();
int i = cursor;
if (i >= size)
throw new NoSuchElementException();
Object[] elementData = ArrayList.this.elementData;
if (i >= elementData.length)
throw new ConcurrentModificationException();
cursor = i + 1;
return (E) elementData[lastRet = i];
} public void remove() {
if (lastRet < 0)
throw new IllegalStateException();
checkForComodification(); try {
ArrayList.this.remove(lastRet);
cursor = lastRet;
lastRet = -1;
expectedModCount = modCount;
} catch (IndexOutOfBoundsException ex) {
throw new ConcurrentModificationException();
}
} /**
* 检查修改次数
*/
final void checkForComodification() {
//实际的修改次数和期望的修改次数不匹配,则抛出并发修改异常
if (modCount != expectedModCount)
throw new ConcurrentModificationException();
}
}
原来,ArrayList从其父类AbstractList继承了一个modCount属性,每当对ArrayList进行修改(add,remove,clear等)时,就会相应的modCount的值加1。而ArrayList中迭代器的实现类Itr也有一个expectedModCount属性。一旦调用iterator()方法来使用迭代器时,Itr类也就被初始化,expectedModCount就会被赋予一个与modCount相等的值。如果接下来进行遍历操作,则每次调用next()方法获取值时都会先进行修改检查(checkForComodification),也就是检查modCount和expectedModCount两个值是否相等。如果在遍历过程中进行了对集合的其它修改操作而使得modCount值发生变化,从而造成两者不等,就立即抛出ConcurrentModificationException。这不就是乐观锁的思想吗。这就是快速失败机制(fail-fast)的实现原理。
另外,我们注意到迭代器自身也提供了remove方法,但该方法并不会修改modCount的值,这是因为我们通常也会通过迭代遍历去删除某一个指定的元素,所以迭代器中自身提供了该remove方法,并保证该remove方法是安全的,而不希望我们在迭代时使用容器提供remove方法。
我们可以得出这样的结论:
一旦使用了迭代器,无论是否已经开始迭代,都不能在接下来的过程对容器进行修改操作,这里的修改指的是容器自身提供的add/remove等修改方法。但是可以使用迭代器自身提供的修改方法(通常只有remove)。
三、避免依赖快速报错机制
需要说明两点
①.虽然ConcurrentModificationException被译为并发修改异常,但这里的"并发",并非仅仅指的是多线程场景。
在单线程情况下:要确保Iterator遍历过程顺利完成,必须保证遍历过程中不更改集合的内容(Iterator的remove()方法除外)。
多线程情况下:如果要在多线程环境中,在迭代ArrayList的同时也要修改ArrayList,则可以使用
Collections.synchronizedList(List list)或者CopyOnWriteArrayList。其中CopyOnWriteArrayList是可以避免ConcurrentModificationException。
实际上CopyOnWriteArrayList、ConcurrentHashMap和CopyOnWriteArraySet都使用了可以避免ConcurrentModificationException的技术。
②.迭代器的快速失败机制无法得到保证,它不能保证一定发生,只是会尽最大努力抛出ConcurrentModificationException异常。
为什么不能保证一定发生呢?
其实原因很简单,再回到前面ArrayList的迭代器代码,我们注意到修改检查并非在同步下进行的,如果容器进行修改操作而导致modCount发生变化,由于可见性,迭代器可能会看到失效的modCount值,从而不会意识到已经发生修改。而这是一种设计上的权衡。
因此,为提高此类操作的正确性,我们不能依赖于该机制,而要使用上一条中提到的线程安全的容器。
四、CopyOnWriteArrayList不支持快速报错机制
ArrayList在迭代遍历的同时进行并发修改是会发生快速失败,因此需要使用同步保证迭代的安全性。但ArrayList对应的线程安全容器CopyOnWriteArrayList能在遍历的同时进行修改,而且未使用同步。
那么它是怎么实现的呢?实际上很简单,CopyOnWriteArrayList每次在进行修改操作时,都会新生成一个数组,然后在新数组上修改,然后替换原数组,而遍历操作则是直接操作原有数组。因为遍历和修改操作的目标都不一样,因此根本不会互相影响。
来看看源码。
/**
* 返回迭代器
*
* 返回的迭代器提供了该迭代器被创建时列表的快照。
* 当移动迭代器时,不需要同步。
* 迭代器不支持remove方法
*/
public Iterator<E> iterator() {
return new COWIterator<E>(getArray(), 0);
} /**
* 内部迭代器的实现类
*/
private static class COWIterator<E> implements ListIterator<E> {
/**数组的快照*/
private final Object[] snapshot;
private int cursor; private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
} public boolean hasNext() {
return cursor < snapshot.length;
} public boolean hasPrevious() {
return cursor > 0;
} @SuppressWarnings("unchecked")
public E next() {
if (! hasNext())
throw new NoSuchElementException();
//在快照数组上进行迭代操作
return (E) snapshot[cursor++];
} @SuppressWarnings("unchecked")
public E previous() {
if (! hasPrevious())
throw new NoSuchElementException();
return (E) snapshot[--cursor];
} public int nextIndex() {
return cursor;
} public int previousIndex() {
return cursor-1;
} /**
* 迭代器不支持remove/set/add方法。
* 总是抛出UnsupportedOperationException异常
*/
public void remove() {
throw new UnsupportedOperationException();
}
public void set(E e) {
throw new UnsupportedOperationException();
}
public void add(E e) {
throw new UnsupportedOperationException();
}
}
迭代器只用于迭代,不提供任何修改操作。这点恰好跟ArrayList相反。
public class Demo { public static void main(String[] args) {
CopyOnWriteArrayList<String> list = new CopyOnWriteArrayList<String>();
//添加元素0-4
for(int i=0;i<5;i++){
list.add(i+"");
}
System.out.println(list);//[0, 1, 2, 3, 4] //进行迭代
Iterator iterator = list.iterator();
while(iterator.hasNext()){
String num = (String) iterator.next();
//迭代时,删除3
if("3".equals(num)){
//iterator.remove();//iterator不支持修改方法(add,set,remove)
list.remove(num);//使用原容器的remove方法
};
}
System.out.println(list);//[0, 1, 2, 4]
}
}
五、练习(如何安全的使用迭代器,如何正确的删除容器中的元素)
程序功能:分别使用for,foreach,iterator来遍历(迭代)容器,然后删除其中的值为"傻强"这个元素。
public class TestTest { private List<String> list; /**
* 初始化操作
*/
@Before
public void setUp(){
list = new ArrayList<String>();
list.add("刘德华");
list.add("周润发");
list.add("傻强");
list.add("古天乐");
list.add("刘青云");
System.out.println(list);
} /**
* Demo1:使用for循环,删除元素
*/
@Test
public void testFor(){
for(int i=0;i<list.size();i++){
//删除傻强
if("傻强".equals(list.get(i))){
list.remove(i);
}
}
System.out.println(list);
} /**
* Demo2:使用foreach,删除元素【错误】
*/
@Test
public void testForeach(){
for (String s : list) {
//删除傻强
if("傻强".equals(s)){
list.remove(s);//使用容器自身的remove
}
}
System.out.println(list);
} /**
* Demo3:使用Iterator,调用Iterator的remove()删除元素
*/
@Test
public void testIterator(){
Iterator<String> iterator = list.iterator();
while(iterator.hasNext()){
String s= iterator.next();
//删除lisi
if("傻强".equals(s)){
iterator.remove();//使用迭代器的remove
}
}
System.out.println(list);
} /**
* Demo4:使用Iterator,调用集合自身的remove()删除元素【错误】
*/
@Test
public void testIterator2(){
Iterator<String> iterator = list.iterator();
while(iterator.hasNext()){
String s= iterator.next();
//删除傻强
if("傻强".equals(s)){
list.remove(s);//使用容器的remove
}
}
System.out.println(list);
} /**
* Demo5:获得iterator后进行了错误操作【错误】
*/
@Test
public void testIterator3(){
Iterator<String> iterator = list.iterator();
//这是错误的操作。获取迭代器后不能再调用容器的修改方法
list.add("这是错误的行为");
//这是允许的。
//iterator.remove(xx); while(iterator.hasNext()){
String s= iterator.next();
//删除傻强
if("傻强".equals(s)){
iterator.remove();//使用迭代器的remove
}
}
System.out.println(list);
}
}
结果:除了demo1和demo3正确,其它demo都会报ConcurrentModificationException异常。
面试题
1.什么是快速失败机制(fail-fast)?
2.ArrayList中快速失败机制的实现原理?
3.为什么不能依赖快速失败机制?
4.如何正确的删除容器中的元素?