Java 集合框架源码分析(一)——ArrayList

时间:2020-12-21 17:52:22

简介

ArrayList中是平常比较常用的一个集合类,经常帮助我们封装一些实体Bean的List集合。典型使用场景如下:

  List<Book> bookList=new ArrayList<Book>();
bookList.add(book1);
bookList.add(book2);
...

ArrayList位于java.util 属于Java集合框架的一部分。层次关系如下。

java.util
类 ArrayList
java.lang.Object
—-继承者 java.util.AbstractCollection
—– 继承者 java.util.AbstractList
—–继承者 java.util.ArrayList

源码分析

以下是ArrayList部分源码(基于sun JDK 1.7.)

package java.util;


public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable
{
private static final long serialVersionUID = 8683452581122892189L;

/**
* 默认初始化容量
*/

private static final int DEFAULT_CAPACITY = 10;

/**
* 用于空实例使用的一个共享的初始化为空的数组。
*/

private static final Object[] EMPTY_ELEMENTDATA = {};

/**
* 用于保存具体元素的数组。
*/

private transient Object[] elementData;

/**
* ArrayList的大小(包含的元素数量)
*/

private int size;

/**
* 根据指定容量大小,构造一个空的ArrayList
*
*/

public ArrayList(int initialCapacity) {
super();
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
this.elementData = new Object[initialCapacity];
}

/**
* 构造空的list,默认容量为10
*/

public ArrayList() {
super();
this.elementData = EMPTY_ELEMENTDATA;
}

/**
*构造一个包含指定 collection 的元素的列表,
* 这些元素是按照该 collection 的迭代器返回它们的顺序排列的。
*/

public ArrayList(Collection<? extends E> c) {
elementData = c.toArray();
size = elementData.length;
// c.toArray might (incorrectly) not return Object[] (see 6260652)
if (elementData.getClass() != Object[].class)
elementData = Arrays.copyOf(elementData, size, Object[].class);
}

/**
* 将此 ArrayList 实例的容量调整为列表的当前大小。应用程序可以使用此操作来最小化 ArrayList 实例的存储量。
*/

public void trimToSize() {
modCount++;
if (size < elementData.length) {
elementData = Arrays.copyOf(elementData, size);
}
}

/**
如有必要,增加此 ArrayList 实例的容量,以确保它至少能够容纳最小容量参数所指定的元素数。
*/

public void ensureCapacity(int minCapacity) {
int minExpand = (elementData != EMPTY_ELEMENTDATA)
// any size if real element table
? 0
// larger than default for empty table. It's already supposed to be
// at default size.
: DEFAULT_CAPACITY;

if (minCapacity > minExpand) {
ensureExplicitCapacity(minCapacity);
}
}

private void ensureCapacityInternal(int minCapacity) {
if (elementData == EMPTY_ELEMENTDATA) {
minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);
}

ensureExplicitCapacity(minCapacity);
}

private void ensureExplicitCapacity(int minCapacity) {
modCount++;

// overflow-conscious code
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}

/**
*可以分配的Array最大容量。
*/

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

/**
* 扩容方法
*/

private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}

private static int hugeCapacity(int minCapacity) {
if (minCapacity < 0) // overflow
throw new OutOfMemoryError();
return (minCapacity > MAX_ARRAY_SIZE) ?
Integer.MAX_VALUE :
MAX_ARRAY_SIZE;
}

/**
* 返回list中的元素个数
*
*
*/

public int size() {
return size;
}

/**
* 返回当前列表是否为空。
*
*/

public boolean isEmpty() {
return size == 0;
}

/**
如果此列表中包含指定的元素,则返回 true。更确切地讲,当且仅当此列表包含至少一个满
足 (o==null ? e==null : o.equals(e)) 的元素 e 时,则返回 true。
*/

public boolean contains(Object o) {
return indexOf(o) >= 0;
}

/**
* 返回此列表中首次出现的指定元素的索引,或如果此列表不包含元素,则返回 -1。更确切地讲,返回满足 (o==null ? get(i)==null : o.equals(get(i))) 的最低索引 i ,如果不存在此类索引,则返回 -1。
*/

public int indexOf(Object o) {
if (o == null) {
for (int i = 0; i < size; i++)
if (elementData[i]==null)
return i;
} else {
for (int i = 0; i < size; i++)
if (o.equals(elementData[i]))
return i;
}
return -1;
}

/**
返回此列表中最后一次出现的指定元素的索引,或如果此列表不包含索引,则返回 -1。更确切地讲,返回满足 (o==null ? get(i)==null : o.equals(get(i))) 的最高索引 i,如果不存在此类索引,则返回 -1。
*/

public int lastIndexOf(Object o) {
if (o == null) {
for (int i = size-1; i >= 0; i--)
if (elementData[i]==null)
return i;
} else {
for (int i = size-1; i >= 0; i--)
if (o.equals(elementData[i]))
return i;
}
return -1;
}

/**
* 返回ArrayList的浅拷贝。
*
*/

public Object clone() {
try {
@SuppressWarnings("unchecked")
ArrayList<E> v = (ArrayList<E>) super.clone();
v.elementData = Arrays.copyOf(elementData, size);
v.modCount = 0;
return v;
} catch (CloneNotSupportedException e) {
// this shouldn't happen, since we are Cloneable
throw new InternalError();
}
}

/**
* 按适当顺序(从第一个到最后一个元素)返回包含此列表中所有元素的数组。
*/

public Object[] toArray() {
return Arrays.copyOf(elementData, size);
}

/**
* 按适当顺序(从第一个到最后一个元素)返回包含此列表中所有元素的数组;返回数组的
* 运行时类型是指定数组的运行时类型。
*
*/

@SuppressWarnings("unchecked")
public <T> T[] toArray(T[] a) {
if (a.length < size)
// Make a new array of a's runtime type, but my contents:
return (T[]) Arrays.copyOf(elementData, size, a.getClass());
System.arraycopy(elementData, 0, a, 0, size);
if (a.length > size)
a[size] = null;
return a;
}

// 位置访问函数

@SuppressWarnings("unchecked")
E elementData(int index) {
return (E) elementData[index];
}

/**
* 获取list指定位置出的元素。
*/

public E get(int index) {
rangeCheck(index);

return elementData(index);
}

/**
* 用指定的元素替代此列表中指定位置上的元素。
*/

public E set(int index, E element) {
rangeCheck(index);

E oldValue = elementData(index);
elementData[index] = element;
return oldValue;
}

/**
* 将指定的元素添加到此列表的尾部。
*/

public boolean add(E e) {
ensureCapacityInternal(size + 1); // Increments modCount!!
elementData[size++] = e;
return true;
}

/**
* 将指定的元素插入此列表中的指定位置。向右移动当前位于该位置的元素(如果有)以及所有后续元素(将其索引加 1)。
*/

public void add(int index, E element) {
rangeCheckForAdd(index);

ensureCapacityInternal(size + 1); // Increments modCount!!
System.arraycopy(elementData, index, elementData, index + 1,
size - index);
elementData[index] = element;
size++;
}

/**
*移除此列表中指定位置上的元素。向左移动所有后续元素(将其索引减 1)。
*/

public E remove(int index) {
rangeCheck(index);

modCount++;
E oldValue = elementData(index);

int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work

return oldValue;
}

/**
*移除此列表中首次出现的指定元素(如果存在)。如果列表不包含此元素,则列表不做改动。更确切地讲,移除满足 (o==null ? get(i)==null : o.equals(get(i))) 的最低索引的元素(如果存在此类元素)。如果列表中包含指定的元素,则返回 true(或者等同于这种情况:如果列表由于调用而发生更改,则返回 true)。
*/

public boolean remove(Object o) {
if (o == null) {
for (int index = 0; index < size; index++)
if (elementData[index] == null) {
fastRemove(index);
return true;
}
} else {
for (int index = 0; index < size; index++)
if (o.equals(elementData[index])) {
fastRemove(index);
return true;
}
}
return false;
}

/**
*
* 私有remove方法跳过边界检查并且不返回被移除的value.
*/

private void fastRemove(int index) {
modCount++;
int numMoved = size - index - 1;
if (numMoved > 0)
System.arraycopy(elementData, index+1, elementData, index,
numMoved);
elementData[--size] = null; // clear to let GC do its work
}

/**
* 清空当前list.
*/

public void clear() {
modCount++;

// clear to let GC do its work
for (int i = 0; i < size; i++)
elementData[i] = null;

size = 0;
}

/**
* 按照指定 collection 的迭代器所返回的元素顺序,将该 collection 中的所有元素
* 添加到此列表的尾部。
*/

public boolean addAll(Collection<? extends E> c) {
Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount
System.arraycopy(a, 0, elementData, size, numNew);
size += numNew;
return numNew != 0;
}

/**
* 从指定的位置开始,将指定 collection 中的所有元素插入到此列表中。
*/

public boolean addAll(int index, Collection<? extends E> c) {
rangeCheckForAdd(index);

Object[] a = c.toArray();
int numNew = a.length;
ensureCapacityInternal(size + numNew); // Increments modCount

int numMoved = size - index;
if (numMoved > 0)
System.arraycopy(elementData, index, elementData, index + numNew,
numMoved);

System.arraycopy(a, 0, elementData, index, numNew);
size += numNew;
return numNew != 0;
}

/**
* 移除列表中索引在 fromIndex(包括)和 toIndex(不包括)之间的所有元素。
*/

protected void removeRange(int fromIndex, int toIndex) {
modCount++;
int numMoved = size - toIndex;
System.arraycopy(elementData, toIndex, elementData, fromIndex,
numMoved);

// clear to let GC do its work
int newSize = size - (toIndex-fromIndex);
for (int i = newSize; i < size; i++) {
elementData[i] = null;
}
size = newSize;
}

/**
* 边界检查
*/

private void rangeCheck(int index) {
if (index >= size)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

/**
* 用于add 和addAll操作的边界检查方法。
*/

private void rangeCheckForAdd(int index) {
if (index > size || index < 0)
throw new IndexOutOfBoundsException(outOfBoundsMsg(index));
}

/**
* 构造IndexOutOfBoundsException异常信息封装。
*/

private String outOfBoundsMsg(int index) {
return "Index: "+index+", Size: "+size;
}

/**
*找到ArrayLis中 与Collection的交集部分并从当前List中移除
*/

public boolean removeAll(Collection<?> c) {
return batchRemove(c, false);
}

/**
* 保留ArrayList 与Collection的交集,并将剩余部分移除
*/

public boolean retainAll(Collection<?> c) {
return batchRemove(c, true);
}
/**
* removeAll(Collection<?> c) retainAll(Collection<?> c)两个方法的具体实现
*/

private boolean batchRemove(Collection<?> c, boolean complement) {
final Object[] elementData = this.elementData;
int r = 0, w = 0;
boolean modified = false;
try {
for (; r < size; r++)
if (c.contains(elementData[r]) == complement)
elementData[w++] = elementData[r];
} finally {
// Preserve behavioral compatibility with AbstractCollection,
// even if c.contains() throws.
if (r != size) {
System.arraycopy(elementData, r,
elementData, w,
size - r);
w += size - r;
}
if (w != size) {
// clear to let GC do its work
for (int i = w; i < size; i++)
elementData[i] = null;
modCount += size - w;
size = w;
modified = true;
}
}
return modified;
}

/**
* 将ArrayList实例的保存至流中,序列化。
*/

private void writeObject(java.io.ObjectOutputStream s)
throws java.io.IOException{
// Write out element count, and any hidden stuff
int expectedModCount = modCount;
s.defaultWriteObject();

// Write out size as capacity for behavioural compatibility with clone()
s.writeInt(size);

// Write out all elements in the proper order.
for (int i=0; i<size; i++) {
s.writeObject(elementData[i]);
}

if (modCount != expectedModCount) {
throw new ConcurrentModificationException();
}
}

/**
* 反序列化,从流中还原ArrayList实例。
*/

private void readObject(java.io.ObjectInputStream s)
throws java.io.IOException, ClassNotFoundException {
elementData = EMPTY_ELEMENTDATA;

// Read in size, and any hidden stuff
s.defaultReadObject();

// Read in capacity
s.readInt(); // ignored

if (size > 0) {
// be like clone(), allocate array based upon size not capacity
ensureCapacityInternal(size);

Object[] a = elementData;
// Read in all elements in the proper order.
for (int i=0; i<size; i++) {
a[i] = s.readObject();
}
}
}

//省略其余部分...
}

为了便于理解,对源码进行了中文注释。
ArrayList 直接继承于AbstractList类,这是一个抽象类,定义了一些基本操作。
至少从源码中我们可以得到以下几点:
1. ArrayList内部使用数组来保存元素。
2. ArrayList 实现了RandomAccess, Cloneable, java.io.Serializable三个标记接口,表示它自身支持快速随机访问,克隆,序列化。
3. ArrayList 不具备并发访问特性,因为所有的方法没有加锁机制。
4. 如果不指定容量大小,默认情况下,ArrayList容量为10,在JDk1.7中ArrayList最大容量为 Integer.MAX_VALUE - 8.
5. ArrayList 内部具备自动扩容机制,当容量不足时,会自动申请内存空间。

扩容实现方案

ArrayList 具体的扩容最终会调用到grow方法。

private void grow(int minCapacity) {  
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}

具体扩容过程

  首先得到数组的旧容量,然后进行oldCapacity + (oldCapacity >> 1),将oldCapacity 右移一位,其效果相当于oldCapacity /2,我们知道位运算的速度远远快于整除运算,整句运算式的结果就是将新容量更新为旧容量的1.5倍,然后检查新容量是否大于最小需要容量,若还是小于最小需要容量,那么就把最小需要容量当作数组的新容量,接着,再检查新容量是否超出了ArrayList所定义的最大容量,若超出了,则调用hugeCapacity()来比较minCapacityMAX_ARRAY_SIZE,如果minCapacity大于最大容量,则新容量则为ArrayList定义的最大容量,否则,新容量大小则为minCapacity。

特别注意

还有一点需要注意的是,扩容是创建一个新的数组,然后将旧数组上的数组copy到新数组,最终调用的是System类中的native方法。

 public static native void arraycopy(Object src,  int  srcPos,
Object dest, int destPos,
int length);

这是一个很大的消耗,所以在我们使用ArrayList时,最好能预计数据的大小,在第一次创建时就申请够内存。