集合系列—LinkedList源码分析

时间:2021-10-05 09:19:50

                                集合系列—LinkedList源码分析

上篇我们分析了ArrayList的底层实现,知道了ArrayList底层是基于数组实现的,因此具有查找修改快而插入删除慢的特点。本篇介绍的LinkedList是List接口的另一种实现,它的底层是基于双向链表实现的,因此它具有插入删除快而查找修改慢的特点,此外,通过对双向链表的操作还可以实现队列和栈的功能。


LinkedList的底层结构如下图所示。

集合系列—LinkedList源码分析

F表示头结点引用,L表示尾结点引用,链表的每个结点都有三个元素,分别是前继结点引用(P),结点元素的值(E),后继结点的引用(N)。结点由内部类Node表示,我们看看它的内部结构。

//结点内部类
private static class Node<E> {
   E item;          //元素
   Node<E> next;    //下一个节点
   Node<E> prev;    //上一个节点

   Node(Node<E> prev, E element, Node<E> next) {
       this.item = element;
       this.next = next;
       this.prev = prev;
   }
}


Node这个内部类其实很简单,只有三个成员变量和一个构造器,item表示结点的值,next为下一个结点的引用,prev为上一个结点的引用,通过构造器传入这三个值。接下来再看看LinkedList的成员变量和构造器。

//集合元素个数
transient int size = 0;

//头结点引用
transient Node<E> first;

//尾节点引用
transient Node<E> last;

//无参构造器
public LinkedList() {}

//传入外部集合的构造器
public LinkedList(Collection<? extends E> c) {
   this();
   addAll(c);
}


LinkedList持有头结点的引用和尾结点的引用,它有两个构造器,一个是无参构造器,一个是传入外部集合的构造器。与ArrayList不同的是LinkedList没有指定初始大小的构造器。看看它的增删改查方法。

//增(添加)
public boolean add(E e) {
   //在链表尾部添加
   linkLast(e);
   return true;
}

//增(插入)
public void add(int index, E element) {
   checkPositionIndex(index);
   if (index == size) {
       //在链表尾部添加
       linkLast(element);
   } else {
       //在链表中部插入
       linkBefore(element, node(index));
   }
}

//删(给定下标)
public E remove(int index) {
   //检查下标是否合法
   checkElementIndex(index);
   return unlink(node(index));
}

//删(给定元素)
public boolean remove(Object o) {
   if (o == null) {
       for (Node<E> x = first; x != null; x = x.next) {
           if (x.item == null) {
               unlink(x);
               return true;
           }
       }
   } else {
       //遍历链表
       for (Node<E> x = first; x != null; x = x.next) {
           if (o.equals(x.item)) {
               //找到了就删除
               unlink(x);
               return true;
           }
       }
   }
   return false;
}

//改
public E set(int index, E element) {
   //检查下标是否合法
   checkElementIndex(index);
   //获取指定下标的结点引用
   Node<E> x = node(index);
   //获取指定下标结点的值
   E oldVal = x.item;
   //将结点元素设置为新的值
   x.item = element;
   //返回之前的值
   return oldVal;
}

//查
public E get(int index) {
   //检查下标是否合法
   checkElementIndex(index);
   //返回指定下标的结点的值
   return node(index).item;
}


LinkedList的添加元素的方法主要是调用linkLast和linkBefore两个方法,linkLast方法是在链表后面链接一个元素,linkBefore方法是在链表中间插入一个元素。LinkedList的删除方法通过调用unlink方法将某个元素从链表中移除。下面我们看看链表的插入和删除操作的核心代码。

//链接到指定结点之前
void linkBefore(E e, Node<E> succ) {
   //获取给定结点的上一个结点引用
   final Node<E> pred = succ.prev;
   //创建新结点, 新结点的上一个结点引用指向给定结点的上一个结点
   //新结点的下一个结点的引用指向给定的结点
   final Node<E> newNode = new Node<>(pred, e, succ);
   //将给定结点的上一个结点引用指向新结点
   succ.prev = newNode;
   //如果给定结点的上一个结点为空, 表明给定结点为头结点
   if (pred == null) {
       //将头结点引用指向新结点
       first = newNode;
   } else {
       //否则, 将给定结点的上一个结点的下一个结点引用指向新结点
       pred.next = newNode;
   }
   //集合元素个数加一
   size++;
   //修改次数加一
   modCount++;
}

//卸载指定结点
E unlink(Node<E> x) {
   //获取给定结点的元素
   final E element = x.item;
   //获取给定结点的下一个结点的引用
   final Node<E> next = x.next;
   //获取给定结点的上一个结点的引用
   final Node<E> prev = x.prev;

   //如果给定结点的上一个结点为空, 说明给定结点为头结点
   if (prev == null) {
       //将头结点引用指向给定结点的下一个结点
       first = next;
   } else {
       //将上一个结点的后继结点引用指向给定结点的后继结点
       prev.next = next;
       //将给定结点的上一个结点置空
       x.prev = null;
   }

   //如果给定结点的下一个结点为空, 说明给定结点为尾结点
   if (next == null) {
       //将尾结点引用指向给定结点的上一个结点
       last = prev;
   } else {
       //将下一个结点的前继结点引用指向给定结点的前继结点
       next.prev = prev;
       x.next = null;
   }

   //将给定结点的元素置空
   x.item = null;
   //集合元素个数减一
   size--;
   //修改次数加一
   modCount++;
   return element;
}


linkBefore和unlink是具有代表性的链接结点和卸载结点的操作,其他的链接和卸载两端结点的方法与此类似,所以我们重点介绍linkBefore和unlink方法。

linkBefore方法的过程图:

集合系列—LinkedList源码分析

unlink方法的过程图:

集合系列—LinkedList源码分析

 

通过上面图示看到对链表的插入和删除操作的时间复杂度都是O(1),而对链表的查找和修改操作都需要遍历链表进行元素的定位,这两个操作都是调用的node(int index)方法定位元素,看看它是怎样通过下标来定位元素的。

//根据指定位置获取结点
Node<E> node(int index) {
   //如果下标在链表前半部分, 就从头开始查起
   if (index < (size >> 1)) {
       Node<E> x = first;
       for (int i = 0; i < index; i++) {
           x = x.next;
       }
       return x;
   } else {
       //如果下标在链表后半部分, 就从尾开始查起
       Node<E> x = last;
       for (int i = size - 1; i > index; i--) {
           x = x.prev;
       }
       return x;
   }
}


通过下标定位时先判断是在链表的上半部分还是下半部分,如果是在上半部分就从头开始找起,如果是下半部分就从尾开始找起,因此通过下标的查找和修改操作的时间复杂度是O(n/2)。通过对双向链表的操作还可以实现单项队列,双向队列和栈的功能。

单向队列操作:

//获取头结点
public E peek() {
   final Node<E> f = first;
   return (f == null) ? null : f.item;
}

//获取头结点
public E element() {
   return getFirst();
}

//弹出头结点
public E poll() {
   final Node<E> f = first;
   return (f == null) ? null : unlinkFirst(f);
}

//移除头结点
public E remove() {
   return removeFirst();
}

//在队列尾部添加结点
public boolean offer(E e) {
   return add(e);
}


双向队列操作:

//在头部添加
public boolean offerFirst(E e) {
   addFirst(e);
   return true;
}

//在尾部添加
public boolean offerLast(E e) {
   addLast(e);
   return true;
}

//获取头结点
public E peekFirst() {
   final Node<E> f = first;
   return (f == null) ? null : f.item;
}

//获取尾结点
public E peekLast() {
   final Node<E> l = last;
   return (l == null) ? null : l.item;
}


栈操作:

//入栈
public void push(E e) {
   addFirst(e);
}

//出栈
public E pop() {
   return removeFirst();
}


不管是单向队列还是双向队列还是栈,其实都是对链表的头结点和尾结点进行操作,它们的实现都是基于addFirst(),addLast(),removeFirst(),removeLast()这四个方法,它们的操作和linkBefore()和unlink()类似,只不过一个是对链表两端操作,一个是对链表中间操作。可以说这四个方法都是linkBefore()和unlink()方法的特殊情况,因此不难理解它们的内部实现,在此不多做介绍。到这里,我们对LinkedList的分析也即将结束,对全文中的重点做个总结:

  • LinkedList是基于双向链表实现的,不论是增删改查方法还是队列和栈的实现,都可通过操作结点实现

  • LinkedList无需提前指定容量,因为基于链表操作,集合的容量随着元素的加入自动增加

  • LinkedList删除元素后集合占用的内存自动缩小,无需像ArrayList一样调用trimToSize()方法

  • LinkedList的所有方法没有进行同步,因此它也不是线程安全的,应该避免在多线程环境下使用

  • 以上分析基于JDK1.7,其他版本会有些出入,因此不能一概而论。


        </div>
            </div>