ArrayList原理分析

ArrayList是最常用的集合之一,其特点为:

  • 数据结构为数组,随机访问快,插入或删除慢

  • 线程不安全

  • 元素可为空,可重复,有序(是指插入的顺序)

下面,就从以上特点入手,简单分析一下ArrayList的代码。

数据结构为数组

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable{

    //默认容量大小:10,即如果在创建ArrayList的时候如果不指定初始大小,则默认为10
    private static final int DEFAULT_CAPACITY = 10;

    //底层存放元素的数据结构,就是一个数组
    transient Object[] elementData; 

    //ArrayList中当前的元素个数
    private int size;

    /**
     *
     * 构造方法,指定初始大小。
     *
     * 如果initialCapacity大于0,就new一个数组,这个数组的容量为initialCapacity
     * 如果initialCapacity等于0,就让底层数组为{}。
     * 如果initialCapacity小于0,就抛出异常。
     */
    public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);
        }
    }

    //构造方法,初始大小为10
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

    //构造方法,传入一个集合
    public ArrayList(Collection<? extends E> c) {
        elementData = c.toArray();
        if ((size = elementData.length) != 0) {
            // c.toArray might (incorrectly) not return Object[] (see 6260652)
            if (elementData.getClass() != Object[].class)
                elementData = Arrays.copyOf(elementData, size, Object[].class);
        } else {
            // replace with empty array.
            this.elementData = EMPTY_ELEMENTDATA;
        }
    }
}

随机访问快

在数组中的元素,可以通过下标直接访问,因此说随机访问速度快。

此外,ArrayList还实现了RandomAccess接口:该接口仅仅是一个标识,其中并没有具体的方法要重写。实现该空接口就意味着支持随机访问,并且在遍历的时候:

也就是说,在遍历集合的时候,可以通过这种方法来优化:

插入或删除速度慢

首先看add方法:

对于add(E e)方法,会将元素添加到数组的最后,此时速度并不慢。但是在调用add(int index, E element)方法的时候,会将index位置以及右侧所有元素向右移动一位,因此说插入速度慢。 此外,如果元素为空,也会成功添加到集合中,也就是说ArrayList允许元素为空,也可以重复。

注意add(int index, E element)set(int index, E element)方法的区别:

  • add并不会改变原index位置处的元素,而是index位置及该位置右边的元素右移一位,将新元素插在index位置处。

  • set则是用新元素直接替换掉index位置的旧元素,但不会影响index位置之后的元素。

再看移除操作:

同样是将元素左移,需要操作大量除index位置处的元素。

在上面的代码中,元素左移和右移是通过方法System.arraycopy方法实现的。arraycopySystem类的静态方法,是一个native方法。

意思是:将数组src从位置srcPos开始的length个元素,放到数组dest中(从位置destPos开始放)。

线程不安全

可以先看ArrayList线程不安全分析中的测试小例子,理解几种线程不安全的情况。我的理解是,多个线程对同一ArraryList实例进行修改时(或者一些线程在修改,另一些线程在遍历),由于未进行同步,导致成员变量size值或者内部数组elementData元素不一样,导致出错:或者越界或者遍历时fail-fast等。限于水平,对Java内存模型的认识不足,不再叙述。

扩容方式

什么时候会扩容?肯定是在添加元素的时候,如果内部数组不足以存放要添加的元素,才会去扩大数组的容量。看下面的代码(去掉了无关的代码)

扩容的大小为

如果一开始就能估计出ArrayList的大小,构造ArrayList时指定初始容量是很好的习惯,可以避免多次扩容带来的额外开销。

Last updated