简介
TreeMap使用红黑树存储元素,可以保证元素按key值的大小进行遍历。
继承体系
TreeMap实现了Map、SortedMap、NavigableMap、Cloneable、Serializable等接口。
SortedMap规定了元素可以按key的大小来遍历,它定义了一些返回部分map的方法。
1 | public interface SortedMap<K,V> extends Map<K,V> { |
NavigableMap是对SortedMap的增强,定义了一些返回离目标key最近的元素的方法。
1 | public interface NavigableMap<K,V> extends SortedMap<K,V> { |
存储结构
TreeMap只使用到了红黑树,所以它的时间复杂度为O(log n),我们再来回顾一下红黑树的特性。
(1)每个节点或者是黑色,或者是红色。
(2)根节点是黑色。
(3)每个叶子节点(NIL)是黑色。(注意:这里叶子节点,是指为空(NIL或NULL)的叶子节点!)
(4)如果一个节点是红色的,则它的子节点必须是黑色的。
(5)从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。
源码解析
属性
1 | /** |
(1)comparator
按key的大小排序有两种方式,一种是key实现Comparable接口,一种方式通过构造方法传入比较器。
(2)root
根节点,TreeMap没有桶的概念,所有的元素都存储在一颗树中。
Entry内部类
存储节点,典型的红黑树结构。
1 | static final class Entry<K,V> implements Map.Entry<K,V> { |
构造方法
1 | /** |
构造方法主要分成两类,一类是使用comparator比较器,一类是key必须实现Comparable接口。
其实,笔者认为这两种比较方式可以合并成一种,当没有传comparator的时候,可以用以下方式来给comparator赋值,这样后续所有的比较操作都可以使用一样的逻辑处理了,而不用每次都检查comparator为空的时候又用Comparable来实现一遍逻辑。
1 | // 如果comparator为空,则key必须实现Comparable接口,所以这里肯定可以强转 |
get(Object key)方法
获取元素,典型的二叉查找树的查找方法。
1 | public V get(Object key) { |
(1)从root遍历整个树;
(2)如果待查找的key比当前遍历的key小,则在其左子树中查找;
(3)如果待查找的key比当前遍历的key大,则在其右子树中查找;
(4)如果待查找的key与当前遍历的key相等,则找到了该元素,直接返回;
(5)从这里可以看出是否有comparator分化成了两个方法,但是内部逻辑一模一样,因此可见笔者comparator = (k1, k2) -> ((Comparable<? super K>)k1).compareTo(k2);
这种改造的必要性。
我是一条美丽的分割线,前方高能,请做好准备。
特性再回顾
(1)每个节点或者是黑色,或者是红色。
(2)根节点是黑色。
(3)每个叶子节点(NIL)是黑色。(注意:这里叶子节点,是指为空(NIL或NULL)的叶子节点!)
(4)如果一个节点是红色的,则它的子节点必须是黑色的。
(5)从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。
左旋
左旋,就是以某个节点为支点向左旋转。
整个左旋过程如下:
(1)将 y的左节点 设为 x的右节点,即将 β 设为 x的右节点;
(2)将 x 设为 y的左节点的父节点,即将 β的父节点 设为 x;
(3)将 x的父节点 设为 y的父节点;
(4)如果 x的父节点 为空节点,则将y设置为根节点;如果x是它父节点的左(右)节点,则将y设置为x父节点的左(右)节点;
(5)将 x 设为 y的左节点;
(6)将 x的父节点 设为 y;
让我们来看看TreeMap中的实现:
1 | /** |
右旋
右旋,就是以某个节点为支点向右旋转。
整个右旋过程如下:
(1)将 x的右节点 设为 y的左节点,即 将 β 设为 y的左节点;
(2)将 y 设为 x的右节点的父节点,即 将 β的父节点 设为 y;
(3)将 y的父节点 设为 x的父节点;
(4)如果 y的父节点 是 空节点,则将x设为根节点;如果y是它父节点的左(右)节点,则将x设为y的父节点的左(右)节点;
(5)将 y 设为 x的右节点;
(6)将 y的父节点 设为 x;
让我们来看看TreeMap中的实现:
1 | /** |
插入元素
插入元素,如果元素在树中存在,则替换value;如果元素不存在,则插入到对应的位置,再平衡树。
1 | public V put(K key, V value) { |
插入再平衡
插入的元素默认都是红色,因为插入红色元素只违背了第4条特性,那么我们只要根据这个特性来平衡就容易多了。
根据不同的情况有以下几种处理方式:
插入的元素如果是根节点,则直接涂成黑色即可,不用平衡;
插入的元素的父节点如果为黑色,不需要平衡;
插入的元素的父节点如果为红色,则违背了特性4,需要平衡,平衡时又分成下面三种情况:
(如果父节点是祖父节点的左节点)
情况 | 策略 |
---|---|
1)父节点为红色,叔叔节点也为红色 | (1)将父节点设为黑色; (2)将叔叔节点设为黑色; (3)将祖父节点设为红色; (4)将祖父节点设为新的当前节点,进入下一次循环判断; |
2)父节点为红色,叔叔节点为黑色,且当前节点是其父节点的右节点 | (1)将父节点作为新的当前节点; (2)以新当节点为支点进行左旋,进入情况3); |
3)父节点为红色,叔叔节点为黑色,且当前节点是其父节点的左节点 | (1)将父节点设为黑色; (2)将祖父节点设为红色; (3)以祖父节点为支点进行右旋,进入下一次循环判断; |
(如果父节点是祖父节点的右节点,则正好与上面反过来)
情况 | 策略 |
---|---|
1)父节点为红色,叔叔节点也为红色 | (1)将父节点设为黑色; (2)将叔叔节点设为黑色; (3)将祖父节点设为红色; (4)将祖父节点设为新的当前节点,进入下一次循环判断; |
2)父节点为红色,叔叔节点为黑色,且当前节点是其父节点的左节点 | (1)将父节点作为新的当前节点; (2)以新当节点为支点进行右旋; |
3)父节点为红色,叔叔节点为黑色,且当前节点是其父节点的右节点 | (1)将父节点设为黑色; (2)将祖父节点设为红色; (3)以祖父节点为支点进行左旋,进入下一次循环判断; |
让我们来看看TreeMap中的实现:
1 | /** |
插入元素举例
我们依次向红黑树中插入 4、2、3 三个元素,来一起看看整个红黑树平衡的过程。
三个元素都插入完成后,符合父节点是祖父节点的左节点,叔叔节点为黑色,且当前节点是其父节点的右节点,即情况2)。
情况2)需要做以下两步处理:
(1)将父节点作为新的当前节点;
(2)以新当节点为支点进行左旋,进入情况3);
情况3)需要做以下三步处理:
(1)将父节点设为黑色;
(2)将祖父节点设为红色;
(3)以祖父节点为支点进行右旋,进入下一次循环判断;
下一次循环不符合父节点为红色了,退出循环,插入再平衡完成。
删除元素
删除元素本身比较简单,就是采用二叉树的删除规则。
(1)如果删除的位置有两个叶子节点,则从其右子树中取最小的元素放到删除的位置,然后把删除位置移到替代元素的位置,进入下一步。
(2)如果删除的位置只有一个叶子节点(有可能是经过第一步转换后的删除位置),则把那个叶子节点作为替代元素,放到删除的位置,然后把这个叶子节点删除。
(3)如果删除的位置没有叶子节点,则直接把这个删除位置的元素删除即可。
(4)针对红黑树,如果删除位置是黑色节点,还需要做再平衡。
(5)如果有替代元素,则以替代元素作为当前节点进入再平衡。
(6)如果没有替代元素,则以删除的位置的元素作为当前节点进入再平衡,平衡之后再删除这个节点。
1 | public V remove(Object key) { |
删除再平衡
经过上面的处理,真正删除的肯定是黑色节点才会进入到再平衡阶段。
因为删除的是黑色节点,导致整颗树不平衡了,所以这里我们假设把删除的黑色赋予当前节点,这样当前节点除了它自已的颜色还多了一个黑色,那么:
(1)如果当前节点是根节点,则直接涂黑即可,不需要再平衡;
(2)如果当前节点是红+黑节点,则直接涂黑即可,不需要平衡;
(3)如果当前节点是黑+黑节点,则我们只要通过旋转把这个多出来的黑色不断的向上传递到一个红色节点即可,这又可能会出现以下四种情况:
(假设当前节点为父节点的左子节点)
情况 | 策略 |
---|---|
1)x是黑+黑节点,x的兄弟是红节点 | (1)将兄弟节点设为黑色; (2)将父节点设为红色; (3)以父节点为支点进行左旋; (4)重新设置x的兄弟节点,进入下一步; |
2)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的两个子节点都是黑色 | (1)将兄弟节点设置为红色; (2)将x的父节点作为新的当前节点,进入下一次循环; |
3)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的右子节点为黑色,左子节点为红色 | (1)将兄弟节点的左子节点设为黑色; (2)将兄弟节点设为红色; (3)以兄弟节点为支点进行右旋; (4)重新设置x的兄弟节点,进入下一步; |
3)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的右子节点为红色,左子节点任意颜色 | (1)将兄弟节点的颜色设为父节点的颜色; (2)将父节点设为黑色; (3)将兄弟节点的右子节点设为黑色; (4)以父节点为支点进行左旋; (5)将root作为新的当前节点(退出循环); |
(假设当前节点为父节点的右子节点,正好反过来)
情况 | 策略 |
---|---|
1)x是黑+黑节点,x的兄弟是红节点 | (1)将兄弟节点设为黑色; (2)将父节点设为红色; (3)以父节点为支点进行右旋; (4)重新设置x的兄弟节点,进入下一步; |
2)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的两个子节点都是黑色 | (1)将兄弟节点设置为红色; (2)将x的父节点作为新的当前节点,进入下一次循环; |
3)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的左子节点为黑色,右子节点为红色 | (1)将兄弟节点的右子节点设为黑色; (2)将兄弟节点设为红色; (3)以兄弟节点为支点进行左旋; (4)重新设置x的兄弟节点,进入下一步; |
3)x是黑+黑节点,x的兄弟是黑节点,且兄弟节点的左子节点为红色,右子节点任意颜色 | (1)将兄弟节点的颜色设为父节点的颜色; (2)将父节点设为黑色; (3)将兄弟节点的左子节点设为黑色; (4)以父节点为支点进行右旋; (5)将root作为新的当前节点(退出循环); |
让我们来看看TreeMap中的实现:
1 | /** |
删除元素举例
假设我们有下面这样一颗红黑树。
我们删除6号元素,则从右子树中找到了最小元素7,7又没有子节点了,所以把7作为当前节点进行再平衡。
我们看到7是黑节点,且其兄弟为黑节点,且其兄弟的两个子节点都是红色,满足情况4),平衡之后如下图所示。
我们再删除7号元素,则从右子树中找到了最小元素8,8有子节点且为黑色,所以8的子节点9是替代节点,以9为当前节点进行再平衡。
我们发现9是红节点,则直接把它涂成黑色即满足了红黑树的特性,不需要再过多的平衡了。
这次我们来个狠的,把根节点删除,从右子树中找到了最小的元素5,5没有子节点,所以把5作为当前节点进行再平衡。
我们看到5是黑节点,且其兄弟为红色,符合情况1),平衡之后如下图所示,然后进入情况2)。
对情况2)进行再平衡后如下图所示。
然后进入下一次循环,发现不符合循环条件了,直接把x涂为黑色即可,退出这个方法之后会把旧x删除掉(见deleteEntry()方法),最后的结果就是下面这样。
二叉树的遍历
我们知道二叉查找树的遍历有前序遍历、中序遍历、后序遍历。
(1)前序遍历,先遍历我,再遍历我的左子节点,最后遍历我的右子节点;
(2)中序遍历,先遍历我的左子节点,再遍历我,最后遍历我的右子节点;
(3)后序遍历,先遍历我的左子节点,再遍历我的右子节点,最后遍历我;
这里的前中后都是以“我”的顺序为准的,我在前就是前序遍历,我在中就是中序遍历,我在后就是后序遍历。
下面让我们看看经典的中序遍历是怎么实现的:
1 | public class TreeMapTest { |
TreeMap的遍历
从上面二叉树的遍历我们很明显地看到,它是通过递归的方式实现的,但是递归会占用额外的空间,直接到线程栈整个释放掉才会把方法中申请的变量销毁掉,所以当元素特别多的时候是一件很危险的事。
(上面的例子中,没有申请额外的空间,如果有声明变量,则可以理解为直到方法完成才会销毁变量)
那么,有没有什么方法不用递归呢?
让我们来看看java中的实现:
1 |
|
是不是很简单?!
(1)寻找第一个节点;
从根节点开始找最左边的节点,即最小的元素。
1 | final Entry<K,V> getFirstEntry() { |
(2)循环遍历后继节点;
寻找后继节点这个方法我们在删除元素的时候也用到过,当时的场景是有右子树,则从其右子树中寻找最小的节点。
1 | static <K,V> TreeMap.Entry<K,V> successor(Entry<K,V> t) { |
让我们一起来分析下这种方式的时间复杂度吧。
首先,寻找第一个元素,因为红黑树是接近平衡的二叉树,所以找最小的节点,相当于是从顶到底了,时间复杂度为O(log n);
其次,寻找后继节点,因为红黑树插入元素的时候会自动平衡,最坏的情况就是寻找右子树中最小的节点,时间复杂度为O(log k),k为右子树元素个数;
最后,需要遍历所有元素,时间复杂度为O(n);
所以,总的时间复杂度为 O(log n) + O(n * log k) ≈ O(n)。
虽然遍历红黑树的时间复杂度是O(n),但是它实际是要比跳表要慢一点的,啥?跳表是啥?安心,后面会讲到跳表的。
总结
到这里红黑树就整个讲完了,让我们再回顾下红黑树的特性:
(1)每个节点或者是黑色,或者是红色。
(2)根节点是黑色。
(3)每个叶子节点(NIL)是黑色。(注意:这里叶子节点,是指为空(NIL或NULL)的叶子节点!)
(4)如果一个节点是红色的,则它的子节点必须是黑色的。
(5)从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。
除了上述这些标准的红黑树的特性,你还能讲出来哪些TreeMap的特性呢?
(1)TreeMap的存储结构只有一颗红黑树;
(2)TreeMap中的元素是有序的,按key的顺序排列;
(3)TreeMap比HashMap要慢一些,因为HashMap前面还做了一层桶,寻找元素要快很多;
(4)TreeMap没有扩容的概念;
(5)TreeMap的遍历不是采用传统的递归式遍历;
(6)TreeMap可以按范围查找元素,查找最近的元素;
(7)欢迎补充…
带详细注释的源码地址
微信用户请“阅读原文”,进入仓库查看,其它渠道直接点击此链接即可跳转。
彩蛋
上面我们说到的删除元素的时候,如果当前节点有右子树,则从右子树中寻找最小元素所在的位置,把这个位置的元素放到当前位置,再把删除的位置移到那个位置,再看有没有替代元素,balabala。
那么,除了这种方式,还有没有其它方式呢?
答案当然是肯定的。
上面我们说的红黑树的插入元素、删除元素的过程都是标准的红黑树是那么干的,其实也不一定要完全那么做。
比如说,删除元素,如果当前节点有左子树,那么,我们可以找左子树中最大元素的位置,然后把这个位置的元素放到当前节点,再把删除的位置移到那个位置,再看有没有替代元素,balabala。
举例说明,比如下面这颗红黑树:
我们删除10这个元素,从左子树中找最大的,找到了9这个元素,那么把9放到10的位置,然后把删除的位置移到原来9的位置,发现不需要作平衡(红+黑节点),直接把这个位置删除就可以了。
同样是满足红黑树的特性的。
所以,死读书不如无书,学习的过程也是一个不断重塑知识的过程。