二叉搜索树简介

二叉搜索树简介

二叉搜索树是一种二叉树的树形数据结构,其定义如下:

  1. 空树是二叉搜索树。

  2. 若二叉搜索树的左子树不为空,则其左子树上所有点的附加权值均小于其根节点的值。

  3. 若二叉搜索树的右子树不为空,则其右子树上所有点的附加权值均大于其根节点的值。

  4. 二叉搜索树的左右子树均为二叉搜索树。

二叉搜索树上的基本操作所花费的时间与这棵树的高度成正比。对于一个有 n 个结点的二叉搜索树中,这些操作的最优时间复杂度为 O(\log n) ,最坏为 O(n) 。随机构造这样一棵二叉搜索树的期望高度为 O(\log n)

基本操作

遍历二叉搜索树

由二叉搜索树的递归定义可得,二叉搜索树的中序遍历权值的序列为非降的序列。时间复杂度为 O(n)

遍历一棵二叉搜索树的代码如下:

1
2
3
4
5
6
7
void print(int o)  //遍历以 o 为根节点的二叉搜索树
{
  if (!o) return;          //遇到空树,返回
  print(lc[o]);            //递归遍历左子树
  printf("%d\n", val[o]);  //输出根节点信息
  print(rc[o]);            //递归遍历右子树
}

查找最小/最大值

由二叉搜索树的性质可得,二叉搜索树上的最小值为二叉搜索树左链的顶点,最大值为二叉搜索树右链的顶点。时间复杂度为 O(h)

1
2
3
4
5
6
7
8
int findmin(int o) {
  if (!lc[o]) return val[o];
  return findmin(lc[o]);  //一直向左儿子跳
}
int findmax(int o) {
  if (!rc[o]) return val[o];
  return findmax(rc[o]);  //一直向右儿子跳
}

插入一个元素

定义 insert(o,v) 为在以 o 为根节点的二叉搜索树中插入一个值为 v 的新节点。

分类讨论如下:

o 为空,直接返回一个值为 v 的新节点。

o 的权值大于 v ,在 o 的左子树中插入权值为 v 的节点。

o 的权值等于 v ,该节点的附加域该值出现的次数自增 1

o 的权值小于 v ,在 o 的右子树中插入权值为 v 的节点。

时间复杂度为 O(h)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
void insert(int o, int v) {
  if (!o) {
    val[o = ++sum] = v;
    cnt[o] = siz[o] = 1;
    return;
  }
  siz[o]++;
  if (val[o] > v) insert(lc[o], v);
  if (val[o] == v) {
    cnt[o]++;
    return;
  }
  if (val[o] < v) insert(rc[o], v);
}

删除一个元素

定义 delete(o,v) 为在以 o 为根节点的二叉搜索树中删除一个值为 v 的节点。

先在二叉搜索树中找到权值为 v 的节点,分类讨论如下:

若该节点的附加 cnt1

o 为叶子节点,直接删除该节点即可。

o 为链节点,即只有一个儿子的节点,返回这个儿子。

o 有两个非空子节点,一般是用它左子树的最大值或右子树的最小值代替它,然后将它删除。

时间复杂度 O(h)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
int deletemin(int o) {
  if (!lc[o])
    int ret = val[o], o = rc[o], return ret;
  else
    return deletemin(lc[o]);
}
void delete (int& o, int v) {
  siz[o]--;
  if (val[o] == v) {
    if (lc[o] && rc[o])
      o = deletemin(rc[o]);
    else
      o = lc[o] + rc[o];
    return;
  }
  if (val[o] > v) delete (lc[o], v);
  if (val[o] < v) delete (rc[o], v);
}

求元素的排名

排名定义为将数组元素排序后第一个相同元素之前的数的个数 +1

维护每个根节点的子树大小 siz 。查找一个元素的排名,首先从根节点跳到这个元素,若向右跳,答案加上左儿子节点个数加当前节点重复的数个数,最后答案加上终点的左儿子子树大小 +1

时间复杂度 O(h)

1
2
3
4
5
int queryrnk(int o, int v) {
  if (val[o] == v) return siz[lc[o]] + 1;
  if (val[o] > v) return queryrnk(lc[o], v);
  if (val[o] < v) return queryrnk(rc[o], v) + siz[lc[o]] + cnt[o];
}

查找排名为 k 的元素

在一棵子树中,根节点的排名取决于其左子树的大小。

若其左子树的大小大于等于 k ,则该元素在左子树中;

若其左子树的大小在区间 [k-1,k+cnt-1] 中,则该元素为子树的根节点;

若其左子树的大小小于 k+cnt-1 ,则该元素在右子树中。

时间复杂度 O(h)

1
2
3
4
5
6
int querykth(int o, int k) {
  if (siz[lc[o]] >= k) return querykth(lc[o], k);
  if (siz[lc[o]] < k + cnt - 1)
    return querykth(rc[o], k - siz[lc[o]] - cnt[o] + 1);
  return o;
}

评论