本篇针对面试中常见的二叉树操作作个总结: (1):前序遍历,中序遍历,后序遍历; (2):层次遍历; (3):求树的结点数; (4):求树的叶子数; (5):求树的深度; (6):求二叉树第k层的结点个数; (7):判断两棵二叉树是否结构相同; (8):求二叉树的镜像; (9):求两个结点的最低公共祖先结点; (10):求任意两结点距离; (11):找出二叉树中某个结点的所有祖先结点; (12):不使用递归和栈遍历二叉树; (13):二叉树前序中序推后序; (14):判断二叉树是不是完全二叉树; (15):判断是否是二叉查找树的后序遍历结果; (16):给定一个二叉查找树中的结点,找出在中序遍历下它的后继和前驱; (17):二分查找树转化为排序的循环双链表; (18):有序链表转化为平衡的二分查找树; (19):判断是否是二叉查找树。
**对于当前结点,先输出该结点,然后输出它的左孩子,最后输出它的右孩子。**以上图为例,递归的过程如下: (1):输出1,接着左孩子; (2):输出2,接着左孩子; (3):输出4,左孩子为空,再接着右孩子; (4):输出6,左孩子为空,再接着右孩子; (5):输出7,左右孩子都为空,此时2的左子树全部输出,2的右子树为空,此时1的左子树全部输出,接着1的右子树; (6):输出3,接着左孩子; (7):输出5,左右孩子为空,此时3的左子树全部输出,3的右子树为空,至此1的右子树全部输出,结束。
而非递归版本只是利用stack模拟上述过程而已,递归的过程也就是出入栈的过程。注意加粗部分的理解。
/* 前序遍历递归版 */
void PreOrderRec(Node * node)
{
if (node == nullptr)
return;
cout << node->data << " "; // 先输出当前结点
PreOrderRec(node->left); // 然后输出左孩子
PreOrderRec(node->right); // 最后输出右孩子
}
/* 前序遍历非递归版 */
void PreOrderNonRec(Node * node)
{
if (node == nullptr)
return;
stack<Node*> S;
cout << node->data << " ";
S.push(node);
node = node->left;
while (!S.empty())
{
while (node)
{
cout << node->data << " "; // 先输出当前结点
S.push(node);
node = node->left; // 然后输出左孩子
} // while 结束意味着左孩子已经全部输出
node = S.top()->right; // 最后输出右孩子
S.pop();
}
}
**对于当前结点,先输出它的左孩子,然后输出该结点,最后输出它的右孩子。**以(1.1)图为例: (1):1-->2-->4,4的左孩子为空,输出4,接着右孩子; (2):6的左孩子为空,输出6,接着右孩子; (3):7的左孩子为空,输出7,右孩子也为空,此时2的左子树全部输出,输出2,2的右孩子为空,此时1的左子树全部输出, 输出1,接着1的右孩子; (4):3-->5,5左孩子为空,输出5,右孩子也为空,此时3的左子树全部输出,而3的右孩子为空,至此1的右子树全部输出, 结束。
/* 中序遍历递归版 */
void InOrderRec(Node * node)
{
if (node == nullptr)
return;
InOrderRec(node->left); // 先输出左孩子
cout << node->data << " "; // 然后输出当前结点
InOrderRec(node->right); // 最后输出右孩子
}
/* 前序遍历非递归版 */
void InOrderNonRec(Node * node)
{
if (node == nullptr)
return;
stack<Node*> S;
S.push(node);
node = node->left;
while (!S.empty())
{
while (node)
{
S.push(node);
node = node->left;
} // while 结束意味着左孩子为空
cout << S.top()->data << " "; // 左孩子已经全部输出,接着输出当前结点
node = S.top()->right; // 左孩子全部输出,当前结点也输出后,最后输出右孩子
S.pop();
}
}
**对于当前结点,先输出它的左孩子,然后输出它的右孩子,最后输出该结点。**依旧以(1.1)图为例: (1):1->2->4->6->7,7无左孩子,也无右孩子,输出7,此时6无左孩子,而6的右子树也全部输出,输出6,此时4无左子 树,而4的右子树全部输出,输出4,此时2的左子树全部输出,且2无右子树,输出2,此时1的左子树全部输出,接着转 向右子树; (2):3->5,5无左孩子,也无右孩子,输出5,此时3的左子树全部输出,且3无右孩子,输出3,此时1的右子树全部输出,输 出1,结束。
非递归版本中,对于一个结点,如果我们要输出它,只有它既没有左孩子也没有右孩子或者它有孩子但是它的孩子已经被输出(由此设置pre变量)。若非上述两种情况,则将该结点的右孩子和左孩子依次入栈,这样就保证了每次取栈顶元素的时候,先依次遍历左子树和右子树。
/* 后序遍历递归版 */
void PostOrderRec(Node * node)
{
if (node == nullptr)
return;
PostOrderRec(node->left); // 先输出左孩子
PostOrderRec(node->right); // 然后输出右孩子
cout << node->data << " "; // 最后输出当前结点
}
/* 后序遍历非递归版 */
void PostOrderNonRec(Node * node)
{
if (node == nullptr)
return;
Node * pre = nullptr;
stack<Node*> S;
S.push(node);
while (!S.empty())
{
node = S.top();
if ((!node->left && !node->right) || // 第一个输出的必是无左右孩子的叶子结点,只要第一个结点输出,
(pre && (pre == node->left || pre == node->right))) // 以后的 pre 就不会是空。此处的判断语句加入一个 pre,只是用来
{ // 确保可以正确输出第一个结点。
cout << node->data << " "; // 左右孩子都全部输出,再输出当前结点
pre = node;
S.pop();
}
else
{
if (node->right)
S.push(node->right); // 先进右孩子,再进左孩子,取出来的才是左孩子
if (node->left)
S.push(node->left);
}
}
}
void LevelOrder(Node * node)
{
Node * p = node;
queue<Node*> Q; // 队列
Q.push(p);
while (!Q.empty())
{
p = Q.front();
cout << p->data << " ";
Q.pop();
if (p->left)
Q.push(p->left); // 注意顺序,先进左孩子
if (p->right)
Q.push(p->right);
}
}
int CountNodes(Node * node)
{
if (node == nullptr)
return 0;
return CountNodes(node->left) + CountNodes(node->right) + 1;
}
int CountLeaves(Node * node)
{
if (node == nullptr)
return 0;
if (!node->left && !node->right)
return 1;
return CountLeaves(node->left) + CountLeaves(node->right);
}
int GetDepth(Node * node)
{
if (node == nullptr)
return 0;
int left_depth = GetDepth(node->left) + 1;
int right_depth = GetDepth(node->right) + 1;
return left_depth > right_depth ? left_depth : right_depth;
}
int GetKLevel(Node * node, int k)
{
if (node == nullptr)
return 0;
if (k == 1)
return 1;
return GetKLevel(node->left, k - 1) + GetKLevel(node->right, k - 1);
}
不考虑数据内容。结构相同意味着对应的左子树和对应的右子树都结构相同。
bool StructureCmp(Node * node1, Node * node2)
{
if (node1 == nullptr && node2 == nullptr)
return true;
else if (node1 == nullptr || node2 == nullptr)
return false;
return StructureCmp(node1->left, node2->left) && Str1uctureCmp(node1->right, node2->right);
}
对于每个结点,我们交换它的左右孩子即可。
void Mirror(Node * node)
{
if (node == nullptr)
return;
Node * temp = node->left;
node->left = node->right;
node->right = temp;
Mirror(node->left);
Mirror(node->right);
}
最低公共祖先,即LCA(Lowest Common Ancestor),见下图:
结点3和结点4的最近公共祖先是结点2,即LCA(3,4)=2。在此,需要注意到当两个结点在同一棵子树上的情况,如结点3和结点2的最近公共祖先为2,即 LCA(3,2)=2。同理LCA(5,6)=4,LCA(6,10)=1。
Node * FindLCA(Node * node, Node * target1, Node * target2)
{
if (node == nullptr)
return nullptr;
if (node == target1 || node == target2)
return node;
Node * left = FindLCA(node->left, target1, target2);
Node * right = FindLCA(node->right, target1, target2);
if (left && right) // 分别在左右子树
return node;
return left ? left : right; // 都在左子树或右子树
}
首先找到两个结点的LCA,然后分别计算LCA与它们的距离,最后相加即可。
int FindLevel(Node * node, Node * target)
{
if (node == nullptr)
return -1;
if (node == target)
return 0;
int level = FindLevel(node->left, target); // 先在左子树找
if (level == -1)
level = FindLevel(node->right, target); // 如果左子树没找到,在右子树找
if (level != -1) // 找到了,回溯
return level + 1;
return -1; // 如果左右子树都没找到
}
int DistanceNodes(Node * node, Node * target1, Node * target2)
{
Node * lca = FindLCA(node, target1, target2); // 找到最低公共祖先结点
int level1 = FindLevel(lca, target1);
int level2 = FindLevel(lca, target2);
return level1 + level2;
}
如果给定结点5,则其所有祖先结点为4,2,1。
bool FindAllAncestors(Node * node, Node * target)
{
if (node == nullptr)
return false;
if (node == target)
return true;
if (FindAllAncestors(node->left, target) || FindAllAncestors(node->right, target)) // 找到了
{
cout << node->data << " ";
return true; // 回溯
}
return false; // 如果左右子树都没找到
}
1968年,高德纳(Donald Knuth)提出一个问题:是否存在一个算法,它不使用栈也不破坏二叉树结构,但是可以完成对二叉树的遍历?随后1979年,James H. Morris提出了二叉树线索化,解决了这个问题。(根据这个概念我们又提出了一个新的数据结构,即线索二叉树,因线索二叉树不是本文要介绍的内容,所以有兴趣的朋友请移步线索二叉树。)
前序,中序,后序遍历,不管是递归版本还是非递归版本,都用到了一个数据结构--栈,为何要用栈?那是因为其它的方式没法记录当前结点的parent,而如果在每个结点的结构里面加个parent分量显然是不现实的,而线索化正好解决了这个问题,其含义就是利用结点的右孩子空指针,指向该结点在中序序列中的后继。下面具体来看看如何使用线索化来完成对二叉树的遍历。
先看前序遍历,步骤如下: (1):如果当前结点的左孩子为空,则输出当前结点并将其右孩子作为当前结点; (2):如果当前结点的左孩子不为空,在当前结点的左子树中找到当前结点在中序遍历下的前驱结点; (2.1):如果前驱结点的右孩子为空,将它的右孩子设置为当前结点,输出当前结点并把当前结点更新为当前结点的左孩子; (2.2):如果前驱结点的右孩子为当前结点,将它的右孩子重新设为空,当前结点更新为当前结点的右孩子; (3):重复以上(1)和(2),直到当前结点为空。
/* 前序遍历 */
void PreOrderMorris(Node * root)
{
Node * cur = root;
Node * pre = nullptr;
while (cur)
{
if (cur->left == nullptr) //(1)
{
cout << cur->data << " ";
cur = cur->right;
}
else
{
pre = cur->left;
while (pre->right && pre->right != cur) //(2),找到 cur 的前驱结点
pre = pre->right;
if (pre->right == nullptr) //(2.1),cur 未被访问,将 cur 结点作为其前驱结点的右孩子
{
cout << cur->data << " ";
pre->right = cur;
cur = cur->left;
}
else //(2.2),cur 已被访问,恢复树的原有结构,更改 right 指针
{
pre->right = nullptr;
cur = cur->right;
}
}
}
}
再来看中序遍历,和前序遍历相比只改动一句代码,步骤如下: (1):如果当前结点的左孩子为空,则输出当前结点并将其右孩子作为当前结点; (2):如果当前结点的左孩子不为空,在当前结点的左子树中找到当前结点在中序遍历下的前驱结点; (2.1):如果前驱结点的右孩子为空,将它的右孩子设置为当前结点,当前结点更新为当前结点的左孩子; (2.2):如果前驱结点的右孩子为当前结点,将它的右孩子重新设为空,输出当前结点,当前结点更新为当前结点的右孩子; (3):重复以上(1)和(2),直到当前结点为空。
/* 中序遍历 */
void InOrderMorris(Node * root)
{
Node * cur = root;
Node * pre = nullptr;
while (cur)
{
if (cur->left == nullptr) //(1)
{
cout << cur->data << " ";
cur = cur->right;
}
else
{
pre = cur->left;
while (pre->right && pre->right != cur) //(2),找到 cur 的前驱结点
pre = pre->right;
if (pre->right == nullptr) //(2.1),cur 未被访问,将 cur 结点作为其前驱结点的右孩子
{
pre->right = cur;
cur = cur->left;
}
else //(2.2),cur 已被访问,恢复树的原有结构,更改 right 指针
{
cout << cur->data << " ";
pre->right = nullptr;
cur = cur->right;
}
}
}
}
最后看下后序遍历,后序遍历有点复杂,需要建立一个虚假根结点dummy,令其左孩子是root。并且还需要一个子过程,就是倒序输出某两个结点之间路径上的各个结点。
步骤如下: (1):如果当前结点的左孩子为空,则将其右孩子作为当前结点; (2):如果当前结点的左孩子不为空,在当前结点的左子树中找到当前结点在中序遍历下的前驱结点; (2.1):如果前驱结点的右孩子为空,将它的右孩子设置为当前结点,当前结点更新为当前结点的左孩子; (2.2):如果前驱结点的右孩子为当前结点,将它的右孩子重新设为空,倒序输出从当前结点的左孩子到该前驱结点这条路径上 的所有结点,当前结点更新为当前结点的右孩子; (3):重复以上(1)和(2),直到当前结点为空。
struct Node
{
int data;
Node * left;
Node * right;
Node(int data_, Node * left_, Node * right_)
{
data = data_;
left = left_;
right = right_;
}
};
void ReversePrint(Node * from, Node * to)
{
if (from == to)
{
cout << from->data << " ";
return;
}
ReversePrint(from->right, to);
cout << from->data << " ";
}
void PostOrderMorris(Node * root)
{
Node * dummy = new Node(-1, root, nullptr); // 一个虚假根结点
Node * cur = dummy;
Node * pre = nullptr;
while (cur)
{
if (cur->left == nullptr) //(1)
cur = cur->right;
else
{
pre = cur->left;
while (pre->right && pre->right != cur) //(2),找到 cur 的前驱结点
pre = pre->right;
if (pre->right == nullptr) //(2.1),cur 未被访问,将 cur 结点作为其前驱结点的右孩子
{
pre->right = cur;
cur = cur->left;
}
else //(2.2),cur 已被访问,恢复树的原有结构,更改 right 指针
{
pre->right = nullptr;
ReversePrint(cur->left, pre);
cur = cur->right;
}
}
}
}
dummy用的非常巧妙,建议读者配合上面的图模拟下算法流程。
方式 | 序列 |
---|---|
前序 | [1 2 4 7 3 5 8 9 6] |
中序 | [4 7 2 1 8 5 9 3 6] |
后序 | [7 4 2 8 9 5 6 3 1] |
以上面图表为例,步骤如下: (1):根据前序可知根结点为1; (2):根据中序可知4 7 2为根结点1的左子树和8 5 9 3 6为根结点1的右子树; (3):递归实现,把4 7 2当做新的一棵树和8 5 9 3 6也当做新的一棵树; (4):在递归的过程中输出后序。
/* 前序遍历和中序遍历结果以长度为 n 的数组存储,pos1 为前序数组下标,pos2 为后序下标 */
int pre_order_arry[n];
int in_order_arry[n];
void PrintPostOrder(int pos1, int pos2, int n)
{
if (n == 1)
{
cout << pre_order_arry[pos1];
return;
}
if (n == 0)
return;
int i = 0;
for (; pre_order_arry[pos1] != in_order_arry[pos2 + i]; i++)
;
PrintPostOrder(pos1 + 1, pos2, i);
PrintPostOrder(pos1 + i + 1, pos2 + i + 1, n - i - 1);
cout << pre_order_arry[pos1];
}
当然我们也可以根据前序和中序构造出二叉树,进而求出后序。
/* 该函数返回二叉树的根结点 */
Node * Create(int pos1, int pos2, int n)
{
Node * p = nullptr;
for (int i = 0; i < n; i++)
{
if (pre_order_arry[pos1] == in_order_arry[pos2])
{
p = new Node(pre_order_arry[pos1]);
p->left = Create(pos1 + 1, pos2, i);
p->right = Create(pos1 + i + 1, pos2 + i + 1, n - i - 1);
return p;
}
}
return p;
}
若设二叉树的深度为h,除第 h 层外,其它各层 (1~h-1) 的结点数都达到最大个数,第 h 层所有的结点都连续集中在最左边,这就是完全二叉树(Complete Binary Tree)。如下图:
首先若一个结点只有右孩子,肯定不是完全二叉树;其次若只有左孩子或没有孩子,那么接下来的所有结点肯定都没有孩子,否则就不是完全二叉树,因此设置flag标记变量。
bool IsCBT(Node * node)
{
bool flag = false;
queue<Node*> Q;
Q.push(node);
while (!Q.empty())
{
Node * p = Q.front();
Q.pop();
if (flag)
{
if (p->left || p->right)
return false;
}
else
{
if (p->left && p->right)
{
Q.push(p->left);
Q.push(p->right);
}
else if (p->right) // 只有右结点
return false;
else if (p->left) // 只有左结点
{
Q.push(p->left);
flag = true;
}
else // 没有结点
flag = true;
}
}
return true;
}
在后续遍历得到的序列中,最后一个元素为树的根结点。从头开始扫描这个序列,比根结点小的元素都应该位于序列的左半部分;从第一个大于跟结点开始到跟结点前面的一个元素为止,所有元素都应该大于跟结点,因为这部分元素对应的是树的右子树。根据这样的划分,把序列划分为左右两部分,我们递归地确认序列的左、右两部分是不是都是二元查找树。
int array[n]; // 长度为 n 的序列,注意 begin 和 end 遵循的是左闭右闭原则
bool IsSequenceOfBST(int begin, int end)
{
if (end - begin <= 0)
return true;
int root_data = array[end]; // 数组尾元素为根结点
int i = begin;
for (; array[i] < root_data; i++) // 取得左子树
;
int j = i;
for (; j < end; j++)
if (array[j] < root_data) // 此时右子树应该都大于根结点;若存在小于,直接 return false
return false;
return IsSequenceOfBST(begin, i - 1) && IsSequenceOfBST(i, end - 1); // 左右子树是否都满足
}
一棵二叉查找树的中序遍历序列,正好是升序序列。 如果结点中有指向父亲结点的指针(假如根结点的父结点为nullptr),则: (1):如果当前结点有右孩子,则后继结点为这个右孩子的最左孩子; (2):如果当前结点没有右孩子; (2.1):当前结点为根结点,返回nullptr; (2.2):当前结点只是个普通结点,也就是存在父结点; (2.2.1):当前结点是父亲结点的左孩子,则父亲结点就是后继结点; (2.2.2):当前结点是父亲结点的右孩子,沿着父亲结点往上走,直到n-1代祖先是n代祖先的左孩子,则后继为n代祖 先或遍历到根结点也没找到符合的,则当前结点就是中序遍历的最后一个结点,返回nullptr。
/* 求后继结点 */
Node * Increment(Node * node)
{
if (node->right) //(1)
{
node = node->right;
while (node->left)
node = node->left;
return node;
}
else //(2)
{
if (node->parent == nullptr) //(2.1)
return nullptr;
Node * p = node->parent; //(2.2)
if (p->left == node) //(2.2.1)
return p;
else //(2.2.2)
{
while (p->right == node)
{
node = p;
p = p->parent;
if (p == nullptr)
return nullptr;
}
return p;
}
}
}
仔细观察上述代码,总觉得有点啰嗦。比如,过多的return,(2)的层次太多。综合考虑所有情况,改进代码如下:
Node * Increment(Node * node)
{
if (node->right)
{
node = node->right;
while (node->left)
node = node->left;
}
else
{
Node * p = node->parent;
while (p && p->right == node)
{
node = p;
p = p->parent;
}
node = p;
}
return node;
}
上述的代码是基于结点有parent指针的,若题意要求没有parent呢?网上也有人给出了答案,个人觉得没有什么价值,有兴趣的朋友可以到这里查看。
而求前驱结点的话,只需把上述代码的left与right互调即可,很简单。
二分查找树的中序遍历即为升序排列,问题就在于如何在遍历的时候更改指针的指向。一种简单的方法时,遍历二分查找树,将遍历的结果放在一个数组中,之后再把该数组转化为双链表。如果题目要求只能使用$O(1)$内存,则只能在遍历的同时构建双链表,即进行指针的替换。
我们需要用递归的方法来解决,假定每个递归调用都会返回构建好的双链表,可把问题分解为左右两个子树。由于左右子树都已经是有序的,当前结点作为中间的一个结点,把左右子树得到的链表连接起来即可。
/* 合并两个 a, b 两个循环双向链表 */
Node * Append(Node * a, Node * b)
{
if (a == nullptr) return b;
if (b == nullptr) return a;
// 分别得到两个链表的最后一个元素
Node * a_last = a->left;
Node * b_last = b->left;
// 将两个链表头尾相连
a_last->right = b;
b->left = a_last;
a->left = b_last;
b_last->right = a;
return a;
}
/* 递归的解决二叉树转换为双链表 */
Node * TreeToList(Node * node)
{
if (node == nullptr) return nullptr;
// 递归解决子树
Node * left_list = TreeToList(node->left);
Node * right_list = TreeToList(node->right);
// 把根结点转换为一个结点的双链表,方便后面的链表合并
node->left = node;
node->right = node;
// 合并之后即为升序排列
left_list = Append(left_list, node);
left_list = Append(left_list, right_list);
return left_list;
}
我们可以采用自顶向下的方法。先找到中间结点作为根结点,然后递归左右两部分。所以我们需要先找到中间结点,对于单链表来说,必须要遍历一边,可以使用快慢指针加快查找速度。
struct TreeNode
{
int data;
TreeNode * left;
TreeNode * right;
TreeNode(int data_) { data = data_; left = right = nullptr; }
};
struct ListNode
{
int data;
ListNode * next;
ListNode(int data_) { data = data_; next = nullptr; }
};
TreeNode * SortedListToBST(ListNode * list_node)
{
if (!list_node) return nullptr;
if (!list_node->next) return (new TreeNode(list_node->data));
// 用快慢指针找到中间结点
ListNode * pre_slow = nullptr; // 记录慢指针的前一个结点
ListNode * slow = list_node; // 慢指针
ListNode * fast = list_node; // 快指针
while (fast && fast->next)
{
pre_slow = slow;
slow = slow->next;
fast = fast->next->next;
}
TreeNode * mid = new TreeNode(slow->data);
// 分别递归左右两部分
if (pre_slow)
{
pre_slow->next = nullptr;
mid->left = SortedListToBST(list_node);
}
mid->right = SortedListToBST(slow->next);
return mid;
}
由$f(n)=2f(\frac n2)+\frac n2$得,所以上述算法的时间复杂度为$O(nlogn)$。 不妨换个思路,采用自底向上的方法:
TreeNode * SortedListToBSTRec(ListNode *& list, int start, int end)
{
if (start > end) return nullptr;
int mid = start + (end - start) / 2;
TreeNode * left_child = SortedListToBSTRec(list, start, mid - 1); // 注意此处传入的是引用
TreeNode * parent = new TreeNode(list->data);
parent->left = left_child;
list = list->next;
parent->right = SortedListToBSTRec(list, mid + 1, end);
return parent;
}
TreeNode * SortedListToBST(ListNode * node)
{
int n = 0;
ListNode * p = node;
while (p)
{
n++;
p = p->next;
}
return SortedListToBSTRec(node, 0, n - 1);
}
如此,时间复杂度降为$O(n)$。
我们假定二叉树没有重复元素,即对于每个结点,其左右孩子都是严格的小于和大于。
下面给出两个方法:
方法 1:
bool IsBST(Node * node, int min, int max)
{
if (node == nullptr)
return true;
if (node->data <= min || node->data >= max)
return false;
return IsBST(node->left, min, node->data) && IsBST(node->right, node->data, max);
}
IsBST(node, INT_MIN, INT_MAX);
方法 2:
利用二叉查找树中序遍历时元素递增来判断。
bool IsBST(Node * node)
{
static int pre = INT_MIN;
if (node == nullptr)
return true;
if (!IsBST(node->left))
return false;
if (node->data < pre)
return false;
pre = node->data;
return IsBST(node->right);
}