大话数据结构学习笔记 - 树的基础知识

树的定义

树(Tree)是 $n (n \geq 0)$ 个结点的有限集。 $n = 0$ 时称为空树。在任意一颗非空树中

有且仅有一个特定的称为根(Root)的结点
当 $n > 1$ 时，其余结点可分为 $m (m > 0)$ 个互不相交的有限集 $T_{1}、T_{2}、......、T_{m}$ ，其中每一个集合本身又是一棵树，并且称为根的子树(SubTree)，如下图所示

注意

$n>0$ 时，根节点唯一，不存在多个根节点
$m>0$ 时，子树个数没有限制，但一定互不相交

树的概念

树的结点包含一个数据元素及若干指向其子树的分支。

度(Degree)：结点拥有的子树树称为结点的度。度为0的结点称为 叶节点(Leaf)或终端结点。度不为0的结点称为非终端结点或分支结点。除根节点外，分支结点也称为内部结点。树的度就是树内各结点的度的最大值。
结点的子树的根称为该结点的 孩子(Child)，相应的，该结点称为汉子的双亲(Parent)。同一个双亲的孩子之间互称 兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。以某结点为根的子树中的任一结点都称为该结点的子孙

扫描二维码关注公众号，回复： 1496906 查看本文章
结点的 层次(Level)从根开始定义起，根为第一层，根的孩子为第二层。树中结点的最大层次称为树的 深度(Depth)或高度。比如下图树的深度为4
有序数：树中结点的各子树从左至右有次序，不能互换，否则为 无序树
森林(Forest)：是 $m (m > 0)$ 课互不相交的树的集合

线性表和树的不同

linear_list_and_tree_structure_differences

树的抽象数据类型

ADT 树 (tree)
Data
    树是由一个根节点和若干棵子树构成。树中结点具有相同数据类型及层次关系
Operation
    InitTree(*T): 构造空树 T
    DestroyTree(*T)：销毁树 T
    CreateTree(*T, definition)：按 definitin 中给出树的定义来构造树
    ClearTree(*T)：若树 T 存在， 则将树 T清为空树
    TreeEmpty(T)： 若 T 为空树，返回 true， 否则返回 false。
    TreeDepth(T)： 返回 T 的深度
    Root(T)：返回 T 的根节点
    Value(T, cur_e)：cur_e 是树 T 中一个结点，返回此节点的值
    Assign(T, cur_e, value)：给树 T 的结点 cur_e 赋值为 value
    Parent(T, cur_e)：若 cur_e 是树 T 的非根节点，则返回它的双亲，否则返回空
    LeftChild(T, cur_e)：若 cur_e 是树 T 的非叶节点，则返回它的最左孩子，否则返回空
    RightSibling(T, cur_e)：若 cur_e 有右兄弟，则返回它的右兄弟，否则返回空
    InsertChild(*T, *p, i, c)：其中 p 指向树 T 的某个结点，i 为所指结点 p 的度加上 1， 非空树 c 与                                T不相交， 操作结果为插入 c 为树 T 中 p 所指结点的第 i 课子树
    DeleteChild(*T, *p, i)：其中 p 指向树 T 的某个节点， i 为所指结点 p 的度，操作结果为删除 T 中                             p 所指结点的第 i 棵子树
endADT

树的存储结构

双亲表示法

树的结点以一组连续空间表示，且在每个结点中，附设一个指示器指示其双亲结点到链表中的位置。

Tree_parent_expression

其中data是数据域，存储结点的数据信息。而parent是指针域，存储该结点的双亲在数组中的下标

tree_parent_node_expression

/* 树的双亲表示法结点结构定义 */
typedef int TElemType;  // 树结点的数据类型，目前暂定为整形
typedef struct PTNode   // 结点结构
{
    TElemType data;     // 结点数据
    int parent;         // 双亲位置
}PTNode;
typedef struct          // 树结构
{
    PTNode nodes[MAX_TREE_SIZE];  // 结点数组
    int r, n;  // 根的位置和结点数
}PTree;

根节点没有双亲，故根节点的域设置为 -1，双亲表示法根据parent指针很容易找到它的双亲结点，时间复杂度为O(1)。但无法确定结点的孩子，必须遍历整个结构。当然可以改进，比如增加孩子域，兄弟域等。

孩子表示法

把每个结点的孩子结点排列起来，以单链表作存储结构，则n个结点有n个孩子链表，如果是叶子节点则此单链表为空。然后n个头指针又组成一个线性表，采用顺序存储结构，采用个顺序存储结构，存放进一个一维数组中。

tree_children_expression
为此，有两种结点结构

孩子链表的孩子结点, child为数据域，存储某个结点在表头数组中的下标，next为指针域，存储指向下一孩子结点的指针
表头数组的表头结点，data是数据域，存储某结点的数据信息。firstchild是头指针域，存储该结点的孩子链表的头指针。

/* 树的孩子表示法结构定义 */
#define MAX_TREE_SIZE 100
typedef struct CTNode  // 孩子结点
{
    int child;
    struct CTNode *next;
}*ChildPtr;
typedef struct  // 表头结构
{
    TElemType data;
    ChildPtr firstchild;
}CTBox;
typedef struct  // 树结构
{
    CTBox nodes[MAX_TREE_SIZE];  //结点数组
    int r, n;                    // 根的位置和结点数
}CTree;

优点是方便查找孩子以及兄弟结点

缺点：对于双亲则需要遍历整棵树。优化方法可以是添加 双亲域

孩子兄弟表示法

任意一棵树，它的结点的第一个孩子如果存在就是唯一的，它的右兄弟如果存在也是唯一的。故可设置两个指针，分别指向第一个孩子和此结点的右兄弟。

tree_childre_sibling_expression

结点结构如下,其中data是数据域，firstchild是指针域，存储该结点的第一个孩子结点的存储地址，rightsib是指针域，存储该结点的右兄弟结点的存储地址

tree_children_sibling_expression_node

/* 树的孩子兄弟表示法结构定义 */
typedef struct CSNode
{
    TElemType data;
    struct CSNode *firstchild, *rightsib;
}CSNode, *CSTree;

优点：将复杂树结构转换为二叉树，且对孩子和兄弟查找方便。

缺点：双亲查找麻烦，可增加双亲指针域优化

结语

关于树的整体知识整理到这里，后续会专门整理某些重要的树类型。