大话数据结构学习笔记 - 树的基础知识

大话数据结构学习笔记 - 树的基础知识

树的定义

树(Tree)是 n ( n 0 ) 个结点的有限集。 n = 0 时称为空树。在任意一颗非空树中

  • 有且仅有一个特定的称为根(Root)的结点

  • n > 1 时,其余结点可分为 m ( m > 0 ) 个互不相交的有限集 T 1 T 2 . . . . . . T m , 其中每一个集合本身又是一棵树,并且称为根的子树(SubTree),如下图所示

    tree_definition

注意

  • n > 0 时,根节点唯一,不存在多个根节点

  • m > 0 时,子树个数没有限制,但一定互不相交

    subtree_can_not_intersect

树的概念

树的结点包含一个数据元素及若干指向其子树的分支。

  • 度(Degree):结点拥有的子树树称为结点的度。度为0的结点称为 叶节点(Leaf)或终端结点。度不为0的结点称为非终端结点或分支结点。除根节点外,分支结点也称为内部结点。树的度就是树内各结点的度的最大值。

  • 结点的子树的根称为该结点的 孩子(Child), 相应的,该结点称为汉子的双亲(Parent)。同一个双亲的孩子之间互称 兄弟(Sibling)。结点的祖先是从根到该结点所经分支上的所有结点。以某结点为根的子树中的任一结点都称为该结点的 子孙

    扫描二维码关注公众号,回复: 1496906 查看本文章
  • 结点的 层次(Level)从根开始定义起,根为第一层,根的孩子为第二层。树中结点的最大层次称为树的 深度(Depth)或高度。比如下图树的深度为4

    tree_depth

  • 有序数:树中结点的各子树从左至右有次序,不能互换,否则为 无序树

  • 森林(Forest):是 m ( m > 0 ) 课互不相交的树的集合

线性表和树的不同

linear_list_and_tree_structure_differences

树的抽象数据类型

ADT 树 (tree)
Data
    树是由一个根节点和若干棵子树构成。树中结点具有相同数据类型及层次关系
Operation
    InitTree(*T): 构造空树 T
    DestroyTree(*T):销毁树 T
    CreateTree(*T, definition):按 definitin 中给出树的定义来构造树
    ClearTree(*T):若树 T 存在, 则将树 T清为空树
    TreeEmpty(T): 若 T 为空树,返回 true, 否则返回 false。
    TreeDepth(T): 返回 T 的深度
    Root(T):返回 T 的根节点
    Value(T, cur_e):cur_e 是树 T 中一个结点,返回此节点的值
    Assign(T, cur_e, value):给树 T 的结点 cur_e 赋值为 value
    Parent(T, cur_e):若 cur_e 是树 T 的非根节点,则返回它的双亲,否则返回空
    LeftChild(T, cur_e):若 cur_e 是树 T 的非叶节点,则返回它的最左孩子,否则返回空
    RightSibling(T, cur_e):若 cur_e 有右兄弟,则返回它的右兄弟,否则返回空
    InsertChild(*T, *p, i, c):其中 p 指向树 T 的某个结点,i 为所指结点 p 的度加上 1, 非空树 c 与                                T不相交, 操作结果为插入 c 为树 T 中 p 所指结点的第 i 课子树
    DeleteChild(*T, *p, i):其中 p 指向树 T 的某个节点, i 为所指结点 p 的度,操作结果为删除 T 中                             p 所指结点的第 i 棵子树
endADT

树的存储结构

双亲表示法

树的结点以一组连续空间表示,且在每个结点中,附设一个指示器指示其双亲结点到链表中的位置。

Tree_parent_expression

其中data是数据域,存储结点的数据信息。而parent是指针域,存储该结点的双亲在数组中的下标

tree_parent_node_expression

/* 树的双亲表示法结点结构定义 */
typedef int TElemType;  // 树结点的数据类型,目前暂定为整形
typedef struct PTNode   // 结点结构
{
    TElemType data;     // 结点数据
    int parent;         // 双亲位置
}PTNode;
typedef struct          // 树结构
{
    PTNode nodes[MAX_TREE_SIZE];  // 结点数组
    int r, n;  // 根的位置和结点数
}PTree;

根节点没有双亲,故根节点的域设置为 -1,双亲表示法根据parent指针很容易找到它的双亲结点,时间复杂度为O(1)。但无法确定结点的孩子,必须遍历整个结构。当然可以改进,比如增加孩子域,兄弟域等。

孩子表示法

把每个结点的孩子结点排列起来,以单链表作存储结构,则n个结点有n个孩子链表,如果是叶子节点则此单链表为空。然后n个头指针又组成一个线性表,采用顺序存储结构,采用个顺序存储结构,存放进一个一维数组中。

tree_children_expression
为此,有两种结点结构

  • 孩子链表的孩子结点, child为数据域,存储某个结点在表头数组中的下标,next为指针域,存储指向下一孩子结点的指针

    tree_children_expression_child_node

  • 表头数组的表头结点,data是数据域,存储某结点的数据信息。firstchild是头指针域,存储该结点的孩子链表的头指针。

    tree_parent_node_expression

/* 树的孩子表示法结构定义 */
#define MAX_TREE_SIZE 100
typedef struct CTNode  // 孩子结点
{
    int child;
    struct CTNode *next;
}*ChildPtr;
typedef struct  // 表头结构
{
    TElemType data;
    ChildPtr firstchild;
}CTBox;
typedef struct  // 树结构
{
    CTBox nodes[MAX_TREE_SIZE];  //结点数组
    int r, n;                    // 根的位置和结点数
}CTree;

优点是方便查找孩子以及兄弟结点

缺点:对于双亲则需要遍历整棵树。优化方法可以是添加 双亲域

孩子兄弟表示法

任意一棵树,它的结点的第一个孩子如果存在就是唯一的,它的右兄弟如果存在也是唯一的。故可设置两个指针,分别指向第一个孩子和此结点的右兄弟。

tree_childre_sibling_expression

结点结构如下,其中data是数据域,firstchild是指针域,存储该结点的第一个孩子结点的存储地址,rightsib是指针域,存储该结点的右兄弟结点的存储地址

tree_children_sibling_expression_node

/* 树的孩子兄弟表示法结构定义 */
typedef struct CSNode
{
    TElemType data;
    struct CSNode *firstchild, *rightsib;
}CSNode, *CSTree;

优点:将复杂树结构转换为二叉树,且对孩子和兄弟查找方便。

缺点:双亲查找麻烦,可增加双亲指针域优化

结语

关于树的整体知识整理到这里,后续会专门整理某些重要的树类型。

猜你喜欢

转载自blog.csdn.net/u011221820/article/details/80402591