31、键树的插入、查找（孩子兄弟存储结构）

一、基本概念

1、键树：如果一个关键字可以表示成字符的序号，即字符串，那么可以用键树（keyword tree），又称数字搜索树（digital search tree）或字符树，来表示这样的字符串的集合。

2、键树相关说明：键树是一棵多叉树（度>=2），树中每个结点并不代表一个关键字或元素，而只代表字符串中的一个字符。例如，它可以表示数字串中的一个数位，或单词中的一个字母等等。根结点不代表任何字符，根以下第一层的结点对应于字符串的第一个字符，第二层的结点对应于字符串的第二个字符……每个字符串可由一个特殊的字符如“$”等作为字符串的结束符，用一个叶子结点来表示该特殊字符。把从根到叶子的路径上，所有结点（除根以外）对应的字符连接起来，就得到一个字符串。因此，键树的深度和关键字集合的大小无关。因此，每个叶子结点对应一个关键字。在叶子结点还可以包含一个指针，指向该关键字所对应的元素。整个字符串集合中的字符串的数目等于叶子结点的数目。如果一个集合中的关键字都具有这样的字符串特性，那么，该关键字集合就可采用这样一棵键树来表示。事实上，还可以赋予“字符串”更广泛的含义，它可以是任何类型的对象组成的串。

3、键树被约定为是一棵有序树，即同一层中兄弟结点之间依所含符号自左至右有序，并约定结束符‘$’小于任何其它符号。

二、算法思想

如下为在树的孩子兄弟链表来表示下的算法描述：

假设: T 为指向双链树根结点的指针，K.ch[0..K.num-1] 为待查关键字，其中K.ch[0]至K.ch[num-2]表示待查关键字中num-1个字符，K.ch[num-1]为结束字符$。

则查找过程中的基本操作为进行下列比较:

K.ch[i] =? p->symbol

其中: p 指向双链树中某个结点，0≤ i ≤ K.num-1，初始状态:p=T->first; i = 0;

若 ( p && p->symbol == K.ch[i] &&i<K.num-1)则继续和给定值的下一位进行比较p=p->first; i++;

若 ( p && p->symbol != K.ch[i] )则继续在键树的同一层上进行查找 p=p->next;

若 ( p == NULL)则表明查找不成功，返回“空指针”;

若 ( p &&p->symbol==K.ch[i] && i==K.num-1)则查找成功，返回指向相应记录的指针 p->infoptr。

三、C语言描述

四、C语言实现

#include"stdio.h"

#include"stdlib.h"

#include"string.h"

#define OK 1

#define ERROR 0

typedef intStatus; // Status是函数的类型,其值是函数结果状态代码，如OK等

typedef intBoolean; // Boolean是布尔类型,其值是TRUE或false

#define N 16 // 数据元素个数

#define MAXKEYLEN16 // 关键字的最大长度

#define Nil ' ' //定义结束符为空格

#defineSTACK_INIT_SIZE 10 // 存储空间初始分配量

#defineSTACKINCREMENT 2 // 存储空间分配增量

struct Others // 记录的其它部分

{

int ord;

};

struct KeysType //关键字类型

{

char ch[MAXKEYLEN]; // 关键字

int num; // 关键字长度

};

struct Record // 记录类型

{

KeysType key; // 关键字

Others others; // 其它部分(由主程定义)

};

enumNodeKind{LEAF,BRANCH}; // 结点种类:{叶子,分支}

typedef structDLTNode // 双链树类型

{

char symbol;

DLTNode *next; // 指向兄弟结点的指针

NodeKind kind;

union

{

Record *infoptr; // 叶子结点的记录指针

DLTNode *first; // 分支结点的孩子链指针

};

}DLTNode,*DLTree;

struct SElemType // 定义栈元素类型

{

char ch;

DLTree p;

};

struct SqStack

{

SElemType *base; // 在栈构造之前和销毁之后，base的值为NULL

SElemType *top; // 栈顶指针

int stacksize; // 当前已分配的存储空间，以元素为单位

}; // 顺序栈

Status InitDSTable(DLTree &DT)

{ // 操作结果: 构造一个空的双链键树DT

DT=NULL;

return OK;

}//InitDSTable

void DestroyDSTable(DLTree &DT)

{ // 初始条件: 双链键树DT存在。操作结果: 销毁双链键树DT

//我们采用深度优先来销毁。

if(DT) // 非空树

{

if(DT->kind==BRANCH&&DT->first) // *DT是分支结点且有孩子

DestroyDSTable(DT->first); // 销毁孩子子树

if(DT->next) // 有兄弟

DestroyDSTable(DT->next); // 销毁兄弟子树

free(DT); // 释放根结点

DT=NULL; // 空指针赋0

}

}//DestroyDSTable

void print(Recorde)

{

int i;

printf("(");

for(i=0;i<e.key.num;i++)

printf("%c",e.key.ch[i]);

printf(",%d)",e.others.ord);

}//print

Record*SearchDLTree(DLTree T,KeysType K)

{ // 在非空双链键树T中查找关键字等于K的记录，若存在，

// 则返回指向该记录的指针，否则返回空指针。算法9.15，有改动

DLTree p;

int i;

if(T)

{

p=T; // 初始化

i=0;

while(p&&i<K.num)

{

while(p&&p->symbol!=K.ch[i])// 查找关键字的第i位

p=p->next;

if(p&&i<K.num) // 准备查找下一位

p=p->first;

++i;

} // 查找结束

if(!p) // 查找不成功

return NULL;

else // 查找成功

return p->infoptr;

}//if

else

return NULL; // 树空

}//SearchDLTree

void InsertDSTable(DLTree &DT,Record *r)

{ // 初始条件: 双链键树DT存在，r为待插入的数据元素的指针

// 操作结果: 若DT中不存在其关键字等于(*r).key.ch的数据元素，

// 则按关键字顺序插r到DT中

DLTree p=NULL,q,ap;

int i=0;

KeysType K=r->key;

if(!DT&&K.num) // 空树且关键字符串非空

{

DT=ap=(DLTree)malloc(sizeof(DLTNode));

for(;i<K.num;i++) // 插入分支结点

{

if(p)

p->first=ap;

ap->next=NULL;

ap->symbol=K.ch[i];

ap->kind=BRANCH;

p=ap;

ap=(DLTree)malloc(sizeof(DLTNode));

}//for

p->first=ap; // 插入叶子结点

ap->next=NULL;

ap->symbol=Nil;

ap->kind=LEAF;

ap->infoptr=r;//在叶子结点处记录指向该关键字的指针

}//if

else // 非空树

{

p=DT; // 指向根结点

while(p&&i<K.num)

{

while(p&&p->symbol<K.ch[i]) // 沿兄弟结点查找

{

q=p;

p=p->next;

}//while

if(p&&p->symbol==K.ch[i]) // 找到与K.ch[i]相符的结点

{

q=p;

p=p->first; // p指向将与K.ch[i+1]比较的结点

++i;

}//if

else // 没找到,插入关键字

{

ap=(DLTree)malloc(sizeof(DLTNode));

if(q->first==p)

q->first=ap; // 在长子的位置插入

else // q->next==p

q->next=ap; // 在兄弟的位置插入

ap->next=p;

ap->symbol=K.ch[i];

ap->kind=BRANCH;

p=ap;

ap=(DLTree)malloc(sizeof(DLTNode));

i++;

for(;i<K.num;i++) // 插入分支结点

{

p->first=ap;

ap->next=NULL;

ap->symbol=K.ch[i];

ap->kind=BRANCH;

p=ap;

ap=(DLTree)malloc(sizeof(DLTNode));

}//for

p->first=ap; // 插入叶子结点

ap->next=NULL;

ap->symbol=Nil;

ap->kind=LEAF;

ap->infoptr=r;

}//else

}//while

}//else

}//InsertDSTable

//如下为对栈的操作

StatusInitStack(SqStack &S)

{ // 构造一个空栈S

if(!(S.base=(SElemType*)malloc(STACK_INIT_SIZE*sizeof(SElemType))))

exit(-1); // 存储分配失败

S.top=S.base;

S.stacksize=STACK_INIT_SIZE;

return OK;

}

Status DestroyStack(SqStack &S)

{ // 销毁栈S，S不再存在

free(S.base);

S.base=NULL;

S.top=NULL;

S.stacksize=0;

return OK;

}

Status ClearStack(SqStack &S)

{ // 把S置为空栈

S.top=S.base;

return OK;

}

Status StackEmpty(SqStack S)

{ // 若栈S为空栈，则返回TRUE，否则返回false

if(S.top==S.base)

return true;

else

return false;

}

int StackLength(SqStack S)

{ // 返回S的元素个数，即栈的长度

return S.top-S.base;

}

Status GetTop(SqStack S,SElemType &e)

{ // 若栈不空，则用e返回S的栈顶元素，并返回OK；否则返回ERROR

if(S.top>S.base)

{

e=*(S.top-1);

return OK;

}

else

return ERROR;

}

Status Push(SqStack &S,SElemType e)

{ // 插入元素e为新的栈顶元素

if(S.top-S.base>=S.stacksize) // 栈满，追加存储空间

{

S.base=(SElemType*)realloc(S.base,(S.stacksize+STACKINCREMENT)*sizeof(SElemType));

if(!S.base)

exit(-1); // 存储分配失败

S.top=S.base+S.stacksize;

S.stacksize+=STACKINCREMENT;

}

*(S.top)++=e;

return OK;

}

Status Pop(SqStack &S,SElemType &e)

{ // 若栈不空，则删除S的栈顶元素，用e返回其值，并返回OK；否则返回ERROR

if(S.top==S.base)

return ERROR;

e=*--S.top;

return OK;

}

Status StackTraverse(SqStackS,Status(*visit)(SElemType))

{ // 从栈底到栈顶依次对栈中每个元素调用函数visit()。

// 一旦visit()失败，则操作失败

while(S.top>S.base)

visit(*S.base++);

printf("\n");

return OK;

}

void TraverseDSTable(DLTreeDT,void(*Vi)(Record))

{ // 初始条件: 双链键树DT存在，Vi是对结点操作的应用函数，

// ViR是对记录操作的应用函数

// 操作结果: 按关键字的顺序输出关键字及其对应的记录

//我们用

SqStack s;

SElemType e;

DLTree p;

int i=0,n=8;

if(DT)

{

InitStack(s);

e.p=DT;

e.ch=DT->symbol;

Push(s,e);

p=DT->first;

while(p->kind==BRANCH) // 分支结点

{

e.p=p;

e.ch=p->symbol;

Push(s,e);// 分支结点入栈

p=p->first;

}//while

e.p=p;

e.ch=p->symbol;

Push(s,e);// 叶子结点入栈

Vi(*(p->infoptr));

i++;

while(!StackEmpty(s))

{//广度优先进行遍历

Pop(s,e);

p=e.p;

if(p->next) // 有兄弟结点

{

p=p->next;

while(p->kind==BRANCH) // 分支结点

{

e.p=p;

e.ch=p->symbol;

Push(s,e);// 叶子结点入栈

p=p->first;

}//while

e.p=p;

e.ch=p->symbol;

Push(s,e);// 叶子结点入栈

Vi(*(p->infoptr));

i++;

if(i%n==0)

printf("\n"); // 输出n个元素后换行

}//if

}//while

}

}//TraverseDSTable

void INputD(DLTree&t,Record r[])

{

Record *p;

for(inti=0;i<N;i++)

{

r[i].key.num=strlen(r[i].key.ch);

p=SearchDLTree(t,r[i].key);

if(!p) // t中不存在关键字为r[i].key的项

InsertDSTable(t,&r[i]);

}//for

}//INputD

voidUserSearch(DLTree t)

{

chars[MAXKEYLEN+1];

Record *p;

KeysType k;

printf("\n请输入待查找记录的关键字符串: ");

scanf("%s",s);

k.num=strlen(s);

strcpy(k.ch,s);

p=SearchDLTree(t,k);

if(p)

print(*p);

else

printf("没找到");

printf("\n");

}//UserSearch

int main()

{

DLTree t;

Recordr[N]={{{"CAI"},1},{{"CAO"},2},{{"LI"},3},{{"LAN"},4},

{{"CHA"},5},{{"CHANG"},6},{{"WEN"},7},{{"CHAO"},8},

{{"YUN"},9},{{"YANG"},10},{{"LONG"},11},{{"WANG"},12},

{{"ZHAO"},13},{{"LIU"},14},{{"WU"},15},{{"CHEN"},16}};

InitDSTable(t);

INputD(t,r);

printf("按关键字符串的顺序遍历双链键树:\n");

TraverseDSTable(t,print);

UserSearch(t);

DestroyDSTable(t);

return 1;

}

五、复杂度分析

参考前面关于树的操作。

hopegrace

发布了321 篇原创文章 · 获赞 31 · 访问量 1万+

私信关注

31、键树的插入、查找（孩子兄弟存储结构）

猜你喜欢