第一章 绪论
1.1 什么是数据结构
简单说来,数据结构是一门研究非数值计算的程序设计问题中计算机的操作对象以及它们之间的关系和操作等的学科。
1.2 基本概念和术语
数据(data)是对客观事物的符号表示,在计算机科学中是指所有能输入到计算机中并被计算机程序处理的符号的总称。它是计算机程序加工的“原料”。
数据元素(data element)是数据的基本单位,在计算机程序中通常作为一个整体进行考虑和处理。有时,一个数据元素可由若干个数据项(data item)组成,数据项是数据的不可分割的最小单位。
数据对象(data object)是性质相同的数据元素的集合,是数据的一个子集。
数据结构(data structure)是相互之间存在一种或多种特定关系的数据元素的集合。在任何问题中,数据元素都不是孤立存在的,而是在它们之间存在着某种关系。这种数据元素相互之间的关系称为结构(structure)。
根据数据元素之间关系不同特性,通常有下列4类基本结构:
(1) 集合:结构中的数据元素之间除了“同属于一个集合”的关系外,别无其他关系;
(2) 线性结构:结构中的数据元素之间存在一个对一个的关系;
(3) 树形结构:结构中的数据元素之间存在一个对多个的关系;
(4) 图状结构或网状结构:结构中的数据元素之间存在多个对多个的关系。
数据结构的形式定义为:数据结构是一个二元组
Data_Structure = (D, S)
其中,D是数据元素的有限集,S是D上关系的有限集。
结构定义中的“关系”描述的是数据元素之间的逻辑关系,因此又称为数据的逻辑结构。
数据结构在计算机中的表示(又称映像)称为数据的物理结构,又称为存储结构。它包括数据元素的表示和关系的表示。
数据元素之间的关系在计算机中有两种不同的表示方法,顺序映像和非顺序映像,并由此得到两种不同的存储结构:顺序存储结构和链式存储结构。
任何一个算法的设计取决于选定的数据(逻辑)结构,而算法的实现依赖于采用的存储结构。
抽象数据类型可以用以下三元组表示:
(D, S, P)
其中,D是数据对象,S是D上的关系集,P是对D的基本操作集。
抽象数据类型的格式为:
ADT抽象数据类型名{
数据对象:<数据对象的定义>
数据关系:<数据关系的定义>
基本操作:<基本操作的定义>
} ADT抽象数据类型名
其中,基本操作的定义格式为:
基本操作名(参数表)
初始条件:<初始条件描述>
操作结果:<操作结果描述>
基本操作有两种参数:赋值参数只为操作提供输入值;引用参数以&打头,除可提供输入值外,还将返回操作结果。“初始条件”描述了操作执行之前数据结构和参数应满足的条件,若不满足,则操作失败,并返回相应出错信息。“操作结果”说明了操作正常完成之后,数据结构的变化状况和应返回的结果。若初始条件为空,则省略之。
1.3 算法和算法分析
1.3.1 算法
算法(algorithm)是对特定问题求解步骤的一种描述,它是指令的有限序列,其中每一条指令表示一个或多个操作;一个算法具有下列特性:
(1) 有穷性:一个算法必须总是(对任何合法的输入值)在执行有穷步之后结束,且每一步都可在有穷时间内完成。
(2) 确定性:算法中每一条指令必须有确切的含义,读者理解时不会产生二义性。并且,在任何条件下,算法只有惟一的一条执行路径,即对于相同的输入只能得出相同的输出。
(3) 可行性:一个算法是能行的,即算法中描述的操作都是可以通过已经实现的基本运行执行有限次来实现的。
(4) 输入:一个算法有零个或多个的输入,这些输入取自某个特定的对象的集合。
(5) 输出:一个算法有一个或多个的输出,这些输出是同舒服有着某些特定关系的量。
1.3.2 算法设计的要求
一个“好”的算法应达到以下目标:
(1) 正确性(correctness)算法应当满足具体问题的需求。
(2) 可读性(readability)算法主要是为了人的阅读与交流,其次才是计算机执行。
(3) 健壮行(robustness)当输入数据非法时,算法能适当地做出反应或进行处理,而不会产生莫名其妙的输出结果。
(4) 效率与低存储量需求 效率指算法执行的时间,存储量需求指算法执行过程中所需要的最大存储空间。
1.3.3 算法效率的度量
一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数f(n),算法的时间度量记作
T(n) = O(f(n))
它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度(asymptotic time complexity),简称时间复杂度。
通常讨论的时间复杂度,指最坏情况下的时间复杂度。
1.3.4 算法的存储空间需求
算法所需存储空间的度量称作空间复杂度(space complexity),记作
S(n) = O(f(n))
其中n为问题的规模(或大小)。
通常,如果所占空间依赖特定的输入,均按最坏情况分析。