2.9.1 算法时间复杂度定义
在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)随n的变化情况并确定T(n)的数量级。算法的时间复杂度,也就是算法的时间量度,记作:T(n) = O(f(n))。它表示随问题规模n的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称为时间复杂度。其中f(n)是问题规模n的某个函数。
这样用大写O()来体现算法时间复杂度的记法,我们称之为大O记法。
一般情况下,随着n的增大,T(n)增长最慢的算法为最优算法。
显然,由此算法时间复杂度的定义可知,我们的三个求和算法的时间复杂度分别为O(n),O(1),O(n2)。我们分别给它们取了非官方的名称,O(1)叫常数阶,O(n)叫线性阶,O(n2)叫平方阶,当然,还有其他的一些阶,我们之后会介绍。
2.9.2 推导大O阶方法
那么如何分析一个算法的时间复杂度呢?即如何推导大O阶呢?
- 用常数1取代运行时间中的所有加法常数。
- 在修改后的运行次数函数中,只保留最高阶项。
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数。
得到的最后结果就是大O阶。
2.9.3 常数阶
首先顺序结构的时间复杂度。下面这个算法,也就是刚才的第二种算法,为什么时间复杂度不是O(3),而是O(1)。
int sum = 0,n = 100; /*执行一次*/
sum = (1+n)*n/2; /*执行一次*/
printf("%d", sum); /*执行一次*/
这个算法的运行次数函数是f(n)=3。根据我们推导大O阶的方法,第一步就是把常数项3改为1。在保留最高阶项时发现,它根本没有最高阶项,所以这个算法的时间复杂度为O(1)。
另外,我们试想一下,如果这个算法当中的语句sum=(1+n)*n/2有10句,即:
int sum=0,n=100; /* 执行1次 */
sum = (1+n)*n/2; /* 执行第1次 */
sum = (1+n)*n/2; /* 执行第2次 */
sum = (1+n)*n/2; /* 执行第3次 */
sum = (1+n)*n/2; /* 执行第4次 */
sum = (1+n)*n/2; /* 执行第5次 */
sum = (1+n)*n/2; /* 执行第6次 */
sum = (1+n)*n/2; /* 执行第7次 */
sum = (1+n)*n/2; /* 执行第8次 */
sum = (1+n)*n/2; /* 执行第9次 */
sum = (1+n)*n/2; /* 执行第10次 */
printf("%d",sum); /* 执行1次 */
事实上无论n为多少,上面的两段代码就是3次和12次执行的差异,这种与问题的大小无关(n的多少),执行时间恒定的算法,我们称之为具有O(1)的时间复杂度,又叫常数阶。
注意,不管这个常数是多少,我们都记作O(1),而不能是O(3)、O(12)等其他任何数字。这是初学者常常犯的错误。
对于分支结构而言,无论是真,还是假,执行的次数都是恒定的,不会随着n的变大而发生变化,所以单纯的分支结构(不包含在循环结构中),其时间复杂度也是O(1)。
2.9.4 线性阶
循环结构就会复杂很多。要确定某个算法的阶次,我们常常需要确定某个特定语句或某个语句集运行的次数。因此,我们要分析算法的复杂度,关键就是要分析循环结构的运行情况。
下面这段代码,它的循环的时间复杂度为O(n)。因为循环体中的代码须要执行n次。
int i,n=100,sum=0;
for( i=0; i < n; i++)
{
sum=sum+i;
}
上面这段代码,它的循环的时间复杂度为O(n),因为循环体中的代码需要执行n次。其实,线性阶就是一个简单的for循环,条件在i<n,因而时间复杂度为O(n)。
2.9.5 对数阶
那么下面的这段代码,时间复杂度又是多少呢?
int i=1,n=100;
while( i<n )
{
i=i*2;
}
由于每次count乘以2之后,就距离n更近了一分。也就是说,有多少个2相乘后大于n,则会退出循环。由2x=n得到x=log2n。所以这个循环的时间复杂度为O(logn)。
2.9.6 平方阶
n等于100,也就是说外层循环每执行一次, 内层循环就执行100次 那总共程序想要从这两个循环出来,需要执行100*100次, 也就是n的平方。 所以这段代码的时间复杂度为0(n^2)。那如果有三个这样的嵌套循环呢? 没错,那就是n^3。所以我们很容易总结得出,循环的时间复杂度等于循环体的复杂度乘以该循环运行的次数。
例一:下面的例子是一个循环嵌套,它的内循环刚才2.9.4中分析过,内循环时间复杂度为O(n)。
int i,j;
for(i=0; i<n; i++)
{
for(j=0; j<n; j++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
而对于外层的循环,不过是内部这个时间复杂度为O(n)的语句,再循环n次。所以这段代码的时间复杂度为O(n²)。
例二:如果外循环的循环次数改为了m,时间复杂度则变为O(m×n)。
int i,j;
for(i=0; i<m; i++)
{
for(j=0; j<n; j++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
例三:那么下面这个循环嵌套,它的时间复杂度是多少呢?
int i,j;
for(i=0; i<n; i++)
{
for(j=i; j<n; j++) /* 注意j=i而不是0 */
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
由于
当i=0时,内循环执行了n次,
当i=1时,执行了n-1次,
…………
当i=n-1时,执行了1次。
n + (n-1) + (n-2) + …… +1 = n(n+1)/2 = n²/2 + n/2
用我们推导大O阶的方法
- 没有加法常数,不考虑;
- 只保留最高阶项,因此保留n²/2;
- 去除这个项相乘的常数,也就是去除1/2。
最终这段代码的时间复杂度为O(n²)。
例四:
int i,j;
for(i=0; i<n; i++)
{
function(i);
}
void function(int count)
{
printf( count );
}
函数体是打印这个参数。其实function函数的时间复杂度是O(1)。
所以整体的时间复杂度是O(n)。
例五:
int i,j;
for(i=0; i<n; i++)
{
function(i);
}
void function(int count)
{
int j;
for(j=count; j<n; j++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
其实这和刚刚的例子是一样的,只是把嵌套内循环放到了函数中,所以最终的时间复杂度还是为O(n²)。
例六:
n++; /* 执行次数为1 */
function(n); /* 执行次数为n */
int i,j;
for(i=0; i<n; i++) /* 执行次数为n² */
{
function(i);
}
for(i=0; i<n; i++) /* 执行次数为n(n+1)/2 */
{
for(j=i; j<n; j++)
{
/* 时间复杂度为O(1)的程序步骤序列 */
}
}
它的执行次数f(n)=1+n+n²+n(n+1)/2=3n²/2+3n/2+1
根据推导大0阶的方法,最终这段代码的时间复杂度也是0(n²)。