如何分析、统计算法的执行效率和资源消耗?
为什么需要复杂度分析?
- 测试结果非常依赖测试环境
- 测试结果受数据规模的影响很大
所以,我们需要一个不用具体的测试数据来测试,就可以粗略地估计算法的执行效率的方法。
大 O 时间复杂度表示法
大 O 时间复杂度实际上并不具体表示代码真正的执行时间,而是表示代码执行时间随数据规模增长的变化趋势。
- 只关注循环执行次数最多的一段代码
- 加法法则:总复杂度等于量级最大的那段代码的复杂度
- 乘法法则:嵌套代码的复杂度等于嵌套内外代码复杂度的乘积
几种常见时间复杂度
常见的时间复杂度我们可以粗略地分为两类,多项式量级和非多项式量级。其中,非多项式量级只有两个:O(2n) 和 O(n!)。
当数据规模 n 越来越大时,非多项式量级算法的执行时间会急剧增加,求解问题的执行时间会无限增长。所以,非多项式时间复杂度的算法其实是非常低效的算法。
- 一般情况下,只要算法中不存在循环语句、递归语句,即使有成千上万行的代码,其时间复杂度也是Ο(1)。
- 在对数阶时间复杂度的表示方法里,我们忽略对数的“底”,统一表示为 O(logn)。
- O(nlogn) 也是一种非常常见的算法时间复杂度。比如,归并排序、快速排序的时间复杂度都是 O(nlogn)。
- O(m+n)、O(m*n)代码的复杂度由两个数据的规模来决定。
空间复杂度分析
我们常见的空间复杂度就是 O(1)、O(n)、O(n2),像 O(logn)、O(nlogn) 这样的对数阶复杂度平时都用不到。
总结
- 常见的复杂度并不多,从低阶到高阶有:O(1)、O(logn)、O(n)、O(nlogn)、O(n2)。
- 复杂度分析并不难,关键在于多练。
课后思考题
我们项目之前都会进行性能测试,再做代码的时间复杂度、空间复杂度分析,是不是多此一举呢?
回答:时间复杂度和空间复杂度分析是一个理论上的模型,并不能真实反映在不同平台不同数据规模下的时间和空间。但是由于是粗略分析,所以不会浪费时间。相反,理论分析和性能测试是相辅相成,互相验证的。最重要的是,它可以锻炼我们的复杂度分析思维。