今天来学习递归。
如何理解“递归”
数据结构和算法中两个最难理解的知识点,一个是动态规划,另一个是递归。
递归是一种应用非常广泛的算法(或者编程技巧)。比如,合并两个有序链表、斐波那契数列等等。
去的过程称为“递”,回来的过程称为“归”。
递归需要满足的三个条件
- 一个问题的解可以分解为几个子问题的解。子问题就是数据规模更小的问题。
- 这个问题与分解之后的子问题,除了数据规模不同,求解思路完全一样。
- 存在递归终止条件
如何编写递归代码
写递归代码最关键的是写出递归公式,找到终止条件。
写递归代码的关键就是找到如何将大问题分解为小问题的规律,并且基于此写出递归公式,然后再敲定终止条件,最后将递推公式和终止条件翻译为代码。
编写递归代码的关键是,只要遇到递归,我们就把它抽象成一个递推公式,不用想一层层的调用关系,不要试图用人脑去分解递归的每个步骤。
递归代码要警惕堆栈溢出
原因:函数调用会使用栈来保存临时变量。每调用一个函数,都会将临时变量封装为栈帧压入内存栈,等函数执行完成返回时,才出栈。系统栈或者虚拟机栈空间一般都不大。如果递归求解的数据规模很大,调用层次很深,一直压入栈,就会有堆栈溢出的风险。
解决方法:在代码中限制递归调用的最大深度。但这种做法并不能完全解决问题,因为最大允许的递归深度跟当前线程剩余的栈空间大小有关,事先无法计算。如果实时计算,代码过于复杂,就会影响代码的可读性。所以,如果最大深度比较小,比如10、50,就可以用这种方法,否则这种方法并不很实用。
将递归代码改为循环处理以避免堆栈溢出。
递归代码要警惕重复计算
为了避免重复计算,可以通过一个数据结构(散列表)来保存已经求解过得f(k)
。当递归调用到f(k)
时,先看下是否已经求解过了。如果是,则直接从散列表中取值返回,不需要重复计算。
将递归代码改写为非递归代码
递归代码有利有弊,利是递归代码的表达能力很强,写起来非常简洁;而弊就是空间复杂度高、有堆栈溢出的风险、存在重复计算、过多的函数调用会耗时较多等问题。
f(x)=f(x-1)+1
改写为非递归代码
1 | def f(n): |
笼统的讲,所有的递归代码都可以改为迭代循环的非递归写法。因为递归本身就是借助栈来实现的,只不过我们使用的栈是系统或者虚拟机本身提供的,我们没有感知罢了。如果我们自己在内存堆上实现栈,手动模拟入栈、出栈过程,这样任何递归代码都可以改写成看上去不是递归代码的样子。
解答开篇
给定一个用户ID,如何查找这个用户的“最终推荐人”。伪代码如下,
1 | long findRootReferrerId(long actorId) { |
存在的问题:
- 递归很深,存在堆栈溢出的风险(限制递归次数)
- 如果数据库里存在脏数据,还需要处理由此产生的无限递归问题,如何检测环?(限制递归次数、快慢指针检测环)
课后思考
对于递归代码,有什么好的调试方法?(答案来自评论区)
- 打印日志发现,递归值
- 结合条件断点进行调试