递归 | Violin's Blog

今天来学习递归。

如何理解“递归”

数据结构和算法中两个最难理解的知识点，一个是动态规划，另一个是递归。

递归是一种应用非常广泛的算法(或者编程技巧)。比如，合并两个有序链表、斐波那契数列等等。

去的过程称为“递”，回来的过程称为“归”。

递归需要满足的三个条件

一个问题的解可以分解为几个子问题的解。子问题就是数据规模更小的问题。
这个问题与分解之后的子问题，除了数据规模不同，求解思路完全一样。
存在递归终止条件

如何编写递归代码

写递归代码最关键的是写出递归公式，找到终止条件。

写递归代码的关键就是找到如何将大问题分解为小问题的规律，并且基于此写出递归公式，然后再敲定终止条件，最后将递推公式和终止条件翻译为代码。

编写递归代码的关键是，只要遇到递归，我们就把它抽象成一个递推公式，不用想一层层的调用关系，不要试图用人脑去分解递归的每个步骤。

递归代码要警惕堆栈溢出

原因：函数调用会使用栈来保存临时变量。每调用一个函数，都会将临时变量封装为栈帧压入内存栈，等函数执行完成返回时，才出栈。系统栈或者虚拟机栈空间一般都不大。如果递归求解的数据规模很大，调用层次很深，一直压入栈，就会有堆栈溢出的风险。

解决方法：在代码中限制递归调用的最大深度。但这种做法并不能完全解决问题，因为最大允许的递归深度跟当前线程剩余的栈空间大小有关，事先无法计算。如果实时计算，代码过于复杂，就会影响代码的可读性。所以，如果最大深度比较小，比如10、50，就可以用这种方法，否则这种方法并不很实用。

将递归代码改为循环处理以避免堆栈溢出。

递归代码要警惕重复计算

为了避免重复计算，可以通过一个数据结构(散列表)来保存已经求解过得f(k)。当递归调用到f(k)时，先看下是否已经求解过了。如果是，则直接从散列表中取值返回，不需要重复计算。

将递归代码改写为非递归代码

递归代码有利有弊，利是递归代码的表达能力很强，写起来非常简洁；而弊就是空间复杂度高、有堆栈溢出的风险、存在重复计算、过多的函数调用会耗时较多等问题。

f(x)=f(x-1)+1改写为非递归代码

def f(n):
    result = 1

    for i in range(2, n+1):
        result = result + 1
    return result

笼统的讲，所有的递归代码都可以改为迭代循环的非递归写法。因为递归本身就是借助栈来实现的，只不过我们使用的栈是系统或者虚拟机本身提供的，我们没有感知罢了。如果我们自己在内存堆上实现栈，手动模拟入栈、出栈过程，这样任何递归代码都可以改写成看上去不是递归代码的样子。

解答开篇

给定一个用户ID，如何查找这个用户的“最终推荐人”。伪代码如下，

long findRootReferrerId(long actorId) {
  Long referrerId = select referrer_id from [table] where actor_id = actorId;
  if (referrerId == null) return actorId;
  return findRootReferrerId(referrerId);
}

存在的问题：

递归很深，存在堆栈溢出的风险(限制递归次数)
如果数据库里存在脏数据，还需要处理由此产生的无限递归问题，如何检测环？(限制递归次数、快慢指针检测环)

课后思考

对于递归代码，有什么好的调试方法？(答案来自评论区)

打印日志发现，递归值
结合条件断点进行调试