五子棋AI教程第二版四：Alpha-Beta 剪枝

Question

五子棋AI教程第二版四：Alpha-Beta 剪枝

lihongxun945 opened this issue 6 years ago · comments

剪枝是必须的

上一篇讲了极小化极大值搜索，其实单纯的极小化极大值搜索算法并没有实际意义。

可以做一个简单的计算，平均一步考虑 50 种可能性的话，思考到第四层，那么搜索的节点数就是 50^4 = 6250000，在我的酷睿I7的电脑上一秒钟能计算的节点不超过 5W 个，那么 625W 个节点需要的时间在 100 秒以上。电脑一步思考 100秒肯定是不能接受的，实际上最好一步能控制在 5 秒以内。

顺便说一下层数的问题，首先思考层数必须是偶数。因为奇数节点是AI，偶数节点是玩家，如果AI下一个子不考虑玩家防守一下，那么这个估分明显是有问题的。
然后，至少需要进行4层思考，如果连4四层都考虑不到，那就是只看眼前利益，那么棋力会非常非常弱。如果能进行6层思考基本可以达到对战普通玩家有较高胜率的水平了（普通玩家是指没有专门研究过五子棋的玩家，棋力大约是4层的水平），如果能达到8层或以上的搜索，对普通玩家就有碾压的优势，可以做到90%以上胜率。

Alpha Beta 剪枝原理

Alpha Beta 剪枝算法是一种安全的剪枝策略，也就是不会对棋力产生任何负面影响。它的基本依据是：棋手不会做出对自己不利的选择。依据这个前提，如果一个节点明显是不利于自己的节点，那么就可以直接剪掉这个节点。

前面讲到过，AI会在MAX层选择最大节点，而玩家会在MIN层选择最小节点。那么如下两种情况就是分别对双方不利的选择：

在MAX层，假设当前层已经搜索到一个最大值 X，如果发现下一个节点的下一层（也就是MIN层）会产生一个比X还小的值，那么就直接剪掉此节点。

解释一下，也就是在MAX层的时候会把当前层已经搜索到的最大值X存起来，如果下一个节点的下一层会产生一个比X还小的值Y，那么之前说过玩家总是会选择最小值的。也就是说这个节点玩家的分数不会超过Y，那么这个节点显然没有必要进行计算了。

通俗点来讲就是，AI发现这一步是对玩家更有利的，那么当然不会走这一步。

在MIN层，假设当前层已经搜索到一个最小值 Y，如果发现下一个节点的下一层（也就是MAX层）会产生一个比Y还大的值，那么就直接剪掉此节点。

这个是一样的道理，如果玩家走了一步棋发现其实对AI更有利，玩家必定不会走这一步。

下面图解说明，直接用wiki上的图：

如上图所示，在第二层，也就是MIN层，当计算到第二层第三个节点的时候，已知前面有一个3和一个6，最大值至少是6。在计算第三个节点的时候，发现它的第一个孩子的结果是5，因为当前是MIN节点，会选择孩子中的最小值，所以此节点值不会大于5。而第二层已经有一个6了，第二层第三个节点肯定不会被选择。因此此节点的后序孩子就没有必要计算了。

其实这个图里面第三层分数为7的节点也是不需要计算的。

这是 MAX 节点的剪枝，MIN节点的剪枝也是同样的道理，就不再讲了。 Alpha Beta 剪枝的 Alpha 和 Beta 分别指的是MAX 和 MIN节点。

代码实现

虽然原理说了很多，但是其实代码的实现特别简单。

对max和min函数都增加一个 alpha 和 beta 参数。在 max 函数中如果发现一个子节点的值大于 alpha，则不再计算后序节点，此为 Alpha 剪枝。在 min 函数中如果发现一个子节点的值小于 beta，则不再计算后序节点，此为 Beta剪枝。

代码实现如下：

var r = function(deep, alpha, beta, role, step, steps, spread) {
  var _e = board.evaluate(role)

  var leaf = {
    score: _e,
    step: step,
    steps: steps
  }

    return leaf
  }
  
  var best = {
    score: MIN,
    step: step,
    steps: steps
  }
  // 双方个下两个子之后，开启star spread 模式
  var points = board.gen(role, step > 1, step > 1)

  if (!points.length) return leaf

  for(var i=0;i<points.length;i++) {
    var p = points[i]
    board.put(p, role)

    var _deep = deep-1

    var _spread = spread

    var _steps = steps.slice(0)
    _steps.push(p)
    var v = r(_deep, -beta, -alpha, R.reverse(role), step+1, _steps, _spread)
    v.score *= -1
    board.remove(p)
 

    // 注意，这里决定了剪枝时使用的值必须比MAX小
    if(v.score > best.score) {
      best = v
    }
    alpha = Math.max(best.score, alpha)
    //AB 剪枝
   
    if(math.greatOrEqualThan(v.score, beta)) {
      // AB 剪枝，不用进行接下来的遍历了，直接返回
      return v
    }
  }
  return best
}

优化效果

按照wiki上的说法，最大优化效果应该达到 1/2 次方。也就是如果你本来需要计算 10000 个节点，那么最好的效果是，你只需要计算 100 个点就够了。这是建立在所有的节点排序都是完美的假设上的。因为我们不可能完美排序，所以我们的优化效果达不到那么好。但是依然可以达到约 3/4次方 的优化效果。

对生成的着法进行排序的算法，就叫 启发式评估函数，下一章我们介绍如何实现启发式评估函数。

下一篇五子棋AI设计教程第二版五：启发式搜索

ggymm · Answer 1 · Sun Jul 22 2018 22:56:14 GMT+0800 (China Standard Time)

在MIN层，假设当前层已经搜索到一个最小值 Y，如果发现下一个节点的下一层（也就是MIN层）会产生一个比Y还大的值，那么就直接剪掉此节点。
应该改为
在MIN层，假设当前层已经搜索到一个最小值 Y，如果发现下一个节点的下一层（ #也就是MAX层）会产生一个比Y还大的值，那么就直接剪掉此节点。

言川 · Answer 2 · Mon Jul 23 2018 09:35:04 GMT+0800 (China Standard Time)

@gongym12138 感谢已更正

FireKnight · Answer 3 · Fri Oct 05 2018 17:49:54 GMT+0800 (China Standard Time)

在剪枝中的r函数中，（negamax.js的191行），注释里写有“这里必须是 greatThan 即明显大于，而不是 greatOrEqualThan”，但是下一行调用了greatOrEqualThan，请问这里？

XMG-mrx · Answer 4 · Mon Apr 20 2020 11:04:13 GMT+0800 (China Standard Time)

请问，在这个算法中alpha有可能比beta小吗

Bug Maker · Answer 5 · Fri Oct 30 2020 11:22:57 GMT+0800 (China Standard Time)

其实这个图里面第三层分数为7的节点也是不需要计算的。

7的上层为MIN层,兄弟节点有6了确实不会被采用,但是dfs算法当你知道这个节点的值为7的时候说明7的子树已经全部遍历完了啊.运算量已经消耗了.

solitaryCat · Answer 6 · Sun Feb 20 2022 11:12:18 GMT+0800 (China Standard Time)

剪枝只可能剪去非叶子节点吧图中把叶子节点都剪掉了

hukezhou · Answer 7 · Wed Feb 23 2022 12:26:12 GMT+0800 (China Standard Time)

我有一点疑惑，剪枝的分数需要回溯才能得到，示例的剪枝是遍历到第4层开始剪枝，然后剪枝后继续遍历，这样的剪枝虽然有一定合理性，但是不是就是伪剪枝呢。或者我理解错了？

myccmj · Answer 8 · Fri Dec 30 2022 23:25:13 GMT+0800 (China Standard Time)

感觉图好像确实有点问题，最右边不可能在到达叶子节点之前就全部剪掉

myccmj · Answer 9 · Fri Dec 30 2022 23:31:09 GMT+0800 (China Standard Time)

感觉图好像确实有点问题，最右边不可能在到达叶子节点之前就全部剪掉

应该是剪掉下面两个6

myccmj · Answer 10 · Sat Jan 07 2023 00:02:31 GMT+0800 (China Standard Time)

在剪枝中的r函数中，（negamax.js的191行），注释里写有“这里必须是 greatThan 即明显大于，而不是 greatOrEqualThan”，但是下一行调用了greatOrEqualThan，请问这里？

我也觉得奇怪hh，而且我看源码里面也是写的greatOrEqualThan，其实alpha beta剪枝就是alpha>=beta，所以应该就是这么写没问题