“人机大战”成为最近人们关注的焦点,机器为何如此强悍?竟连世界顶级的围棋手都连败两局。

今天,CCTV-2《第一时间》揭秘了阿尔法狗是如何学习围棋的。报道中指出,之所以敢叫板韩国顶尖围棋手,在于它突破了传统的程序,有了一些深度学习的能力。那么阿尔法狗的机器学习算法是怎样的呢?

研究人员在阿尔法狗的程序中搭建了两套模仿人类思维方式的深度神经网络。第一种叫“策略网络”它让程序学习人类棋手的下法,挑选出比较有胜率的棋谱,抛弃明显的差棋,使总运算量维持在可以控制的范围内。

另一种叫价值网络,主要用于减少搜索的深度,它不会一下子搜索一盘棋所有的步数,而是一边下一边进行未来十几步的计算,这样也就大量减少计算量。

这款程序还会自己与自己下棋,通过大量的锻炼,抛弃可能失败的方案,精中选精。“深度思维”研究人员大卫·希尔韦表示,普通人一生时间能够进行的比赛数量是有限的,一年可能下一千盘,但阿尔法狗每天能下三百万盘棋。



相关文章