克隆人之崛起第四十五章四劫循环（中）

字体

大

中

小

关灯

第四十五章四劫循环（中）（2/2）

之路，它巧妙地混合了三种算法：蒙特卡洛树搜索+监督学习+增强学习。

其中蒙特卡洛树搜索是一种优化过的暴力计算，比1997年深蓝的暴力计算更聪明。而这里的监督学习，是通过学习3000万步人类棋谱，对六段以上职业棋手走棋规律进行模仿，也是alphago获得突破性进展的关键算法。

而增强学习作为辅助，是两台alphago从自我对战众中学习如何下棋，据悉对棋力提升有限。

而alphago2.0完全抛弃掉人类这两千年来进化的围棋经验，另寻他径，仅凭两台机器自我对弈中学习和进化，最终不仅赶超了人类进化的速度，还发展出一套截然不同的下棋方法，并且更加接近完美的状态，实现了对人类的碾压，重演了一部围棋的进化史，而且得出了与这两千年来不同的进化结果。

alphago2.0依靠的，是其核心研发团队研制的人工神经网络!

而距离今天，alphago2.0版本，已经成为了古董。因为，这个故事已经是半个世纪前的事情了。

今天，仅仅两周后，更加惊人的消息传来。mr.dust竟然战胜了最新的alphago6.0版本!而这个版本，是alphago2.0历经50多年后的最新进化成果。

根据最新的比赛规则进行的对弈，双方的结果，竟然是4：0!
本章已完成！

第四十五章 四劫循环（中）（2/2）

第四十五章四劫循环（中）（2/2）