字体
关灯
上一页 进书架 回目录    存书签 下一章

第四十五章 四劫循环(中)(2/2)

之路,它巧妙地混合了三种算法:蒙特卡洛树搜索+监督学习+增强学习。

其中蒙特卡洛树搜索是一种优化过的暴力计算,比1997年深蓝的暴力计算更聪明。而这里的监督学习,是通过学习3000万步人类棋谱,对六段以上职业棋手走棋规律进行模仿,也是alphago获得突破性进展的关键算法。

而增强学习作为辅助,是两台alphago从自我对战众中学习如何下棋,据悉对棋力提升有限。

而alphago2.0完全抛弃掉人类这两千年来进化的围棋经验,另寻他径,仅凭两台机器自我对弈中学习和进化,最终不仅赶超了人类进化的速度,还发展出一套截然不同的下棋方法,并且更加接近完美的状态,实现了对人类的碾压,重演了一部围棋的进化史,而且得出了与这两千年来不同的进化结果。

alphago2.0依靠的,是其核心研发团队研制的人工神经网络!

而距离今天,alphago2.0版本,已经成为了古董。因为,这个故事已经是半个世纪前的事情了。

今天,仅仅两周后,更加惊人的消息传来。mr.dust竟然战胜了最新的alphago6.0版本!而这个版本,是alphago2.0历经50多年后的最新进化成果。

根据最新的比赛规则进行的对弈,双方的结果,竟然是4:0!
本章已完成!
上一页 进书架 回目录    存书签 下一章
草根石布衣 再见2002 师傅是个外星人 他来时星河璀璨林绾绾萧夜凌 末日幻世录 刑警使命 极品全能修仙 最强天王系统 都市之绝世战神凌风林思琪 爱不逢时