2018-04-05 11:56 快包智能硬件
微博 微信 QQ空间

相信大家都玩过围棋,围棋每一步的选择比象棋多得多,多得像宇宙中所有原子一样。因此没有一种方法可以计算出所有的可能性,这是不可能实现的。正因为如此,围棋像是人工智能的圣杯。而阿尔法狗的出现展现了机器真的可以像人类一样学习和思考。

阿尔法围棋是一款围棋人工智能程序,由位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和戴密斯·哈萨比斯与他们的团队开发。

这个程序的原理是“深度学习”和“两个大脑”。“深度学习”是指多层的人工神经网络和训练它的方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取权重,再产生另一个数据集合作为输出。“两个大脑”:第一大脑是“落子选择器”,阿尔法围棋的第一个神经网络大脑是“监督学习的策略网络 ,观察棋盘布局企图找到最佳的下一步。第二大脑是“棋局评估器”,根据棋子的位置情况,预测每一个棋手赢棋的可能。这就是第二个神经网络大脑:“价值网络”。通过整体局面的判断来辅助落子选择器。但这个判断仅仅是大概的。

“阿尔法围棋”的发展分为四个阶段:

“阿尔法围棋-樊”

“阿尔法围棋-李”

“阿尔法围棋-大师”

“阿尔法围棋-零”前三个版本在刚开始学习围棋时,都要依靠人类知识,即先教它们一些人类摸索出的基本下法,然后再开始自己学习。而“阿尔法围棋-零”摆脱了这个限制,研究人员没有给它除棋盘和棋子之外的任何输入,它完全是“从零开始”,自己与自己对弈,通过更为优秀的算法,取得飞速进步。“阿尔法围棋-零”取得的进步已经证明,基于强化学习的人工智能比基于人类知识经验的智能表现地更好。

阿尔法围棋-零”带来的进步是围棋棋手日后学习的宝库。 “阿尔法围棋-零”是独立学习训练的,但它使用的招数却超越了许多人类棋手的下棋顺序和招法。也就说,人工智能丰富了我们下围棋的选择。或许它在下棋过程中有些下法是人类无法理解的,甚至认为是错误的,但在机器的理解看来确实万分正确的。从这些经验中,人类棋手看到了与以往不同的围棋世界。

另一视角

换一换

24小时热文

热门标签

24小时热文

点击: