在周日第四局的比赛中,李世石下出白78“神之一手”,导致AlphaGo误判形势,在程
序的“值网络”(用于评估电脑胜率)中,误以为胜率达到70%,直到第87步才反应过来,最终李世石中盘获胜,取得对AlphaGo的首场胜利,而
AlphaGo也因为首场失利获得世界第四的排名。
今日的比赛,由李世石执黑先行,谷歌AlphaGo执白。李世石与AlphaGo的首次交战在棋盘右上与右下方,李世石顽强作战将这部分黑棋做活。之后双方在棋盘中腹展开厮杀。
与之前的4场比赛不同,今天的对决双方一直杀到收官阶段。最终,比赛在进行到5小时后,李世石投子认输。
因AlphaGo以4:1总比分击败李世石,谷歌公司将自己所设立获得100万美元奖金。谷歌方面已经宣布将这笔奖金捐给联合国儿童基金会和相关围棋教育机构。
首场人机大战结束后,AlphaGo之父、DeepMind联合创始人德米斯·哈萨比斯表示,人工智能的下一步目标是让计算机自己学棋。也就是说,下个版本的AlphaGo将从零开始,不接受人类的灌输的特定知识,做到真正的自主学习。
DeepMind认为,最终目标包括智能手机助手、医疗健康和机器人。而尽管AlphaGo目前只是个下围棋的系统,但哈萨比斯认为,一些基本原理也适用于解决现实世界问题。
李世石持黑与AlphaGo的第5局棋谱参见这里。