手机浏览器扫描二维码访问
蒙特卡洛树搜索,是围棋ai的基本解决框架。
围棋ai每一步都选择若干种落子,然后在电脑中模拟到终局,进行数子,最终选择胜率最高的那一步棋。
因为计算量太大,ai只能给出一个近似最优解,并非全枚举,在alphago之前ai因此也只能达到业余五级的水准。
这依旧是一个计算的范畴,而职业棋士很多时候并不是单靠计算做出判断,像之前所说的全局观念,就是蒙特卡洛树搜索无法解决的问题。
要让ai发挥出人脑的效果,到底靠的什么?
当天晚上,谢榆从美国的某个计算机大牛那里,获知了他想要的答案。
alphago团队在蒙特卡洛树搜索上加装了策略网络和价值网络两个模块。
这两个模块让alphago不是单纯地计算,而是深度学习、模仿人类!
策略网络,顾名思义是决策下一步走子。
alphago会检索kcs围棋服务器上所有真人在线对弈,进而判断:如果是人类棋手处于它当前的位置,他最有可能走哪一步?它只对那些解进行计算!然后,它就自我对弈上千万局,看看这一步是否真的是最优解!
遵循策略网络,蒙特卡洛树搜索的树宽将大量减少,但深度依旧存在。
上千万局博弈,每一局都走到最后,依旧是可怕的计算量。
计算深度的减少用上了价值网络。
它以alphago产生的大量自我博弈作为样本,检索这种棋形在历史上的胜率,把好坏、优劣变成了一个概率问题!那么每一回,alphago计算到一定深度就可以停下来,直接估算当前胜率!
经验的本质是概率,从本质上来说,以概率判断局面的alphago,就是以&ldo;经验判断现状&rdo;的人类大脑运行模式!alphago的走子,也完全遵循了人类棋手的思维历程‐‐大量背谱,吸取经验,自我思考,判断局势……然后估算其后若干步的棋局导向!
只是这个棋手,等于千百年来千千万万个棋手的经验总和,并且,完全不会出错罢了。
第二天,乌镇再传出消息:魏柯第二局,依旧惨败!
魏柯意识到细棋是没有机会的,一开始就主动展开攻势,趁着布局阶段想要对alphago进行压制。
他意识到alphago非常有经验,尝试用怪着、偏着对付他,导致子效低下,输得比昨天更惨!王梦雨甚至在解说时失声痛哭,即使他根本不是魏柯,也无法承受这种绝望的差距,可想而知魏柯所肩负的压力。
然而公众是难以理解的。
消息一出,全网哗然。
因为此前对魏柯寄望太高,现在舆论开始转了风向,对人类失败的恐慌很容易就演变成了对魏柯的愤怒:&ldo;魏柯他根本不能代表全人类&rdo;、&ldo;他之前是靠作弊获胜的,谷歌怎么会选中这种人&rdo;、&ldo;他脑子不太好使的吧&rdo;、&ldo;一年没下棋,已经不是从前那个他了&rdo;……唱衰之声频频出现。
甚至又有黑子借机挑事,想要将他彻底踩在脚下。
与此相对的,是alphago遭受到了所有人的追捧。
开发人员为其植入了虚拟人格,专门注册了一个网站,使得人类可以在alphago不比赛的时候与他进行交流沟通。
因为电脑天生具有多线程任务的能力,它迅速地成为了网友的手机宠物。
请关闭浏览器阅读模式后查看本章节,否则将出现无法翻页或章节内容丢失等现象。
大学生张远志毕业后被分配到了鸡不拉屎的艳门乡,女友被迫嫁入官门,一次下村考察竟然在山洞里救下了一个美女领导,平淡一年的张远志万万没有想到自己的发迹竟然从这一刻开始,官路坎坷,女领导架梯,且看这个楞小子如何借助美女领导,玩转官场,在官场之上风生水起!...
我是单亲家庭,我爸在我小的时候欠了很多赌债跑了,有人欺负我我就跟人打架,但是我看上的那个女孩...
关于超品天师超品天师天师分九品,一品才入门,二品可驱邪,三品算登堂,四品可开观,五品入世练,六品道术绝,七品天下走,八品没奈何,九品云端见,绝品相人,相国,相天地!...
夏薇茗死了,沈修瑾亲手将简童送进了女子监狱。三年牢狱,简童被沈修瑾一句好好关照她折磨的大变样,甚至狱中被同意捐肾。入狱前,简童说我没杀她。沈修瑾不为所动。出狱后,简童说我杀了夏薇茗,我有罪。沈修瑾铁青着脸你给我闭嘴!不要再让我听到这句话!简童笑了真的,我杀了夏薇茗,我坐了三年牢。简童逃了,沈修瑾找疯...
一代战神豪门噩梦被誉为一代杀戮之王的魔王回归都市,带着一颗冰冷嗜血的心,只为家族雪耻。魔王归来,诸强胆寒,杀戮灭情,鲜血炼心!尒説影視ρ○①⑧αrt「Рo1⒏аrt」...
关于狐狸师兄不好惹惨遭男友背叛就算了,男人千千万,不行咱就换。狗血的穿越到异世,本以为会美男环绕从此逆袭,结果自己居然成了江湖魔宫中一个心狠手辣的大胖妹???没爹没娘还被师兄师姐各种嫌弃。小心翼翼步步为营,活得那叫一个艰辛。好不容易获取了大家的信任,结果原主联合玉虚宫少主让我的日子鸡飞狗跳。伤害我可以,但要是敢动我身边人,我就让你们尝尝我这个女魔头的手段!!!...