今天特别开心李世石终于赢回一局。
然后很多人不能理解阿尔法那种走法。但是我想从训练的原始数据来分析,这一种情况是很有可能的。
核心在于原始数据里没有权重。无论任何一种训练方法,都给定了原始数据一个样本,即是已有分类标签是对的。换句话说,所有在原始样本里面有结果的局,里面的人下的手都是有意义的。
事实上呢?不是的,你取胜有两个原因,一个是你做对了
另一个是你对手做错了。
但是围棋里不同的是,因为你做对而胜的棋谱千千万,因为对手做错(特别是大错)而胜的棋是有限的。
这种是什么样的棋谱呢。举例,一个小朋友,上手拍天元,然后送两手,最后还赢了,可能吗?
可能的话,是因为他有一个更好笑的对手,完全不知道规则吃子,在对手送分的情况下还投子了。
对吗?
对的。
事实上大家都觉得今天黑93手不对,101手傻。
高手不会这样下对吧,所以你们有走过101走的棋谱吗?
没有。
但是这种对局会不会出现呢?有消息说这次来源的棋谱是奕城的。一个新的新手下出这种棋是完全可能的。
因为下这一步棋的人一定不会对上一个真正的高手,所以下一步棋,其实是可能胜率很大的(因为训练集中的棋谱)。
换句话说,在这一瞬间,阿尔法狗的战略是(把你拉到和我一样幼稚的水平,再用我丰富的经验战胜你)。
因为在这一过程中,阿尔法的训练集告诉它,只要我傻气的走一步,对手就会比我更傻,或者是至少这样的对手不能完全执行之前的小李子的战略。
从经验上来说,这是一个个别样本由于稀缺变量的存在性而导致其显示结果有很大变动的问题。
而阿尔法没有想到的是,对手不应。
好处是,他的集里只有这两步是弱手了。所以其后又回复了正常。
因为有些人失误也能赢,故意走错棋也能赢,但是这是相关,不是因果。但这里面的失误是自选择效应还是真实的战略结果GOOGLE不清晰。
是的。这也是相关分析不能代表因果分析的原因。大数据,机器学习就是这样。
其实处理不难,只要在原始数据处理这些稀缺战略,应该就可以了。可以降低权重或者剔除。因为按照贝叶斯的话,这些样本大概是永远不会从数据里删掉的。他们始终可以发挥作用,但是他们一旦发挥作用的话,就是问题所在了。
这点也说明了为什么阿狗遇强则强,遇弱则弱,因为你能够下出的棋,他最熟悉的反馈是和你差不多水平的人的反馈。在非遍历的情况下,原始数据的朴素贝叶斯效应非常严重。
想到这一个算法本身可能就还存在漏洞。还是很开心了。
真心祝贺,今天下午开心。见到了那种好奇心满足而显现出的真正的开心。
没有评论:
发表评论