随便讲讲

以下是知乎的一个问题和一个答案,时间是去年3月,alphago对李世石之前:

AlphaGo 能战胜李世石吗?

先直接回答这个问题,下面再分析AlphaGo和人工智能的未来。我认为AlphaGo这次的比赛打败李世乭比较悬,但是1-2年之内必然完胜人类。

  1. 按照两者的Elo(围棋等级分),可以算出去年年底的AlphaGo打败李世乭的概率相当低。如何算出的呢?AlphaGo去年年底的顶级分布式版本的Elo是3168(见下面第一张图),而李世乭的Elo大约是3532(全球围棋手Elo: Go Ratings ,见下面第二张图)。照这两个等级分的两个棋手对弈,李世乭每盘的胜算为89%(\frac{1}{(1+10^{((3168-3532)/400))} )} ,公式见:How to Guide: Converting Elo Differences To Winning Probabilities : chess)。如果对弈一盘,AlphaGo尚有11%的获胜的可能性,而整个比赛五盘胜出三盘或更多,AlphaGo就只有1.1%的可能性了。(当然,这是几个月前的AlphaGo,也许今天已经超越了:见下面第三点)。

  2. AlphaGo不是打败了欧洲冠军吗?有些人认为AlphaGo去年底击败了欧洲冠军樊麾,所以挑战(前)世界冠军应有希望。但是,樊麾只是职业二段(Elo 3000左右),而李世乭是职业九段(ELO 3532)。这两位的差别是巨大的,完全不能混为一谈。就比如说一个人乒乓球打败了非洲冠军,并不代表他就可以成功挑战中国冠军。

  3. AlphaGo有可能在这几个月突飞猛进,进而击败李世乭吗?AlphaGo的负责人说:”外界不知道我们这几个月进步了非常多“。(来自:Odds favor machine over human in big Go showdown )。这点确实有可能。AlphaGo进步的方法有两个:(1)增加硬件:我们从Nature的文章可以看到:从1202个CPU到1920个CPU,AlphaGo的ELO只增加了28,而且线性地增加CPU,不会看到线性的ELO成长。若要达到364 ELO积分的提升,需要的CPU将达到天文数字(有篇文章估计至少要10万个CPU:AlphaGo and AI Progress)。当然,谷歌有钱有机器,但是纯粹加机器将会碰到并行计算互相协调的瓶颈(就是说假设有十万万台机器,它们的总计算能力很强,但是彼此的协调将成为瓶颈)。在几个月之内增加两个数量级的CPU并调节算法,降低瓶颈,应该不容易。(2)增加学习功能:AlphaGo有两种学习功能,第一种是根据高手棋谱的学习,第二种是自我对弈,自我学习。前者已经使用了16万次高手比赛,而后者也在巨大机组上训练了8天。这方面肯定会有进步,但是要超越世界冠军可能不容易。最后,换一种分析方式:如果从过去深蓝击败世界冠军的“成长过程”来看,深蓝大约1993年达到职业大师水平,4年后才在一场六盘的比赛中击败世界冠军(大约500Elo积分点的提升)。今天的AlphaGo应该和1993年的深蓝相似,刚进入职业大师水平。若要击败世界冠军,虽然未必需要4年的时间,但是几个月似乎不够。

  4. 还有什么以上未考虑的因素,导致AlphaGo获胜吗?如果谷歌刻意未出全力和樊麾对抗,或者有其它学习或并行计算方面超越了Nature里面的描述,那AlphaGo完全有可能获胜。

后面还有些技术讨论,不写了。回答的人,对,就是李开复。

事实证明他估计错误,当然这不是要紧的:许多人那时都看错了。而我想讨论的是他的思考方法。

尽管在3,4李开复补充了另一种可能性,但1才是他的主要观点。或者说,如果逼着他必须下一个赌注(作为公司的老板这种挑战说来就来),他会押在李世石一边。

这种思考方法,其实是很好的:找一个标准。这个标准,满足三个条件:第一,有普遍性:任何棋手,都有一个等级分。第二,能抓住大局:等级分是衡量棋手整体战绩的分数。第三,有充分多的数据支持这个标准。这种思考方法的好处是,第一,整体正确率不低。第二,有根有据,别人容易信服(有时推断正确的重要性,不如别人相信你的重要性)。第三,即使错了,别人也挑不出毛病。

也许是我这个人喜欢剑指偏锋,我不太喜欢这种思考方法。不是不喜欢用,我还是乐意用它来解决80%的问题。但总觉得,这种思考方法彷如一束强光,让人无法洞察黑暗中的蛛丝马迹。

凡事有辣有不辣。坏处是,简单的问题我可能花更多的时间,正确率也不如别人。好处是,我有时想到些很怪的东西,别人想不到。而运气好的时候,怪想法可以派上用场。

两者兼顾是很难的。大脑有习惯,不容易切换。而且思考方式代表一个人的价值观,而价值观不是可以变来变去的。可见的解决方法,是找个正常人放在我身边,在我用奇葩方法解决普通问题时拉住我,但在面对重要问题时又允许我自由发挥。这种合作是可遇不可求的。而要命的是,在我发迹之前,是不会有人在旁边这么“伺候”我的。

所以呢,要多交点朋友,有什么事情问问人家怎么做。这样就兼顾了。

也只能是这样了。

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s

%d 位部落客按了讚: