日韩

围棋数据统计分析2:对比分析中日韩6大高手

字号+作者:弈客围棋 来源:弈客围棋2019-05-20 我要评论() 收藏成功收藏本文

本文所有的数据,均来自于弈客鹰眼的数据库。数据来源分为个人鹰眼与鹰眼市场,个人鹰眼为弈客用户申请的鹰眼分析,选取了最近的5500局;鹰眼市场的数据来源为'...

本文所有的数据,均来自于弈客鹰眼的数据库。数据来源分为个人鹰眼与鹰眼市场,个人鹰眼为弈客用户申请的鹰眼分析,选取了最近的5500局;鹰眼市场的数据来源为职业对局与AI对局,库内目前总计有近1400局,全部选取用以分析。


二、吻合度与个体差异


选取鹰眼市场中6位近期棋谱较多,且风格有代表性的棋手进行分析。依据这两个要求,最终选定了柯洁、芈昱廷、陈耀烨、朴廷桓、申真谞与井山裕太。除了个别对局外,均是2017年后的对局,且单个棋手对局数量不少于40局。


① 全局分析


图1:全局吻合度拟合


对6位棋手全局吻合度进行拟合,都符合正态分布[1]。全局吻合度均值最高的棋手是柯洁与芈昱廷,分别为62.35%与62.19%。但是根据t检验结果,柯洁的数据显著高于鹰眼库,芈昱廷有很大可能性高于鹰眼库[2][3]。之后是陈耀烨的60.91%,申真谞的59.81%与朴廷桓的59.10%,不能认为与鹰眼库均值存在差异[4]。井山裕太的数据垫底,为58.00%,很可能低于鹰眼库均值[5]。


从6人的战绩来看,井山裕太要比另外5位要明显糟糕一些,但是这并不能说明吻合度低与此有唯一的相关性。棋力永远不是一个单一的维度,吻合度只是其中一个指标。


除了柯洁与陈耀烨,另外四位棋手的σ都较低,说明盘与盘之间的差异相对较低。柯洁与陈耀烨的σ都在10%,提示每盘之间的发挥起伏可能高于另外四位棋手。从成绩来看,柯洁的起伏相对较大与一般的认知相符,陈耀烨对下手也存在偏软的现象。井山裕太与申真谞的σ尤其小,均在7%的样子,稳定性好或许与对战下手过多有关。


② 序盘分析


图2:序盘吻合度拟合


对6位棋手序盘吻合度进行拟合,柯洁、陈耀烨、朴廷桓与芈昱廷对正态分布吻合较好[6],芈昱廷与井山裕太数据有明显的双峰现象,与正态分布吻合较差,相较之下芈昱廷符合程度更差[7]。


从芈昱廷的序盘吻合度拟合图来看,在50%和70%各有一个明显的峰值,最终造成了均值在60%左右的结果。芈昱廷的序盘有非常明显的两极分化趋势,这可能与芈昱廷喜好在序盘早早进入中盘战斗有关系,而这些挑起战斗的招法往往不被AI所认同。

其余5位棋手中,序盘吻合度最高的是申真谞的63.79%与陈耀烨的63.48%,非常可能高于鹰眼库数据[8]。与预期相反,柯洁与朴廷桓并没有想象中高,分别为59.26%与58.28%。柯洁很可能低于鹰眼库数据,而朴廷桓则非常可能低于鹰眼库数据[8]。井山裕太57.89%的数据再一次垫底,但是由于样本差异较大,很难认为与鹰眼库数据有差异[10]。


序盘吻合度数据的差异,可能是棋手性格的体现。申真谞与陈耀烨对AI招法研究深入,平稳的风格更容易命中AI的选点。柯洁与朴廷桓虽然对AI研究也十分深入,但是可能自己的想法更多,追求AI与自身招法的融合,并不是单纯一味的模仿。芈昱廷和井山裕太是典型的战斗风格,喜欢早早在序盘导入战斗。不过仅看吻合度不能说明棋手的布局水平,依然需要挖掘其他的数据指标[11]。


σ值反映了棋手每盘之间的差异。陈耀烨σ仅为8.85%,是全场唯一一位低于10%的棋手,序盘几乎一如既往的稳定。申真谞在这一点上,与陈耀烨有了明显的区别。σ=12.45%位列全场第三,要明显大一些,这暗示申真谞的序盘可能并没有陈耀烨可靠。芈昱廷与井山裕太的σ最大,超过了13%,也说明两位棋手序盘可能存在更多的起伏。

③ 中盘分析


图3:中盘吻合度拟合


中盘环节是人类与AI差异最大的地方,一来是不像序盘有据可循,二来也不像官子能够清楚计算。中盘的选点十分考验棋感与天赋,战与和的决策也受性格影响很大。对6位棋手中盘吻合度进行拟合,都符合正态分布[12]。


中盘吻合度最高的是柯洁,63.08%的成绩一枝独秀,毫无疑问的高于鹰眼库的数据[13]。井山裕太与芈昱廷分列2、3,分别为59.63%与59.25%,不能认为与鹰眼库数据均值有差异[14]。三名被认为稳健型棋风的数据垫底,朴廷桓58.30%、申真谞58.01%、陈耀烨57.42%,也均不能认为与鹰眼库数据均值有差异[15]。


从均值来看,6位棋手中柯洁中盘的棋感无疑是最接近AI的人类,这一点毋庸置疑,成绩最为突出绝对不是一件偶然的事情。力战型棋风的芈昱廷与井山裕太,要稍微高于剩余三位稳健的棋手,但是从成绩角度却是后三位棋手更佳。这也说明吻合度的高低并不是反应棋力的唯一指标,发挥的稳定性对于棋力更为重要。


从σ值来看,申真谞与陈耀烨最低,分别为7.54%以及6.91%,这说明这两位棋手每盘棋发挥相对均衡一些。而剩余四位棋手,σ都在9%-10%之间,要稍微大一些。从这个角度来看,虽然同样是稳健派的棋手,朴廷桓的中盘风格与陈耀烨、申真谞是有一定的差别的。柯洁棋风灵活,芈昱廷与井山裕太好战,每盘之间的起伏一定更大。


④ 总结

结合上述分析,通过棋手数十盘到上百盘棋的吻合度,可以建立一名棋手的吻合度分布。通过均值与标准差,可以一定程度的猜测棋手的实力与风格。稳健的棋手中盘吻合度的σ很可能较低,战斗的棋手则有可能中盘吻合度均值稍高。


值得注意的是,柯洁序盘吻合度明显低于全局吻合度,这说明柯洁在中后盘的选点上比其他人与AI相似度更高。柯洁的中盘吻合度的确明显高于鹰眼库均值,这也是柯洁成绩好的一个保证。芈昱廷全局吻合度比例高,但是序盘与中盘吻合度并不高,这一定程度上说明了芈昱廷的对局可能手数较长,更擅长中后盘的拉锯战。


从数据上看,陈耀烨与申真谞十分接近,朴廷桓与两者有一定的差异。同样是稳健型的棋手,朴廷桓或许比前面两位更喜好战斗。井山裕太与芈昱廷的数据也很像,尤其是布局两极分化这一点,或许是因为两位棋手都喜欢早早打响战斗。柯洁的数据独一种,风格确实与众不同。


⑤ 附录

[1] 6组数据的R平方值,只有陈耀烨、申真谞相对较低,为0.965和0.987。其余5人都非常好,均在0.993之上。据此,可以认为所有样本均符合正态分布。

[2] 采用t检验。对于柯洁的全局吻合度均值,t=3.034,在α=0.0025的情况下与鹰眼库数据有差异;对于芈昱廷的全局吻合度均值,t=1.729,在α=0.05的情况下与鹰眼库数据有差异。

[3] 造成这样差异的关键是柯洁的样本较多,170盘的数据显著多于芈昱廷45局的,因而可信度较高。

[4] 采用t检验。陈耀烨t=0.669,朴廷桓t=0.943,申真谞t=0.232,在统计学意义上均无法认定与鹰眼库数据有差异。

[5] 采用t检验。井山裕太的t=1.838,在α=0.05的情况下与鹰眼库数据有差异。

[6] 这4位棋手的R平方值可以分为两组,柯洁与朴廷桓均在0.994以上,陈耀烨的0.941与申真谞的0.964稍差,但是都可以认为符合正态分布。
[7] 芈昱廷的R平方值仅为0.755,难以认为符合正态分布;而井山裕太的R平方值为0.892,正态分布勉强有一定的参考价值。

[8] 采用t检验。陈耀烨t=2.071、申真谞t=2.290,在α=0.025的情况下与鹰眼库数据有差异。

[9] 采用t检验。柯洁t=1.956,在α=0.05的情况下与鹰眼库数据有差异;而朴廷桓t=2.285,在α=0.025的情况下与鹰眼库数据有差异。

[10] 采用t检验。井山裕太t=1.580,在统计学意义上无法认定与鹰眼库数据有差异。

[11] 除了风格之外,训练使用的AI也会一定程度左右棋手的选择。日韩棋手在之前普遍使用ELF权重,而中国顶尖棋手应该是结合了绝艺与ELF。虽然不同的AI、不同算力的情况下,在选点上差异并不会很大,但是不可否认这会造成棋手的细微差异。

[12] 6组数据的R平方值,都在0.980以上,与正态分布吻合较好。

[13] 采用t检验。柯洁t=6.780,在α=0.0005的情况下与鹰眼库数据有差异。

[14] 采用t检验。井山裕太t=1.231,芈昱廷t=1.182,在统计学意义上无法认定与鹰眼库数据有差异。

[15] 采用t检验。朴廷桓t=0.406,申真谞t=1.078,陈耀烨t=0.532,在统计学意义上无法认定与鹰眼库数据有差异。


(毒奶菇)


相关文章