一、全历史等级分(WHR)算法简介
WHR的引入,要从h2h说起。如果说,我们能凭h2h判断同期选手的优劣,那么,WHR就能用它来分析史上所有选手的强弱关系。换言之,如果你认同h2h对于判断选手实力强弱的价值,那么就可以有足够的理由相信WHR。
WHR算法的原理,简单来说,就是将每名选手在每个时间节点的等级分记为一个变量,利用这些变量建立一个函数模型(概率模型),再以带有时间信息的全部选手历史对阵记录作为输入,通过牛顿法进行多轮迭代运算,拟合出有关选手实力的最有可能实现的一组等级分组合。
可以看出,WHR算法与我们司空见惯的做法一样,本质上都是利用h2h对选手的强弱关系进行分析,甚至可以说是猜测,但数学方法的优势自然不言而喻。在严密的概率学假设下,通过对巨量数据进行充分运算,无疑可以将各种意外尤其是球风相克等因素的影响降至最低,从而实现对h2h最科学有效的利用。
另外算法也不失之灵活,较明显的优点是包含了这样一个假设:选手在邻近时间节点的等级分具有相关性(满足高斯分布),这很大程度上是符合羽毛球选手的状态变化规律的。一言以蔽之,WHR算法在实力评分方面具备足够的可信度。
二、新世纪羽毛球男单WHR排名
WHR算法的整体演算原理比较复杂,感兴趣可参考此处:全历史等级分(Whole-History Rating);全历史等级分(WHR)算法;全历史等级分(WHR)开源代码。
比赛数据的获取源自此网站:比赛数据(论坛球友提供),另外根据论坛数据帝以及维基的数据,通过特殊方法进行了有限的补充。不过整体而言,上世纪选手的比赛数据还是缺失较多,因此,虽然算法算出的是所有选手在所有时间节点的等级分,但考虑到数据失真的问题,在进行排名时,只对主要活跃于本世纪的选手进行排名。
相关参数设置按照原文献给出的最佳参数,具体可参看原文献。
Algorithm
Time
Training
Test
Optimal parameters
Elo
0.41 s
56.001%
55.121%
k = 20
Glicko
0.73 s
56.184%
55.522%
σ0 = 150 Elo, w2 = 20 Elo2/day
TrueSkill
0.40 s
56.212%
55.536%
β2 = 1, σ20 = 0.5, w2 = 0.000975/game
Bayeselo
88.66 s
56.216%
55.671%
prior = 1
Decayed history
89.86 s
56.260%
55.698%
prior = 1, τ = 400 days
WHR
252.00 s
56.356%
55.793%
prior = 1.2, w2 = 14 Elo2/day
以下是主要活跃于本世纪的男单选手的峰值全历史等级分(WHR)排名,最右边的时间表示的是这个峰值出现的年份,仅列出前20名:
姓名
WHR
时间
林丹
3783
2011
李宗伟
3749
2011
安赛龙
3662
2022
谌龙
3613
2015
桃田贤斗
3608
2019
陶菲克
3581
2005
陈金
3479
2008
鲍春来
3473
2007
陈宏
3460
2005
盖德
3437
2011
李炫一
3412
2013
石宇奇
3398
2019
李梓嘉
3387
2022
杜鹏宇
3370
2013
索尼
3364
2007
夏煊泽
3343
2003
斯里坎特
3328
2017
金廷
3320
2019
骆建佑
3315
2021
孙完虎
3312
2014
与另一位球友算出的结果对照,可以看出,林李的分数依旧是一骑绝尘,与他们生涯胜率的级别完全相符,包括峰值出现的时间也与传统印象高度吻合。同时从数据看,2011年的李宗伟也的确拥有与巅峰林丹一战之力。
安赛龙凭着最近接连的高光表现,分数一直呈上升趋势,位在林李之下,但仍与二人存在较大差距。另外由于算法假设选手在邻近时间节点的等级分具有相关性,因此日后安赛龙跌下巅峰后,他的分数应该也会有所下降。
值得一提的是谌龙与桃田贤斗的分数差距微小,通过调整权重,甚至曾算出二人的分数几乎一致。如果仅考虑相互对战,二人巅峰期交手极有可能五五开,这也符合一部分球友的推断。
可能由于权重不同,我算出鲍春来的峰值不是出现在09年,而是在07年,不过实际上,07年与09年的差距并不大,相差不到10分。
然而依旧没有改变的是,盖德、李炫一的峰值还是分别出现在11、13年,我在这里稍作解释:盖德的情况是因为11年有段时间他只输林李谌,而李炫一的情况,应该与世纪之初比赛数据缺失有关。这二人的数据暂时保留疑问。
另外陈金峰值依旧出现在08年,而非传统印象中他个人最强的10年。他08年之所以高,我想是因为从结果上看,当年他赢了林丹三次,还赢了李宗伟。他10年并非最高,大概是受到了11年状态下滑的影响。值得注意的是,陈金08年与10年的等级分差距同样不大。
以下是部分天王级选手在个人高水平年度的大赛等级分与最高等级分对比,据此可判断这些选手的最佳状态是否出现在大赛或大赛附近:
姓名
时间
大赛WHR
最高WHR
陶菲克
2004
3470
3477
陶菲克
2005
3581
3581
林丹
2006
3674
3675
林丹
2007
3655
3664
林丹
2008
3689
3690
林丹
2009
3729
3735
林丹
2010
3706
3711
林丹
2011
3783
3783
林丹
2012
3736
3737
林丹
2013
3674
3676
谌龙
2014
3562
3570
谌龙
2015
3610
3613
谌龙
2016
3488
3490
安赛龙
2017
3431
3454
李宗伟
2011
3708
3749
李宗伟
2012
3669
3680
李宗伟
2013
3628
3630
李宗伟
2014
3552
3568
李宗伟
2015
3539
3554
李宗伟
2016
3527
3528
这里值得留意的是05年的陶菲克与11年的林丹,这二人当年的最高等级分都恰好出现在大赛。反而是李宗伟11年的最高等级分并非出现在世锦赛,而是出现在世锦赛前的一段时间。
下表能更直观看到部分天王级选手在大赛(决赛)对决时的等级分情况,据此可判断比赛的质量:
赛事
冠军WHR
亚军WHR
2005世锦赛
陶菲克3581
林丹3573
2008奥运会
林丹3689
李宗伟3531
2011世锦赛
林丹3783
李宗伟3708
2012奥运会
林丹3736
李宗伟3669
2013世锦赛
林丹3674
李宗伟3628
2014世锦赛
谌龙3562
李宗伟3552
2015世锦赛
谌龙3610
李宗伟3539
2016奥运会
谌龙3488
李宗伟3527
2017世锦赛
安赛龙3431
林丹3387
2020奥运会
安赛龙3638
谌龙3449
可以看出,11世锦赛决赛的确是新世纪男单的巅峰对决,质量之高可谓绝无仅有,12奥运决赛虽然堪称伟大,但整体的比赛质量比起11世锦赛还是稍逊半筹,这个通过观看比赛视频其实也可以看出来,尤其是第二局。
另外,从数据上看,14至16年的李宗伟,论综合实力已经不如13年,更明显不如11、12年。这些年虽然他一直稳定杀进大赛决赛,但这并不意味着他的实力也一直处于同一水平线。
三、全历史等级分(WHR)何去何从
作业过程中查阅了论坛球友搜集的资料,同时有赖于两位计算机专业朋友的帮助,我在编写程序方面并不是很擅长,主要负责居中协调。
全历史等级分(WHR)在羽毛球领域应用得不多,关注更是无从谈起。它看起来像是一股新鲜血液,然而在唯大赛成绩论的实力观面前,其实并没有什么冲击力。它的信徒,是极少数的。
真理往往是简单的,却又是值得深思的。其实成绩与实力之间隔了很多东西,只是没人愿意思考。羽毛球在发展,对它的认知却在倒退。不过还是抱有这样一种想法:让有价值的东西得到更多的关注。我做不到,也总有人会做到的。
来源网络:球圣