电竞比分别被Rating骗了：深度解析对手质量如何影响选手数据

每一位体育迷都见过或听过某个选手被贬低为只会打“弱旅”或“鱼腩”。CS中也不例外，数据常被粉丝用作选手之间互喷的弹药。像rating这样的指标是关键，但它本身更像是一个话题的引子，而非终极评判标准。

Rating 3.0已经为讨论提供了大量背景信息：按角色和风格划分的平均rating更为接近，且经济局击杀受到了惩罚。但总会有额外的因素，其中最重要的是选手自身队伍的水平以及对手的水平。一个在大赛中常年身处弱队的角色选手，不能与一支胜率远高于他的顶级队伍中的第三选手公平比较。

btrams已经研究了焦灼比赛中的rating，as3455则强调了你在队伍中的“胜利贡献值”，并发布了他自己的调整后rating版本。但我们仍有更多可挖掘的内容。为此，我们在BLAST鹿特丹赛前收集了大量CS2选手逐图数据。

强敌与弱旅

我们先简单看看选手身处更强一方时的表现。直观上看，绝大多数选手在弱队时表现更差。但也有例外。当Vitality在比赛中是排名较低的一方时，ZywOo平均rating为1.41。请注意，这只是CS2线下赛中25张地图的样本，但他能在对阵通常排名第一的队伍时打出这样的数据，确实说明了一些问题。

现在，大家最想看的来了：谁是最大的“弱队刷子”？谁在面对强队时表现下滑？我们来看选手在对阵排名更高和排名更低的对手时的rating差值。蓝色表示好，橙色表示差。我们展示了2025年TOP20选手（如果有足够地图样本）以及该指标下最佳和最差的三名选手。

要理解如何解读这些数据，我们需要绕个小弯，看看选手形象是如何建立的。粉丝们生活忙碌。从收视数据可知，普通观众观看的大多数比赛要么是淘汰赛，要么是两支顶级队伍之间的对决。因此，当我们看到这些数据时，就能理解为什么那些在这种场景下表现下滑的选手会招致如此多的敌意。如果你只在torzsi对阵Vitality时才看他比赛，难怪你会觉得他是个差劲的狙击手。即便是像Spinx和m0NESY这样的顶级选手，身处相对更弱战队时也有显著的下滑，这也解释了为什么论坛上对这两人也能口诛笔伐。即使是强大的donk，rating也会下降0.08，至区区1.32。

我们知道赢得比赛会带来更高的rating，而要做到这一点，你需要一支好的队伍。这些数据提供了一个起点，垫底的名字也是你意料之中的，但我们还可以更进一步。一支相对的强队，可能领先25个排名，也可能只领先1个；这个指标并未考虑这一点。

势均力敌的比赛

当我们转而观察选手在对阵排名相近的对手（此处指排名相差5名以内）时的rating时，像YEKINDAR这样的选手从上图的垫底直接跃升到本图的前列。w0nderful下降最多，在对阵与Natus Vincere排名相近的对手时rating仅为1.01。显然，单纯看身处强队或弱队时的rating，还有更多细微差别。

当然，只看势均力敌的比赛也有其缺陷。在超过200支队伍的完整排名中，相差10个名次内的队伍质量差异可能很大。我们可以改用排名积分，但有更好的方法。

利用CS2线下赛中超过200名选手的数据，我们追踪了每位选手档案中的特色rating部分。这是粉丝们检查“水货”的便捷方法：如果他们整体rating为1.20，但对阵TOP50队伍时低于1.00，你就知道他们受益于弱旅。

在我们的样本中，对阵不同级别对手的平均rating如下：

直观上，对手越强，rating越低，以至于对阵TOP5队伍时0.95的rating已高于平均水平。这可能甚至比实际应该的值更高，因为幸存者偏差意味着我们只看了那些足够优秀、能大量对阵强队且未被踢出的选手。

但即使没有幸存者偏差，我们还需要更进一步。同一级别中，不同选手的样本可能差异巨大。ropz对阵TOP50队伍的436张地图中，有253张是对阵TOP10队伍（占58%）。即便是其他一线选手，如EliGE（45%），也远低于这个赛程难度。insani的数据总是令人印象深刻，但他这个比例只有20%。

因此，将ropz对阵所有TOP50对手的rating与insani的直接比较显然不公平。所以我们必须将它们分开，分别看选手对阵TOP5、TOP6-10、TOP11-20等等的rating。

在这种方法下，我们样本中的平均rating看起来有所不同，因为规避了ropz与insani的问题。在ropz对阵排名31-50队伍的18张地图样本中，他平均rating为1.37，充分利用了对阵低排名对手的机会，但这仅将他对阵TOP50对手的rating比对阵TOP30的rating提高了0.01（从1.13到1.14）。

利用这些分离后的rating，我们可以做出一个加权rating，显示选手在面对其相应级别的对手时的表现。结果如下：

图表顶部的选手面对的对手非常强。调整后的rating则通过选手向右移动的距离来显示。像try、blameF和xKacpersky这样的选手在他们所在的级别中令人印象深刻，但他们的调整后数值远低于他们之前1.20+的原始rating。

如果看相对于他们在CS2线下赛中未调整rating提升最多的选手，broky（从第52百分位跃升至第79）、TeSeS（从第36升至第60）和torzsi（从第58升至第83）表现突出。这三人在面对更强队伍时都很挣扎，但他们与强队交手如此之多，以至于他们的平均rating低得不公平。

值得注意的是，下降明显的选手主要是尚未迈出下一步的年轻天才。cobrazera从第74百分位降至第47。jambo从第83降至第63。这向我们展示了整体rating是多么容易偏向耀眼的新星，而非我们习以为常的老面孔。

对手调整后rating（OAR）

我们已经取得了一些进展，但如果想更进一步，还有一个明显的问题。当我们把对手分桶归类时，我们丢失了大量细节。对阵积分1000分的世界第一，显然比对阵靠几次好成绩爬上来的第五名要难得多。因此，对于下一个指标，我们将更深入地挖掘。

为此，我们收集了所有知名选手的逐图数据，以观察表现的细粒度变化。从中我们可以看出，对阵世界第一队伍的平均rating仅为0.90，而对阵世界第十则升至1.01——这一跃升足以说明我们正在丢失一些有用的背景信息。例如，HeavyGod对阵TOP5队伍每图有1.02的rating，但对阵世界第五则为1.17，这掩盖了他在对阵前四时的一些较差表现。

因此，为了创建一个真正的对手调整后rating（OAR），我们需要每个对手的确切质量。然后，根据对手的排名积分，我们得到每张地图的调整后rating。例如，ZywOo在2025年3月对阵世界第一（921积分）Spirit时打出的1.75 rating，将调整为2.03。然后我们对每张地图重复这个过程。

你可能已经发现了一个问题：当时Vitality是世界第二，那么ZywOo值得这么大的提升吗？我们认为不值得，所以我们在调整中增加了另一个因素：“相对难度”。因此，在这场比赛系列中，ZywOo该图的OAR为1.88，这是对手质量调整后的2.03和相对排名差调整后的1.76的平均值。

在更大的样本中，这意味着顶级队伍的选手的相对难度调整值略低，因为他们很少在对阵最强队伍时成为弱旅中的弱旅。这也意味着低级别队伍的选手如果在对阵同级别对手时表现出色，也能脱颖而出。

当我们查看CS2历史OAR排行榜时，blameF以1.13跃入前十。这比他1.21的线下赛rating低0.08，但这是对他对阵强队时rating能够保持（对阵TOP10为1.10，对阵TOP20为1.14）的认可——尽管他超过80%的样本是在排名20名之外的队伍中打的。

正如我们在文章开头所暗示的，任何试图将大量背景信息压缩成一个数字的高级指标都有其盲点。kyousuke在这里排名第六，但他在淘汰赛中的rating仅为1.07。对手质量是整体图景的重要组成部分，但它仍然只是众多因素中的一种颜色。评估选手——无论是为了潜力新星榜、TOP20，还是作为战队球探——都需要尽可能多地考虑这些因素。但在你正确考虑对手质量之前，这一切都是不可能的。我们希望，通过OAR，我们在这条道路上又向前迈进了一步。