`

Geek讲足球:一张图就能让你看出球队进攻好坏

2017/10/15 8:53:09 www.zb8.com.cn 互联网

编者按:本篇来自足球数据网站StatsBomb的文章主要讲述了MK射门分布图的产生过程,其中也包含了该分布图中的一些项目的设计初衷,相信这篇文章能够使得读者们在未来对围绕着这一射门分布图而展开讨论的分析文章有更好的理解。

在很久很久以前,准确讲是2014年11月,我对当时的传统射门分布图很是感慨。尽管它所呈现的结果还算可以接受,但它并不能够令我准确地找到我想要挖掘的信息,同时也不能让我在图中找到在不同场次间的数据差别。但我并不是说这样的分布图就是糟糕的,我只是期望能够在其中看到更多的信息。我的最初想法是或许我们可以将NBA著名数据分析师戈尔兹伯里的方法运用在足球上。

我将自己的想法解释给了我的小伙伴“马雷克-科维亚特科夫斯基博士”(他一直让我这么称呼他)。我与他合作了很多个年头,因此我可以保证他绝对是个超级天才。如果没有他的及时反馈,那么我的研究的质量绝不会那么好。我们俩的关系就像这样……

额……不管怎么说,在他被我“安利”了我的想法之后,他便开始了相关的编程工作。下文就是我在Smartodds(即中日德兰和布伦特福德的老板马修-贝纳姆的足球数据分析网站)任职时期关于如何将我的这一想法变为真正的分析工具的过程中的所遭遇的一系列挫折和改正的“设计日记”。

【“设计日记”全记录(译注:实际上是两人的电子邮件记录)】

2014年11月10日

嗨,泰德(即原文作者的名字,下同)

这是阿森纳在上赛季主场对阵卡迪夫城的(射门)表现(本特纳和沃尔科特在比赛的第89和第90分钟各入一球)。

图示说明:

圆形=头球射门,矩形=用脚或其他地方部位的射门(或许这样做的话我们可以将三角形代表乌龙球?)

边框黑色加粗=进球,边框黑色=打在门框内的射门,边框灰色=其余射门

颜色深度=期望进球(实际的数字仍然是摇摆不定的,但这仍然是与期望进球的概念所契合的)(译注:期望进球数是一个数字,指根据相关数学模型应该打进的进球情况,其实该模型一般情况会模拟一场比赛乃至一个赛季的进球数情况,但在该图示中的说明针对的是每脚射门的进球可能性,越是可能进球,颜色就越深)。

还有一些想法:

1.要不要添加射门球员的号码?

2.要不要添加对于被封堵射门的统计?

泰德:

(我认为我们)需要考虑的事情:

对创造射门机会的动作增加图形说明:

1)直传球(用箭头表示?)

2)成功过人(用三角形表示?)

3)传中球(用缩小1/3的任何图形表示?)

将不同的概率分配给不同的颜色

1.00-0.8:红色

0.79-0.7:橘红色

0.69-0.6:橙色

0.59-0.5:橘黄色

0.49-0.4:黄色

0.39-0.3:黄绿色

0.29-0.2:绿色

0.19-0.1:连续的蓝色(根据你发来的图谱)

0.09-0.0:连续的紫色

就像你说的,我们在低概率区的统计还有很多事情要做,这也是我们在之后需要多加注意的地方。增加了两种连续的颜色(即蓝色和紫色)会对此有些帮助,不过关于颜色分配方面还有很大的讨论空间。

我认为绿色的边框表示进球更好一些,它看起来更醒目。射正的射门用黑色边框表示的话效果会不错。

我认为被封堵的射门应该用灰色表示,就像这些射门的存在被抹去了一样,因为他们并没有一个真实的期望进球数值,并且它的对应值绝不是100%。

从长期开发的角度讲,我们可以做出一个交互式的程序,将鼠标指针移至具体的每一次射门可以显示更多的相关信息。

你认为将球员号码加入到图形中是会更加直观还是只会增加干扰?

马雷克:

嘿,

我在下面贴出了几个新做出来的版本。

1.我们自己的版本

2.戈尔兹伯里版本

3.Brewer版本

我们自己的版本=我按照上一封电子邮件中的方式修改的,戈尔兹伯里版本=直接使用他图示中的概率图谱,Brewer的版本=来自colorbrewer2.org的图谱

直立向上的三角形=来自于直传球助攻的射门,向左/向右的三角形=来自于传中球助攻的射门,星形=在过人后的射门,内部有点状装饰的=头球射门

灰色填充的=被封堵的射门

边框的部分仍然问题需要解决,用黑白配色并不能很好地表现出来射门的分布。我之后可以对此做出更好的配色处理。

总的来说,我认为我们在处理这些图示的信息内容方面似乎遇到了瓶颈。我已经不再迷信于点状配色了,同时我也不太喜欢用过多的图形来定义各种射门的情况了。

对于配色,我认为用不同的配色来标注期望进球的分布情况是正确的。我们应该将颜色划分成10个同等规格的等级,并且将这些配色串联成一个连续的图谱。在我看来戈尔兹伯里就是这样做的。不利的因素在于配色的规格等级边界很难制定好,不过我并不确定我们要重新制定这个边界(译注:即保持原来10个百分点一个等级的方式)。

泰德:

酷!太棒了!尽管有如此多需要处理的,但真的不错。现在我们可以筛选一下我们此前做的效果比较好和比较差的部分。

我个人认为梯度配色+我们自己的版本是最棒的。梯度配色+Brewer版本大概能排在第二位的,它与最佳方案的差距并不大。

我也讨厌点状配色,它们的呈现的效果根本就不鲜明。

应该去掉对于传球方向的标示。尽管这的确是个很好的想法,但是它承载了过多的关于助攻方面的信息。

我们不妨将头球用圆形表示,用六边形(或者矩形)来表示常规的射门。

星形以及代表直传球的正三角形所呈现的效果非常好。

黑色和绿色的边框标注效果也不错。

或许我们应该去掉所有常规射门的边框标注?

很显然我们的图示说明应该做得更清楚一些,不过我认为它很快就能达到标准。

马雷克:

或许我们正在让我们的射门分布图一点点地变好吧。我非常喜欢这个方案。

在这方案中采用了http://t.cn/RwzNdYq中的这个jet部分的配色图谱的右半部分。如今我可以利用这个配色图谱来做更多的尝试。

在我看来,关于进球的边框注释要比常规的图形注释要更鲜明(举例来说,三角形与星形就稍稍有些容易混淆),而这是我所尝试过的最好的一个方案了。我认为六边形的效果要比我们原有的方案效果更好:黑色与白色对于头球和普通射门的差异可能不会显得特别直观,但在读图时它也能立刻为读者呈现出其所承载的信息。

泰德:

这个方案很不错。(不过)我们需要做出一个更为鲜明和富有细节的图示说明来解释我们的射门分布图,过几天我会将它(更为完整的版本)贴出来。

在此时,泰德(译注:其实就是原文作者自己啊……)已经意识到他并不能对自己目前的方案再做出任何有益的改进,而目前的配色方案看起来也有些糟糕。因此他咨询了专业的设计师朋友(推特上的@bootifulgame)。

设计师反馈的意见让泰德感觉自己被智商压制了,他甚至开始怀疑起自己的人生,因为他穷尽此生也无法让自己的图示做得如此漂亮。

(译注:上图只是一个模板而已,原图称其为2014年1月31日阿森纳3-1战胜莱斯特城的英超联赛,但实际上根本不存在这场比赛,当时的莱斯特城更是还未升上英超。为避免误会,故小编处理原图时隐去了模板中的部分错误信息,该图的目的也主要是展示模板)

这一切都表明了一个棒极了的专业设计师加入其中会令你的研究发生些什么,这并不是单纯做数据分析的人所能做到的。在他的帮助下,我们的最终版本看起来真是太棒了。

下面是马雷克做的对于单场比赛的射门分布图的测试版本。

对于单个球员的赛季表现,其射门分布图是这样的:

而对于一支球队的赛季表现,其射门/被射门分布图是这样的:

【(同此前相比)这个版本的射门分布图做出了什么改变?】

实际上它还有进一步调整的空间。

1.马雷克去掉了代表成功过人的星形图案,将这一项归类至由六边形图案所表示。而其他的图案都显得很直接。

2.在图示中最深的颜色被改为表示0.05或是更低的概率。

3.还有很多其他的信息可以添加到图示说明中,大家都可以在此基础上做出其他的图示,比如说运动战方面的射门分布图。

4.对于各支球队来说,在这个方案下的整个赛季的射门分布图还是显得有些复杂。不过似乎也没有什么更好的办法了。我们也有两种不同风格的其他方案来试图简化射门分布图,但它们都存在有一定问题。

【结语】

这就是MK(即马雷克-科维亚特科夫斯基的英文名缩写)射门分布图以及它的产生过程。与具体的期望进球数据相结合,球迷们可以得到一个更为完整的比赛分析,至少对于射门方面会有一个更好的认识。在此后的文章中我们也将会利用这一射门分布图并通过具体实例来分析球队的情况。


也许您还喜欢:世界杯直播  亚洲杯直播  欧洲杯直播  足球直播吧

返回体育新闻首页>>

上一篇:  舒梅切尔:狐狸现在还不能松懈


下一篇:  绿城迎战鲁能海报:橙就


百度搜索:Geek讲足球:一张图就能让你看出球队进攻好坏

360搜索:Geek讲足球:一张图就能让你看出球队进攻好坏

搜狗搜索:Geek讲足球:一张图就能让你看出球队进攻好坏