`

数据统计杂谈-足球的数据是如何产生的

2017/10/15 1:17:20 www.zb8.com.cn 互联网

数据统计杂谈

一.数据统计到底有没有用?

我的答案是,看你的数据样本有多大,如果数据样本太小的话,数据几乎没有意义,没有用;而数据样本足够大,就很能说明问题。我先来讲个案例:某国际知名服装品牌,为其专卖店的每件衣服上都安放了一个计数器,只要这件衣服被顾客拿进了试衣间试穿一次,计数器便计一次。经过一段试验之后,该公司后台发现有一款外套被试穿的次数最多,但销量却十分惨淡,可正常来讲,试穿次数与销量应该成正比。后来该公司便根据此项数据,改进了此款外套的严重设计漏洞。

而足球领域,我认为数据统计将会有同样重要的意义。在我的中超数据统计当中,我记录了“被过次数”这样一项数据,我查了opta、whoscore、创冰、搜达等数据公司的数据,都没有发现有关这项数据的统计。我通过中超几十场的统计,我发现~至少在我统计的这些场次当中~“被过次数”最多的球员居然是郑智,我分析有以下几个原因。一是与郑智对位的都是中超各家俱乐部技术最好的球员,郑智出场次数多,自然被过的次数也多。二是郑智的跑动肯定是最积极的,哪里有危险哪里有漏洞就积极的去补位,经常踢球的朋友可能也有体会,全力跑去补防的时候是最容易被过的。三是随着年龄的增大,郑智的转身、反应肯定变慢,更容易被过,我想假如有郑智年轻时候的防守数据,就更能说明问题。

二.数据统计有没有可能由电脑来完成?

我的答案是,以目前人类的技术水平,不能。因为人脑和电脑完全是两种运算模式,在人工智能开发的领域,我觉得我们人类还有很长很长的路要走。想象一下这两个问题:

1.如果把2开平方,精确到的小数后13位是多少?

我想正常的人脑没有人能算出来,而一般的计算机可能一秒钟就能算出来。

2.范冰冰和凤姐谁好看?

现在的电脑上有人脸识别系统,我们每天上下班都要刷脸。可是你让这个系统,分别出谁更好看,几乎不可能。而一般人类5岁的小孩也可以毫不犹豫的指出是冰冰。(如果有人觉得凤姐更好看,那可以直接忽略我这篇文章了)。


所以说人脑和电脑完全不是一类计算模式。再看其他体育运动项目,也没有用电脑来识别打分的,比如体操、跳水、拳击记点等,还是由几个专家打分取平均值。这届奥运会我们就受到了所谓的打分不公平的待遇,现在科技这么发达为什么不用电脑来打分呢?我认为还是科技水平不够,还没有发明出来这样的电脑,来判断每个动作的完成质量。因此我可以推断,在足球数据统计当中,除了跑动距离,热点区域可以用电脑来计算,其他的技术动作,射门、传球、停球、犯规等,只能靠人脑来记录,而不能用电脑来识别。

下面就来具体讲讲如何高效准确的来记录足球场上的数据。回想一下我这中间走过的过程,确实很艰辛,一开始做的时候是用笔和纸来记的,非常痛苦,一场比赛要看六七个小时,都快看吐了才能把数据记录的比较全。图


记录比赛数据是第一步,更痛苦的是第二步,要把所有人的数据进行汇总,也就是把纸上的东西转换到电脑里,这个过程也需要好几个小时。平时白天需要上班,大多数时间都得晚上回家做,最开始的一场比赛我记得是记辽宁宏运对河北华夏的一场比赛,我虽然只记辽宁的数据,但是从记录到汇总也用了一个星期。

从这之后我就想,我们平时看到得数据统计,一定是好几个人一起记的,一个人无论如何也不能完成。我自己也有一个业余联赛的球队,我也想分析一下我自己队员的表现,可是如果这个工作需要占用大量的时间就没有意义了。不能说这场比赛踢完了,一个礼拜之后或者半个月之后才出数据,那就没有队员看了,所以必须提高记录效率。

据说一场比赛opta要三个人用特殊的软件来记录。但可是我没有这样的软件,更没有另外两个人来一起帮我。我就想到了可不可以用电脑上的其他软件来记录。我想到的是用word或者excel,把场上发生的一切通过办公软件,都转换成一种足球语言,最后再一汇总,我想会节省很多时间。有了这个想法之女,经过试验,我选择了excel。

下面要讲的就是怎样利用excel。其实足球数据统计,类似于翻译,要把图像翻译成足球语言。而足球语言简单来说就是“队员+动作”,比如“鲁尼射门”、“梅西过人”等,数百个这种简单的短语的组成就是一场完整的比赛。首先看“队员”,也就是“鲁尼”应该用什么表示。我要打字“鲁尼”,这样太慢了,不利于提速,所以必须转换成他的号码“10”来表示鲁尼。可是如果曼联对巴萨的话,梅西也是10号,怎么办?我的方法是主队用“10表示”,客队用“010”表示,其他号码有重叠的也是在客队前面加个“0”,这样就能较方便且清楚的表明“队员”了。伊布是“9”,苏牙是“09”,以此类推。

接下来是最难的,就是“动作”用什么来表示。还是那个问题,如果“射门”用打字的话,还是太慢了,能否用字母来表示?我不得不感谢我当年玩fifa的经历,游戏当中不就是用某个键位来控制球员的某项动作么。所以我又重新设计了一下动作键位的分布对应,且充分考虑了某项动作的发生频率,高频率的动作要对应我手指头比较灵活的键位。比如传球对应的一定是"f"键,因为大多数人的食指最灵活,而传球是球场上发生频率最高的动作,占了70-80%。其他的动作比如,头球w、盘带s、射门a等等。这样“动作”也表示出来了,一场比赛发生的一切,我都可以翻译成电脑语言,就是图


接下来的工作就是怎么样把这些需要语言汇总成统计表,变成我们想要的样子。接下来就是excel编程方面的工作。总之我设计出了这样的公式,可以在一分钟之内,把上图直接变成这样,不得不说excel功能真的非常强大,感谢微软!!


以上就是我的数据统计的方法,说起来简单,实际操作我想不经过训练,就没有人能做到。就像是说“航天工程的关键是把人送到月球上去,并安全的送回来”。说起来容易,但这中间却凝结了数千年人类智慧。同样数据统计工作,简单说就是记录足球语言,可是要想快速准确的记录,甚至可以跟着直播来记录,还必须具备以下几个条件,缺一不可:

1.左手可以盲打字母键盘。楼主本人曾经参加过gre考试,专门练习过盲打作文,这个没问题。

2.右手可以盲打数字键盘。楼主本人在银行干过,就是银行楼下专门给你取钱汇款的小柜员,所以右手盲打数字是我们的基本功。

3.球场上的大多数球员你必须认识,且从带球动作都可以看出是谁,并且牢记球员号码。这个条件楼主本人基本满足,一般豪门的都能认识,最怕碰见一般球队的球员,这个只能通过不断的回放来看。最痛苦的是看中超,碰见不熟悉的球队,外援还好说,国内球员真是毫无特点,得回放好几遍才能看出来是谁,是几号。

4.需要耐心和不断的练习,数据统计绝对是个苦活累活,最怕半途而废,一开始可以只记一场比赛其中一个球队的数据,同时记两个球队的数据对于新手不现实,很容易放弃。

5.要想跟住直播的信号来进行数据统计,记忆力一定要好,甚至我们的大脑要有回放功能。因为有时候球场上的节奏特别快,电光火石之间,有可能发生将近10个技术统计,两只手得记录跟不上,这就需要在节奏慢下来的时候,用大脑把刚刚发生的事件再重新回放一遍,再记下来。

6.必须对足球的理解非常深刻。因为我现在的技术统计已经不简单的记录“队员+动作”,而是“谁+动作+效果”(请参考往期文章),所以需要记录者能够瞬间反应出这个动作到底完成的怎么样,属于一般还是高质量,还是失误。就像高水平的运动员退役去干体操裁判的工作一样,瞬间就能判断出这个队员某项技术动作到底应该打多少分,足球比赛就想一场90分钟的体操比赛,你需要给20多个队员的所有动作,进行打分。

说了这么多,就是想说数据统计不简单,要想既准又快的记录,绝对是对人的大脑的全方位的考验。经过几个月的练习训练,现在本人已经能够达到与直播同步记录数据的水平。但是就算我自己的水平再高,也没时间去完整的采集某个联赛所有比赛的数据,需要有兴趣的朋友和我一起来做,如果数据足够大的话,绝对会发现不一样的世界!

作者:soccercode


也许您还喜欢:世界杯直播  亚洲杯直播  欧洲杯直播  足球直播吧

返回体育新闻首页>>

上一篇:  延边战亚泰海报:吉林德比,又一个主场


下一篇:  恩里克:罗贝托要准备踢中卫了


百度搜索:数据统计杂谈-足球的数据是如何产生的

360搜索:数据统计杂谈-足球的数据是如何产生的

搜狗搜索:数据统计杂谈-足球的数据是如何产生的