足球数据统计的发展历程:从人工记录到人工智能的变革

2024-07-12 16:27:44

这些数据是如何计算出来的?是人工计算的还是人工智能计算的?在回答这个问题之前,我们先来看看早期足球比赛的统计数据。

足球统计历史

现代足球起源于19世纪末的英国,随后迅速发展并席卷全球。当时主要的传播媒介是报纸。足球比赛结束后,报纸将比赛的比分、照片和各种数据连同简单的评论传播到世界各地。可想而知,当时的足球数据还仅限于“场上数据”的统计。简单的比分、扑救、定位球数、红黄牌数等,都被各大报纸的工作人员记录在小本子里。比赛结束后,大家对比发现,差不多了,就把稿件寄给笔者,这才是最初的数据统计。这种现在看来缺乏时效性和参与度的方式,在当时却在全世界播下了足球文明的种子。

中超足球球员详细数据_中超足球详细球员数据图_中超联赛球员数据

图:早期英国体育报纸的足球报道

球迷们显然对纸质媒体的时效性非常不满,于是1927年1月27日,英国广播公司首次转播了阿森纳对阵谢菲尔德的比赛。BBC为这场比赛安排了两位评论员,一位负责评论场上的情况,另一位则指出足球在下图所示网格中的位置。两人合力将最准确的比赛信息传达给观众。这种转播方式现在看来非常考验想象力和反应能力。由此可以想象,早期球迷的足球素养水平是相当高的。

中超联赛球员数据_中超足球详细球员数据图_中超足球球员详细数据

图:英国广播评论分区图,球场被分为8个区域

1939年,电视屏幕上播放了阿森纳一线队和预备队比赛的视频,虽然很遗憾无法录制比赛,但这是球迷第一次通过电视观看比赛,观众可以自主收集和查看数据,这对转播公司实时数据统计提出了更高的要求,必须更加准确和及时。这一时期的足球统计仍然依赖于手工作业。

此时计算机技术逐渐发展,计算机成为专业的统计辅助工具。专业统计员把场上的每一个动作都变成一个事件,把每分钟30次以上的各种高密度动作转换成事件并存储起来,再通过程序进行人工验证和实时发布。这种方式对人工的要求极高,因此准确率也很高。常被第三方数据服务商采用,为转播商、评论员、博彩公司等提供服务。

然而,这些新兴黑科技真的改变了行业吗?

谁负责统计?

要回答这个问题,首先要明白足球比赛的实时数据是谁在采集。作为电视观众中超足球球员详细数据,比赛过程中获取信息的渠道有两个:眼睛捕捉到的图像和耳朵听到的解说。转播图像给球迷带来最原始的视觉冲击,而解说则帮助球迷更深入地了解比赛。球迷经常听到这样的话:“本场比赛***队射门15次,其中只有3次命中目标。”解说员是不是要在比赛过程中一边解说一边把数据记录在小本子上,然后对数据进行加减运算,计算出控球率呢?

如果真是这样,那些德才兼备的老评论员们早就疲惫不堪了。

一般来说,一些大型足球联赛,比如欧洲五大联赛,都是由专业的信号制作公司进行转播,他们在球场设置6台、8台甚至更多的摄像机,从赛前的采访到进球后的每一个眼神,尽力捕捉球员的每一个动作,然后在布满电线的大型制作现场,通过卫星把比赛信号传送到世界各地。比赛时的实时数据,是由专门的数据公司提供的,转播公司向数据公司购买服务,数据公司采用专业的数据采集方式,采集实时数据,一部分数据在直播中展示,一部分更深入细致的数据,在赛后进行整理、分析、展示。简单来说,我们在CCTV5看到的中超转播信号的制作,其实是一家叫体奥动力的公司提供的,我们看到的实时数据,则是其名下的英动力大数据公司提供的。

国外从事数据业务的公司很多,而且很多公司的技术非常成熟,竞争也相当激烈。这些公司中不乏巨头,比如英国的OPTA,法国的Sport等等。不同公司的数据收集体系也有所不同。下面以OPTA为例进行分析。

OPTA 是一家英国体育直播数据公司,是全球领先的数据提供商。该公司目前是英超、德甲、荷甲等多个主要赛事的官方数据合作伙伴,也为包括中超在内的各大联赛提供数据服务,如下图所示。除了为俱乐部提供服务外,OPTA 还与 Canal+、Sky 、ESPN 等电视台合作,提供赛前、赛中、赛后的数据分析服务。

中超联赛球员数据_中超足球详细球员数据图_中超足球球员详细数据

图:OPTA活动合作伙伴(来源:OPTA官网)

比赛过程中,OPTA会对场上200多项技术统计数据进行统计分析,并实时更新,同时为客户提供XML数据接口,方便全球客户访问。OPTA拥有全球最全的体育历史数据库,从1996年开始收集各类比赛数据,逐渐形成了全球最大、最权威的比赛数据库。此外,OPTA会根据不同的需求提供不同的数据服务,其中就包括解说支持。球迷在比赛过程中必须熟知历史数据中超足球球员详细数据,解说员时刻清楚知道下一个进球会是球员职业生涯中的哪个进球,甚至是欧冠历史上的哪个进球等等。其实这很大程度上依赖于OPTA这样的数据服务商。总之,这家公司真的在做几乎所有和足球数据相关的业务。

中超足球球员详细数据_中超足球详细球员数据图_中超联赛球员数据

图:OPTA提供的服务类型(数据来源:OPTA官网)

数据是如何收集的?

赛场内的数据是如何采集的?人们普遍认为,顶级职业联赛运用了许多令人惊叹的高科技,只要架设一台机器,数据就会如流水般流淌而出。这种想法显然是不现实的。其实,无论哪家公司、采用什么样的高科技,核心都是要解决两个问题:球在哪里、球员在哪里;人对球做了什么、人与人之间做了什么。

人和球在哪里,有很多种解决方案,其中一种是安装多个高速摄像机,保证每个区域都有两个以上的摄像机覆盖。图像识别可以确定谁有球、球速有多快,但人想做什么,是射门还是传球,需要经验丰富的记录员来判断。优秀的记录员可以在很短的时间内判断球员的意图,然后用辅助记录软件选择球员和球员此刻对应的事件。这些事件包括传球、传中、拦截、射门、扑救、犯规等中超足球球员详细数据,这样一共可以记录下比赛中超过 2000 个事件。

中超联赛球员数据_中超足球详细球员数据图_中超足球球员详细数据

图:OPTA的数据专家正在实时采集数据(来源:OPTA官网)

OPTA 的实时统计系统是人工智能和人工智能相结合的成果。每个录制团队有三个人,其中两个人实时收集数据,一个人进行实时视频回放验证。有些人可能会质疑这种人工方法的准确性。事实上,不同公司提供的比赛数据确实不同,每家公司在数据收集背后都有独特的理念。

2018年1月13日的一场西甲常规赛,皇家马德里主场对阵黄色潜水艇比利亚雷亚尔。赛后数据统计显示:控球率为58% VS 42%,传球成功率为89% VS 85%。而国内足球数据公司创兵科技给出的控球率为54.9% VS 45.1%,传球成功率为84% VS 84%。即便是射门次数这样一个看似简单的统计指标,两家网站也分别给出了28 VS 10、27 VS 9的不同结果,说明两家公司的统计人员对射门事件的判断不同,而这正是足球比赛数据统计中的“人为失误”。

中超足球球员详细数据_中超联赛球员数据_中超足球详细球员数据图

图:皇马 VS 比利亚雷亚尔数据统计(来源:)

中超足球详细球员数据图_中超足球球员详细数据_中超联赛球员数据

图:创兵数据对皇马vs比利亚雷亚尔的比赛统计(来源:创兵数据)

人工智能+智能的数据采集方式可以说是各有不同,统计指标的计算方式也会影响到最终的统计结果。结合上面对采集方式的介绍,我们可以大致知道,射门、角球、任意球、点球、犯规的统计方式就一个字:数。对于这类事件,记录员对场上发生的事情有较长的时间反应,出错的可能性比较小。控球率也是一个很容易记录的指标。控球率=控球时间/两队总控球时间,控球时间是指球没有被对方触碰之前的时间。机器可以记录下此时哪个队拥有球权,以及控球了多长时间。只需要进行一些简单的人工修正,比如剔除死球时间(庆祝时间、角球、任意球时间),就可以得到控球率。同样,传球成功率=传球成功次数/全队总传球次数,其实就是没有被拦截的次数。 也有通过机器和人工进行采集,通过人工验证进行统计的。

其实,每家公司对于指标的统计方法都不一样,这也是我们看到结果不同的原因。也说明足球统计是一个值得统计人员深入研究的领域,而懂足球的人也是这个行业的核心生产力。

人工智能+智能的方式当然不等同于人工智能,但这肯定只是足球统计史上的一个时期。其实现在有很多可穿戴设备可以用于球员数据采集,可以监测球员的各项身体数据甚至脑电波。但由于竞技体育对球员的服装服饰要求严格,可穿戴设备并没有在赛场上得到广泛的应用,反而是一些俱乐部更多的是在训练中使用。希望在不久的将来,我们能看到梅西踢球时的脑电波,以及他带球突破时解说员喊道,“梅西拿到球,他本来要传给前场的阿尔巴,不,此刻他改变了主意,他本来要前场远射,应该是在球门左下角,此刻门将的脑电波显示他要扑向球门右侧,梅西这一脚射门的成功率大概在80%左右,果然,球进了!!!”

足球行业的数据分析

大数据正在悄然改变每一个行业,足球也不例外。说到足球数据的应用,首先想到的肯定是博彩。对于博彩公司来说,真实完整的历史数据报告可以为精算师计算初始赔率提供数据支持。实时比赛数据的持续及时输入,将帮助博彩公司及时调整实时赔率,获取更大利润。值得注意的是,虽然博彩公司的初始赔率是基于球队数据,但决定性因素其实是市场预期,这也是足球数据行业值得关注的领域。

2017年世俱杯半决赛,皇家马德里在阿布扎比客场对阵半岛电视台。这场比赛最吸引眼球的并不是两支球队的对决,而是阿里云团队运用人工智能技术对比赛的解说。AI不仅正确识别了球队和球员,还准确识别了球员的传球、射门等动作。

紧张的比赛过程中,解说员难免会犯错,但人工智能背后强大的数据有效避免了这个问题。一句看似简单的解说,其实是利用多通道神经网络卷积模型来定位球和球员,配合高效的追踪算法,实现对球员和球的实时追踪。同时,人工智能提前学习球衣号码,提取球员面部特征,再比对输入的球员信息,完成球员身份识别。此外,对球门、边界线等球场基本信息的识别,也能让机器对球场形成更全面的感知。可见,未来人工智能在足球领域的一大应用,或许就是呈现更多形式、更精准的赛事转播。

回归足球本身,如何帮助球队取胜、如何以最低的溢价签下最合适的球员,或许才是足球数据最有意义的应用。众所周知,每支球队都有自己的球队风格,比如巴萨的Tiki-Taka战术以传控为主,而宿敌皇马则强调以速度取胜。每种打法都有自己的特点,相得益彰。比如西甲中下游球队塞尔塔、英超中下游球队水晶宫,虽然联赛战绩不佳,但却是名副其实的强队收割机。这些隐藏在表面数据之下的特殊规律,都可以被足球大数据挖掘出来。

或许有人会说,强大的数据让足球失去了原有的魅力,甚至担心有一天人工智能机器人会打败人类足球,但其实,数据只会让大家更加理性地参与足球活动,甚至从中获益。足球永远是一项充满不确定性的运动,因为球是圆的。

假期结束了,是时候振作起来,专注于业绩了。由 Data 制作的这款零售店 Excel 模板每天只需要您填写 6 个数字,您就可以随时看到商店的关键指标和变化趋势,让您更轻松地跟踪、预测和分析!现在只需点击图片,您就可以看到您一直在寻找的商店管理工具。不要错过!

Theme Customizer

Theme Styles