【也算技术贴吧】对0809赛季英超BIG4比赛的补时研究
利物浦吧
全部回复
仅看楼主
level 6
李家小三 楼主
这帖子的基本内容都是来自俺的毕业论文,语言上为简练一些进行重新叙述。这论文技术难度不是很大,但是统计类的基础活也着实把人累够呛。主要研究的问题是裁判的偏向性,利用的数据是2008-2009赛季曼联、利物浦、切尔西、阿森纳参加的139场比赛(本来应该140场,但38轮桑德兰对切尔西的比赛全场视频录像找不到,只好作罢)。
比较容易想到的裁判的两个偏向性是偏向主场球队和偏向强队。俺本来打算弄0809全赛季所有球队的所有比赛的。一般网站技术统计找不到补时的数据,只有必须去翻全场录像。但是除了big4的录像比较完整,其他队的比赛残缺严重。我也无奈(我毕业论文截止日期前1个半月我开始着手弄= =,换题压力太大,大家要谨慎)中只好调整角度,对big4这个整体和其内部进行考察,所以主要的考察对象就是裁判是否对强队进行偏向。反复提到了补时数据,这个东西是作为考察裁判偏向的一个指标。像红
黄牌
、点球啥的,好多东西争议太大,你不好说是不是裁判角度问题还是啥的,说不清楚。补时嘛,就是一个数放在那,清楚明显。还一个,之前有人用补时研究过其他联赛,这也算是有例可循。
当然了,作为一个利物浦球迷,不喜欢哪个队大伙也都心知肚明,也没什么好瞒着的,如果能顺带找到一些证据性的发现,也算解解心头之不爽。
废话结束。开始上图上数据。完了我会知会大家一声,之前先别插楼,写了哈~
2010年05月21日 07点05分 1
level 6
李家小三 楼主
结论一:不考虑球队的差别,平均而言,90分钟内比分相差一球之内相对于比分悬殊的情况下,裁判给予更多的补时时间。但主队落后一球与打平或领先一球的情形下,补时时间不存在显著性差异。
这个图是选的这139场比赛(70个主场,69个客场)按照90分钟正常比赛时间内主客场进球差分类的。图中横轴表示的是90分钟正常比赛时间结束主队与客队的进球差,大于0意味着主队领先,等于0为平局,小于0则表示主队落后。下方的柱形表示的是公示的补时时间,整个柱形长度表示的是实际补时时间。从图中可以看到,当比赛处于激烈的焦灼状态时(图中横轴为-1至1的区域),裁判都倾向于更长的伤停补时时间。而且明显可以看到,比分相近时,实际补时与公示补时之间的差距要更大,这意味着相较于胜负明显的比赛,比分相近的比赛实际中裁判又额外酌情增加了更多的补时时间。统计学上的检验表明。当比分差距在2球或以上时,无论是公示的或是实际的补时时间显著的短于比分差在1球之内的情形,与主队或客队领先无关。当比分差距在1球之内时,补时时间在主队落后的情况下(225.7秒)稍稍略长于主队领先时的情形(218.2秒),但并不存在显著性差异。结论一是从比赛主场球队的角度出发进行统计分析,并不针对某一支或某一些特定的球队的胜负。下面,将分析主体固定为BIG4对上述数据重新进行分析,得到结论二。
2010年05月21日 07点05分 3
level 6
李家小三 楼主
结论二:对于BIG4而言,无论是主场或是客场,它们90分钟内落后两球之内的比赛相对于它们打平或领先的比赛获得了显著的更多的补时时间,即存在BIG4优势。
这个图是按照139场比赛90分钟内BIG4和其他球队的进球差上图中的横轴表示的是90分钟内BIG4与其他球队之间的进球差,大于0表示BIG4领先,等于0表示打平,小于0表示BIG4落后 。当BIG4落后两球之内时,补时时间均显著长于落后三球或以上、打平或领先的情况 。在这里,值得注意的有两点。一个是BIG4在90分钟内落后一球与领先一球的比较。当BIG4落后一球时,平均公示的补时时间为4.33分(261.8秒)显著高于领先一球的平均补时3.66分(219.5秒),多出了约40秒的时间,此乃BIG4优势之一。另一点是,当比分差距在两球时的不对称性。BIG4球队在落后对手两球的情况下平均补时时间显著长于对手落后BIG4两球时的情形(p=0.05),甚至显著长于BIG4领先一球的情况(p=0.1)。此乃BIG4优势之二。这意味着在BIG4落后的情况下,裁判相对的给予BIG4更多的补时时间缩小比分差距、扳平或是取胜的机会,而在BIG4领先的情况下,裁判并没有给予其他球队同样的待遇。
2010年05月21日 07点05分 4
level 6
李家小三 楼主
结论三:裁判对BIG4不存在显著的主场偏向。
尽管结论一的统计分析显示主队落后一球与领先一球的情况下不存在显著差异,貌似并不支持主场优势的存在,但其实并不能作为论断主场优势是否存在的有效依据。这是由于本文的数据选择并不涵盖所有球队之间的比赛,有许多球队之间的比赛不在本文的数据范围内。换句话说,从图论角度上而言,并不是一个完全图,从而来有效说明英超比赛的整体情况。但另一方面,本文选取了BIG4球队参加的所有比赛,进而可以对裁判对BIG4是否存在主场偏向的实证性检验。
将数据按照BIG4作为主场或客场分类,类似结论二的统计,得到BIG4与其他球队的进球差和补时时间的关系,见下图。
2008-2009赛季中,BIG4输球的场次并不多,再进行主客和输球数量分类计算,样本则进一步减少。由于样本数量所限,比较在主场落后一球与在主场领先一球是否存在显著的差别的统计学意义已经不大。不妨换个角度来看这个问题。在BIG4与其他球队的进球差数量相同的情况下,无论是主场或是客场,平均补时时间差异很小。换句话说,裁判对于BIG4的偏向与主客场无关。

2010年05月21日 07点05分 5
level 6
李家小三 楼主
=,=刚才电脑突然关机。。。我先继续。。。
总之上头说的就一句话:BIG4确实受照顾,而且是纯照顾,不管你主场客场都照顾。
下面用了计量的东西,定量分析补时时间与90分钟内领先落后是不是有关系。补时这个东西,与红黄牌、换人数量都有关系,这些显而易见的因素不能不考虑。我先贴张表,然后再说这表到底咋看。

2010年05月21日 07点05分 15
level 6
李家小三 楼主
为毛贴的图这么不清楚,囧。。。
先声明一下,因为这里是把big4作为整体考虑的,所以先不把内战放进来,这样的话只有127场比赛。刚才看到在落后一球或两球到领先一球这之间补时明显比其他时间长。比分激烈的情况下,裁判的决定才有可能扭转大局,才有意义。所以就讨论比分激烈的情况。
上面这四个,第二个是最说明问题的。大家看见红黄牌数量和换人数量的数旁边的小星星了吧,这个表明数据的正负是有效的。就是说,红黄牌数量和换人数量对补时时间的影响显然是正的,大约一个牌增加0.14分钟,换一个人增加0.15分钟。上面状态的那个星星表示的是啥呢?是说排除红黄牌和换人的因素的干扰,BIG4在落后一球或两球的情况下比领先一球的时候,补时时间还是显然的要长,长0.52分钟。
第三栏是测量主场优势的。主场优势那个数旁边没有小星星,数据意义不大。最后一个是看上半场的情况,可以看到红黄牌和换人数量还是对补时时间有显著的正向影响,但是此时领先一球还是落后一两个对补时时间影响就不大了。这说明,裁判是多么的鸡贼。只有关系到最后结果的时候,人家才亮杀手锏。上半场的话,爱咋输咋输。反正下半场还有45分钟呢。
2010年05月21日 07点05分 19
level 6
李家小三 楼主
BIG4整体被护的问题探讨到此。下面来关键的了。看看BIG4内部的情况。作为一个搞科研的,我是利物浦球迷我能到处乱说么?显然是不能的。咱得一视同仁。但裁判是不是一视同仁的呢?请看下面结果。
现在,咱考虑BIG4每个队的比赛,这个时候就要算上内战了。为嘛呢?因为俺们不再是一个整体一致对外了,咱要互相掐了。这个时候,你是你,我是我。刚才的时候考虑的是落后一球或者两球和领先一球的情况,现在因为一下子总样本从127变成了38,再这么择,就没几个了,结果就很诡异了。所以咱就分胜和不胜两种情况考虑。这样也不妨碍俺们说明问题。再来张图。

2010年05月21日 08点05分 21
level 6
李家小三 楼主
这个图成这个样子我也算是无语了。。。细心的童鞋可能发现了,之前那个表状态一栏的数都是正的,现在咋都负的了呢。。这严格说,是我的一个失误,上头那表把一个0,1变量设反了。刚才那个表,1表示的是落后,所以落后的时候增加。这里头1表示的是领先,所以领先的时候要减。
仿照之前那个表的读法,我们发现曼联和切尔西的状态变量的数旁边带上了小星星,就是说在排除红黄牌和换人数量的影响之外,曼联和切尔西领先的时候比不领先的时候时间要显著的短,短多少就是状态变量的那个数,曼联短了0.78分钟,车子短了0.49分钟。利物浦和阿森纳不存在显著差别。
2010年05月21日 08点05分 23
level 6
李家小三 楼主
然后自己跟自己个比完了之后,再横向比较一下。注意一下,这里的横向比较说的是某个big4队和其他三支队伍的整体水平是否有差别。下面的表里头,比如标写利物浦的,表示的就是利物浦和曼车娜这三个队伍整体比是否有差别。表示这种差别的是team变量。
讨论三种情况:90分钟内不胜,落后或者领先一球。先看不胜或者落后的情况。
发现了吧,没有一个球队team变量有小星星。这说明当90分钟内不胜或者落后的情况下,没有一支球队和其他三只球队比在补时时间上有显著差异。
2010年05月21日 08点05分 25
level 6
李家小三 楼主
接下来是领先一球。为啥要单独拎出来这个情况呢。90分钟内领先一球,在补时时间内,如果自己进球,还是胜,那么意义不大,如果对手进了,到手的3分变1分了,就囧了。有人说为啥不拎出来平局呢。平局的时候,裁判有可能很纠结。一个是希望偏向的球队赢,这样会倾向延长补时时间,另一个是担心偏向的球队输,这样会更愿意减少补时时间,在两边都能说通的情况下,数据就很难说明问题了。
只有曼联球队的team变量旁边有个小星星。这说的是当领先一球的情况下,曼联的补时时间跟其他三个队比,显著要少,少大约半分钟。
2010年05月21日 08点05分 27
level 6
李家小三 楼主
裁判对BIG4球队偏向的原因,可能与BIG4之前连续4年占据积分榜前四的战绩有关。作为近几年联赛中最强的四支队伍,使得裁判潜意识认为BIG4赢是“正常”的,输是“反常”的。在四强中,又属曼联近几年的联赛成绩更为突出。自英超1992年成立以来,至2007-2008赛季一共16个赛季,曼联共10次获得英超联赛冠军,特别是在上两个赛季,06-07和07-08赛季曼联还实现了两连冠(最终08-09赛季,曼联再次获得英超联赛冠军,实现了三连冠)。这样突出的成绩或许是使得曼联在BIG4中又受到了额外照顾(即在领先一球的情况下,补时时间相对其他三队更短)的原因。对于裁判偏向BIG4的原因,仅仅是主观推断,有待证明。
这里所谈论的裁判偏向,不一定指的是主观刻意偏向,也有受环境、信息等因素的干扰潜意识的偏向行为。本文仅用来指出英超赛场中裁判偏向现象的存在,并不是对裁判进行指责。指出该问题的所在,是希望裁判能意识到自己存在偏向行为而更加注意规范自己的行为决策。
2010年05月21日 08点05分 28
level 6
李家小三 楼主
完。水平有限,有砖慢拍。想看论文原版的请看
https://tieba.baidu.com/f?kz=775659378
2010年05月21日 08点05分 29
level 12
[Love]
- -开始拆楼 对不住了 插楼的- -
2010年05月21日 08点05分 30
level 7
果然技术帖 LZ谦虚了 俺的数学退步严重
此帖要顶 [顶]
2010年05月21日 08点05分 31
level 13
[扯花]我的2L。。
2010年05月21日 08点05分 32
level 7
兰州学啥的?
2010年05月21日 08点05分 33
level 6
李家小三 楼主
图或者表没看懂的,尽管问哈~我是学经济的,这贴把前头的经济理论省了哈。
2010年05月21日 08点05分 34
level 7
兰州好强!膜拜下~
2010年05月21日 08点05分 35
level 6
李家小三 楼主
回复:32楼
哈,一直想问z3和梅花,你们是有啥抢沙发或翻页的工具么
2010年05月21日 09点05分 36
level 8
高中生表示鸭梨很大,看得有点晕……深深膜拜小3~~~统计学专业的??
2010年05月21日 09点05分 37
1 2 尾页