14日晚,2018俄罗斯世界杯在莫斯科卢日尼基体育场揭幕,四年一度的全球狂欢正式开始!虽然国足无缘世界杯,但我们作为体育强国的参与度完全不输其他国家。揭幕赛前,各类“懂球帝”就开始出现在各大网站报端和朋友圈,在这些人中,有一类人是让宠物或者孩子抓阄的野生预言家。有一类人是试图以数据为基,算法为梁来揭开世界杯奥秘的科班预言家。那么,今年究竟是野生预言家傲视百家延续一哥保罗的预测神话,还是科班预言家用数据说话技压群雄尽显科学的魅力,未来一个月,我们一起检验。
2018
科班预言家做了什么?
近日瑞士联合银行、日本野村证券、德国商业银行、丹麦银行以及投行高盛等机构纷纷发布了各自的2018年世界杯预测报告。报告可信度究竟有几分,那就见仁见智了,这里我们不预测结果,只做预测结果的搬运工。
- 瑞银认为德国夺冠概率最高,其次为巴西和西班牙。
- 高盛认为巴西夺冠概率最高,并且其次为法国、德国、葡萄牙
- 荷兰国际集团(ING)认为西班牙夺冠概率最高,其次为法国。值得一提的是,ING的预测方法主要是基于参赛球队的市场估值,这也就不奇怪西班牙成为夺冠大热。
- 野村(Nomura)给出了三个热门,分别是法国、巴西、西班牙;三匹黑马,分别是波兰、乌拉圭、丹麦;两个潜力股,分别是塞内加尔秘鲁。野村给出的是一个投资组合,他们的预测思想是以资产的方式看待团队,考虑到团队背后的动力和球队的价值分配,并且考察球队中所有球员的价值,假设每个球员都有可能像最好的球员一样踢得好,也有可能像最差的球员一样糟糕。
- 德商银行认为德国夺冠概率最高,其次是巴西、西班牙、阿根廷。
- 丹麦丹斯克银行认为巴西夺冠概率最高,其次是阿根廷和德国。
仔细看看这些机构的预测,夺冠呼声最高的四支队伍分别是德国、巴西、西班牙、阿根廷。但是,在第一轮小组赛中,这四支球队无!一!取!胜!(捂脸),其中卫冕冠军德国队0:1输给了防反先锋墨西哥,梅西踢飞了点球阿根廷憾平冰岛大巴,西班牙神勇发挥不敌C罗帽子戏法艰难守住平局,巴西即使库鸟穿云箭却也最终被瑞士逼平。
这下不止勒夫慌了、梅西慌了、内马尔慌了,科班预言家们更慌。
好了好了,预测冠军手牵手,谁进四强谁是狗。
其实科班预言家们的预测逻辑大多是从数据科学的角度出发来建立指标和模型,但是足球本身是一个“业务”很复杂、专业性很强的“行业”,所以懂“业务”的人,更能选到适合的指标来建立模型。前面提到的机构大多来自金融业,是一群善于摆弄计量经济模型的大佬,但在足球领域,其实算是个“外行人”,我们很难说哪家做的更好,但最具经验的,一定是高盛。
高盛算是个预测界的网红,从1998年的法国世界杯开始,高盛在世界杯之前都要发布一份关于世界杯经济学的投行报告,该报告会详细分析参赛各国的经济基本面的状况,并将其延伸到竞技基本面,对赛事做出预测。但是,2014年高盛预测巴西将会强势夺冠,而最终被德国7:1狠狠打脸,网红险些过气。今年,高盛携人工智能卷土重来,继续提前剧透——巴西队将夺得2018年世界杯冠军,然而纵使库鸟穿云箭,巴西首站也只是艰难战平瑞士,不知道高盛现在是否瑟瑟发抖?
在经历过多年完善和修正之后,高盛本次的预测以之前历年世界杯、欧洲杯和世界杯资格赛的数据为基准,使用机器学习运行了20万个模型(我读书少不要骗我)。运用了Random Forest,Bayesian ridge regression,Lasso regression,and a gradient boosted machine等算法,从多个方面分别挖掘球员和球队的数据,随后模拟了100万场比赛,以计算每支球队晋级的概率。指标的选取上,高盛主要用了5个指标来预测胜负,相关性从高到低分别是:球队评级(Elo等级)、球员评级、球队近期表现、对手近期表现、球队近期进球势头。如果大家有兴趣自己做世界杯预测,那么这些指标还是值得参考的,下面仅作简单介绍。
球员表现
从天道酬勤力挽狂澜的C罗,到宝刀未老攻城掠地的莫德里奇,明星球员的发挥在一定程度上能够左右比赛的走向。然而,即使明星球员能够在重要时刻力挽狂澜,但是球队某个位置有明显短板的球员可能会成为球队兵败滑铁卢的罪魁祸首,因此将整支球队的所有球员纳入评价体系的球员评级是客观预测比赛胜负的重要指标。从图中我们可以看到,拥有世界顶级青训体系的西班牙力压上届世界杯冠军德国占据头名,拥有巴萨皇马两支铁军的西班牙国家队,随随便便就凑了个全明星阵容。而孔帕尼、阿扎尔、德布劳内领衔的比利时青年军紧随其后,相反,没落的贵族英格兰和欧洲新贵葡萄牙遗憾垫底。
球队评级
与球员评级不同,Elo球队评级从整体上衡量了球队的实力,有些球队虽然拥有众多天赋球员,但是由于球队磨合程度、战术配合等因素无法碰撞出良好的化学反应。从Elo球队评级上来看,世预赛全胜晋级决赛圈的南美洲老大巴西和传统豪强德国依旧排名前二,在球员评级中位列第三的比利时国家队滑落到第十位,也印证了赛前关于比利时国家队内讧的传闻。
近期表现
近期表现包括球队近期表现、对手近期表现、球队近期进球势头。在2018世界杯揭幕战俄罗斯对阵沙特阿拉伯的比赛中,解说一再强调赛前的热身赛中俄罗斯7场不胜的近期战绩,并强调不胜战绩对球队带来的负面影响,赛前也有多家机构发布沙特赢球的预测结果,但最终俄罗斯却以一场5:0的大胜揭开世界杯的帷幕,并在第二轮小组赛中以3:1击败埃及队。所以,实际上任何指标都不能完全决定一场比赛,很多时候,科学会输给足球,这就是足球的魅力,也是天台上站满人的原因。
除了高盛之外,多特蒙德工业大学的Andreas Groll教授团队也给出了自己的预测,在团队发表的Prediction of the FIFA World Cup 2018 ——A random forest approach with an emphasis on estimated team ability parameters一文中,他们认为德国和巴西将会会师总决赛,而德国队会笑到最后。
总的来说科班预言家们的做法还是很讲道理的,只是世界杯似乎是道超纲题。不过历年的世界杯冠军夺冠之路都是磕磕绊绊,虽然夺冠热门第一仗都栽了跟头,但每支球队也做出了相应的调整,西班牙在第二轮小组赛中1:0战胜了伊朗队,两战拿下四分,出线在望。其他队伍也是一样,道阻且长,我们拭目以待(zuo deng da lian)。
如果说用数据科学预测世界杯让我们开始相信科学的话,那么接下来要介绍的这些人Or动物不禁让我们怀疑起了来自宇宙的神秘力量。
2018
野生预言家
玄学榜No.1 瘆人的毒奶
首先就是球王贝利,巴西神锋球场上所向披靡,在预测界也是声名显(lang)赫(ji),从1990年世界杯开始,每届世界杯球王贝利都会做出预测,但被他看好的球队无一例外地都被提前淘汰掉了,2010年甚至一口毒奶将自己的主队巴西队拒之半决赛门外,巴西队、阿根廷、西班牙等队纷纷表示不约不约。除了足球领域,球王还将自己的神秘力量延伸到了排球界,在2016年的里约奥运会的排球比赛中,贝利表示自己看好塞维利亚队,结果中国女排暌违12年再度夺冠。然后就是国产毒奶天后“乌贼刘”刘语熙,2014年巴西世界杯比赛期间,刘语熙只要穿上哪个球队的队服,这个球队就一定会输掉比赛。而且不止足球比赛,NBA赛季时,只要刘语熙身穿某个篮球队的队服,该球队也会毫无悬念的输掉比赛,“乌贼刘”的功力可见一般!
- 赛前
- 赛后
玄学榜No.2 动物也疯狂
世界上很多事情就是如此没道理,章鱼保罗在2008欧洲杯和2010世界杯两届大赛中,预测14次,成功13次,预测准确率高达92.85%。然而保罗已经去世,今年自然也有一众动物想要继承保罗哥的衣钵。比如喵星人阿喀琉斯,这只出生于冬宫博物馆的皇家警卫猫后代在去年的联合会杯中命中率高达75%,然而出师不利,在14号晚间进行的揭幕战中,阿喀琉斯把宝压在了远道而来的沙特队上,结果惨遭5比0血洗。又比如小黑猪马库斯,据说曾经成功预测了2014年世界杯冠军以及特朗普当选美国大选,今年预测世界杯四强为比利时、阿根廷、尼日利亚和乌拉圭,然而尼日利亚和阿根廷在第一轮小组赛分别取得了负、平的战绩,从小组战绩来看,两支球队同时出线的可能性已经为0。
保罗为什么有如此之高的预测成功率呢,有传言说因为章鱼是无脊椎动物中智商最高的,而章鱼喜欢吃的食物恰好有黑、红、黄三种颜色,正好是德国国旗的颜色,所以自然会得到章鱼保罗的青睐。同样的道理,阿根廷国旗没有任何吸引章鱼的颜色,所以章鱼保罗自然会选择德国队。所以我们可以认为,动物预测有可能是某种神秘的自然力量,但大多只是人的意愿的一种体现,大家还是别忙着培养自家的狗狗去咬国旗了。
世界杯第一轮小组赛刚刚结束,冷门频频爆出,仅仅十天的赛程天台上就已经站满了人,这也印证了那句话,足球是圆的,赛场上一切都有可能。其实,每个球迷心中都有一个指标体系,复杂程度甚至超过科学家们设置的指标体系,有对人的情感,有对足球的情感,甚至对国家的情感,并且随着时间变化,经过大脑加工,形成一个复杂的模型,最终输出一个能说服自己的预测。这也就是再强大的预测模型,也难免会在世界杯翻船的原因,因为有太多科学家们有待发现的指标隐藏在赛场上的每一个细节。每个人都是预言家,每个人都应该好好享受足球,你预测哪支队伍能捧起大力神杯,评论区留下你的预测结果,预测成功狗熊会有惊喜哦。
本文由 狗熊会 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/56963.html 。