品觉导读:
- 各个国家的教练也在利用运动员的分析数据和公开可用的数据来改善训练方案。就团体性运动而言,教练们会分析运动员的过往比赛数据、面对特定对手时的表现以及有关适应性的统计数据。就非团体性运动来说,预测性分析被用来预测特定运动员的对手、分析其优势和劣势并研究过往战术,更为重要的是,根据表现趋势来增强适应性。
- 里约奥运对大数据的运用主要体现在以下三个方面:
- -预测比赛结果和奖牌归属
- -更好地训练运动员
- -防止疾病传播
原文翻译:
里约奥运会的IT总预算为15亿美元,所有数据都储存在云端。2012年伦敦奥运会开创了大数据驱动体育赛事的先河,每秒产生60GB数据和3万条推文,而世界各地的体育迷们每天会创造15TB数据。但与今年的里约奥运相比,这些数字就是个笑话。
里约奥运对大数据的运用主要体现在以下三个方面:
1. 预测比赛结果和奖牌归属
2. 更好地训练运动员
3. 防止疾病传播
1. 预测奖牌榜排名
里约奥运还没有开始,大数据就被用来预测奖牌的归属情况。例如,全球娱乐数据提供商Gracenote利用其大数据和预测性分析能力,详细预测哪些国家将称霸奖牌榜、哪些运动员将脱颖而出,以及总奖牌榜的情况。Gracenote表示,该公司利用数千项赛事的数据和一个囊括奥运会百年历史的庞大数据库,创造了一个“虚拟奖牌榜。转播商、体育网站和移动服务提供商将利用其中的数据,为各自国家的观众提供个性化的预测结果。
2. 基于数据分析的运动员训练方式
不只是第三方提供商在利用大数据,各个国家的教练也在利用运动员的分析数据和公开可用的数据来改善训练方案。就团体性运动而言,教练们会分析运动员的过往比赛数据、面对特定对手时的表现以及有关适应性的统计数据。就非团体性运动来说,预测性分析被用来预测特定运动员的对手、分析其优势和劣势并研究过往战术,更为重要的是,根据表现趋势来增强适应性。简而言之,通过大数据分析,可以发现运动员的优势和运动能力。
3. 将寨卡病毒挡在里约奥运的大门之外
数千名巴西官员和数十家非营利组织参与了里约奥运的疾病预防工作。面对寨卡病毒、登革热和基孔肯雅病毒的潜在威胁,官员们利用社交数据来抵御这些病毒。IBM利用大数据,帮助巴西奥组委分析来自社交媒体的数据。该公司汇总并整理了大量网络数据,例如,在监测到涉及寨卡等病毒的社交媒体评论及对话时,他们会分析这些言论的出现频率和分布状况。
IBM也利用其云计算能力来分析有关寨卡病毒的葡萄牙语推文。另外,该公司还分析GPS数据,好找出埃及伊蚊(寨卡病毒主要传播媒介)的主要活动区域。所有这些数据会与天气、巴西各地机场位置等辅助数据保持同步。在机场,疑似寨卡病毒感染者会被隔离。其他的高风险区域则受到实时监控,以便及时发现疾病的爆发、标记高风险地区以及防止运动员和观众受到感染。
大数据分析结果是怎么算出来的?
想要更好地了解在这些场景中大数据是如何进行预测性分析的,我们需要考虑在预测比赛排名时所需处理的数据性质。让我们一步一步来说:
第一步:首先确定关键指标。100多年的可用数据可以划分为国别、赛事、成绩、运动员姓名、年龄、过往表现记录,等等。
第二步:确定指标后,把数据分成两个子数据集,即训练数据集和测试数据集。
第三步:使用训练数据集的数据建立模型。测试数据集包含所有的历史数据,比如具体的比赛成绩。
第四步:把测试数据集的数据输入模型并进行分析。这样一来,我们就能根据历史数据来预测结果。
然而,若是通过监控社交数据来预防疾病爆发,过程就要相对简单:
来自不同社交渠道的社交媒体互动数据(可能利用Spark Streaming)被实时输入Hadoop分布式文件系统(HDFS)。把所有不同数据转换成标准格式,然后结合起来分析,比如位置的坐标、数据的时间等等。按照详尽的关键词组检索相关数据,创建实时警报,以有效地控制疾病。
原文:RioOlympics 2016: Big Data powers the biggest sporting spectacle of the year!
来源:http://www.edureka.co/blog/big-data-powers-rio-olympics-2016/
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。