在最近发布的Minitab版本中,Minitab 将相关图纳入可视化工具之列。我想来探索一下,这些图形工具在高级分析的过程中为何如此实用且广受欢迎。
简单来说,相关图(有时也称为相关矩阵)就是对相关统计量的可视化。相关图能够快速确定存在强相关性的变量,从而评估随机性及确定数据中的简单模式。与其他数据分析一样,观察和理解数据结构是预测分析过程中的第一步,这一步具有举足轻重的作用。此外,了解变量之间是否高度相关能够为后续步骤提供建议。
使用相关图快速确定相关
您可能会想:“我已经搭配使用相关和矩阵图来评估相关性与随机性。这次的功能有什么不一样呢?”若您只是处理几个变量且样本数量相对较小,当然可以选择搭配使用相关和矩阵图。
但是,我们来看一下接下来的示例。有一位为电动汽车设计燃料电池的工程师,他演示了为何在涉及的变量和样本增加时,相关图会成为一款强大的工具。
操作温度是影响燃料电池性能的其中一个参数,其他参数还包括压力、流速和湿度,而任何燃料电池设计都必须确定最优操作温度。 为了优化燃料电池设计以提升性能和效率,工程师需要理解电池中氢容量、氧容量以及为产生能量向燃料电池加注氢氧时的温度这三者之间的关系。
工程师计划使用针对所有前述测量结果的 14 个观测值,评估氢氧之间稍高或稍低温度化学反应是否会影响燃料电池的供电。
在 Minitab 中运行相关分析(与单击“统计 > 基本统计量 > 相关”一样简单)后,工程师可以利用相关表和矩阵图来观测本研究中变量之间的相关。
根据表格中的结果,氢含量与电量时间之间的 Pearson 相关系数为 -0.791,且 p 值为 0.001。p 值低于显著性水平 0.05,表明相关与零之间存在显著差异。相关性意味着随着氢含量的增加,产生的电量时间趋于减少。(回想一下,相关测量的是两个变量之间线性相关性的强度,且范围是介于 -1 [强负相关] 和 +1 [强正相关] 之间的数值。相关接近零表示两个变量之间没有强线性关联。)
矩阵图可显示单个关联,是实现此分析可视化的实用工具。在下方的示例中,请注意电量时间与氢含量的图位于左下角。
此外,矩阵图还是确定潜在异常值的实用工具。然而,矩阵图并不适用于快速确定最强或最弱相关。例如,看下上方的矩阵图,您需要多长时间才能判断出下列这些相关中,哪一个最接近 -1 或 +1?
想要快速回答这个问题,相关图的工具实用价值更高,向需要一目了然地浏览及理解这些信息的其他人呈现此类分析时更是如此。
考虑通过下方相关图(在 Minitab : Graph-Correlogram 中)呈现这些相同数据:
注意到了吗?您的眼睛可以迅速移到底部深红色方格(电量时间与氧图)的位置。在相关图中,色彩浓度与相关系数成比例,方格颜色越深表示相关越强。因此,相关图为相关提供了清晰、便于浏览的直观表示。在这个案例中,工程师只需运行相关图,就能轻松理解数据中的相关。
将相关图用于较大数据量
现在,我们考虑一个含 14 个变量及 1,000 行数据的分析。具体细节并不重要,它可以是消费品调查结果,也可以是电路板过程的测量结果。如果您让您的团队从以下矩阵图中直观地选出最强(接近 +1 或 -1)关联,那么他们需要多长时间才能确定最强相关?
现在我们来看下方相关图中呈现的相同数据。请注意看,图中已从视觉角度将弱相关最小化,而您的注意力都被高相关的区域所吸引。想象一下,团队确定重要信息的速度将会得到多么大的提升!
理解变量之间的关系(例如相关)十分关键,这决定了您能否执行强大的预测分析。分析变量相对较少的数据时,可以使用不同的方法轻松确定相关,但随着变量数及数据集大小的增加,理解相关所需要的工作量也会随之增加。通过熟练掌握相关图的强大功能,您可以更加快速、轻松、有效地利用 Minitab 进行统计分析,处理再复杂的问题也能游刃有余!
本文由 MinitabUsersGroup 投稿至 数据分析网 并经编辑发表,内容观点不代表本站立场,如转载请联系原作者,本文链接:https://www.afenxi.com/113917.html 。