描述数据的“三个维度”

在社会生产和生活的各个领域,时时刻刻都在产生数据,这些数据类型不一,数量庞大。在各种偶然因素的影响下,这些数据看起来往往是杂乱无章、无迹可寻的。但是,如果有意识地对这些无序的数据进行整理和分类,并且从不同的维度进行描述,就可以从中发现影响数据变化的必然因素,这种因素就是不同领域的内在变化趋势。通过对这种趋势的研究,不仅可以了解事物的本质特征,更能掌握事物发展变化的规律,变被动为主动。

掌握数据的分类方法并对数据进行正确分类后,下一步就是对不同类型的数据集合进行描述,得到整体数据的特征描述指标。通过特征描述指标,纵使摆在面前的数据集合体量巨大,杂乱无章,分析者也能对数据整体有清晰的了解。这就好比面对敌军的千军万马,只要对敌军的指挥官有精准的了解,就能够大概知道对面的整支军队是什么战斗力。指挥官是一支军队的灵魂,特征描述指标也就是数据整体的灵魂。

数据分析的对象主要是结构化数据,这些数据可能是连续型数据,也可能是离散型数据;可能是定类和定序数据,也可能是定距和定比数据。虽然数据的类型有很多,但是所有的结构化数据都可以从三个维度进行描述,这三个维度就是数据的集中趋势描述,数据的离散程度描述和数据的分布形态描述。如图2-6所示,在每个数据描述维度,分别包含数量不定的几个数据特征描述指标,有的指标适用于所有的数据类型,有的指标只适用于一种数据类型。

描述数据的“三个维度”

接下来会对数据描述的三个维度进行详细介绍。包括数据的集中趋势描述、数据的离散程度描述和数据的分布形态描述。

注:文章内容,来自草堂君的新书《人人都会数据分析-从生活实例学统计》

本文为特邀专栏文章,来自:生活统计学,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/124048.html 。

(0)
生活统计学的头像生活统计学专栏
上一篇 2025-01-07 16:53
下一篇 2016-06-01 10:19

你可能也喜欢这些文章

发表文章
意见反馈
意见反馈
分享本页
返回顶部