有时候,把握问题的核心是当务之急。你的核心竞争力是什么?认识事物,要抓重点,抓事物的本质。这个方法论,也是一个很好的学习之道。
从一大堆数字中看出模式和趋势可能不容易,而求出平均数通常是把握全局的第一步。在认识数据的过程中,我们需要全局意识和整体观念,通过数据的平均数能够迅速找出数据中最具代表性的数字,从而得出重要的结论。统计世界中几个表示集中趋势的重要统计量:均值、中位数和众数。通过学习和理解,从而有效地汇总数据,尽可能得出简单而有用的结论。
均值
均值,平均数的一般量度。
计算大量平均数的一个常用方法,将所有数字累加起来,然后除以数字的个数。在统计学中,这种计算方法,称其为均值。
平均数具有多种,换而言之,不同的平均数有着不同的计算方法。
如果你想成为真正的统计高手,就需要把一些统计符号用顺手。也就是说,学会和使用一种合适的表示方式——符号表示法。
把所有的数字x累加起来,表示形式
均值的计算公式
均值的专用符号
如果用f代表频数,均值计算公式
中位数
当偏斜数据和异常值使得均值产生误导时,我们就需要使用其他方式表示典型值。我们可以取中间值,中间值是另外一种平均数,称其为中位数。
中位数计算方法
右偏和左偏
通过观察图形尾巴的走向以及中位数和均值的判别关系来确定是否存有偏斜。
右偏,均值被拉高,从而均值大于中位数;左偏,均值被拉低,从而均值小于中位数;对称,均值等于中位数。
众数
众数是第三种平均数,它是指一批数字中最常见的数字,即频数最大的数值,而且是最频繁出现的数值。
众数不仅能够用于数值型数据,还能应用类别数据。事实上,众数是唯一能够用于类别数据的平均数。
计算众数的方法
重要统计量
均值
异常值
偏斜数据
众数
总结:均值、中位数和众数
思考题:
1常用的平均数有哪些?请举例说明。
2众数怎么计算,请选择一种程序语言编程实现?
3动动笔,做个计算。
作者:王路情,80后,数据科学研究者和实践者,包括数据科学知识传播,数据挖掘项目实践,数据分析报告撰写等工作。
来自:http://www.wangluqing.com/2015/06/30/luqinbiji2/
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。