今天是小S入门的第二天了,经过一天的工作洗礼后,终于屁颠屁颠的下班了,拥抱那美好的统计学梦想去了。
言归正常,话说昨天介绍了统计学的入门基础和基本概念后,小S私下反馈进度太慢太慢了,我要一下子学会降龙十八掌,作为为师,十分佩服小S的雄心,只好回了一大耳括子….咳…..咳 废话太多了,调整电影镜头中….
前边我们讲过,由于工作中统计的方便,所以数据分为:
分类型是用标记来识别项目的类型。比如彩球的颜色分类。
数量型就类似平时的表达多少或者大小的数值,比如几个红色的球几个蓝色的等。
小S平时喜欢思考,比如说在超市中购物,有时候会特别好奇在这些卖软饮料这些品牌当中,哪种是最受欢迎的呢?这个问题咱可以用”频数分布”这个角度来分析,所谓频数分布,是指一种数据的表格汇总,表示在几个互不重叠的组别中的每一组的项目个数(即频数)。比如卖软饮料的,可以采用个简单的方法,如果不怕苦的话可以采用人海战术,盯在旁边,每次客户拿什么品牌的就记录下来,样本可以采用50次,假设结果出现19个可口可乐,百事可乐18次,汇源果汁10次,康师傅3次,整理表格如下
此图专业好听的话叫频数分布,可以从分布上能看出每个个体的分布形状,就像生物学上经常见到的某种介绍,狮子活跃在哪里,黑卷尾生活在哪里等若干若干,有助于大体认识,比如你想捕捉黑卷尾,通过分布就能提高遇到的概率哈哈。
频数分布:能表明在几个互不重叠的组别中每一组的项目个数(即频数)。但是通过上图也看到,通过绝对数的介绍人是没有感觉的,或者数大了感觉差不离,没啥影响似的,所以要换算成比例或者百分比更有趣。接下来2个概念,
相对频数分布:各组相对频数数据的表格汇总。公式是:组的相对频数=组频数/n 百分比频数=组的相对频数*100%
在生活中有时候我们得到了好几个样本数据,全是数据值的,对于这种数据型数据确定频数分布的步骤如下:
- 确定互不重叠的组数。(一般来讲都是采用经验的多些,比如你平时注意电话一定会发现大多5 10等多些整数类的,根据数据项来定)
- 确定每组的组宽,可以采用经验公式 近似组宽=(最大数据值-最小数据值)/组数
- 确定组限
累计频数:表示小于或等于每一个组上组限的数据项个数
价值总结:一个频数分布的价值就在于它提供了对数据的深刻理解,而直接观察原始的数据,是看不出什么来的,这就是价值所在。
接下来简单介绍描述统计学的其它图表法(求放过,这种的知识咱百度好么)
- 条形图
- 饼图
- 直方图
- 打点图
- 茎叶图
- 散点图:说说这个,生活中作用大的很,一般是关于2个变量之间的关系的图形表述,比如说一个男的与一个女的关系是怎样的呢,要是正常来讲,大家都会说关系挺好 关系不一般,这种都是文字上的总会有那么缺憾,如果把它量化,那就简单了,比如一天的互动次数,按时间来分解,如果很明显的直线关系,那可以判断这2人关系不一般哼哼(这里不严谨)。我们举个商业类的,比如销售额与广告的关系,这种就发挥作用了,到底有没有效果可以一定程度上来通过散点图分析。注意,这里散点图是判断的是相关关系而不是因果关系。通过一个例子来看(x轴是广告次数,Y轴是销售额(100美元)
像本图描述的就是正相关关系,表明了广告次数和销售额直接存在正相关关系。但是所有的点并没有在一条线上,所以这种关系是不完全的。然而,这些带你的分布模式和趋势线表明,整体关系是正相关的。
反过来:
像本图表明:广告次数和销售额之间存在负相关次数。较高的销售额和较高的广告次数没有产生联系,反而加速了销售额下滑,(这里不讲广告和实际产品出现某种意外,比如不匹配或者引发了质量事件等,再者实际这种情况 很少,这里只是为举例负相关),这种图就是负相关,即随的X增加,Y趋向减少。
不思不觉45分钟过去了,这节课收获满满,瞧了瞧QQ信息等,小S深深的感受到了充分利用时间不闲玩,专注学习的魅力,他相信,随的时间的演化,他会加速实现想要的生活。接下来看了看明日统计学的预告
- 位置的度量
- 变异的度量
- 两关系间的度量
话说讲到这里,摆擂台,抛绣球,小S累个半死,预知小S累成啥样了,静待明日分解。
作者:求知不才
来源:天善智能
链接:https://ask.hellobi.com/blog/xiaoshang/4131
本文为专栏文章,来自:天善智能,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/19739.html 。