统计学
-
说人话的统计学:你真的懂p值吗?
有人说:「统计学就是个p!」此p可不像彼「屁」,可以一放了之。
-
《深入浅出统计学》15相关与回归:我的线条如何?
了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。 发现事物之间的相互关系:相关与回归。 数据类型探讨 单变量数据考虑的是一个单一变量的频数或者概率。 二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。 二变量数据可视化 散…
-
《深入浅出统计学》14卡方分布:继续探讨
有时候事实与期望并不相符,我们需要有这个心理准备,同时,我们需要寻求其他方法进行分析和解答。 使用卡方检验评估差异 检验统计量代表什么 拟合优度检验 拟合优度检验——它检验观察频数是否和假设的概率分布相吻合。 自由度确定规律 要点一 总结 1卡方检验的含义 2卡方检验的应用 练习
-
《深入浅出统计学》13 假设检验的运用:研究证据
他人的言论未必句句真实可信。如何判断和定论?其目的就是发现真相,还原本真,呈现可靠。 如何判断他人的言论是真,是假?假设检验是一种思维方法——利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果——是纯属巧合,还是存在其他内在根据。 假设检验具体过程 查看断言 查看证据 做出决策 假设检验的六个步骤 原假设 备选假设 注意:进行假设检…
-
《深入浅出统计学》12 置信区间的构建:自信地猜测
有时候样本无法给出足够正确的结果。 点估计量是我们有可能给出的总体统计量的最佳估计。点估计量是有价值的,但也许存在小小的误差。为什么呢?原因很简单,因为我们用的是样本。 认识置信区间 利用点估计量,是通过指定一个确切的数值估计总体。 我们不指定一个确切的数值,而是指定两个数值,即为总体的均值确定一个区间。 求解置信区间的四步骤 关于上述步骤,解说如下。 第一…
-
《深入浅出统计学》11总体和样本的估计:进行预测
得样本而知总体,不亦乐乎。通过样本去推知总体,属于推断性统计学。 若要想成为样本专家,首先需要有效地利用样本去准确地预测总体,并以一定方式说明预测结果的可靠程度。 点估计量 样本均值被称为总体均值的点估计量,换而言之,样本均值,作为一个对于所有样本数据的计算结果,它是总体均值的良好估计。 点估计近似总体参数 当总体参数的确切数值无法获知的情况下,我们用“点估…
-
《深入浅出统计学》10统计抽样的运用:抽取样本
统计需要处理数据,数据从何而来? 有时候收集数据很简单,有时候收集数据很复杂。 在实际工作中,如何成功地收集数据——有效地,正确地,省时省钱地收集数据?抽样是一种很好的方法。 总体 统计学上的总体指的是准备对其进行测量、研究或者分析的整个群体,可以是人、得分,也可以是糖果——关键在于总体指的是所有的对象。 普查指的是对总体进行研究和调查。 普查可以给出总体的…
-
《深入浅出统计学》9再谈正态分布的运用:超越正态
但愿所有的连续概率分布是是正态分布。这是但愿而已,人总是要有着美好的愿望,同时,又要面对现实生活和客观实际。 X+Y问题【组合正态分布问题】 通过图性描述X+Y的特点。 思考:X-Y的问题? 线性变换描述了数据的基本变化。 要点一 二项分布与正态分布的近似关系 在某些情况下,泊松分布可以近似二项分布;不过,在另一些情况下,正态分布也可以近似二项分布。 近似处…
-
《深入浅出统计学》8正态分布的运用:保持正态
离散概率分布并非无所不能。 除了数值是离散的概率分布以外,还有一大类,即数值是连续的概率分布。正态分布是一种重要的连续型概率分布。 连续型数据 连续型数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度的要求。 对于离散概率分布,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围内的概率。 概率密…
-
《深入浅出统计学》7几何分布、二项分布、泊松分布:坚持离散
计算概率分布颇为耗时。但是,我们可以掌握一些特殊而有用的概率分布,比方说几何分布、二项分布和泊松分布,利用这些特殊的概率分布,可以快速地计算概率、期望和方差。 几何分布 几何分布有以下特点: 进行一系列相互独立的试验。 每一次试验都既有成功的可能,也有失败的可能,且单次试验的成功概率相同。 你所研究的是为了取得第一次成功需要进行多少次试验。 几何分布表示形式…
-
《深入浅出统计学》6排列与组合:排序、排位、排
顺序有时候很重要。《大学》里面有言:物有本末,事有终始,知所先后,则近道矣。 计算排位 推导出用于重复排列的公式 设想你需要清点n个对象的排位方式的数目,再设想有k个对象是类似对象,其排位数计算公式如下。 推广上述公式,设想对n个对象进行排位,其中一类对象共计k个,另一类对象共计j个,排位方式的数目如下。 按类型排位数目计算公式 何谓排列? 排列数总结如下。…
-
《深入浅出统计学》5离散概率分布的运用:善用期望
意外从天而降,未来如何演变? 利用概率预测长期结果,利用期望度量结果的确定性。 随机变量 随机变量是一个可以等于一系列数值的变量,而这一系列数值中的每一个值都与一个特定概率相关联。 离散变量,这里的变量具有离散值,即该变量只能取确定数值。 只要算出概率分布,就能利用概率分布来确定预期的结果。 期望指示预测结果。 变量X的期望通常写作E(X)。 期望的计算公式…
-
《深入浅出统计学》4概率计算:把握机会
人生无常,且行且珍惜。 世界总是在变化,但有些事情总比其他事情更有可能发生,可能性问题的研究需要概率论。通过概率论评估各种结果的可能,让你预测未来。知悉可能的结果则可帮助你作出有根据的决策。 几率有多大? 概率是量度某事发生几率的一种数量指标。统计学用“事件”一词表示有概率可能的任何事情。 为了求出押中赌注的概率,我们用押中赌注的可能数目除以可能出现的结果数…
-
《深入浅出统计学》3分散性与变异性的量度:强大的“距”
事实是否可靠,我们该问谁?我们该如何分析和判断? 平均数在寻找数据典型值方面是一个好手段,但是平均数不能说明一切。平均数能够让你知道数据的中心所在,但若要给数据下结论,尽有均值、中位数、众数还无法提供充足的信息。分析数据的分散性和变异性,可以更好地认识和理解数据。通过各种距和差来度量分散性和变异性。 使用全距区分数据集 平均数往往给出部分信息,它让我们能够确…
-
《深入浅出统计学》2集中趋势的度量:中庸之道
有时候,把握问题的核心是当务之急。你的核心竞争力是什么?认识事物,要抓重点,抓事物的本质。这个方法论,也是一个很好的学习之道。 从一大堆数字中看出模式和趋势可能不容易,而求出平均数通常是把握全局的第一步。在认识数据的过程中,我们需要全局意识和整体观念,通过数据的平均数能够迅速找出数据中最具代表性的数字,从而得出重要的结论。统计世界中几个表示集中趋势的重要统计…