统计学
-
知乎精选:想学统计学需要掌握哪些知识?
【数据哥注】这是一个很好的问题,对于新手、特别是非统计科班出身的人来说,心里总是有这样的顾虑,掌握的统计学基础只是不够,然而又应该从哪里入手呢?以下是数据分析精选整理自知乎的一些答案,希望对大家会有所帮助。 @肖玄: 我认为首先要明确的是学统计干什么,如果有明确的作用,比如时间序列,市场调研这些,那么推荐书籍各不一样,统计终究只是一个工具,在实际运用中的偏重…
-
说人话的统计学 | 贝叶斯vs频率派:武功到底哪家强?
运用之妙,存乎一心,正所谓“无招胜有招”才是最高境界,你说是吗?
-
说人话的统计学:见识数据分析的「独孤九剑」
为什么不发明一些统计检验直接算出假设成立的可能性呢?
-
说人话的统计学:做统计,多少数据才算够?(下)
多少数据才算够?
-
说人话的统计学:做统计,多少数据才算够?(上)
多少数据才算够?
-
说人话的统计学:你真的懂p值吗?
有人说:「统计学就是个p!」此p可不像彼「屁」,可以一放了之。
-
《深入浅出统计学》15相关与回归:我的线条如何?
了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。 发现事物之间的相互关系:相关与回归。 数据类型探讨 单变量数据考虑的是一个单一变量的频数或者概率。 二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。 二变量数据可视化 散…
-
《深入浅出统计学》14卡方分布:继续探讨
有时候事实与期望并不相符,我们需要有这个心理准备,同时,我们需要寻求其他方法进行分析和解答。 使用卡方检验评估差异 检验统计量代表什么 拟合优度检验 拟合优度检验——它检验观察频数是否和假设的概率分布相吻合。 自由度确定规律 要点一 总结 1卡方检验的含义 2卡方检验的应用 练习
-
《深入浅出统计学》13 假设检验的运用:研究证据
他人的言论未必句句真实可信。如何判断和定论?其目的就是发现真相,还原本真,呈现可靠。 如何判断他人的言论是真,是假?假设检验是一种思维方法——利用样本检验各种统计断言是否可能属实。通过假设检验可以权衡证据,检验极限结果——是纯属巧合,还是存在其他内在根据。 假设检验具体过程 查看断言 查看证据 做出决策 假设检验的六个步骤 原假设 备选假设 注意:进行假设检…
-
《深入浅出统计学》12 置信区间的构建:自信地猜测
有时候样本无法给出足够正确的结果。 点估计量是我们有可能给出的总体统计量的最佳估计。点估计量是有价值的,但也许存在小小的误差。为什么呢?原因很简单,因为我们用的是样本。 认识置信区间 利用点估计量,是通过指定一个确切的数值估计总体。 我们不指定一个确切的数值,而是指定两个数值,即为总体的均值确定一个区间。 求解置信区间的四步骤 关于上述步骤,解说如下。 第一…
-
《深入浅出统计学》11总体和样本的估计:进行预测
得样本而知总体,不亦乐乎。通过样本去推知总体,属于推断性统计学。 若要想成为样本专家,首先需要有效地利用样本去准确地预测总体,并以一定方式说明预测结果的可靠程度。 点估计量 样本均值被称为总体均值的点估计量,换而言之,样本均值,作为一个对于所有样本数据的计算结果,它是总体均值的良好估计。 点估计近似总体参数 当总体参数的确切数值无法获知的情况下,我们用“点估…
-
《深入浅出统计学》10统计抽样的运用:抽取样本
统计需要处理数据,数据从何而来? 有时候收集数据很简单,有时候收集数据很复杂。 在实际工作中,如何成功地收集数据——有效地,正确地,省时省钱地收集数据?抽样是一种很好的方法。 总体 统计学上的总体指的是准备对其进行测量、研究或者分析的整个群体,可以是人、得分,也可以是糖果——关键在于总体指的是所有的对象。 普查指的是对总体进行研究和调查。 普查可以给出总体的…
-
《深入浅出统计学》9再谈正态分布的运用:超越正态
但愿所有的连续概率分布是是正态分布。这是但愿而已,人总是要有着美好的愿望,同时,又要面对现实生活和客观实际。 X+Y问题【组合正态分布问题】 通过图性描述X+Y的特点。 思考:X-Y的问题? 线性变换描述了数据的基本变化。 要点一 二项分布与正态分布的近似关系 在某些情况下,泊松分布可以近似二项分布;不过,在另一些情况下,正态分布也可以近似二项分布。 近似处…
-
《深入浅出统计学》8正态分布的运用:保持正态
离散概率分布并非无所不能。 除了数值是离散的概率分布以外,还有一大类,即数值是连续的概率分布。正态分布是一种重要的连续型概率分布。 连续型数据 连续型数据往往通过测量得到,而不是通过计数得到,测量结果在很大程度上取决于测量精度的要求。 对于离散概率分布,我们关心的是取得一个特定数值的概率;而对于连续概率分布来说,我们关心的是取得一个特定范围内的概率。 概率密…
-
《深入浅出统计学》7几何分布、二项分布、泊松分布:坚持离散
计算概率分布颇为耗时。但是,我们可以掌握一些特殊而有用的概率分布,比方说几何分布、二项分布和泊松分布,利用这些特殊的概率分布,可以快速地计算概率、期望和方差。 几何分布 几何分布有以下特点: 进行一系列相互独立的试验。 每一次试验都既有成功的可能,也有失败的可能,且单次试验的成功概率相同。 你所研究的是为了取得第一次成功需要进行多少次试验。 几何分布表示形式…