统计学
-
小白学统计(30)推断统计基础:点估计与区间估计
参数估计:就是根据样本统计量的数值对总体参数进行估计的过程。根据参数估计的性质不同,可以分成两种类型:点估计和区间估计。
-
小白学统计(29)切比雪夫(Chebyshev)定理
在总体分布未知(或非正态)且样本容量小于30时,均值的抽样分布是未知的,这时我们就不能运用中心极限定理、t分布和大样本理论来估计总体的均值,此时,可以运用切比雪夫(Chebyshev)定理来近似估计总体均值。
-
小白学统计(28)抽样分布:t分布
有正态总体(均值为μ),定义随机变量T(见下方公式),它的值为t(变量用大写字母表示,具体的值用小写字母表示)。
-
从程序员的角度说统计学习方法概论
对于程序员来说,特别是很少见数学公式的来说,要读一本这样满是公式的书其实是比较有挑战的。
-
小白学统计(27)抽样分布:详述均值的抽样分布及中心极限定理
均值的抽样分布类型 抽样分布的定义、作用和主要种类已经介绍过(回顾点击:通俗解释“大数据”及推断性统计学:抽样分布),本篇介绍均值的抽样分布。均值抽样分布根据样本量的情况分为均值的理论抽样分布和均值的经验抽样分布。 均值的理论抽样分布 通俗的解释:有总体N,每次从中抽取固定容量为n的样本并计算出该样本的均值,如果将所有可能抽取的样本列出,并计算均值,这些均值…
-
小白学统计(26)连续型随机变量概率分布——抽样均值分布
抽样分布十分重要,它是进行统计推断的基础,正是依赖抽样分布的理论,我们才能对总体的有关特征作出具有一定概率保证的估计和检验。因此,深入理解抽样分布的概念并掌握某些重要的抽样分布,对于进一步学习统计推断的其它方法将大有裨益。 统计量与抽样分布的概念 统计推断的目的,就是通过样本的特征值去推断总体的特征。在推断统计中将描述总体特征的指标都称为总体参数,而将反映样…
-
小白学统计(25)通俗解释“大数据”及推断性统计学:抽样分布
大数据 近两年来,大数据这个词火了,新闻媒体的报道铺天盖地,好像什么东西都要和它搭上边才能显得“高大上”。这些报道大多在阐述大数据的运用和作用,忽略它的理论基础,普通民众无法将其与生活实例联系起来,就让他们觉得不懂和高大上,这样的例子已经有很多,比如“纳米”、“光伏”等概念,很多商家在宣传自己产品的时候都会加上这些概念,可以提升产品的销售价格,甚至某些商家的…
-
聪明的数据分析师也会常犯的错误
在数据分析过程中,聪明的数据分析师也会常犯些错误
-
小白学统计(24)推断性统计学:抽样设计
推断性统计学 大多数研究的目的是取得有关总体的一般真实情况。然而由于难以得到整个总体,所以需要从总体中抽取一个样本,然后运用统计方法,从样本信息推断关于总体某些特征的结论。为了使推断合理,样本必须在抽样设计的严格条件下抽取。 抽样设计 从总体中抽取合适样本的方法,使得由样本到总体的推断是合理的,这一过程称为抽样设计,即对一个存在的测量总体,制定一种从中抽取测…
-
小白学统计(23)概率分布关系:正态分布作为泊松分布近似
内容介绍: 正态分布能用于近似泊松分布。泊松分布的参数是μ=λ,可以证明λ增加,泊松分布接近μ=σ2=λ的正态分布。因此,只要λ足够大,就可以将泊松分布看作是μ=σ2=λ的正态分布,然后可以用标准正态分布方法计算面积(概率)值。因为这样得到的概率值只是泊松概率真实值的近似,所以正态分布的这种应用称为泊松分布的正态近似。如下图所示,λ增大,概率曲线越接近正态分…
-
一克统计学:小数定律和随机事件
一起来学一学
-
什么是二项分布?
二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里始创的,所以又叫贝努里分布。
-
小白学统计(22)概率分布关系:正态分布作为二项分布近似
内容介绍: 计算二项分布的某个概率,需要对二项式展开(p+q)n的相关项相加,这是一个放缩的过程,而且对较大的n值或许得有一台计算机。上一篇(概率分布关系:泊松分布作为二项分布近似)指出,在一定条件下(当n≥20且q≤0.05时),可以使用泊松分布对二项概率进行近似。类似地,在一定条件下正态分布也是二项分布的一个良好近似,如下图所示,从而可用于计算二项分布的…
-
开发者和IT人士成为数据科学家的学习路线
这篇指南旨在帮助WEB开发者、软件工程师以及其他的IT从业者转行到数据分析/数据科学行业。
-
关于数据科学历史的新手指南
尽管很多数据科学的支持者已经拿起大数据作为武器,并且提出新的主张和挑战,但是关于数据科学你还需要了解一些名字和日期。