大数定律和中心极限定律关系

大数定律给出了随着样本量的增加样本矩收敛到总体矩的条件。中心极限定律提供有关随着样本量增加样本矩收敛到总体矩的速率的信息。

在统计学中,这两个最重要但难以理解的概念构成了流行的假设检验框架的基础。 任何基于互联网的公司(例如:电子商务、食品配送、OTT 等)的关键决策通常由涉及假设检验的 A/B 测试支持。

在现实世界中,不可能分析整体。因此,我们采用抽样及其分析,试图根据样本得出关于总体的结论。

期望线性

期望线性是随机变量之和的期望值等于它们各自期望值之和的性质,无论它们是否独立。随机变量的期望值本质上是可能结果的加权平均值。 我们经常对随机变量总和的期望值感兴趣。

大数定律

我们从大数定律开始,它告诉我们样本平均值何时会收敛到它们的总体均值。

经典大数定律

经典的大数定律涉及独立同分布随机变量。以下是经典大数定律的最强版本,被称为科尔莫哥洛夫强定律。

令 $X_1, \ldots, X_n$ 是独立同分布的标量随机变量,具有共同分布 $F$。

当它存在时,令 $\mu$ 表示该样本的共同均值:

$$ \mu := \mathbb E X = \int x F(dx) $$

此外,令

$$ \bar X_n := \frac{1}{n} \sum_{i=1}^n X_i $$

Python模拟经典大数定律

中心极限定律

接下来,我们转向中心极限定理,它告诉我们样本平均值和总体平均值之间的偏差分布。

Python模拟中心极限定律

投币期望线性值