大数定律

在概率论中,大数定律 (LLN) 是描述大量执行相同实验的结果的定理。 根据规律,大量试验所得结果的平均值应接近预期值,并随着试验次数的增加而趋于接近预期值。

LLN 很重要,因为它保证了一些随机事件的平均值的长期稳定结果。例如,虽然赌场可能会在轮盘赌的单次旋转中赔钱,但其收益将趋向于在大量旋转中的可预测百分比。 玩家的任何连胜最终都会被游戏的参数所克服。 要注意的是,该定律仅在考虑大量观察时才适用(如名称所示)。 没有原理关系的是少数观察结果会与预期值一致,或者一个值的连续性会立即被其他值“平衡”。

另外是要注意,LLN 仅适用于平均值。因此,虽然

$$ \lim {n \rightarrow \infty} \sum{i=1}^{n} \frac{X_{i}}{n}=\bar{X} $$

其他看起来相似未经验证的公式,例如与“理论结果”的原始偏差:

$$ \sum_{i=1}^{n} X_{i}-n \times \bar{X} $$

它不仅不会随着 $n$ 的增加而收敛到零,反而随着 $n$ 的增加,它的绝对值也趋于增加。

模拟

为了完整起见,下面的模拟将按照以下逻辑估计 $\pi$ 的值:

知道圆的面积是 $\pi r^{2}$,我们知道半径 ( $r$ ) 为 1 的圆的面积只是 $\pi$ 。 如果我们将圆完美地放置在边长为 2 的正方形(即面积为 4)的内部,我们知道圆的面积与正方形的面积之比为 $\frac{\pi}{4}$。

因此,如果我们随机向一个尺寸相同的飞镖板多次投掷飞镖,那么圆内的飞镖与击中正方形的飞镖的比率应该接近 $\frac{\pi}{4}$。如果我们将这个比率乘以 4,我们就得到了 $\pi$ 的估计值。

# Create a dartboard 
dart_board <- ggplot() + 
 geom_circle(aes(x0 = 0, y0 = 0, r = 1), fill = "black") + 
 geom_circle(aes(x0 = 0, y0 = 0, r = 0.99), fill = "red") + 
 geom_circle(aes(x0 = 0, y0 = 0, r = 0.7), fill = "lightyellow") + 
 geom_circle(aes(x0 = 0, y0 = 0, r = 0.2), fill = "red") + 
 geom_circle(aes(x0 = 0, y0 = 0, r = 0.1), fill = "darkgreen") + 
 coord_fixed() + 
 geom_segment(aes(x=-1,xend=1,y=1,yend=1)) + 
 geom_segment(aes(x=-1,xend=1,y=-1,yend=-1)) + 
 geom_segment(aes(x=1,xend=1,y=-1,yend=1)) + 
 geom_segment(aes(x=-1,xend=-1,y=-1,yend=1)) + 
 xlab("x")+ylab("y")+ 
 theme_bw() 
 
dart_board

绘制收敛趋势图

源代码

https://embed.notionlytics.com/wt/ZXlKd1lXZGxTV1FpT2lJM056QTFaV1ZtTlRGbE9XSTBaVE01WVRBNFl6Qm1aamt6WVRJME1qRXhOQ0lzSW5kdmNtdHpjR0ZqWlZSeVlXTnJaWEpKWkNJNklsZHNTR2hsVEZSUFdXeHpaVmRhUW1ZNU1YQmxJbjA9