正交分解: 向量空间 $V$ 中的任何向量都可以唯一地分解为子空间 $W$ 及其正交补空间 $W^{\perp}$ 中的分量。这使得我们可以定义正交投影算子 $P$,它是自伴随且幂等的。
投影的矩阵表示: 投影矩阵 $P、Q$ 和 $R$ 清楚地展示了投影算子如何通过标准基变换工作。和 $Q + R = I$ 证实了每个向量都分解为 $W$ 和 $W^{\perp}$ 中的分量。
与统计学的联系: 相关性自然地解释为两个向量之间夹角的余弦。偏相关性则对应于它们在与第三个变量正交的超平面上的投影之间夹角的余弦。
偏相关性的几何直观: 通过消除混淆变量 $z$ 的影响,残差向量 $r_x$ 和 $r_y$ 更清晰地展示了 $x$ 和 $y$ 之间的直接关系。这与回归分析中偏相关性的解释非常吻合。
我们可以将正交投影和偏相关性的概念应用到现实世界的数据集,例如经济指标或健康指标。让我们以金融领域的一个例子来说明:股票回报率、市场回报率和通货膨胀率之间的关系。
场景: 我们有一个数据集,其中:
我们想要:
我们将使用 NumPy 和 SciPy 来计算投影和偏相关性。
我们模拟股票回报率、市场回报率和通货膨胀率。
我们将股票回报率和市场回报率投影到与通货膨胀正交的超平面上。