P250 命题1

This commit is contained in:
2025-10-23 19:32:48 +08:00
parent 7d35bfc378
commit f5f0f13f5f

View File

@ -0,0 +1,203 @@
## 1. 问题设定
我们有:
- \( r \):超额收益率向量 (我们想估计的随机向量)(维度 \(N\)
- \( g \):原始预测向量 (观测到的随机向量)(维度 \(K\)
- 线性估计形式:
\[
\hat{r}(g; b, A) = b + A g
\]
其中 \(b\) 是 \(N\) 维向量,\(A\) 是 \(N \times K\) 矩阵。
估计误差:
\[
q = r - \hat{r}
\]
均方误差MSE
\[
\text{MSE}(b,A) = E[q^T q] = E\left[ \sum_{n=1}^N q_n^2 \right]
\]
---
## 2. 第一步:对 \(b\) 优化
我们要最小化 \(\text{MSE}(b,A)\),先对 \(b_n\) 求偏导(\(n=1,\dots,N\))。
注意:
\[
q_n = r_n - b_n - \sum_{k=1}^K A_{n,k} g_k
\]
\[
\frac{\partial \text{MSE}}{\partial b_n} = E\left[ 2 q_n \cdot (-1) \right] = -2 E[q_n] \overset{\text{令}}{=} 0
\]
所以:
\[
E[q_n] = 0
\]
即:
\[
E[r_n - b_n - \sum_{k=1}^K A_{n,k} g_k] = 0
\]
\[
E[r_n] - b_n - \sum_{k=1}^K A_{n,k} E[g_k] = 0
\]
因此:
\[
b_n = E[r_n] - \sum_{k=1}^K A_{n,k} E[g_k]
\]
写成向量形式:
\[
b = E[r] - A E[g]
\]
于是最优线性估计的形式变为:
\[
\hat{r} = E[r] + A (g - E[g])
\]
取期望
\[
E[\hat{r}] = E\big[ E[r] + A (g - E[g]) \big]
\]
由于 \( E[r] \) 是常数,\( A \) 是固定矩阵(不是随机的),
\[
E[\hat{r}] = E[r] + A \cdot E[g - E[g]]
\]
\[
E[g - E[g]] = E[g] - E[g] = 0
\]
所以
\[
E[\hat{r}] = E[r] + A \cdot 0 = E[r]
\]
因此估计是无偏的:
\[
E[\hat{r}] = E[r]
\]
从而 \( E[q] = 0 \)
因为
\[
q = r - \hat{r}
\]
\[
E[q] = E[r] - E[\hat{r}] = E[r] - E[r] = 0
\]
---
## 3. 引入中心化变量
令:
\[
s = g - E[g], \quad p = r - E[r]
\]
则:
\[
q = p - A s
\]
并且 \(E[q] = 0\)。
---
## 4. 展开 MSE
\[
\text{MSE}(A) = E[q^T q] = E[(p - A s)^T (p - A s)]
\]
\[
= E[p^T p] - 2 E[p^T A s] + E[s^T A^T A s]
\]
---
## 5. 对 \(A_{n,k}\) 求偏导
我们也可以直接对每个 \(A_{n,k}\) 求偏导来得到条件。
\[
q_n = p_n - \sum_{j=1}^K A_{n,j} s_j
\]
\[
\frac{\partial \text{MSE}}{\partial A_{n,k}} = E\left[ 2 q_n \cdot ( - s_k ) \right] = -2 E[q_n s_k] \overset{\text{令}}{=} 0
\]
所以:
\[
E[q_n s_k] = 0
\]
即:
\[
E\left[ \left( p_n - \sum_{j=1}^K A_{n,j} s_j \right) s_k \right] = 0
\]
\[
E[p_n s_k] - \sum_{j=1}^K A_{n,j} E[s_j s_k] = 0
\]
注意:
- \(E[p_n s_k] = \text{Cov}(r_n, g_k)\)(因为 \(p_n = r_n - E[r_n]\)\(s_k = g_k - E[g_k]\)
- \(E[s_j s_k] = \text{Cov}(g_j, g_k)\)(即 \(\text{Var}(g)\) 的第 \((j,k)\) 元素)
---
## 6. 矩阵形式
对每个 \(n\),有:
\[
\text{Cov}(r_n, g) - A_{n,\cdot} \cdot \text{Var}(g) = 0
\]
其中 \(A_{n,\cdot}\) 是 \(A\) 的第 \(n\) 行。
将所有行堆起来:
\[
\text{Cov}(r, g) - A \cdot \text{Var}(g) = 0
\]
这里 \(\text{Cov}(r,g)\) 是 \(N \times K\) 矩阵,元素为 \(\text{Cov}(r_n, g_k)\)。
所以:
\[
A = \text{Cov}(r, g) \cdot \text{Var}(g)^{-1}
\]
---
## 7. 最终估计量
代入:
\[
\hat{r} = E[r] + \text{Cov}(r, g) \cdot \text{Var}(g)^{-1} \cdot (g - E[g])
\]
这就是命题中给出的形式。