7.8 KiB
核心假设
考虑一个包含 ( N ) 个资产的投资。关键假设是,我们拥有恰好 ( N ) 个预测信号,且每一个资产 ( n ) 都对应一个独一无二的预测信号 ( g_n )。即资产与信号的数量相等,( K = N )。
为了进行数学推导,我们建立两个核心假设:
- 统一的预测能力:每个信号的预测能力是相同的,由一个共同的信息系数 ( IC ) 衡量。具体地,每个信号 ( g_n ) 与其对应资产收益率 ( r_n ) 的协方差为:
[ Cov{r_n, g_n} = IC \cdot \omega_n \cdot Std_{TS} {g_n} ]
这个公式将预测信号 ( g_n ) 预测资产收益率 ( r_n ) 的能力,分解为三个部分的乘积:
- ( IC ) (信息系数):这是一个无量纲的标量,衡量的是预测的质量或技能。在理想情况下,它被定义为预测信号 ( g_n ) 与实现收益率 ( r_n ) 的相关系数:
[ IC = Corr(r_n, g_n) ] 模型的关键假设是,这个相关系数对于所有资产对的信号都是相同的。
-
( \omega_n ) (资产风险):这是资产 ( n ) 的收益率 ( r_n ) 的标准差。它代表了该资产固有的、整体的不确定性或波动性。
-
( Std_{TS} {g_n} ) (信号波动性):这是预测信号 ( g_n ) 在时间序列上的标准差。它衡量了这个信号本身的波动程度。
根据定义,资产收益率 ( r_n ) 和其信号 ( g_n ) 的相关系数 ( \rho_{r_n, g_n} ) 为:
[ \rho_{r_n, g_n} = Corr(r_n, g_n) = \frac{Cov(r_n, g_n)}{Std(r_n) \cdot Std(g_n)} ]
- 这个相关系数就是信息系数 ( IC )。
- 资产收益率 ( r_n ) 的标准差 ( Std(r_n) ) 就是其固有风险 ( \omega_n )。
- 信号 ( g_n ) 的标准差 ( Std(g_n) ) 就是 ( Std_{TS} {g_n} )。
将这些假设代入相关系数的定义式:
[ IC = \frac{Cov(r_n, g_n)}{\omega_n \cdot Std_{TS} {g_n}} ]
将这个等式变形:
[ Cov(r_n, g_n) = IC \cdot \omega_n \cdot Std_{TS} {g_n} ]
- 信号相关性主导的交叉影响:一个资产的收益率与另一个资产的信号之间的协方差,完全由这两个信号之间的相关性所驱动。具体地:
[ Cov{r_n, g_m} = IC \cdot \omega_n \cdot \rho_{nm} \cdot Std_{TS} {g_m} ]
其中 ( \rho_{nm} ) 是信号 ( g_n ) 与 ( g_m ) 之间的相关系数。这个假设是模型可解的关键,它意味着资产收益的交叉相关性是通过信号关联来传递的。
矩阵形式表述
理解矩阵的维度与含义
- ( \mathbf{r} ): ( N \times 1 ) 向量,代表 N 个资产的收益率。
- ( \mathbf{g} ): ( N \times 1 ) 向量,代表 N 个预测信号(每个资产对应一个)。
- ( Cov{\mathbf{r}, \mathbf{g}} ): 是一个 ( N \times N ) 的矩阵,它描述了所有资产收益率与所有信号之间的协方差。这个矩阵的 ( (n, m) ) 元素是 ( Cov(r_n, g_m) )。
现在,我们来看等式右边的四个矩阵:
- ( IC ): 一个标量。代表所有信号共享的、统一的信息系数。
- ( \mathbf{\Omega} ): 一个 ( N \times N ) 的对角矩阵。对角线上的第 ( n ) 个元素是资产 ( n ) 的收益率标准差 ( \omega_n ),非对角元素为 0。即 ( \mathbf{\Omega} = diag(\omega_1, \omega_2, ..., \omega_N) )。
- ( \mathbf{P} ): 一个 ( N \times N ) 的矩阵。代表所有信号之间的相关系数矩阵。其 ( (n, m) ) 元素是 ( \rho_{nm} = Corr(g_n, g_m) )。
- ( \mathbf{Std} ): 一个 ( N \times N ) 的对角矩阵。对角线上的第 ( n ) 个元素是信号 ( g_n ) 的标准差 ( Std_{TS}{g_n} ),非对角元素为 0。即 ( \mathbf{Std} = diag(\sigma_{g1}, \sigma_{g2}, ..., \sigma_{gN}) )。
计算 ( IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std} ) 这个矩阵乘积的 ( (n, m) ) 元素:
-
( \mathbf{\Omega} \cdot \mathbf{P} ): 一个 ( N \times N ) 矩阵。由于 ( \mathbf{\Omega} ) 是对角矩阵,这个乘法的效果是将 ( \mathbf{P} ) 的第 ( n ) 行(代表信号 ( g_n ) 与其他所有信号的相关性)的每一个元素都乘以资产 ( n ) 的风险 ( \omega_n )。所以,( (\mathbf{\Omega} \cdot \mathbf{P}){n, m} = \omega_n \cdot \rho{nm} )。
-
( (\mathbf{\Omega} \cdot \mathbf{P}) \cdot \mathbf{Std} ): 再用这个结果右乘对角矩阵 ( \mathbf{Std} )。其效果是将结果的第 ( m ) 列的每一个元素都乘以信号 ( g_m ) 的标准差 ( \sigma_{gm} )。所以,最终这个乘积矩阵的 ( (n, m) ) 元素是:
[ (IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std}){n,m} = IC \cdot (\omega_n \cdot \rho{nm}) \cdot \sigma_{gm} = IC \cdot \omega_n \cdot \rho_{nm} \cdot Std_{TS}{g_m} ]
而这,恰恰就是我们对 ( Cov{r_n, g_m} ) 的假设!
由此可得矩阵形式为:
- 收益率向量 ( \mathbf{r} ) 与信号向量 ( \mathbf{g} ) 的协方差矩阵为:
[ Cov{\mathbf{r}, \mathbf{g}} = IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std} ]
- 信号向量 ( \mathbf{g} ) 本身的方差-协方差矩阵为:
[ Var{\mathbf{g}} = \mathbf{Std} \cdot \mathbf{P} \cdot \mathbf{Std} ]
公式 (11-1) 描述的是在给定预测信号 g 的条件下,资产收益率向量 r 的条件期望:
[ E[\mathbf{r}|\mathbf{g}] = E[\mathbf{r}] + Cov[\mathbf{r}, \mathbf{g}] \cdot Var^{-1}[\mathbf{g}] \cdot (\mathbf{g} - E[\mathbf{g}]) ] 这是一个关于收益率的公式。
目标:从阿尔法向量的通用公式出发,在“每只资产一个信号” ((K=N)) 的特定假设下,推导出简洁的标量形式 (\phi_n = \omega_n \cdot IC \cdot z_{TS,n})。
证明:
- 起点(阿尔法向量的通用公式):
[ \mathbf{\phi} = Cov[\mathbf{r}, \mathbf{g}] \cdot Var^{-1}[\mathbf{g}] \cdot (\mathbf{g} - E[\mathbf{g}]) ] 此处的 ( \mathbf{\phi} ) 即为阿尔法向量,其分量 ( \phi_n ) 可被视为资产 n 的风险调整后预期超额收益。
-
代入模型假设: 我们代入技术附录中建立的矩阵形式假设:
- ( Cov[\mathbf{r}, \mathbf{g}] = IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std} )
- ( Var[\mathbf{g}] = \mathbf{Std} \cdot \mathbf{P} \cdot \mathbf{Std} )
代入后得到:
[ \mathbf{\phi} = (IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std}) \cdot (\mathbf{Std} \cdot \mathbf{P} \cdot \mathbf{Std})^{-1} \cdot (\mathbf{g} - E[\mathbf{g}]) ]
- 矩阵简化: 接下来的简化步骤与我之前所述一致,但请注意,这里的起点是 ( \mathbf{\phi} ),而不是 ( E[\mathbf{r}|\mathbf{g}] )。
[ \begin{aligned} \mathbf{\phi} &= IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{Std} \cdot \mathbf{Std}^{-1} \cdot \mathbf{P}^{-1} \cdot \mathbf{Std}^{-1} \cdot (\mathbf{g} - E[\mathbf{g}]) \ &= IC \cdot \mathbf{\Omega} \cdot \mathbf{P} \cdot \mathbf{P}^{-1} \cdot \mathbf{Std}^{-1} \cdot (\mathbf{g} - E[\mathbf{g}]) \ &= IC \cdot \mathbf{\Omega} \cdot \mathbf{I} \cdot \mathbf{Std}^{-1} \cdot (\mathbf{g} - E[\mathbf{g}]) \ &= IC \cdot \mathbf{\Omega} \cdot \mathbf{Std}^{-1} \cdot (\mathbf{g} - E[\mathbf{g}]) \end{aligned} ] 这里,信号相关性矩阵 ( \mathbf{P} ) 再次被抵消。
- 得到最终向量与标量形式: 上述公式就是技术附录中推导出的向量形式结果。将其写成分量形式:
[ \phi_n = IC \cdot \omega_n \cdot \left( \frac{g_n - E[g_n]}{Std[g_n]} \right) ] 这正是文本中的公式 (11-2):
[ \phi_n = \omega_n \cdot IC \cdot z_{TS,n} ] 其中 ( z_{TS,n} = \frac{g_n - E[g_n]}{Std[g_n]} ) 正是信号 ( g_n ) 的标准化分数(Z-Score)。