统计套利的主要思路是先找出相关性最好的若干对股票,再找出每一对股票的长期均衡关系(协整关系),当某一对股票的价差(协整方程的残差)偏离到一定程度时开始建仓:买进被相对低估的股票,卖空被相对高估的股票,等到价差回归均衡时获利了结即可。
当残差序列是平稳的,并且服从正态分布时,统计套利就会变得很容易—投资者只需在价差出现在分布的尾部时建仓,在价差出现在零附近时平仓即可。事实上,残差序列往往不是服从正态分布的,因此可以采用混合正态分布或直接用非参数的方法来拟合其收益率的分布。当然,残差中可能还存在自相关性或异方差性,这就需要考虑用ARMA模型或ARCH模型来刻画这些特性。另外,还可以采用Kalman滤波来排除噪声干扰,并利用最新的信息来估计残差的可预测部分,当实际残差与预测值发生较大偏离时入场套利。
此外,主成分法也可以应用于统计套利,其原理是先找出一些股票的共同驱动因素—主成分,然后根据主成分的系数向量构建主成分组合(类似于市场基准),并将每一只股票的收益率表示为这些主成分组合的线性函数,当残差出现一定的偏离时,做空该成分股并做多主成分组合(或相反),以实现在β中性的前提下获取一定的Alpha收益。