在理论上,如果能够实现完全复制,那将是最好的复制策略。但是由于操作上的困难,使得完全复制执行起来难度很大,这就使得我们必须考虑其他的方法。
指数成分股之间有很多共同因子,当组合中缺失一些股票时,可以使用具有相同因子(包括行业、市值等)的其他股票来替代。采用具有相同因子的部分指数成分股进行指数复制即抽样复制,被选择用于复制指数的股票称为核心股票。
对于完全复制而言,由于每只股票都按照指数的比例配置,因此所有股票的权重跟指数的变动是同步的。但是对于抽样复制的股票替代部分而言,由于存在与被替代股票的差别,用于替代的各个部分的权重与实际需要改变了复制组合的代表性。因此,就必须经常监测跟踪误差,根据预测的跟踪误差的扩大情况及时更新复制组合,将其降低到可接受的水平。
假设所有股票的收益率服从多元正态分布,在存在指数成分股之间的预期方差协方差矩阵及指数组合权重的情况下,不难推导出预期跟踪误差,可以用如下公式表示:
其中,PTE (Predicted Tracking Error)是估计的预期跟踪误差(投资组合收益率与指数收益率差的方差),V是指数所有成分股的预期方差协方差矩阵ω是指数本身的权重向量(列向量), ωp是复制指数所用的组合中各只股票的权重向量(列向量)。
借助预期跟踪误差公式,可以预测随着市场情况的变化及持有股票占整个组合的权重变化,组合的跟踪误差可能发生什么样的变化,并及时调整组合。
抽样复制指数常用的技术包括市值优先、分层抽样、最优化等方法。此外还可以根据需要把这些方法混合,组成混合抽样方法。针对不同的市场状况、方法的表现可能不同,必须按需选择。
1)市值优先抽样
把股票按市值从大到小排列,选择排名在最前面的股票。统计出选出的所有股票的总权重,每只股票配置的比例等于该只股票在总权重中所占的比例,然后通过合适的现金配置策略使整个组合的Beta等于目标指数的Beta,这样的方法称为市值优先抽样方法。
不难发现,这种方法的优点是,在使用相同数最股票进行抽样复制时,其市值占比最高,体现了大市值股票的个别风险。此外,市值最大的股票往往也是流动性最好的股票,更有利于投资者进行买卖。
但是这种方法忽略了股票之间的其他共同点,过于偏向于大市值股票。而恰恰有一些股票间的共同因子与市值大小高度相关,这就会造成选择的组合可能出现明显的风格特征与行业特征,使指数跟踪在特定的时间段与目标指数相比出现系统性的偏差。
2)分层抽样
由于不同股票的表现互相并不是独立的,许多股票之间可能存在一些共同的因子。如果把成分股按照是否有共同因子(除市场因子外)分类,在每一类中选择若干股票,就能依靠少数股票达到提高组合对指数的代表性的目的。这种方法不重视股票的个别影响成分,而是努力寻找共同的因素。
股票最重要的共同因子是股票的行业因子。各个行业中的企业一般都具有不同程度类似的供给需求结构和技术水平,容易受到同样因素的影响,保证各个行业都有一定的代表就能把这些影响因素反映在组合中,更有助于以较少的股票提高指数的跟踪效果。
另外,由于市值差异较大的股票有不同的风险结构和不同的投资者群体,类似市值的股票受这些因素影响的程度类似,这种特点构成了基于市值大小分类的不同投资风格。当指数攫盖市值范围较大时,风格因子也是分层抽样需要采用的分类方法。
3)最优化方法
利用历史数据,通过最优化技术求解使跟踪误差最小的配置方法成为最优化方法。
虽然均属于抽样复制,但与分层抽样不同的是,最优化方法关心的不是指数成分股对因子的代表性,而是历史上各只股票之间的相关关系。这种方法假设股票相关性在一段时间内是相对静态的、可预测的。
通过数学推导得出以下结论:如果能够预测未来指数成分股的方差协方差矩阵,在己知股票权重的情况下,可以采用如下公式计算以最小化TE为目标的核心股票最优权重。
假设组合中选择了n只核心股票,还有其他m只股票需要替代。在公式中,ω是核心股票的最优权重(n×l向量),ω是核心股票在目标指数中的权重(n×1向量),V1是核心股票的方差协方差矩阵((nXn矩阵),ω2是非核心股票在目标指数中的权重(m×l向量), Cov2是核心股票与非核心股票之间的协方差矩阵(n×m矩阵)。
最优化方法的最大好处是为复制指数提供了一个整体框架,可以把各种不同影响复制的因素放在一起考虑。
下面是一个案例,利用4种不同的方法进行复制指数后的跟踪误差。
这里使用4种不同的方式复制沪深300指数,实证测试这些方式在2010年1~12月的跟踪效果,结果如表4-1所示。由于中证指数公司并不公开自由流通量数据,因此依靠可得的数据,即使使用完全复制也存在一定的误差。
表4-1,各种方法在不同股票数量下的跟踪误差(年化)