在本章开头的部分,作者简单介绍了多因子选股策略是如何在若干个有效因子的基础之上进行构建的。随后作者展示了两个因子的实际案例,可以看到,流通市值因子和上个月收益反转因子在所研究的样本数据之上是两个具有预测效力和盈利能力的选股因子。在这一节中,
作者就将这两个因子组合成多因子模型并用来选择股票,这样的做法一来遵循循序渐进的过程,二来也简化了多因子策略的复杂度,用最基本的两个选股因子来做直观的案例展示,从而方便读者更好地了解多因子选股策略的整体框架。需要注意的是,本书中使用的两个选股因子都在2014年年底和2015年年初出现了比较极端的失效情况,因此多因子选股策略会相应地经历一个短暂但程度较大的回撤也是必然的结果,这在本节和后面章节中的实际案例里都会有具体的体现。不过就多因子选股策略的本质而言,有效因子越多、因子配置越均衡,多因子选股策略受到单因子失效影响的程度也就会越小,这其实和投资组合配置的情况是类似的,实际交易中研究人员还是应该尽可能地多发掘出-些相关性较小的选股因子,从而增强多因子选股策略的稳健性。
为了研究多因子选股策略,作者获取的同样是自1991 年1月开始直到2015年6月底结束的国内股票月度数据。所选股票的范围酒盖在深圳证券交易所进行交易的所有A股,包括主板、中小企业板和创业板三个板块,以及在上海证券交易所进行交易的所有A股。月度数据则包括月末收盘时股票的复权后月度收益率,以及股票的月度流通市值,这其实与单个市值因子研究中的样本数据完全一致。但是在进行线性回归之前,需要对流通市值进行对数化处理,其目的是为了更好地反映出月度收益率和流通市值之间的线性关系。当然,还应该存在着更为适合的数据预处理手段,使得因子和收益率之间的线性关系更加明晰。不过这属于第2章2.2节中提到过的数据准备工作,不在本书讨论范围之内,因此不再做深入研究,读者可以在研究过程中自行摸索合理的处理方法。
开始挑选股票进行买卖的时间同样从2011年12月收盘开始,也就是说在回溯测试样本中将一共交易四年半的时间。1991 年1月到2010年12月的所有月度流通市值数据和月度收益率则作为开始买卖股票前的备用数据,不过对于本节中简单的多因子选股策略而言也只需要用到2010年12月这一个月的数据。而在整个交易过程中,回溯动作也设定为只进行买入和卖出操作,不进行卖空的操作,资金全部用于持有股票,与单因子的研究环境一致。
回溯测试的过程如下,在第一个选股和交易的时间点,即2010年12月收盘时,将此时所有股票的月收益率、流通市值与2011年1月的收益率进行匹配,并进行回归估计,如下所示:
式中,r,是2011年1月的月收益率;S,,是2010年12月收盘时股票的流通市值;r :是2010年12月的月收益率,通过估计该回归式可以得到针对2011年1月的a、b、b:三个参数估计值。
首先将时间按月份向后推进,每-一个月都可以得到一组参数估计值,直到2015年6月收盘时结束,一共54组估计参数;然后将54个a进行平均得到a,将54个b平均得到历,将54个br平均得到万,那么基于整个样本所得到的最终回归结果就是
同第4章中所介绍的简单择时策略一样, 作者在估计完回归式之后,又会将该回归式用到相同的样本数据上进行交易的模拟。虽然这样会产生未来信息的问题,但是相对简单的流程处理可以方便读者进行理解。具体来说,就是在2010年12月收盘的选股时间点上,基于2010年12月所有股票的月度流通市值和月度收益率数据,使用最终得到的回归式计算得到所有股票在2011年1月的收益率的预测值。其次将股票按照收益率预测值从高到低进行排序,再按顺序等分为若干个部分,每一等份中的股票又按照等权重进行组合,也就是买入占用的资金量相等的组合。然后在2011年2月底进行相同的排序和等分过程,各个等份中的股票组成基于预测收益率排序的变化而发生改变。之后每一个月收盘时都进行相同的操作,直到交易样本结束即2015年6月收盘为止。
排序完成之后的处理,与单因子的研究内容完全-致。首先根据每一个等份下长度为54的收益率序列,计算出各个等份的平均月度收益情况,进而判断多因子模型预测下一期收益率的整体趋势性。不过由于多因子模型本身的作用不在于挑选合适的因子,因此这.部分的结果仅作参考,实际意义小于其在单因子研究中的作用。交易策略方面,则根据排序中的第一个等份选择股票,这也就是每一个月多因子选股策略所选择的股票组合。根据这个长度为54的收益率序列,就可以计算出多因子选股策略的净值走势。需要指出的是,多因子选股模型预测的是下一个月各只股票的收益率水平,因此按预期收益从大到小排序,排序第一的股票就应该是建仓的选择,这是符合交易逻辑的。而本书中挑选出来的两个单因子恰好都是收益预期与因子大小具有反向关系,因此按照因子从小到大进行排序,建仓选择才是排序第--的股票组合。希望读者能够区分这之间的差别。
和单因子的研究设置相仿,作者将所有股票按照预期收益大小排序划分为3等份、10等份、30等份共三种情况来加以研究。