上一节中作者以国内所有A股为样本介绍了多因子选股策略的推进分析流程,并发现在特定的样本期以及策略设置下可以得到一个正面的盈利结果。在这部分的研究中,由于回归模型来自选股因子的交易逻辑,因此并没有具体的设置参数需要提前确定。但是正如第6章中提到过的,训练样本的大小也就是图8-1中白色框的长度,作为推进分析本身的设置参数是需要在分析之前人为给定的。在这一节中,作者就主要针对训练样本大小这一参数设置进行多因子选股策略的双层推进分析,从而进一步判断多因子选股策略的实际盈利能力。当然,这也同时为读者提供了一个可以参考的多层推进分析示例,特别是针对推进分析自身设置所进行的多层推进分析示例。至于多因子选股策略的构造形式,读者可以参考上一节以及第5章5.4节的相关内容,这里不再赘述。
多层推进的数据也和前面所获取的数据一致, 样本酒盖在深圳证券交易所和上海证券交易所进行交易的所有A股,具体包括月末收盘时股票的复权后月度收益率,以及股票的月度流通市值。在进行策略研究之前,为了更好地反映出月度收益率和流通市值之间的线性关系,需要对流通市值进行对数化处理。图8-11描述了多因子选股策略双层推进分析中第二层的数据划分和运行情况,而为了简化示意图,推进分析第一层的设置没有在图中进行展示。但是值得注意的是,这一节研究中第层推进分析的具体情况与第7章7.5节中的情况又有所不同。在自回归择时策略的双层推进分析中,第二层推进分析主要针对的是自回归模型的阶數,因此第一层白色框的长度依然保持为1年没有改变,第一层推进分析的具体形式也相对比较固定。但是在这里,第一层白色框的长度正是第二层推进分析所针对的检验对象,因此图8-11中没有展示的第一层推进分析的结构其实是随着第二层的检验过程面不断变动的。
下面进行具体的说明。在第二层推进分析的第一行操作中,浅灰色框为第一层白色框长度设置的优化期,同时也是第一层推 进分析的模拟交易期,从2008年1月开始,直到2010年12月结束,共计36个月。对白色框长度的优化采用完全的网格搜索,也就是将长度分别设置为1 ~ 120,使用与上一节中雷同的推进分析流程逐个测试不同长度下的模拟交易情况,进而选取盈利能力最强的白色框长度设置作为最优结果。因此,第.行操作中没有具体显示的白色框最远回溯到120个月之前,也就是1997年1月。再加上估计多因子回归模型所需要用到的前一个月的备用数据,全部的双层推进分析所使用的数据实际从1996年12月开始。需要说明的是,由于中国股票市场的迅速发展,较早的样本数据与当前的股票数据在内在特征上是否具有较大差异,显然是一个值得考虑的问题。因此在本节这种样本期较长的情况下,有必要对研究结果持有更高的怀疑态度。
在确定了第一行的最优白色框长度之后,就可以将该长度设置固定到深灰色框的多因子回归模型之上,进行相似的第一层推进分析操作,也就是根据前期数据估计出回归模型系数之后,在2010年12月收盘的选股时间点上,基于2010年12月所有股票的月度流通市值和月度收益率数据,使用得到的回归式计算出所有股票在2011年1月的收益率的预测值。然后将股票按照收益率预测值从高到低进行排序,再按顺序等分为若干个部分,每一等份中的股票又按照等权重进行组合,也就是买入占用的资金量相等的组合。在进行完一行的操作之后, 将所有的数据框都分别向后推进一个月,重复相同的研究过程,直到最后一行为止。
在得到了所有深灰色框中的排序结果之后,需要进行的处理实际上也就与其他因子选股研究流程完全-致了。首先根据每一个等份下长度为54的收益率序列,计算出各个等份的平均月度收益情况,进而判断多因子模型预测下一期收益率的整体趋势性。交易策略方面,则根据排序中的第一个等份选择股票,这个序列的股票组合即是每一个月多因子选股策略所选择的股票组合,而该等份的收益率序列也就是策略在每个月下的交易收益。根据这-长度为54的收益率序列,可以计算出多因子选股策略在深灰色框模拟交易下的净值走势。
深灰色框下的研究设置依然沿用前面研究选股策略时所采用的设置,即将所有股票按照收益预期大小排序划分为3等份、10 等份、30等份共三种情况来加以研究。