股票市场交易规律显示:在股价波动的过程中,整个市场并不是经常性地普涨普跌,而是呈现出板块轮动、涨跌不一的状况。其实金融风险并不可怕,如果能够发现股票板块的运动规律及其相互的联动关系,那么金融风险在一定程度上可以通过风险流动得以规避。
1、数据与模型构建
案例:基于关联规则的板块轮动策略
本案例使用的数据,来自2007年1月4日至2008年3月31日A股市场的21个板块指数的日收盘值,取得295条口收盘数据记录共6195个观察值进行分析。这21个板块指数分别为采掘指数、地产指数、食品指数、金属指数、批零指数、石化指数、运输指数、制造指数、机械设备指数、服务指数、金融指数、水电指数、医
药指数、建筑指数、造纸指数、IT指数、农林牧渔指数、纺织指数、传播指数、电子指数及木材指数,它们基本涵盖了现有证券交易系统中所有板块的历史交易信息,为数据挖掘建模提供了较为完整的数据样本。
在进行关联规则挖掘之前,必须对所收集的数据进行预处理,根据每种股票板块指数在当天交易的涨跌情况将其对应的日收盘数据转化为二项数值,“I”代表上涨,“0”代表下跌。如表11-4所示为经过数据预处理后得到的包含295条记录的布尔关系表数据片断。
表11-4 21种股票板块指数布尔关系表数据片断
2、数据实证结果
数据预处理后,根据股票板块指数“涨”、“跌”情况,采用二值型关联规则算法进行挖掘,这里采用Apriori算法来实施关联分析。设定当支持度阈值为0.5,置信度阈值为0.95时,可以从模型中找到许多有意义的强关联规则,例如:
金属、机械设备、石化3种指数上涨、制造指数上涨,则置信度=100%。
即当金属、机械设备、石化3种指数上涨时,100%的情况下,制造指数也在上涨。而且该规则作用度为1.62、支持度为51.18%,说明制造指数变动受金属、机械设备、石化3种指数的影响较大,该规则具有较高的应用价值。各个板块之间的关联如图11-4所示。
综合置信度、支持度与作用度3个因素进行分析,可以看到,模型的主体由制造、石化、运输、机械设备、医药、电子、纺织及水电8种指数间的关联规则构成;采掘、服务、金属、建筑、造纸、IT及农林牧渔7种指数也有着强关联规则;而批零、木材两种指数均只与石化指数表现出紧密的联动关系。此外,模型中未发现地产、食品、金融及传播4种指数的关联规则,说明它们在板块联动中的作用较弱。
图11-4 主要股票板块指数的Web节点
从连线数量角度来看,它以石化与制造两种指数为核心,向外辐射连接其他股票指数;电子、机械设备、纺织、运输及医药5种指数散开的连线也较多;而金属、IT、建筑3种指数在图中只有单根连线。此外,木材、服务、批零、农林牧渔、采掘、造纸及水电7种指数由于关联频数低,均没有连线,而是作为孤点在图中显示。从所有连线的关联程度强弱来看,石化、机械设备两种指数与制造指数的关联程度是最强的,而医药、纺织两种指数与制造指数的关联程度最弱,其他连线关联程度居中。
可以得出以下的结论:
(1)制造、石化指数作为关联规则的核心,与其他板块指数(除金融、地产、食品与传播4种指数之外)之间有着紧密的关系。通过它们之间的强关联规则进行板块组合分析,往往可以在某一板块出现明显涨跌状况的情形下,预测出相关联的板块运动趋势,然后进行风险管理,以此达到规避风险或追求利润的目的。
(2)模型结果显示,金融、地产、食品与传播4种指数与其他板块指数不存在强关联规则。也就是说,在板块联动过程中,它们的联动效应是不显著的,这4个板块的涨跌主要考虑国际市场、国内宏观经济、行业状况及其他因素。所以,在证券交易过程中,它们不是通过板块轮动避险的最佳选择对象。