保密对于基金行业并不陌生,但是对于量化投资来说,保密基本上是第一个需要考虑的问题。对于算法交易来说,策略算法就是一切的核心。多一个人使用同样的算法就意味着利润空间少了一分。也正是因为如此,任何有可能曝光算法的信息渠道都会被严加看管。而且数量化基金对交易技术的追求可以用醉心来形容,任何过去被证明是失败的算法模型都是基金的宝贵财富。当我们来开始走进这个领域的时候,值得庆幸的是中国的投资者暂时不用担心毫秒,乃至微妙级别的抢通道。但是算法的保密性还是应该得到重视的。举两个例子读者就会发觉这群顶尖的数量化基金究竟严苛到了什么程度。
西蒙斯的复兴技术在2007年遭到两名前员工AlexanderBelopolsky和PavelVolfbeyn的指控,“公司违反证券法规并‘鼓励’他们协助这种行为”。不要以为这两个博土是为了雁过拔毛的勒索这只下金蛋的母鸡。实际上他们更有可能希望能躲避开复兴技术越远越好。复兴技术在2003年12月起就开始了没完没了的诉讼追杀,而两位博土使用的这一策略也可能仅仅是为了传递“兔子急了还咬人”的信息吧。
复兴技术给彭博社的回复也是相当干脆:“这些无根据的指控仅仅是让我们分心于现有案件的烟雾弹。”但究竟为何复兴技术会对这两个人不依不饶呢?《解读量化投资》一书中引用了一段律师的话:“复兴技术对我的客户穷追不舍的原因就是想杀鸡给猴子看,防止复兴技术的其他雇员跳槽到其他公司另起炉灶。”不知道是不是“小人之心度君子之腹”,笔者对这个说法深信不疑。
实际上,从两人诉讼事后的报道中看不出什么特别重要的东西。比方说,Volfbeyn被上级要求设计一种方法或电脑指令去显示机构交易组合系统原本希望保密的信息。这到底犯了哪门子法笔者还真是搞不清楚。Volfbeyn所谈论的第二个关于限价指令的算法更是匪夷所思,可以被任何人看到的公开信息处理究竟又招惹到谁了呢?没有过多信息的“大骗局”我们也不谈了,但整个事件留给笔者的印象是威胁。两名前员工在用法院为跳板威胁复兴技术公司:“如果复兴技术再如此不依不饶,他们将在法院里把复兴技术的家底抖出来。”这似乎也足以看出复兴技术已经把这俩人逼到了什么份上。复兴技术大动干戈就是为了保护好自己的算法核心。
交易的隐蔽性是基金的共同追求。这个道理不仅仅在国外市场上能够应验,在国内A股也是有了一次难得实例。上交所曾经短暂推出top-view赢富数据,在这个数据中交易席位信息会被以延迟1-2天左右的时间展示给个人投资者。聪明的个人投资者通过数据挖掘可以追踪到部分机构的买卖行为,进而以几乎同一时间进行相应的资产配置。笔者曾经就是topview的使用者之一,平心而论数据确实有用。但正是零和博弈的属性让这个有用的数据分析手段走进了坟墓。由于泄漏了机构投资者的行踪,直接影响到了机构投资者的收益率,可想而知他们的怨言有多么大。监管机构要求上海证券交易所自2009年1月1日起停止提供该数据服务。数据的使用者很多都是普通的投资人,有一些能力稍强的机构也参与其中。而就是这样的杂牌队伍,面对着国内基金也想出了应对办法。读者应该不会吃惊为什么一流的数量化基金往往将交易在不同的通道内分块实现。这样即便拿到有限的交易记录,也很难反推出交易模型的任何信息。
其实,我们不妨设想一下当两家基金同时使用一个策略会出现什么问题。由于交易主机接收指令必有先后,所以谁的指令更早的被接受,谁就有可能得以成交。而另一个指令则会面临成交失败或帮助拉动价格的效果。这只是一个笨推想,市场的微观结构中充满了各种各样的套利可能。算法交易发达的国家曾经出现过闪电指令,其操作原理是“借助电脑系统与交易所联网优势,比其他交易者早约500毫秒‘提前’看到市场价格波动与买卖成交状况,而电脑则在20-500毫秒之间相应做出套利指令。”从陆续被各大交易所叫停的情况来看,闪电指令确实有“先跑”的嫌疑。而另一个层面也说明,让高频基金们费尽心思的拉近与交易所主机的物理距离不是没有道理。当我们国内投资者醉心于价值投资这套忽悠人的东西的时候,国外的对冲(高频交易)基金们在用数量化算法赚得暴利。不过,似乎国内2暂时还不会遇到这样的问题,因为我们的交易所对不以成交为目的的挂单行为打击较为严厉,所以闪电指令中用频繁挂撤单方式引诱其他算法交易执行充当对手单的方法在国内可能实现不了。当然,算法交易的实现方式是多样的。只要保密方式做得好,完全也不必非要对响应时间过度依赖。但一个重要的前提是掠夺性算法交易的出现并不会扩展到你所使用的算法交易范围。当然,有掠夺性算法就有反抗措施,但没有了保密这个大前提的保驾护航,一切都是无用功。
普通投资者使用数量化方法会有一个棘手问题——滑价风险。尤其是在股票市场采用数量化分析手段,更是因交易指令集相对较少而加重了此种风险发生。而保密做得不好会直接导致滑价严重。在常规的处理方式中,增大回报风险率是一种手段,但这对策略算法和资金管理算法都提出了更为苛刻的要求。也正是因为这个原因,笔者将保密作为了第一个要着重强调的领域。一旦读者开始投入到数量化算法的开发中,记得做好保密措施。