如何用传统计量经济学方法处理分笔数据?
大部分的现代计算技术都是用于处理均匀时间间隔数据的,比如月数据、周数据、日数据、小时数据,以及其他固定数据等。研究人员对固定时间间隔的传统依赖性主要来源于以下几个方面:
每日数据相对容易获得(从19世纪20年代开始报纸就已经公开发布每日报价)均匀间隔数据相对易于处理“驭动证券价格和收益的因素在短期之内应该不会有太大变化”( Goodhart和0' Hara 1997, pp, 80-81)这类过时观点的影响
分笔数据和传统均匀间隔数据的主要不同之处在于,分笔数据之间的时间间隔是有变化的。一种应对这种数据不规则性的方法就是按照事先确定的时段(例如,每小时或每分钟)进行采样。
传统的金融文献对收盘价进行取样。例如,如果要将分笔数据转换成分钟“线”( bar),那么按照传统的方法,任一分钟的买价或者卖价都将是这一分钟最后一笔达到的报价。如果该分钟没有报价达到,就用上一分钟的收盘价作为这一分钟的收盘价,并且依此类推。这种方法隐含的假设是在没有新报价出现的情况下,价格会保持不变,而事实上并不一定如此。
Dacorogna等人(2001)提出了一种可能更精确的报价采样方法:在相邻报价之间进行线性时间权重插值。插值技术的核心假设是,在任意给定时间,未观测到的报价处于与它相邻的两个观测到的报价连接而成的直线上。
另外一种评估分笔数据波动性的方法是使用混合分布模型( mixtures ofdistributions model, MODM)对高频数据的分布进行建模。例如,Tauchen和Pitt,证明,如果市场价格的变动服从正态分布,那么价格变动与交易量——起近似服从联合正态分布。
分笔数据与低频数据大相径庭。利用分笔数据可以创造很多在低频数据下无法获得的交易机会。