支持向量机(SVM)是目前很流行的一个数学方法,主要用于分类与预测。择时本质上是一个预测过程,即利用过去的数据预浏未来一段时间大盘是上涨还是下跌。但是市场是非线性的,使得传统的线性预测方法效果不佳。由于SVM独特的机制和效果,对非线性预测有非常好的效果,因此利用SVM技术来建立择时模型,可以有效地避免传统回归模型的精度和扩展性问题。
基本概念
在传统的金融分析和理论中,所采用的决策模型往往都是建立在苛刻的假设条件下的,形式上就是一些简单的数学公式。虽然这些简洁的模型很容易理解和解释,但在精度和解释力度上往往偏离了实际情况,金融数据挖掘技术的运用从某些意义上来讲可以突破这些限制,得到更实用、更贴近现实的预测结果。
单就股票市场而言,其中的金融规律复杂,影响因素较多。就其影响因素总体而言,影响股市的变化趋势主要包括国家的经济趋势、股市中的资金状况、股市的市场信心等。最终导致金融变量的取值可能会和很多因素有关,并且其中的相关关系可能是线性的,也可能是非线性的。具体到量化模型而言,有些关系能够用初等函数来表示,而另一些可能没有办法用数学形式来表示。
金融数据中所包含的规律往往时效性非常强,随着时间的推移和环境的变化,金融序列中所蕴含的规律在不断更迭。例如,在熊市中的某些规律往往到了牛市就不再起作用了,传统模型对于金融序列的动态性就束手无策了,而运用数据挖掘技术可以在不断地获得新数据后动态更新以适应新的环境。
而支持向量机((SVM)作为数据挖掘领域应用于模式识别的新技术,它克服了传统的统计模式识别方法存在的缺点,因此其具备良好的机器识别能力。
传统的统计模式识别方法的缺点如下:
(1)传统的统计模式识别方法,只有在样本趋向无穷大时,其性能才有理论的保证。
(2)传统的统计模式识别方法,包括BP神经网络等,在进行机器学习时,强调经验风险最小化。而单纯的经验风险最小化会产生学习问题,其推广能力较差。
(3)传统的统计模式识别方法存在局部极小值的问题。
而作为支持向量机的理论基础—统计学习理论,则是小样本统计估计和预测学习的最佳理论,它解决了传统方法存在的以上问题。