第三节交易是博弈而不是匠艺
博弈论(GameTheory)也叫“对策论”、“赛局理论”。属于应用数学的一个分支,目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学(经济学)理论和方法,也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。博弈论思想古已有之,我国古代的《孙子兵法》不仅是部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博究局势的把握只停留在经验上,没有向理论化发展。
近代对于博弈论的研究,开始于策墨洛(Zermelo)、波雷尔(Borel)及冯·诺伊曼(VonNeumann)。1928年,冯·诺伊曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺伊曼和奥斯卡·摩根斯特恩共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弃结构并将博弈论系统地应用于经济领域,从面奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(JohnForbesNashJr)利用不动点定理证明了均衡点的存在,为博弃论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起了推动作用。今天博弈论已发展成一门较完善的学科。博弈论和决策论(DecisionTheory)、运筹学(OperationsResearch)等一起构成现代企业经济、军事战略等系统管理学的理论基础。博弈的分类根据不同的基准也有所不同。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有就是合作博弈,如果没有就是非合作博弈。
从行为的时间序列性划分,博弈论进一步分为两类:静态博弈和动态博弈。静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解“囚徒困境”就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。
按照参与人对其他参与人的了解程度,可分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益丽数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解得不够准确,或者不是对所有参与人的特征、策略空间及收益两数都有准确的信息,在这种情况F进行的博弈就是不完全信息博弈。
目前,经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(NashEquilibrium)、子博弈精炼纳什均衡(SubgamePerfectNashEquilibrium)、贝叶斯纳什均衡(BayesianNashEquilibrium)、精炼贝叶斯纳什均衡(PerfectBayesianNashEquilibrium)。博弈论还有很多分类,比如以博弈进行的次数或者持续长短可以分为有限博弈和无限博穿:以表现形式也可以分为一般型(战略型)或者展开型等。
面对如许重重迷雾,博弈论怎样着于分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解,从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯.诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈一好比两个人下棋或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方)、策略集合(所有棋着)和盈利集合(赢子输子),能否且如何找到一个理论上的“解”或“平衡”,也就是对参与双方来说都最“合理”、最优的具体策略?怎样才是“合理”?应用传统决定论中的“最小最大”准则,即博弈的每一方都假设对方的所有攻略的根本目的是使自己最大限度的失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对于每一个二人零和博弈,都能够找到一个“最小最大解”。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在于,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性”思想是“抱最好的希望,做最坏的打算”。
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(Prisoners'Dilemma)博弈模型,如表8-1所示。该模型用一种特别的方式为我们讲述了警察与小偷的故事。假设有两个小偷A和B联合犯事,私人民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年。如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
表8-1囚徒困境博弈决策矩阵
我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表8-1中的四种行动选择组合中,(抵赖,抵赖)是帕累托最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。
对于投机交易而言,交易者得到的结果不仅仅取决于他自己的行为,因为结果都是由代表性交易者(有影响力)共同决定的,所以一场交易的获利与否需要考虑到所有代表性参与者的行为。请看表8-2,这是一个忽略了很多细节的模型,但是基本可以模拟交易这个博弈过程,当然这里主要针对是投机交易,也就是零和博弈。在表8-2中,A代表我,B代表机构交易者,C代表散户交易者。如果机构交易者和散户交易者都做空,则市场上基本缺乏进一步做空的力量,所以如果我加入空方阵营,则会遭遇大逆转走势,亏损自然也很大,简单计为-3。如果机构交易者做空,而散户交易者做多,则表明市场上还存在很多散户力量可以转为空头,而且机构交易者一般在趋势的前段和中段持仓,则表明下跌趋势还未结束,所以这时候我们加入机构交易者一边,可以赚信息和资金上处于劣势的散户交易者们的钱,简单计为2。当市场上机构交易者们做多,而散户交易者做空,我们应该同此理,站在机构交易者一边,但是,如果我们站在散户一边,则亏钱,简单计为-2。当机构交易者们和散户交易者们都做多的时候,市场肯定是缺乏进一步上涨的动量了,此时做空则可以获利不少,简单计为3。这是对表8-2“A做空”一行的介绍,“A做多”一行也类似。
表8-2交易这个博弈过程
表8-2很好地模拟了真实短线交易中面临的博弈情景,如果仔细去揣摩其中的意义,可以对大家的交易起到不小的促进作用。即使只掌握最浅一层的含义,也能对你的交易思路有不少启发:你交易行为的绩效取决于其他参与者的行为!