随机变量
随机变量( random variable)的概念最初产生于自然科学的实验中。在物理学的发展史上,有一个古老而重要的实验—布朗运动,正是通过对布朗运动实验的研究才使人们能够窥探微观世界。1827年,英国植物学家布朗,在显微镜下观察水中悬浮的植物花粉时,发现花粉在水中不停地做随机运动。
我们将随机实验的每个可以观测的结果称为随机事件,其中有些结果本身就是数量,有些结果可以量化后用数字来表示。随着实验的不断重复,实验者可以观察到不同的结果,并且每次试验的结果都无法预知。在随机实验中,产生一个取不同值的变量,我们称这个变量为随机变量。直观上,随机变量就是测量随机试验结果的量。随机变量可以分为离散随机变量和连续随机变量。当所有可能出现的实验结果都是离散的值的时候,这个随机变量就是离散变量;当所有可能出现的实验结果都是连续的值的时候,这个随机变量就是连续变量。举例来说,抛硬币就是一个简单的随机实验,每次硬币落地后可能正面朝上,也可能反面朝上。如果我们规定出现正面的结果为1,反面为0。这样我们就定义一个离散的随机变量。在金融市场上,证券价格就可以看作连续的随机变量。例如,股票价格受到很多种因素的影响,每时每刻会不断产生出新的价格,但没有人能准确地预测下一个时刻的股票价格。
样本与总体
样本(sample)是指在有限的重复随机实验中所取得的实验结果的值。因为我们不可能无休止地实验直到每一种可能的结果都以自己的概率出现,所以我们通过有限的实验结果来分析全体可能的实验结果的性质。这有限的实验结果就是样本,而所有可能的实验结果就是总体或全体(population)。
在掷硬币的时候,对于每一次投掷,可能的结果只有正面和反面两种情况,那么正面和反面就是这次投掷结果的总体。而在股票价格的例子中,每一个时刻的股价都可以看作是一次产生股价的实验所得到的结果,每一时刻产生的价格有无穷多种可能,而真正实现的只有一个。我们把氮个时刻产生股价的过程看成是相同的股价产生实验,那么股价的历史数据就是这个随机实验结果的样本。虽然历史数据不能完全表现出每一种可能的股价,但它足以体现出股价变化的主要性质。因此,通过统计方法我们可以利用样本的数据来推测总体的性质。