统计决策和推断里最基本的概念就是总体与样本。统计学的一个基本任务就是通过样本的特性来推测或掌握总体的特性。
而且,既然总体的特性是由样本的特性推断出来的,就存在可靠性的问题。其中结论的可靠性与样本量的大小有直接的关系:一般来说,样本量越大,得到的统计结论就越可靠;样本量越小,结论就越不可靠。
因此,在处理统计问题时,一个很基本的问题就是:样本量取多大合适?样本量小了,缺乏可靠性,样本量大了,费时费力。而且有些试验还具有毁灭性,抽样的时候不适合进行过多次数。
如下例:[例]某灯泡厂6月份引进新设备,生产了一批新灯泡,数量为10万只,现在要检验这批灯泡是否合格。一只灯泡如果使用寿命超过1000小时,就认为是合格的。
如果该批灯泡中合格率达到90%,就认为这批灯泡是合格的。要检验这批灯泡是否合格,最好的方法就是抽样检验。
按照统计推断原理,从中随机挑选100只灯泡进行试验,记录其中不合格的数量。以此来判断这批灯泡是否合格:如果其中有超过10只不合格灯泡,那么样本里不合格的概率超过10%,所以也认为整批灯泡不合格率超过10%,否则就认为是合格的。
在这个问题中,100就是样本的数量。为了准确可靠地得到该批灯泡的合格率,样本数量越大自然越好。
比如,如果将10万只灯泡都逐一试验一次,那么最后得到的结论是最可靠的,可是这样的话,这10万只灯泡也就作废了。如果样本数量过少,比如检验10只,那很有可能由于“运气”不好,正好就有2只不合格的被抽到了四,实际上整批灯泡很有可能是合格的。所以,样本过少的话,结论的可靠性就要打折扣。
在进行股市分析时也经常要碰到类似的问题,比如在使用指南针软件的评测功能时,要考虑时间范围,这个时间范围实际.上就相当于样本量的大小。
时间范围太小的话,评测结果就不太可靠。比如,某个定式在2004年初成功率达到了98%,但这个定式的成功率高很有可能仅仅是因为2004年初的牛市。而如果统计时间太长的话,计算量要大很多,且时间跨度大,有可能总体的性质都会发生变化,比如2001年到2003年底是熊市格局,那么这段时间总结出来的规律就有可能不适合于牛市操作。
所以,对于统计推断和决策,样本量的选取是重要的,一般来说,在条件允许的情况下,尽量使得样本量足够大。但是在考虑到成本的情况下,一般是在保证所得结论有足够可靠性(比如可靠性达到了80%)的前提下,样本量越小越好。关于样本量的确定有两种方法。通常的统计推断一般是在抽样之前就预先给定样本量的大小。
实践表明,这种方法能解决很多问题,但是在有些情况下,会导致不必要的浪费,甚至有时还会导致错误的结论。这里仍以刚才的例子进行说明。
比如在抽取100只灯泡作为样本试验时,假设试验不是一同进行,而是逐一进行,如果在前50只灯泡里面已经发现了有20多只不合格品,那么基本上就可以不用往下进行试验(因为按这个试验结果,合格率至少应该在80%以下),就可以断定该批灯泡是不合格的。这种检验方法不同于通常的检验,因为它并没有事先固定样本量,这种思路就是序贯方法。