第 9 章 统计推断的概念

9.1 人群与样本

讨论样本时,需考虑下面几个问题:

  1. 样本是否具有代表性?
  2. 人群被准确定义了吗?
  3. 我们感兴趣的“人群”是否可以是无限大 (多) 的?
  4. 我们研究的样本,是仅仅用来观察,亦或是计划对之进行某种干预呢?
  5. 我们从所有可能的人群中抽样了吗?

9.2 样本和统计量

通常我们在进行实验或观察时只是获得了样本的数据。而希望从样本数据去推断 (inference) 总体 (或人群) 的一些特征。我们也许只是想用样本的平均值来估计整体人群的某个特征的平均值。不管是何种估计和推断,都是基于对样本数据的计算,从样本中获得想要推断总体的统计量 (statistics)。我们用已知样本去推断未知总体的过程就叫做估计 (estimate)。这个想要被推断的总体或人群的值,被叫做参数 (parameter),常常使用希腊字母来标记。用来估计总体或人群的,从样本数据计算得来的统计量,叫做估计量 (estimator)

所有的统计量,都有样本分布 (sampling distributions,意为重复无限次取样后获得的无限次统计量的分布)。推断的过程归纳如下:

  1. 从总体或人群中抽样 (样本量 \(n\))
  2. 计算这个样本的合适统计量,从而用于估计它在整体或人群中的值。
  3. 我们还需要决定计算获得的统计量的样本分布 (假定会抽样无数次) 。
  4. 一旦可以精确地确认样本分布,我们就可以定量地计算出使用步骤2中获得的统计量估计总体或人群的参数时的准确度。

9.3 估计

从样本的均值,推断总体或人群的均值是一种估计。我们的目的是,从已知样本中计算一个尽可能接近那个未知的总体或人群参数的值。一个估计量有两个与生俱来的性质 (properties):1) 偏倚 (bias); 2) 精确度 (precision)。这两个性质都可以从样本分布和估计量获得。

  1. 偏倚: 偏倚简单说就是样本分布的均值,也就是我们从样本中计算获得的估计量,和我们想要拿它来估计的总体或人群的参数之间的差距。 (The bias is the difference between the mean of the sampling distribution – the expected or average value of the estimator – and the population parameter being estimated.) 一个小的偏倚,确保了我们从样本中计算获得的估计值(假设我们抽样无数次,计算无数个样本估计值) 均匀地分布在总体或人群参数的左右两边。偏倚本身并不是太大的问题,但是假如样本量增加,偏倚依然存在 (估计量不一致, inconsistent) ,那常常意味着是抽样过程出现了问题。例如:
    用简单随机抽样法获得的样本均值,就是总体或人群均值的无偏估计 (unbiased estimator)。如果抽样时由于某些主观客观的原因导致较小的样本很少被抽样(抽样过程出了问题,脱离了简单随机抽样原则) ,那么此时得到的样本均值就会是一个过高的估计值(upward biased estimator)。

  2. 精确度:估计值的精确度可以通过样本分布的方差或标准差来评价 (简单说是样本分布的方差越低,波动越小,精确度越高) 。样本分布的标准差被定义为估计值的标准误。假如估计量是样本均值,那么样本分布的标准差 (估计量的标准误) 和样本数据之间有如下的关系:

\[\text{true standard error of the mean} = \frac{\text{true standard deviation}}{\sqrt{\text{sample size}}}\]

在一些简单的情况下,通常估计值的选用不言自明 (例如均值,或者百分比) 。但是在复杂的情况下,我们可能可以有多个不同类型的估计量可以选择,他们也常常各有利弊,需要我们做出取舍。

9.4 置信区间

从样本中计算估计量获得的一个估计值,只是一个点估计 (point estimate)。对比之下,置信区间就是一个对这个点估计的精确度的体现。置信区间越窄,说明我们对于总体或人群的参数的可能取值的范围估计越精确。

置信区间通常是成对成对的出现的,即有上限和下限。这样的一对从样本数据中计算得来的统计量,同样也是有样本分布的。 每次我们重新从总体或人群中抽样,计算获得的置信区间都不同,这些置信区间就组成了置信区间的样本分布。总体和人群的参数落在这些置信区间范围内的概率,就是我们常说的置信区间的水平 (\(95\%\)) 。 常用的这个概率值就是 \(95\%, 90\%, 99\%\)

当从样本数据计算获得的估计量的置信区间很宽,说明了这个收集来的数据提供了很少的参数信息,导致估计变得很不精确。

~~看到这里的都是好汉一条啊!我不知道你晕了么有,反正我是已经晕了。 。 。 ~~