参数估计与假设检验

概率论与数理统计\
数理统计基本概念

参考:我应该对显著性水平使用什么值?

参数估计 指用样本估计总体分布的参数。分点估计和区间估计。\
假设检验 指对总体情况的假设做检验,在给定显著水平下做出拒绝或接受的判断。

参数的点估计

构造一个适当的统计量 $\hat{\theta}=\hat{\theta}(X_1,X_2,…,X_n)$, 作为对总体参数 $\theta$ 的估计。称函数(也是随机变量) $\hat{\theta}$ 为参数 $\theta$ 的 估计量, 代入样本观测值得到函数值,称为 估计值

矩估计

矩估计的依据:大数定律

用总体矩表示总体参数,然后用对应样本矩作为总体矩的估计,达到以样本矩估计总体参数的目的。以下用矩估计期望 $\mu$ 和二阶中心矩 $M_2$:

$$ \hat{\mu} = \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \
\hat{\sigma}^2 = M2 = \frac{1}{n} \sum{i=1}^n (X_i - \overline{X})^2
$$

极大似然估计

按照最大可能性估计参数。构造抽出当前样本的概率——似然函数,(常用 似然方程)估计最优参数使该概率最大。

似然函数:样本个体概率之积(离散型)或概率密度之积(连续型),记为 $L(x_1,x_2,…,x_n;\theta_1,\theta_2,…,\theta_m)$;\
似然方程:似然函数的对数对参数求偏导

$$ \frac{\partial\ln L}{\partial\theta_k},\quad k=1,2,…,m$$

估计量的优良性准则

不同方法求出的估计量很可能不同,估计量的优良性准则就可用于挑选优良估计量。

无偏性

如果 $E(\hat{\theta})=\theta$, 则称 $\hat{\theta}$ 为 无偏估计量。 样本方差是总体方差的无偏估计。

有效性

如果无偏估计 $\hat{\theta}_1$ 和 $\hat{\theta}_2$ 满足 $D(\hat{\theta}_1) \le D(\hat{\theta}_2)$, 则称 $\hat{\theta}_1$ 比 $\hat{\theta}_2$ 有效。如果 $\hat{\theta}$ 是 $\theta$ 估计中方差最小的,称为 最小方差无偏估计

相合性

估计量应随着样本容量增大而接近总体参数的真值。当样本容量 $n\rightarrow \infty$ 时, $\hat{\theta}_n$ 依概率收敛于 $\theta$, 即对任意 $\epsilon > 0$, 满足

$$ \lim_{n\rightarrow \infty} P{ |\hat{\theta}_n - \theta| < \epsilon } = 1 $$

则称 $\hat{\theta}_n$ 为 $\theta$ 的 相合估计量一致估计量

区间估计

点估计不能给出估计值的可信程度,区间估计弥补了这点。区间估计指估计参数的取值区间及对应的可信程度(概率)。它有 2 个基本要求,可信程度(概率)尽可能大和区间尽可能小,显然这是矛盾的。一般的做法是先指定可信程度,再在该前提下尽可能缩小区间。

如果满足

$$ P{\hat{\theta}_1(X_1,X_2,…,X_n) \le \theta \le \hat{\theta}_2(X_1,X_2,…,X_n)} = 1 -\alpha $$

则称 $[\hat{\theta}_1,\hat{\theta}_2]$ 为 $\theta$ 的 置信度 为 $1-\alpha$ 的 置信区间

枢轴变量法

几个抽样分布定理 中,可见 统计量、总体分布参数与抽样分布 三者存在一定关系,利用这些关系构造“统计量与总体参数的函数”——服从已知分布的 枢轴变量, 及其指定置信度下的概率方程,解出枢轴变量估计区间,进而解出参数估计区间。

例如,已知 正态 总体分布方差 $\sigma^2$ 和一个容量为 n 的样本,给定置信度 $1-\alpha$, 求期望 $\mu$,可构造枢轴变量

$$ U = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1),\quad because\; \overline{X} \sim N(\mu,\frac{\sigma^2}{n}) $$

$$ \Rightarrow P{ -u{\alpha/2} \le U \le u{\alpha/2}} = 1-\alpha $$

其中 $u_{\alpha/2}$ 是正态分布 上侧 $\frac{\alpha}{2}$ 分位数, 可以查表解出得到 $U$ 的估计区间,进而解聘 $\mu$ 的估计区间。

一个正态总体的区间估计

以下是用枢轴变量法解出的正态总体参数的估计区间结果。 $\mu,\sigma^2$ 分别为期望、方差,指定置信度为 $1-\alpha$。

$\mu$ 置信区间

$$ [\overline{X}-\frac{\sigma}{\sqrt{n}}u{\alpha/2},\;\; \overline{X}+\frac{\sigma}{\sqrt{n}}u{\alpha/2}],\quad with\; \sigma^2\; known$$

$$ [\overline{X}-\frac{S}{\sqrt{n}}t{\alpha/2}(n-1),\;\; \overline{X}+\frac{S}{\sqrt{n}}t{\alpha/2}(n-1)],\quad with\; \sigma^2\; unknown$$

其中 $u{\alpha/2},\;t{\alpha/2}$ 分别是正态分布与 T 分布的上侧分位数。

$\sigma^2$ 置信区间

$$ [\frac{(n-1)S^2}{\chi^2{\alpha/2}(n-1)} ,\;\; \frac{(n-1)S^2}{\chi^2{1-\alpha/2}(n-1)}] ,\quad with\; \mu\; unknown $$

其中 $\chi^2{\alpha/2},\;\chi^2{1-\alpha/2}$ 为 $\chi^2$ 上侧分位数。

两个正态总体的区间估计

以下是用枢轴变量法解出的正态总体参数的区间估计。 $\mu_1,\sigma_1^2$ 与 $\mu_2,\sigma_2^2$ 分别为两个总体的期望、方差,指定置信度为 $1-\alpha$。

$\mu_1 - \mu_2$

$$ [\overline{X} - \overline{Y} - u_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n2}} ,\;\; \overline{X} - \overline{Y} + u{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}} ],\quad with\; \sigma_1^2,\sigma_2^2\; known$$

如果 $\sigma_1^2,\sigma_2^2$ 未知但相等,则区间为

$$ [(\overline{X}-\overline{Y})-t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n2}} ,\quad (\overline{X}-\overline{Y})+t{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}] $$

$$ S_w = \sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} $$

其中 $u{\alpha/2},\;t{\alpha/2}$ 分别是正态分布与 T 分布的上侧分位数。

$\frac{\sigma_1^2}{\sigma_2^2}$ 区间

$$ [\frac{S_2^2}{S1^2}F{1-\alpha/2}(n_1-1,n_2-1),\;\; \frac{S_2^2}{S1^2}F{\alpha/2}(n_1-1,n_2-1)],\quad with\; \mu_1,\mu_2\; unknown$$

其中 $F{\alpha/2},F{1-\alpha/2}$ 为 F 分布上侧分位数。

大样本方法

用“样本均值”与“总体期望方差”构造出枢轴变量,使之满足中心极限定理,当样本容量足够大时,近似服从正态分布,从而得到指定置信度下的概率方程,解出置信区间。如果总体期望方差均未知,可用点估计代替其中一个解另一个。

单侧置信区间

指估计区间只要求上限或下限,与双侧置信区间解法区别不大。

假设检验

为了检验假设 $H_0$, 称为 原假设零假设, 假定 $H_0$ 是正确的,进行推导,如果指导出小概率事件,就有理由拒绝原假设,反之,接受原假设。

原假设的逆命题 $H_1$ 称为 对立假设备择假设。 使原假设接受的(根据假设构造的) 检验统计量 取值区域称为 检验的接受域, 反之为 检验的拒绝域

假设检验的两类错误

假设检验可能犯两类错误, 第一类错误“弃真”第二类错误“纳伪”。 犯第一类错误的概率:

$$ P{ 拒绝 H_0 | H_0 为真} = \alpha $$

称为 显著性水平, 通常是一个 小概率第一二类错误概率发生概率是互相矛盾的, 在实际应用中,根据二者犯错代价设置显著性水平大小。(参考:我应该对显著性水平使用什么值?

显著性检验的步骤

整个过程类似参数区间估计

  • 提出假设
  • 构造检验统计量,并 在 $H_0$ 成立的条件下, 能确定检验统计量的分布
  • 选定显著性水平 $\alpha$, 确定拒绝域
  • 根据样本观测值和拒绝域,作出检验决策

单个正态总体假设检验

期望 $\mu$ 检验

$H_0: \mu=\mu_0,\quad H_1: \mu \ne \mu_0$

总体方差 $\sigma^2$ 已知, 检验统计量:

$$ U = \frac{\overline{X} - \mu0}{\sigma/\sqrt{n}} \sim N(0,1),\quad 拒绝域:|u|> u{\alpha/2} $$

总体方差未知, 检验统计量:

$$ T = \frac{\overline{X} - \mu0}{S/\sqrt{n}} \sim t(n-1),\quad 拒绝域:|t|> t{\alpha/2}(n-1) $$

其中, $u{\alpha/2},\;t{\alpha/2}(n-1)$ 为正态分布与 T 分布上侧分位数。对于备择假设为不等式的情况,统计量不变,拒绝域稍做变化。

方差 $\sigma^2$ 检验

$H_0: \sigma^2=\sigma^2_0,\quad H_1: \sigma^2 \ne \sigma^2_0$

总体期望未知,检验统计量:

$$ \chi^2 = (n-1)\frac{S^2}{\sigma0^2} \sim \chi^2(n-1),\quad 拒绝域:\chi^2 > \chi{\alpha/2}^2(n-1)\; 或\; \chi^2 < \chi_{1-\alpha/2}^2(n-1) $$

总体期望 $\mu$ 已知,检验统计量:

$$ \chi^2 = \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma0^2} \sim \chi^{2}(n),\quad 拒绝域:\chi^2 > \chi{\alpha/2}^2(n)\; 或\; \chi^2 < \chi_{1-\alpha/2}^2(n) $$

参考“期望 $\mu$ 检验”备注。

两个正态总体假设检验

期望差 $\mu_1 - \mu_2$ 检验

$H_0: \mu_1 - \mu_2 = 0,\quad H_1: \mu_1 - \mu_2 \ne 0$

总体方差 $\sigma_1^2,\;\sigma_2^2$ 均已知, 检验统计量:

$$ U=\cfrac{(\overline{X}-\overline{Y})}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n2}} \sim N(0,1),\quad 拒绝域:|u|>u{\alpha/2}$$

总体方差 $\sigma_1^2,\;\sigma_2^2$ 均未知,但 $\sigma_1^2=\sigma_2^2=\sigma$, 检验统计量:

$$ T=\cfrac{(\overline{X}-\overline{Y})}{S_w\sqrt{1/n_1+1/n_2}} \sim t(n_1+n2-2),\quad 拒绝域:|t|>t{\alpha/2}(n_1+n_2-2)$$

$$ S_w = \sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} $$

参考“期望 $\mu$ 检验”备注。

方差比 $\frac{\sigma_1^2}{\sigma_1^2}$ 检验

$H_0:\sigma_1^2=\sigma_2^2,\quad H_1:\sigma_1^2\ne\sigma_2^2$

总体期望均未知, 检验统计量:

$$ F=\frac{S_1^2}{S_2^2} \sim F(n_1-1, n2-2),\quad 拒绝域:f > F{\alpha/2}(n_1-1,n2-1)\; 或\; f < F{1-\alpha/2}(n_1-1,n_2-1) $$

参考“期望 $\mu$ 检验”备注。

大样本检验法

类比区间估计的大样本方法