参数估计与假设检验

参数估计 指用样本估计总体分布的参数。分点估计和区间估计。\
假设检验 指对总体情况的假设做检验，在给定显著水平下做出拒绝或接受的判断。

参数的点估计

构造一个适当的统计量 $\hat{\theta}=\hat{\theta}(X_1,X_2,…,X_n)$，作为对总体参数 $\theta$ 的估计。称函数（也是随机变量） $\hat{\theta}$ 为参数 $\theta$ 的 估计量，代入样本观测值得到函数值，称为 估计值。

矩估计

矩估计的依据：大数定律

用总体矩表示总体参数，然后用对应样本矩作为总体矩的估计，达到以样本矩估计总体参数的目的。以下用矩估计期望 $\mu$ 和二阶中心矩 $M_2$：

$$ \hat{\mu} = \overline{X} = \frac{1}{n} \sum_{i=1}^n X_i \
\hat{\sigma}^2 = M2 = \frac{1}{n} \sum{i=1}^n (X_i - \overline{X})^2
$$

极大似然估计

按照最大可能性估计参数。构造抽出当前样本的概率——似然函数，（常用 似然方程）估计最优参数使该概率最大。

似然函数：样本个体概率之积（离散型）或概率密度之积（连续型），记为 $L(x_1,x_2,…,x_n;\theta_1,\theta_2,…,\theta_m)$；\
似然方程：似然函数的对数对参数求偏导

$$ \frac{\partial\ln L}{\partial\theta_k},\quad k=1,2,…,m$$

估计量的优良性准则

不同方法求出的估计量很可能不同，估计量的优良性准则就可用于挑选优良估计量。

无偏性

如果 $E(\hat{\theta})=\theta$，则称 $\hat{\theta}$ 为 无偏估计量。样本方差是总体方差的无偏估计。

有效性

如果无偏估计 $\hat{\theta}_1$ 和 $\hat{\theta}_2$ 满足 $D(\hat{\theta}_1) \le D(\hat{\theta}_2)$，则称 $\hat{\theta}_1$ 比 $\hat{\theta}_2$ 有效。如果 $\hat{\theta}$ 是 $\theta$ 估计中方差最小的，称为 最小方差无偏估计。

相合性

估计量应随着样本容量增大而接近总体参数的真值。当样本容量 $n\rightarrow \infty$ 时， $\hat{\theta}_n$ 依概率收敛于 $\theta$，即对任意 $\epsilon > 0$，满足

$$ \lim_{n\rightarrow \infty} P{ |\hat{\theta}_n - \theta| < \epsilon } = 1 $$

则称 $\hat{\theta}_n$ 为 $\theta$ 的 相合估计量 或 一致估计量。

区间估计

点估计不能给出估计值的可信程度，区间估计弥补了这点。区间估计指估计参数的取值区间及对应的可信程度（概率）。它有 2 个基本要求，可信程度（概率）尽可能大和区间尽可能小，显然这是矛盾的。一般的做法是先指定可信程度，再在该前提下尽可能缩小区间。

如果满足

$$ P{\hat{\theta}_1(X_1,X_2,…,X_n) \le \theta \le \hat{\theta}_2(X_1,X_2,…,X_n)} = 1 -\alpha $$

则称 $[\hat{\theta}_1,\hat{\theta}_2]$ 为 $\theta$ 的 置信度 为 $1-\alpha$ 的 置信区间。

枢轴变量法

在几个抽样分布定理中，可见 统计量、总体分布参数与抽样分布 三者存在一定关系，利用这些关系构造“统计量与总体参数的函数”——服从已知分布的 枢轴变量，及其指定置信度下的概率方程，解出枢轴变量估计区间，进而解出参数估计区间。

例如，已知正态总体分布方差 $\sigma^2$ 和一个容量为 n 的样本，给定置信度 $1-\alpha$，求期望 $\mu$，可构造枢轴变量

$$ U = \frac{\overline{X} - \mu}{\sigma / \sqrt{n}} \sim N(0,1),\quad because\; \overline{X} \sim N(\mu,\frac{\sigma^2}{n}) $$

$$ \Rightarrow P{ -u{\alpha/2} \le U \le u{\alpha/2}} = 1-\alpha $$

其中 $u_{\alpha/2}$ 是正态分布 上侧 $\frac{\alpha}{2}$ 分位数，可以查表解出得到 $U$ 的估计区间，进而解聘 $\mu$ 的估计区间。

一个正态总体的区间估计

以下是用枢轴变量法解出的正态总体参数的估计区间结果。 $\mu，\sigma^2$ 分别为期望、方差，指定置信度为 $1-\alpha$。

$\mu$ 置信区间

$$ [\overline{X}-\frac{\sigma}{\sqrt{n}}u{\alpha/2},\;\; \overline{X}+\frac{\sigma}{\sqrt{n}}u{\alpha/2}],\quad with\; \sigma^2\; known$$

$$ [\overline{X}-\frac{S}{\sqrt{n}}t{\alpha/2}(n-1),\;\; \overline{X}+\frac{S}{\sqrt{n}}t{\alpha/2}(n-1)],\quad with\; \sigma^2\; unknown$$

其中 $u{\alpha/2},\;t{\alpha/2}$ 分别是正态分布与 T 分布的上侧分位数。

$\sigma^2$ 置信区间

$$ [\frac{(n-1)S^2}{\chi^2{\alpha/2}(n-1)} ,\;\; \frac{(n-1)S^2}{\chi^2{1-\alpha/2}(n-1)}] ,\quad with\; \mu\; unknown $$

其中 $\chi^2{\alpha/2},\;\chi^2{1-\alpha/2}$ 为 $\chi^2$ 上侧分位数。

两个正态总体的区间估计

以下是用枢轴变量法解出的正态总体参数的区间估计。 $\mu_1，\sigma_1^2$ 与 $\mu_2，\sigma_2^2$ 分别为两个总体的期望、方差，指定置信度为 $1-\alpha$。

$\mu_1 - \mu_2$

$$ [\overline{X} - \overline{Y} - u_{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n2}} ,\;\; \overline{X} - \overline{Y} + u{\alpha/2}\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}} ],\quad with\; \sigma_1^2,\sigma_2^2\; known$$

如果 $\sigma_1^2,\sigma_2^2$ 未知但相等，则区间为

$$ [(\overline{X}-\overline{Y})-t_{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n2}} ,\quad (\overline{X}-\overline{Y})+t{\alpha/2}(n_1+n_2-2)S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}] $$

$$ S_w = \sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} $$

其中 $u{\alpha/2},\;t{\alpha/2}$ 分别是正态分布与 T 分布的上侧分位数。

$\frac{\sigma_1^2}{\sigma_2^2}$ 区间

$$ [\frac{S_2^2}{S1^2}F{1-\alpha/2}(n_1-1,n_2-1),\;\; \frac{S_2^2}{S1^2}F{\alpha/2}(n_1-1,n_2-1)],\quad with\; \mu_1,\mu_2\; unknown$$

其中 $F{\alpha/2},F{1-\alpha/2}$ 为 F 分布上侧分位数。

大样本方法

用“样本均值”与“总体期望方差”构造出枢轴变量，使之满足中心极限定理，当样本容量足够大时，近似服从正态分布，从而得到指定置信度下的概率方程，解出置信区间。如果总体期望方差均未知，可用点估计代替其中一个解另一个。

单侧置信区间

指估计区间只要求上限或下限，与双侧置信区间解法区别不大。

假设检验

为了检验假设 $H_0$，称为 原假设 或 零假设，假定 $H_0$ 是正确的，进行推导，如果指导出小概率事件，就有理由拒绝原假设，反之，接受原假设。

原假设的逆命题 $H_1$ 称为 对立假设 或 备择假设。使原假设接受的（根据假设构造的） 检验统计量 取值区域称为 检验的接受域，反之为 检验的拒绝域。

假设检验的两类错误

假设检验可能犯两类错误， 第一类错误“弃真” 和 第二类错误“纳伪”。犯第一类错误的概率：

$$ P{ 拒绝 H_0 | H_0 为真} = \alpha $$

称为 显著性水平，通常是一个 小概率。 第一二类错误概率发生概率是互相矛盾的，在实际应用中，根据二者犯错代价设置显著性水平大小。（参考：我应该对显著性水平使用什么值？）

显著性检验的步骤

整个过程类似参数区间估计

提出假设
构造检验统计量，并 在 $H_0$ 成立的条件下，能确定检验统计量的分布
选定显著性水平 $\alpha$，确定拒绝域
根据样本观测值和拒绝域，作出检验决策

单个正态总体假设检验

期望 $\mu$ 检验

$H_0: \mu=\mu_0,\quad H_1: \mu \ne \mu_0$

总体方差 $\sigma^2$ 已知，检验统计量：

$$ U = \frac{\overline{X} - \mu0}{\sigma/\sqrt{n}} \sim N(0,1),\quad 拒绝域：|u|> u{\alpha/2} $$

总体方差未知，检验统计量：

$$ T = \frac{\overline{X} - \mu0}{S/\sqrt{n}} \sim t(n-1),\quad 拒绝域：|t|> t{\alpha/2}(n-1) $$

其中， $u{\alpha/2},\;t{\alpha/2}(n-1)$ 为正态分布与 T 分布上侧分位数。对于备择假设为不等式的情况，统计量不变，拒绝域稍做变化。

方差 $\sigma^2$ 检验

$H_0: \sigma^2=\sigma^2_0,\quad H_1: \sigma^2 \ne \sigma^2_0$

总体期望未知，检验统计量：

$$ \chi^2 = (n-1)\frac{S^2}{\sigma0^2} \sim \chi^2(n-1),\quad 拒绝域：\chi^2 > \chi{\alpha/2}^2(n-1)\; 或\; \chi^2 < \chi_{1-\alpha/2}^2(n-1) $$

总体期望 $\mu$ 已知，检验统计量：

$$ \chi^2 = \frac{\sum_{i=1}^n (X_i - \mu)^2}{\sigma0^2} \sim \chi^{2}(n),\quad 拒绝域：\chi^2 > \chi{\alpha/2}^2(n)\; 或\; \chi^2 < \chi_{1-\alpha/2}^2(n) $$

参考“期望 $\mu$ 检验”备注。

两个正态总体假设检验

期望差 $\mu_1 - \mu_2$ 检验

$H_0: \mu_1 - \mu_2 = 0,\quad H_1: \mu_1 - \mu_2 \ne 0$

总体方差 $\sigma_1^2,\;\sigma_2^2$ 均已知，检验统计量：

$$ U=\cfrac{(\overline{X}-\overline{Y})}{\sqrt{\sigma_1^2/n_1+\sigma_2^2/n2}} \sim N(0,1),\quad 拒绝域：|u|>u{\alpha/2}$$

总体方差 $\sigma_1^2,\;\sigma_2^2$ 均未知，但 $\sigma_1^2=\sigma_2^2=\sigma$，检验统计量：

$$ T=\cfrac{(\overline{X}-\overline{Y})}{S_w\sqrt{1/n_1+1/n_2}} \sim t(n_1+n2-2),\quad 拒绝域：|t|>t{\alpha/2}(n_1+n_2-2)$$

$$ S_w = \sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} $$

参考“期望 $\mu$ 检验”备注。

方差比 $\frac{\sigma_1^2}{\sigma_1^2}$ 检验

$H_0:\sigma_1^2=\sigma_2^2,\quad H_1:\sigma_1^2\ne\sigma_2^2$

总体期望均未知，检验统计量：

$$ F=\frac{S_1^2}{S_2^2} \sim F(n_1-1, n2-2),\quad 拒绝域：f > F{\alpha/2}(n_1-1,n2-1)\; 或\; f < F{1-\alpha/2}(n_1-1,n_2-1) $$

参考“期望 $\mu$ 检验”备注。

大样本检验法

类比区间估计的大样本方法