二维随机变量及其概率分布

概率论与数理统计

参考: 随机变量函数 - Vamei

联合分布函数

性质

  • $P { x_1 < X \le x_2,\;\; y_1 < Y \le y_2 } \ge 0$
  • 分别对 x,y 单调不降,即 $x_1 < x_2$ 有 $F(x_1,y) \le F(x_2,y)$
  • 对每个变量 F(x,y) 是右连续的,有 $\lim_{x\rightarrow x_0^+} F(x,y)= F(x_0,y)$
  • $0\le F(x,y) \le 1$ 且 $\lim{x\rightarrow -\infty} F(x,y) =0$ 且 $\lim{x\rightarrow +\infty,\;y\rightarrow +\infty} F(x,y) =1$

联合分布律

$$ P{ X = x_i, Y= yi } = p{ij} $$

性质
  • $p_{ij}$ 和为 1
  • $P{ X = xi}=p{i\cdot}$ 边缘分布函数

联合概率密度

$$ F(x,y) = \int{-\infty}^x \int{-\infty}^y f(u,v) \; du\;dv $$

边缘概率密度

$$ fX(x) = \int{-\infty}^{+\infty} f(x,y) dy $$

概率由密度函数计算

$$ P{ (X,Y) \in G } = \underset{G}{\int\int} f(x,y) d\sigma $$

二维均匀分布

$$ f(x,y) = \left{ \begin{array}{l}
\frac{1}{S(G)},\quad (x,y) \in G \
0,\quad (x,y) \notin G
\end{array} \right. $$

二维正态分布

$(X,Y) \sim N(\mu_1, \sigma^2; \mu_2, \sigma_2^2; \rho)$, $-1 < \rho < 1$

当 $\rho=0$,

$$ \varphi(x,y) = \frac{1}{2 \pi \sigma_1 \sigma_2} \exp(-\frac{1}{2} ( \frac{(x-\mu_1)^2}{\sigma_1^2} + \frac{(y-\mu_2)^2}{\sigma_2^2} ) ) $$

有:若 $(X,Y) \sim N(\mu_1, \sigma^2; \mu_2, \sigma_2^2; \rho)$, 则 $X\sim N(\mu_1,\sigma_1^2)$, $Y\sim N(\mu_2,\sigma_2^2)$, 所以二维正态随机变量的边缘分布仍为正态分布。

随机变量的独立性

满足 $P{ X \le x,\; Y\le y } = P{ X \le x} P{Y \le x}$, 则 X 与 Y 相互独立。

离散型的等价条件: $P{ X = x,\; Y = y } = P{ X = x} P{Y = x}$

连续型的等价条件: $f(x,y)=f_X(x)f_Y(y)$

条件分布

条件分布律

对离散型,有:

$$ P{ X = x_i,\; Y = yi} = \frac{p{ij}}{p_{\cdot j}} $$

条件概率密度

若 $f(x,y)$, $f_Y(y)$ 在 $(x,y)$ 及邻域连续,则

$$ f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)} $$

条件概率计算:

$$ P{ a < X \le b | Y = c } = \inta^b f{X|Y}(x|c) dx $$

求解技巧

随机变量函数的分布

连续型单调函数

连续型随机变量 X 有概率密度 $f_X(x),\; x\in R$, $Y=g(X) \in (a,b)$ 为 可导单调 函数,则 Y 为连续型随机变量,其概率密度为:

$$ f_Y(y) = \left{ \begin{array}{l}
f_X(g^{-1}(y)) \cdot g^{-1’}(y),\quad y \in (a,b) \
0,\quad 其他
\end{array} \right. $$

来源: $f_Y(y)=F’(g^{-1}(y))$

一般解法

已知 $X$ 的概率密度 $f(x)$ 及 $Y=g(X)$

  1. 根据 $g(X)$ 对 $y$ 分段,注意 区间右连续
  2. $F(y)=P{ g(X) \le y }$, 求解 $X$ 的取值范围
  3. 根据 X 分布求解出 $F(y)$

求解条件概率密度

已知联合概率密度 $f(x,y)$, 求解 $f_{X|Y}(x|y)$

  1. 作积分区域图
  2. 求解边缘概率密度 $f_Y(y)$
  3. 对 $y$ 分段讨论,求解条件概率密度

两个随机变量简单函数的概率密度

Z = X + Y

利用公式

$$ fZ(z) = \int{-\infty}^{+\infty} f(x, z-x) dx $$

  1. 求解 $f(x,y)$
  2. 转化 $f(x, z-x)$
  3. 作 z - x 积分区域图
  4. 利用公式求得 $f_Z(z)$, 可能需要对 z 分段
一般方法
  1. 求解 $f(x,y)$
  2. 作 y - x 积分区域图
  3. 对 z 分段讨论,二重积分得到 z 的分布函数
  4. 对分布函数求导