Speech Cheat Sheet

复数

$$z=a+bi$$

复数的表示

坐标表示,分为实部$a$,虚部$b$:
$$z=a+bi$$
三角形式,$r$表示模,$\theta$为幅角
$$z=r(\cos\theta + i\sin \theta)$$
指数形式
$$z=re^{i\theta}$$
欧拉公式
$$ e^{ix}=\cos x+i\sin x $$

共轭复数

$$z=a-bi$$

四则运算

$$ (a+bi) + (c+di) = (a+c) + (b+d)i $$
$$ (a+bi)(c+di) = (ac-bd) + (bc+ad)i $$
$$ (a+bi) / (c+di) = [(ac + bd) / (c^2 + d^2)] + [(bc - ad) / (c^2 + d^2)]i $$

四则运算的推论

$$ a \cdot (c+di) = ac + adi $$
$$ {(a+bi)}^2 = (a^2 - b^2) + 2abi $$

$$ |a + bi| = \sqrt{a^2 + b^2} $$

模的平方
$$ {|a + bi|}^2 = a^2 + b^2 $$

复数乘积的模等于模的乘积
$$ |z_1 z_2| = |z_1| |z_2| $$

复数与幅度、相位

用$R$表示幅度,$φ$表示相位,则有:
$$ a+ib = R e^{jφ} = R\cos φ + iR\sin φ $$
所以有:
$$ a=R\cos φ, \quad b = R\sin φ $$
得到:
$$ R=\sqrt{a^2+b^2}, \quad φ=\arctan \frac{b}{a} $$

时频域变换

为什么要将时域信号转换到频域?因为一些在时域上不显著的特征,在频域上表现很明显。

离散傅里叶变换(DFT)

参考网上课件
$$ F[n] = \sum_{k=0}^{N-1} f[k] e^{-i \frac{2\pi}{N} n k} \quad (n=0:N-1) $$
上式计算了长度为$N$的信号$f(k)$的频域表示$F(n)$。注意$F(n)$的长度也是$N$,这是从连续傅里叶变换推导出DFT确定的。

逆变换:
$$ f[k] = \frac{1}{N} \sum_{n=0}^{N-1} F[n] e^{+i \frac{2\pi}{N} n k} $$
对应的逆矩阵是原始(对称)矩阵的复共轭的$\frac{1}{N}$倍

离散余弦变换(DCT)

参考网上课件1课件2

$$ Cx(k) = \sum{n=0}^{N-1} 2x(n) \cos(\frac{\pi}{2N} k (2n+1) ) $$
其中$x$是信号。用$W_{2N}$表示$2N$长度的DFT转换矩阵基本元素,$Y(k)$表示DFT频点,则有:
$$ Cx(k) = W{2N}^{k/2} Y(k) $$

利用DFT计算DCT的过程:

用IDFT计算DCT逆运算(IDCT):

信号处理原理

采样定理

采样是将一个信号(例如时间或空间上连续的函数)转换为数字序列(时间或空间上离散的函数)的过程。定义:为了能由离散信号恢复原来的连续信号,采样频率应该不小于连续信号频谱中最高频率的2倍。可直觉上理解为一个信号周期内,需要由两个点确定波形的走向。

混叠现象

如果采样频率低于模拟信号最高频率的2倍,会产生混叠现象,即高于采样频率一半的频率成分将被重建成低于采样频率一半的信号。在直觉上可以理解,如果采样频率过低,高频信号采样点可能与低频信号重叠,我们无法根据这些采样点分辨是高频或低频信号。

不确定性原理

频率分辨率 是指频谱分析中能够分辨的两个相邻频率点谱线的最小间距。在DFT中,用$Fs$表示采样频率,$N$表示采样点数目,$t$表示序列的时长,则频率分辨率可以表示为:
$$ \Delta f = \frac{F_s}{N} = \frac{F_s}{F_s t} = \frac{1}{t}$$

不确定性原理最初定义在量子力学领域,后来被用于其他领域,包括信号处理。在DFT中,表现为频率分辨率与时间分辨率不能同时无限提升。(参考博文

信号处理技术

压缩感知

压缩感知(Compressed sensing),也被称为压缩采样(Compressive sampling)或稀疏采样(Sparse sampling),是一种寻找欠定线性系统的稀疏解的技术。这个方法利用讯号稀疏的特性,相较于奈奎斯特理论(采样定理),得以从较少的测量值还原出原来整个欲得知的讯号。(wikipedia