量化
数学描述
最简单最易懂的量化是标量(有别于多维矢量)量化,开始标量量化之前先要给出输入数据。 通常,一个标量量化操作可以给出下面的描述
其中
x {\displaystyle x} 是实数,
⌊ ⌊ --> x ⌋ ⌋ --> {\displaystyle \lfloor x\rfloor } 是下取整函数,生成整数 i = ⌊ ⌊ --> f ( x ) ⌋ ⌋ --> {\displaystyle i=\lfloor f(x)\rfloor }
f ( x ) {\displaystyle f(x)} 和 g ( i ) {\displaystyle g(i)} 是任意的实值函数。
整数 i {\displaystyle i} 是表示的数值,它通常被存储或者传输,然后在后来需要解释的时候使用 g ( i ) {\displaystyle g(i)} 进行最终的解释重建。整数 i {\displaystyle i} 有时也称作 量化指数 。
在计算机或者其它应用,一个已知的量化方法 均匀量化 (en:uniform quantization)。在均匀量化方法里共有两个变量,叫 mid-rise 和 mid-tread 。
如果 x {\displaystyle x} 是一个-1到1之间的数,一个mid-rise uniform量化操作,可以用"M"bit来表示量化的精度。
在这个例子中 f ( x ) {\displaystyle f(x)} 和 g ( i ) {\displaystyle g(i)} 运算符都是乘以比例因子(其中一个是另外一个的逆),并且在 g ( i )中带有一个偏移量以使得每个量化表示都位于输入区域的中间位置。 2 − − --> ( M − − --> 1 ) {\displaystyle 2^{-(M-1)}} 经常称为 量化步长 。按照这个量化定律,假定在整个量化步长上量化噪声大致是均匀分布的,并且假定量化的输入信号 x {\displaystyle x} 在整个-1到1的区间大致均匀分布,量化的信噪比(SNR)可以用下面的公式计算,
根据这个等式,人们常说SNR大约是每位6dB。
在mid-tread一致量化中,偏移0.5将加在下取整函数内部而不是外部。
有时候,mid-rise量化使用时不加偏移0.5。这将信号与噪声比减小了大约6.02 dB,但是当步距小的时候为了简化这是可接受的。
在数字电话系统中,两个流行的量化机制是"A-law"(在欧洲占据主导地位)和"μ-law"(在北美和日本占据主导地位)。这些机制将离散的模拟数值映射到8位尺度,在小值的时候近似线性随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比。
忽略熵约束:Lloyd–Max量化
在上面的陈述中,若令 λ λ --> {\displaystyle \lambda } 等于 0,从而忽略掉比特率约束,或等价地假设要用定长码(FLC)而非用 变长码 ( 英语 : variable-length code ) (熵编码法编码法,如算术编码在率失真上就比定长码好)来表示量化数据,这个最优化问题就简化为了只需最小化失真 D {\displaystyle D} 的问题了。
M {\displaystyle M} 级量化器产生的索引可以用 R = ⌈ ⌈ --> log 2 --> M ⌉ ⌉ --> {\displaystyle R=\lceil \log _{2}M\rceil } 比特/符号的定长码。例如当 M = {\displaystyle M=} 256 阶时,定长码的比特率 R {\displaystyle R} 为 8 比特/符号。由于这个原因,这样的量化器有时称作8比特量化器。不过使用定长码消除了压缩改进,但可以通过更好的熵编码来改善。
假设 M {\displaystyle M} 阶定长码,率失真最小化问题可以简化为失真最小化问题。 简化的问题可以陈述为:给定一个概率密度函数为 f ( x ) {\displaystyle f(x)} 的信源 X {\displaystyle X} ,并约束量化器必须仅使用 M {\displaystyle M} 个分类区域,求得决策边界 { b k } k = 1 M − − --> 1 {\displaystyle \{b_{k}\}_{k=1}^{M-1}} 与重建层级 { y k } k = 1 M {\displaystyle \{y_{k}\}_{k=1}^{M}} 来最小化得到的失真
对上述问题求最优解得到的量化器有时叫做MMSQE(最小均方量化误差)解,而得到的概率密度函数最优化的(非均匀)量化器叫做 Lloyd–Max 量化器,是用独立发现迭代方法 从 ∂ ∂ --> D / ∂ ∂ --> b k = 0 {\displaystyle {\partial D/\partial b_{k}}=0} 和 ∂ ∂ --> D / ∂ ∂ --> y k = 0 {\displaystyle {\partial D/\partial y_{k}}=0} 求解两组联立方程的两个人来命名的,如下:
会将阈值置于每对重建值的中点,而
会让重建值位于其相关分类区间的质心(条件期望值)。
Lloyd方法I算法 ( 英语 : Lloyd"s algorithm ) ,最初于1957提出,并可以直接推广到用于向量数据。这个推广会得到 Linde–Buzo–Gray(LBG) ( 英语 : Linde–Buzo–Gray algorithm ) 或K-平均分类器最优化方法。此外,此方法还可以进一步推广到对向量数据包含一个熵约束。
量化与数据压缩
量化在有损数据压缩中起着相当重要的作用。很多情况下,量化可以被当作将有损数据压缩同无损数据压缩相区别的标志之一。量化的目的通常是为了减少数据量。一些压缩算法,例如MP3和Vorbis,以有选择地丢弃部分数据作为压缩的一种方法,这种手段可以被认为是量化的过程也可以被看作是一种有损压缩的形式。
JPEG是一种利用了量化的图像有损压缩。JPEG的编码过程对原始的图像数据作离散余弦变换,然后对变换结果进行量化并作熵编码。通过量化可以降低变换值的精度,从而减少图像的数据量。当然,精度的损失意味着图像质量的下降。然而图像的质量可以通过量化位数的选择加以控制。例如,JPEG在每像素3比特的精度下得到的图像质量还让人可以接受的,相对于PCM抽样得到的每个像素24比特的原始图像来说,数据量大大下降了。
现代压缩技术通常以量化输出的信息熵,而不是输出值集合的大小度量信息量的多少。
自然界中的量子化
从最基本的意义上来说,所有的物理量都是量子化的,这是量子力学的结论。为了数学上的明晰性,在宏观的尺度上可以将量子的性质忽略,因此信号可以表示为连续的形式。
在实际应用中,这种内在的量子或量化的性质并不需要考虑。首先,量子效应会被信号的噪声淹没,因为任何观察对象在实际系统中总会伴随有其他物理现象。其次,测量仪器不可能绝对精确,被测的信号必然会被测量噪声污染。
相关条目
模-数转换器,数-模转换器
量化误差,量化噪声
离散信号,数字信号
抖动
信息论
率失真
矢量量化
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
- 有价值
- 一般般
- 没价值