族谱网 头条 人物百科

量化

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:339
转发:0
评论:0
数学描述最简单最易懂的量化是标量(有别于多维矢量)量化,开始标量量化之前先要给出输入数据。通常,一个标量量化操作可以给出下面的描述其中x{displaystylex}是实数,⌊⌊-->x⌋⌋-

数学描述

最简单最易懂的量化是标量(有别于多维矢量)量化,开始标量量化之前先要给出输入数据。 通常,一个标量量化操作可以给出下面的描述

其中

x {\displaystyle x} 是实数,

⌊ ⌊ --> x ⌋ ⌋ --> {\displaystyle \lfloor x\rfloor } 是下取整函数,生成整数 i = ⌊ ⌊ --> f ( x ) ⌋ ⌋ --> {\displaystyle i=\lfloor f(x)\rfloor }

f ( x ) {\displaystyle f(x)} 和 g ( i ) {\displaystyle g(i)} 是任意的实值函数。

整数 i {\displaystyle i} 是表示的数值,它通常被存储或者传输,然后在后来需要解释的时候使用 g ( i ) {\displaystyle g(i)} 进行最终的解释重建。整数 i {\displaystyle i} 有时也称作 量化指数 。

在计算机或者其它应用,一个已知的量化方法 均匀量化 (en:uniform quantization)。在均匀量化方法里共有两个变量,叫 mid-rise 和 mid-tread 。

如果 x {\displaystyle x} 是一个-1到1之间的数,一个mid-rise uniform量化操作,可以用"M"bit来表示量化的精度。

在这个例子中 f ( x ) {\displaystyle f(x)} 和 g ( i ) {\displaystyle g(i)} 运算符都是乘以比例因子(其中一个是另外一个的逆),并且在 g ( i )中带有一个偏移量以使得每个量化表示都位于输入区域的中间位置。 2 − − --> ( M − − --> 1 ) {\displaystyle 2^{-(M-1)}} 经常称为 量化步长 。按照这个量化定律,假定在整个量化步长上量化噪声大致是均匀分布的,并且假定量化的输入信号 x {\displaystyle x} 在整个-1到1的区间大致均匀分布,量化的信噪比(SNR)可以用下面的公式计算,

根据这个等式,人们常说SNR大约是每位6dB。

在mid-tread一致量化中,偏移0.5将加在下取整函数内部而不是外部。

有时候,mid-rise量化使用时不加偏移0.5。这将信号与噪声比减小了大约6.02 dB,但是当步距小的时候为了简化这是可接受的。

在数字电话系统中,两个流行的量化机制是"A-law"(在欧洲占据主导地位)和"μ-law"(在北美和日本占据主导地位)。这些机制将离散的模拟数值映射到8位尺度,在小值的时候近似线性随着幅度增长按照对数增加。由于人耳对于音量的感知近似对数曲线,这就使用一定的位数在可听见的声音强度范围提供了更高的信噪比。

忽略熵约束:Lloyd–Max量化

在上面的陈述中,若令 λ λ --> {\displaystyle \lambda } 等于 0,从而忽略掉比特率约束,或等价地假设要用定长码(FLC)而非用 变长码 ( 英语 : variable-length code ) (熵编码法编码法,如算术编码在率失真上就比定长码好)来表示量化数据,这个最优化问题就简化为了只需最小化失真 D {\displaystyle D} 的问题了。

M {\displaystyle M} 级量化器产生的索引可以用 R = ⌈ ⌈ --> log 2 ⁡ ⁡ --> M ⌉ ⌉ --> {\displaystyle R=\lceil \log _{2}M\rceil } 比特/符号的定长码。例如当 M = {\displaystyle M=} 256 阶时,定长码的比特率 R {\displaystyle R} 为 8 比特/符号。由于这个原因,这样的量化器有时称作8比特量化器。不过使用定长码消除了压缩改进,但可以通过更好的熵编码来改善。

假设 M {\displaystyle M} 阶定长码,率失真最小化问题可以简化为失真最小化问题。 简化的问题可以陈述为:给定一个概率密度函数为 f ( x ) {\displaystyle f(x)} 的信源 X {\displaystyle X} ,并约束量化器必须仅使用 M {\displaystyle M} 个分类区域,求得决策边界 { b k } k = 1 M − − --> 1 {\displaystyle \{b_{k}\}_{k=1}^{M-1}} 与重建层级 { y k } k = 1 M {\displaystyle \{y_{k}\}_{k=1}^{M}} 来最小化得到的失真

对上述问题求最优解得到的量化器有时叫做MMSQE(最小均方量化误差)解,而得到的概率密度函数最优化的(非均匀)量化器叫做 Lloyd–Max 量化器,是用独立发现迭代方法 从 ∂ ∂ --> D / ∂ ∂ --> b k = 0 {\displaystyle {\partial D/\partial b_{k}}=0} 和 ∂ ∂ --> D / ∂ ∂ --> y k = 0 {\displaystyle {\partial D/\partial y_{k}}=0} 求解两组联立方程的两个人来命名的,如下:

会将阈值置于每对重建值的中点,而

会让重建值位于其相关分类区间的质心(条件期望值)。

Lloyd方法I算法 ( 英语 : Lloyd"s algorithm ) ,最初于1957提出,并可以直接推广到用于向量数据。这个推广会得到 Linde–Buzo–Gray(LBG) ( 英语 : Linde–Buzo–Gray algorithm ) 或K-平均分类器最优化方法。此外,此方法还可以进一步推广到对向量数据包含一个熵约束。

量化与数据压缩

量化在有损数据压缩中起着相当重要的作用。很多情况下,量化可以被当作将有损数据压缩同无损数据压缩相区别的标志之一。量化的目的通常是为了减少数据量。一些压缩算法,例如MP3和Vorbis,以有选择地丢弃部分数据作为压缩的一种方法,这种手段可以被认为是量化的过程也可以被看作是一种有损压缩的形式。

JPEG是一种利用了量化的图像有损压缩。JPEG的编码过程对原始的图像数据作离散余弦变换,然后对变换结果进行量化并作熵编码。通过量化可以降低变换值的精度,从而减少图像的数据量。当然,精度的损失意味着图像质量的下降。然而图像的质量可以通过量化位数的选择加以控制。例如,JPEG在每像素3比特的精度下得到的图像质量还让人可以接受的,相对于PCM抽样得到的每个像素24比特的原始图像来说,数据量大大下降了。

现代压缩技术通常以量化输出的信息熵,而不是输出值集合的大小度量信息量的多少。

自然界中的量子化

从最基本的意义上来说,所有的物理量都是量子化的,这是量子力学的结论。为了数学上的明晰性,在宏观的尺度上可以将量子的性质忽略,因此信号可以表示为连续的形式。

在实际应用中,这种内在的量子或量化的性质并不需要考虑。首先,量子效应会被信号的噪声淹没,因为任何观察对象在实际系统中总会伴随有其他物理现象。其次,测量仪器不可能绝对精确,被测的信号必然会被测量噪声污染。

相关条目

模-数转换器,数-模转换器

量化误差,量化噪声

离散信号,数字信号

抖动

信息论

率失真

矢量量化


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 量化
自然语言中的量化所有已知人类语言都使用量化,即使是那些没有完整的数字系统的语言(Wiese2004)。例如:“我最近订的所有玻璃都碎了”。“站在河边的一些人带着白臂章”。“我交谈的多数人都没有从属的俱乐部”。“在候诊室里的所有人都对Ballyhoo医生有至少一个抱怨”。“在他的班级中有些人能够正确的回答我提出的所有问题”。“大量的人是聪明的”。不存在简单的方式把这些表达重新公式化为句子们的合取或析取,它们每个都有个体的简单谓词如“酒杯碎了”。这些例子也暗示了在自然语言中的量化表达式构造可以是语法上非常复杂的。幸运的是,对于数学断言,量化过程在语法上是更加直接的。研究自然语言中的量化比研究形式语言的量化要难很多。这部分的由于自然语言句子的文法结构可能隐藏了逻辑结构的事实。而数学约定严格的为形式语言量词指定了有效范围;为自然语言指定有效性的范围要求处理不平凡的语义问题。Montague文法给出...
· 存在量化
基础假如你希望写一个公式,它为真当且仅当某些自然数自乘得25。你可以尝试的一个朴素的方式是:因为重复使用了"或",这是看起来是一个逻辑析取。但是"以此类推"使得它在形式逻辑中不可能解释为析取。转而我们把句子重组为注意这个陈述实际上比最初的更加精确。短语"以此类推"明确的意味着包含所有自然数,而没有更多其他的什么东西,但是这不是一个明确的陈述,这是这个短语不能形式解释的根本原因。在另一方面,在这个量化的陈述中自然数被明确的提及了。这个特定例子是真的,因为5是自然数,并且当我们把n代换为5的时候,我们得到"5·5=25",这是真的。这与"n·n=25"对于大多数自然数n为假无关,在实际上除了5之外都为假;即使只存在一个单一的解就足以证明存在量化为真。(当然,多个解也行...
· 全称量化
基础假设你要说的是由于“以及”一词的重复使用,这似乎是一个逻辑合取。然而形式逻辑中的合取概念却不能表达出“等等”一词的含义。因此将该命题改述为这便是一个使用全称量化的单一命题。请注意,事实上该命题比原命题更精确。很明显,“等等”一词表示的是要包括所有的自然数、且除此之外不包括任何其它内容,但语言中并没有明确地陈述这点,这便是“等等”一词不能被形式地解释的根本原因。这个特定的例子中的命题是真值的,因为可以对n取任何自然数都使命题“2·n=n+n”成立。反之,命题“对任何自然数n,都有2·n>2+n”则是假值的,因为举例来说,将其中的n用1来取代,就能得到假命题“2·1>2+1”。尽管对“大多数”自然数n来说,命题“2·n>2+n”都成反例但只要存在一个反例便足以举证该全称命题为假。另一方面,“对任何合数n,都有2·n>2+n”是真命题,因为所有的反例均不是合数。这说明了论域的重要性,其指定了...
· 唯一量化
简约为普通量词唯一量化通常被认为是全称量化(“对于所有”,∀)、存在量化(“对于某个”,∃)和等式(“等于”,=)的组合。因此,如果P(x)是要在其上量化的谓词(在我们上面例子中的P(x)是“x-2=4”),那么∃!x,P(x)意味着:“正好存在一个x使得P(x)”的陈述还可以写为两个更弱的陈述的逻辑合取。其中第一个简单的存在量化:∃x,P(x)。第二个是唯一性,有些人写为!x,P(x)。它被定义为:∀x,∀y,P(x)∧P(y)→x=y。这两个陈述的合取逻辑等价于前面给出的单一陈述。但是实际上,证明唯一存在性通常要分别证明这两个陈述。参见量化(数理逻辑)
· 乌雷松度量化定理
内容如果一个拓扑空间X是正则的,且有一组可数基,那么X是可度量化的。一个拓扑空间中被说成是可度量的,如果有一个度量(X,ττ-->){\displaystyle(X,\tau)}d::-->X××-->X→→-->[0,∞∞-->){\displaystyled\colonX\timesX\to[0,\infty)}并且这拓扑ττ-->{\displaystyle\tau}由d诱导产生。证明的想法利用X是正则的且有一组可数基的假定就可以证明,X能嵌入一个度量空间之中。因此,X与一个度量空间的子空间同胚。由于一个度量空间的子空间是可度量化的,又由于可度量性是一种拓扑性质,于是得出:X是可度量化的。例子Z上的等差数列拓扑由所有形如Aa,b={...,a-2b,a-b,a,a+b,a+2b,...}的等差数列所组成的基来定义,其中a,b∈R.b≠0。诱导Z上的...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信