族谱网 头条 人物百科

编码理论

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:287
转发:0
评论:0
编码理论的历史1948年,克劳德·香农发表了《通信的数学理论》,这篇文章由《贝尔系统技术杂志》的七月和十月刊分两部分发行。该文重点研究了如何最有效地对发送者要发送的信息进行编码的问题。在这篇基础性的论文中,他使用了诺伯特·维纳发展的概率论工具,而这些概率论工具用于通信理论在当时还尚处萌芽阶段。香农提出信息熵作为消息不确定性的量度,而实质上创造了信息论这个领域。二进制戈莱码(英语:binaryGolaycode)在1949年被提出。更具体地说,它是一种每个24位字能够纠正三个错误、检测出第四个错误的纠错码。汉明距离的二维可视化理查德·汉明因在贝尔实验室在数值方法、自动编码系统以及错误检测和纠错码的成就于1968年获得了图灵奖。他发明了汉明码、汉明窗、汉明数和汉明距离等概念。信源编码信源编码的目的是让源数据变小。定义数据可以看作是随机变量X:ΩΩ-->→→-->X{\displaystyleX...

编码理论的历史

1948年,克劳德·香农发表了《通信的数学理论》,这篇文章由《贝尔系统技术杂志》的七月和十月刊分两部分发行。该文重点研究了如何最有效地对发送者要发送的信息进行编码的问题。在这篇基础性的论文中,他使用了诺伯特·维纳发展的概率论工具,而这些概率论工具用于通信理论在当时还尚处萌芽阶段。香农提出信息熵作为消息不确定性的量度,而实质上创造了信息论这个领域。

二进制戈莱码(英语:binary Golay code)在1949年被提出。更具体地说,它是一种每个24位字能够纠正三个错误、检测出第四个错误的纠错码。

编码理论

汉明距离的二维可视化

理查德·汉明因在贝尔实验室在数值方法、自动编码系统以及错误检测和纠错码的成就于1968年获得了图灵奖。他发明了汉明码、汉明窗、汉明数和汉明距离等概念。

信源编码

信源编码的目的是让源数据变小。

定义

数据可以看作是随机变量X:Ω Ω -->→ → -->X{\displaystyle X:\Omega \rightarrow {\mathcal {X}}},其中 x∈ ∈ -->X{\displaystyle x\in {\mathcal {X}}} 出现概率为 P[X=x]{\displaystyle \mathbb {P} [X=x]}。

数据用字母表Σ Σ -->{\displaystyle \Sigma } 中的字符串(单词)进行编码的。

码是一个函数 C:X→ → -->Σ Σ -->∗ ∗ -->{\displaystyle C:{\mathcal {X}}\rightarrow \Sigma ^{*}}(或当空字符串不在字母表内时为 Σ Σ -->+{\displaystyle \Sigma ^{+}})。C(x){\displaystyle C(x)} 是与 x{\displaystyle x} 关联的码字。

码长写作 l(C(x)){\displaystyle l(C(x))}。

码长的期望值为 l(C)=∑ ∑ -->x∈ ∈ -->Xl(C(x))P[X=x]{\displaystyle l(C)=\sum _{x\in {\mathcal {X}}}l(C(x))\mathbb {P} [X=x]}

码字拼接C(x1,...,xk)=C(x1)C(x2)...C(xk){\displaystyle C(x_{1},...,x_{k})=C(x_{1})C(x_{2})...C(x_{k})}.

空字符串的码字为空字符串本身:C(ϵ ϵ -->)=ϵ ϵ -->{\displaystyle C(\epsilon )=\epsilon }

性质

当 C:X→ → -->Σ Σ -->∗ ∗ -->{\displaystyle C:{\mathcal {X}}\rightarrow \Sigma ^{*}} 为单射时,是非奇异码。

当 C:X∗ ∗ -->→ → -->Σ Σ -->∗ ∗ -->{\displaystyle C:{\mathcal {X}}^{*}\rightarrow \Sigma ^{*}} 为单射时,是唯一可解码(英语:Uniquely decodable code)。

如果 C(x1){\displaystyle C(x_{1})} 和 C(x2){\displaystyle C(x_{2})} 相互不是另一个的前缀,则 C:X→ → -->Σ Σ -->∗ ∗ -->{\displaystyle C:{\mathcal {X}}\rightarrow \Sigma ^{*}} 是即时码。

原理

信源的熵是信息的度量。基本上,信源编码在尽量减少信源的冗余,用携带更多信息的更少的比特来表示信源。

明确试图根据特定的假定概率模型来最小化消息的平均长度被称为熵编码。

有各种采用信源编码方案试图达到信源熵的极限的技术。C(x) ≥ H(x),其中 H(x) 为信源熵(比特率),C(x) 为压缩后的比特率。特别指出,没有源编码方案可以比信源的熵更好。

例子

传真传输使用简单的游程编码。信源编码去除所有发射机必要发送以外所有多余数据,降低了传输所需的带宽。

参见

编码增益(英语:Coding gain)

覆盖码(英语:Covering code)

前向错误更正

群试(英语:Group testing)

汉明距离、汉明重量

信息论

李距离

多天线研究中的空间编码和MIMO

参考文献

Vera Pless (1982), Introduction to the Theory of Error-Correcting Codes, John Wiley & Sons, Inc., ISBN 0-471-08684-3.

Elwyn R. Berlekamp(1984), Algebraic Coding Theory, Aegean Park Press (revised edition), ISBN 0-89412-063-8, ISBN 978-0-89412-063-3.

Randy Yates, A Coding Theory Tutorial.


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 编码
扩展定义对于特定的上下文,编码有一些更具体的意义。编码(Encoding)在认知上是解释传入的刺激的一种基本知觉的过程。技术上来说,这是一个复杂的、多阶段的转换过程,从较为客观的感觉输入(例如光、声)到主观上有意义的体验。字符编码(Characterencoding)是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。文字编码(Textencoding)使用一种标记语言来标记一篇文字的结构和其他特征,以方便计算机进行处理。语义编码(Semanticsencoding),以正式语言乙对正式语言甲进行语义编码,即是使用语言乙表达语言甲所有的词汇(如程序或说明)的一种方法。电子编码(Electronicencoding)是将一个信号转换成为一个代码,这种代码是被优化过的以利于传输或存储。转换工作通常由一个编解码器完成。神经编码...
· E编码
格式E编号的格式为E字后加三位数字,分类细项则是EXXX之后再加上i∕ii∕iii或abcd,新项目到用四位数字:EXXXX。分类所有有E编号的食品添加物又更进一步可根据他们的号码分成几大类。食用色素此类别的添加物主要用来使食物具有多种颜色,某些食用色素也具有香味。例如一般常见的橘子汽水,就是加入食用色素调制而成。E100-109–黄色食用色素E110-119–橙色食用色素E120-129–红色食用色素E130-139–蓝色食用色素和紫色食用色素E140-149–绿色食用色素E150-159–棕色食用色素和黑色食用色素E160-199–其他颜色的食用色素防腐剂防腐剂类的添加物主要用于延长食品保存期限,通常都具有抑制细菌生长的功用,以达到防止食品腐坏的效果。E200-209–山梨酸盐类(E201/E202)E210-219–苯甲酸盐类(E211)E220-229–亚硫酸盐类(E227)E23...
· 熵编码法
编码使用长度不同的比特串对字母进行编码有一定的困难。尤其是,几乎所有几率的熵都是一个有理数。使用整数比特(bit)霍夫曼编码建议了一种将比特进位成整数的算法,但这个算法在特定情况下无法达到最佳结果。为此有人加以改进,提供最佳整数比特数。这个算法使用二叉树来设立一个编码。这个二叉树的终端节点代表被编码的字母,根节点代表使用的比特。除这个对每个要编码的数据产生一个特别的表格的方法外还有使用固定的编码表的方法。比如加入要编码的数据中符号出现的概率匹配一定的规则的话就可以使用特别的变长编码表。这样的编码表具有一定的系数来使得它适应实际的字母出现概率。改进使用整数比特的方法往往无法获得使用熵计算的比特数,因此其压缩并非一定最佳。比如字母列由两个不同的字母组成,其中一个字母的可能性是p(A)=0.75{\displaystyle\mathrm{p}(A)=0{.}75},另一个字母的可能性是p(B)=...
· 编码器
举例媒体以下的软件可以将声音、视频或是文字等数据编码成标准格式:压缩软件可以将数据(如声音、图片或视频)编辑成长度较小的数据(引用编解码器)。音频编解码器可以转换及压缩声音数据。视频压缩可以转换及压缩数字视频数据。加密更多资料:密码学和加密基于数据隐私的需求。又分成可逆与不可逆两种。以做为验证系统登录的密码为例,其存放在数据库时,则常使用不可逆的散列函数进行编码,以防止当存放密码的数据库外泄时,被外人轻易得知密码。可逆的加密编码,则配合解码器与用于解密的密钥,以便将数据还原。文件验证为了验正文件的完整性,常使用CRC32、MD5、SHA1等方式计算验证用的键值。传感器支持EnDat通信协议的旋转编码器传感器的编码器是利用光学或磁性或是机械接点的方式感测位置,并将位置转换为电子信号后输出,作为控制位置时的回授信号。传感器依运动方式可分为旋转编码器或是线性编码器(英语:linearencode...
· 非编码DNA
参考文献Bennett,M.D.andI.J.Leitch.Genomesizeevolutioninplants.(编)T.R.Gregory(ed.).TheEvolutionoftheGenome.SanDiego:Elsevier.2005:89–162.Gregory,T.R.Genomesizeevolutioninanimals.(编)T.R.Gregory(ed.).TheEvolutionoftheGenome.SanDiego:Elsevier.2005.

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信