族谱网 头条 人物百科

高级音频编码

2020-10-16
出处:族谱网
作者:阿族小谱
浏览:318
转发:0
评论:0
扩展名AAC编码的主要扩展名有三种:.aac-使用MPEG-2AudioTransportStream(ADTS,参见MPEG-2)容器,区别于使用MPEG-4容器的MP4/M4A格式,属于传统的AAC编码(FAAC默认的封装,但FAAC亦可输出MPEG-4封装的AAC)。.mp4-使用了MPEG-4Part14(第14部分)的简化版即3GPPMediaRelease6Basic(3gp6,参见3GP)进行封装的AAC编码(NeroAAC编码器仅能输出MPEG-4封装的AAC)。.m4a-为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名,AppleiTunes对纯音频MP4文件采用了".m4a"命名。M4A的本质和音频MP4相同,故音频MP4文件亦可直接更改扩展名为M4A。概览作为一种高压缩比的音频压缩算法,AAC压缩比通常为18:1,也有数据说为20:...

扩展名

AAC 编码的主要扩展名有三种:

.aac - 使用MPEG-2 Audio Transport Stream(ADTS, 参见MPEG-2 )容器,区别于使用MPEG-4容器的MP4/M4A格式,属于传统的AAC编码(FAAC默认的封装,但FAAC亦可输出MPEG-4封装的AAC)。

.mp4 - 使用了MPEG-4 Part 14(第14部分)的简化版即3GPP Media Release 6 Basic(3gp6, 参见3GP )进行封装的AAC编码(Nero AAC编码器仅能输出MPEG-4封装的AAC)。

.m4a - 为了区别纯音频MP4文件和包含视频的MP4文件而由苹果(Apple)公司使用的扩展名,Apple iTunes对纯音频MP4文件采用了".m4a"命名。M4A的本质和音频MP4相同,故音频MP4文件亦可直接更改扩展名为M4A。

概览

作为一种高压缩比的音频压缩算法,AAC压缩比通常为18:1,也有数据说为20:1;在音质方面,由于采用多声道,和使用低复杂性的描述方式,使其比几乎所有的传统编码方式在同规格的情况下更胜一筹。不过直到2006年,使用这一格式存储音乐的并不多,可以播放该格式的mp3播放器更是少之又少,目前所知仅有苹果iPod、SonyWalkman(NWZ-A、NWZ-S、NWZ-E、NWZ-X系列)、任天堂NDSi和iPhone(微软推出的Windows 7附带的Windows Media Player 12也支持AAC)。此外电脑上很多音乐播放软件都支持AAC(前提是安装过AAC解码器),如苹果iTunes。但在移动电话领域,AAC的支持度已很普遍,Nokia、Sony Ericsson、Motorola等品牌均在其中高端产品中支持AAC(一开始主要是LC-AAC,随着移动电话性能的发展,HE-AAC的支持也已广泛)。

特点

AAC可以支持多达48个音轨,15个低频(LFE)音轨,5.1多声道支持,更高的采样率(最高可达96kHz,音频CD为44.1kHz)和更高的采样精度(支持8bit、16bit、24bit、32bit,音频CD为16bit)以及有多种语言的兼容能力,更高的解码效率。

改良与扩充

相对于传统的LC-AAC,High Efficiency AAC(高效AAC,简写为HE-AAC或AAC-HE)又称为"aacPlus v1"或"AAC+"- 结合了谱带复制(Spectral Band Replication,SBR)及AAC技术;适用于低比特率(64kbps以下);

HE-AAC v2,又称为"aacPlus v2" - 结合了参数化立体声(Parametric Stereo,PS)和HE-AAC中的SBR技术。

规格一览

因为AAC是一个庞大家族,他们共分为9种规格,以适应不同场合的需要,也正是由于AAC的规格(Profile)繁多,导致普通电脑用户感觉十分困扰:

MPEG-2 AAC LC低复杂度规格(Low Complexity)

MPEG-2 AAC Main主规格

MPEG-2 AAC SSR可变采样率规格(Scaleable Sample Rate)

MPEG-4 AAC LC低复杂度规格(Low Complexity),现在的手机比较常见的MP4文件中的音频部分就包括了该规格音频文件

MPEG-4 AAC Main主规格

MPEG-4 AAC SSR可变采样率规格(Scaleable Sample Rate)

MPEG-4 AAC LTP长时期预测规格(Long Term Predicition)

MPEG-4 AAC LD低延迟规格(Low Delay)

MPEG-4 AAC HE高效率规格(High Efficiency)

MPEG-4 AAC LC(Low Complexity)是最常用的规格,我们叫“低复杂度规格”,我们简称“LC-AAC”,这种规格在中等码率的编码效率以及音质方面,都能找到平衡点。所谓中等码率,就是指:96kbps-192kbps之间的码率。因此,如果要使用LC-AAC规格,请尽可能把码率控制在之前说的那个区间内。

编码器一览

由于AAC格式家族比较庞大,要了解他,首先要清楚其各有不同的编码器,目前包括了商业的、免费的AAC格式音频编码器,其中几个主要的编码器如下:

FhG:Fraunhofer IIS研发的权威编码器,

Nero AAC:同时支持LC-AAC / HE-AAC规格,由Nero公司免费发布的Nero AAC编码器

QuickTime/iTunes:Apple公司的两款软件都提供了AAC编码功能,其编码技术来自"Dolby Laboratories"(简写为Dolby Labs,杜比实验室)

FAAC(Freeware Advanced Audio Coder):也是一种很好的命令行编码器,支持LC/Main/LTP规格,而这个软件是免费的。FAAC是属于自由软件。

DivX AAC:2009年DivX开发出来的新AAC编码器,支持LC/HE/HEv2规格。目前正在测试中。

另外还有Psytel(已停止开发),Coding Technologies(已被杜比实验室收购),HHI/z Plane(Compaact),Dolby AAC等AAC编码器,而其他如Panasonic,Nokia,AT&T,NEC等公司也都有独家开发的编码器,在大家弄清楚这些AAC格式音频规格和编码器之后,我们就不难知道为什么同一款手机会支持看起来都是AAC格式音频的诸多文件格式了,比如Nokia 6230i就是既支持AAC格式也支持M4A格式和MP4格式的机型,而这些音频文件格式其实都是属于AAC家族成员。

目前听到用的比较多的应该是LC和HE(适合低码率)。

HE:“high efficiency”(高效性)。HE-AAC v1(又称AACPlusV1,SBR)用容器的方法加了原AAC(LC)+SBR技术。SBR其实代表的是Spectral Band Replication(频段复制)。简单概括一下,音乐的主要频谱集中在低频段,高频段幅度很小,如果对整个频段编码,要么为了保护高频造成低频段编码过细以致文件巨大,要么为了保存了低频的主要成分而失去高频成分以致丧失音质。SBR把频谱切割开来,低频单独编码保存主要成分,高频单独放大编码保存音质,在相同音质下降低了文件大小。

HEv2(又称为HEPS)它用容器的方法包含了HE-AAC v1和PS技术。PS指“Parametric Stereo”(参数立体声)。这个其实好理解,原来的立体声文件,文件大小是一个声道的两倍。但是两个声道的声音存在某种相似性,根据香农信息熵编码定理,相关性应该被去掉才能减小文件大小。所以PS技术存储了一个声道的全部信息,然后,花很少的字节用参数描述另一个声道和它不同的地方。

许可和专利

用户不需要许可或付款来流式传输或分发AAC格式的内容。 这个原因可以使AAC比照其前身的MP3一样,特别是根据适用于流媒体(如互联网广播)分发内容成为更有吸引力的格式。

然而,AAC 编解码器的所有制造商或开发商都需要专利许可。 因此,FFmpeg和FAAC等自由开放源代码软件的实现可能仅以源代码形式分发,以避免专利侵权。

 


免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。

——— 没有了 ———
编辑:阿族小谱
发表评论
写好了,提交
{{item.label}}
{{commentTotal}}条评论
{{item.userName}}
发布时间:{{item.time}}
{{item.content}}
回复
举报
点击加载更多
打赏作者
“感谢您的打赏,我会更努力的创作”
— 请选择您要打赏的金额 —
{{item.label}}
{{item.label}}
打赏成功!
“感谢您的打赏,我会更努力的创作”
返回

更多文章

更多精彩文章
打赏
私信

推荐阅读

· 编码
扩展定义对于特定的上下文,编码有一些更具体的意义。编码(Encoding)在认知上是解释传入的刺激的一种基本知觉的过程。技术上来说,这是一个复杂的、多阶段的转换过程,从较为客观的感觉输入(例如光、声)到主观上有意义的体验。字符编码(Characterencoding)是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。文字编码(Textencoding)使用一种标记语言来标记一篇文字的结构和其他特征,以方便计算机进行处理。语义编码(Semanticsencoding),以正式语言乙对正式语言甲进行语义编码,即是使用语言乙表达语言甲所有的词汇(如程序或说明)的一种方法。电子编码(Electronicencoding)是将一个信号转换成为一个代码,这种代码是被优化过的以利于传输或存储。转换工作通常由一个编解码器完成。神经编码...
· E编码
格式E编号的格式为E字后加三位数字,分类细项则是EXXX之后再加上i∕ii∕iii或abcd,新项目到用四位数字:EXXXX。分类所有有E编号的食品添加物又更进一步可根据他们的号码分成几大类。食用色素此类别的添加物主要用来使食物具有多种颜色,某些食用色素也具有香味。例如一般常见的橘子汽水,就是加入食用色素调制而成。E100-109–黄色食用色素E110-119–橙色食用色素E120-129–红色食用色素E130-139–蓝色食用色素和紫色食用色素E140-149–绿色食用色素E150-159–棕色食用色素和黑色食用色素E160-199–其他颜色的食用色素防腐剂防腐剂类的添加物主要用于延长食品保存期限,通常都具有抑制细菌生长的功用,以达到防止食品腐坏的效果。E200-209–山梨酸盐类(E201/E202)E210-219–苯甲酸盐类(E211)E220-229–亚硫酸盐类(E227)E23...
· 熵编码法
编码使用长度不同的比特串对字母进行编码有一定的困难。尤其是,几乎所有几率的熵都是一个有理数。使用整数比特(bit)霍夫曼编码建议了一种将比特进位成整数的算法,但这个算法在特定情况下无法达到最佳结果。为此有人加以改进,提供最佳整数比特数。这个算法使用二叉树来设立一个编码。这个二叉树的终端节点代表被编码的字母,根节点代表使用的比特。除这个对每个要编码的数据产生一个特别的表格的方法外还有使用固定的编码表的方法。比如加入要编码的数据中符号出现的概率匹配一定的规则的话就可以使用特别的变长编码表。这样的编码表具有一定的系数来使得它适应实际的字母出现概率。改进使用整数比特的方法往往无法获得使用熵计算的比特数,因此其压缩并非一定最佳。比如字母列由两个不同的字母组成,其中一个字母的可能性是p(A)=0.75{\displaystyle\mathrm{p}(A)=0{.}75},另一个字母的可能性是p(B)=...
· 编码器
举例媒体以下的软件可以将声音、视频或是文字等数据编码成标准格式:压缩软件可以将数据(如声音、图片或视频)编辑成长度较小的数据(引用编解码器)。音频编解码器可以转换及压缩声音数据。视频压缩可以转换及压缩数字视频数据。加密更多资料:密码学和加密基于数据隐私的需求。又分成可逆与不可逆两种。以做为验证系统登录的密码为例,其存放在数据库时,则常使用不可逆的散列函数进行编码,以防止当存放密码的数据库外泄时,被外人轻易得知密码。可逆的加密编码,则配合解码器与用于解密的密钥,以便将数据还原。文件验证为了验正文件的完整性,常使用CRC32、MD5、SHA1等方式计算验证用的键值。传感器支持EnDat通信协议的旋转编码器传感器的编码器是利用光学或磁性或是机械接点的方式感测位置,并将位置转换为电子信号后输出,作为控制位置时的回授信号。传感器依运动方式可分为旋转编码器或是线性编码器(英语:linearencode...
· 音频工程师
研究开发音频工程师他们进行研究开发创造新科技、测试设备和专门技术,提高进程还有艺术性。他们可以设计室内声场模拟、为音频信号处理(audiosignalprocessing)做塑形运算、指定公共广播系统(英语:publicaddresssystems)(publicaddresssystems)、为电子游乐器生产制造所进行可听声波的研究,以及其他音频工程先进领域。他们也可以被称为声学工程师。教育音频工程师从事研究开发工作可能来自于像是声学、计算机科学、广播工程(英语:broadcastengineering)(broadcastengineering)、物理学、声学工程(英语:acousticalengineering)(acousticalengineering)以及电子学这样的专业背景。音频工程课程在大学或是学院概约的分成两大类别:(一)培训成为音响工程师且有创造性的运用音频,还有(二)...

关于我们

关注族谱网 微信公众号,每日及时查看相关推荐,订阅互动等。

APP下载

下载族谱APP 微信公众号,每日及时查看
扫一扫添加客服微信