锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

MP3参数,格式,术语有关一切内容详解。

时间:2022-10-09 02:00:00 kh系列交流电流变送器as4n胆电容精密电阻thick咖啡机用铝电解电容器2s9分压电阻aac过载继电器

原文:http://itbbs.pconline.com.cn/bbs/3119490.html

一音频编码篇

通常我们使用脉冲代码来调制编码,即PCM编码。PCM连续变化的模拟信号通过抽样、量化和编码转换为数字编码。

1.采样率和采样大小是什么(位/bit)?

频率对应时间轴,振幅对应电平轴。波是无限光滑的,弦线可以看作是由无数点组成的,由于存储空间相对有限,在数字编码过程中,弦线的点必须采样。采样过程是提取某一点的频率值。显然,一秒钟内提取的点越多,获取的频率信息就越丰富。为了恢复波形,振动中必须有两个点,人耳能感觉到的最高频率是20kHz,因此,为了满足人耳的听觉要求,每秒至少需要40次k次采样,用40kHz表达,这个40kHz是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的。我们还必须获得频率的能量值并量化来表示信号强度。我们常见的量化电平数为2的整数次幂CD位16bit采样大小,即2的16次方。采样的大小比采样率更难理解,因为显得抽象,举个简单的例子:假设一波采样8次,采样点对应的能量值分别为A1-A但是我们只用2bit我们只能保留采样的大小A1-A8中4个点的价值放弃另外4个。假如我们做3bit采样大小刚好记录了8点的所有信息。采样率和采样尺寸值越大,记录的波形越接近原始信号。

2.损坏和无损

根据采样率和采样寸可以看出,与自然信号相比,音频编码最多只能无限接近,至少目前的技术只能是这样。与自然信号相比,任何数字音频编码方案都受损,因为无法完全恢复。在计算机应用中,能达到最高保真水平的是PCM编码,被广泛用于素材保存及音乐欣赏,CD、DVD以及我们常见的WAV应用于文件中。因此,PCM约定俗成无损编码,因为PCM代表数字音频中最好的保真水平,并不意味着PCM确保信号绝对保真,PCM只有最大限度的无限接近。习惯性地把我们MP三是相对于有损的音频编码类别PCM编码的。强调编码的相对损坏和无损是为了告诉你很难实现真正的无损,就像用数字来表达圆周率一样。无论精度有多高,它只是无限接近,而不是真正等于圆周率的值。

3.为什么要使用音频压缩技术?

要算一个PCM音频流的码率很容易,采样率值×采样大小值×声道数bps。采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件的数据速率是44.1K×16×2=1411.2Kbps。我们常说128K的MP3,对应的WAV这个参数就是这个1411.2Kbps,该参数也被称为数据带宽ADSL带宽是一个概念。将码率除以8,就可以得到这个WAV1766.4KB/s。这意味着存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM176.4KB1分钟的空间约为10分钟.34M,这对大多数用户来说是不可接受的,尤其是那些喜欢在电脑上听音乐的人。减少磁盘占用只有两种方法,以减少采样指标或压缩。因此,专家们开发了各种压缩方案来降低指标。由于用途不同于目标市场,各种音频压缩编码达到的音质和压缩比也不同,我们将在后面的文章中逐一提到。可以肯定的是,他们都压缩了。

4.频率与采样率的关系

  采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz和20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD的44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。 

  因为,根据耐奎斯特采样理论,你的采样频率必须是信号最高频率的两倍。例如,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。 而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz。22Khz×2=44Khz,考虑到一定的余量采用44.1Khz. 

5、流特征 

  随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。 


                             WAVE文件的编解码器
WAV文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFF和IFF格式。多媒体应用中使用了多种数据,包括位图、音频数据、视频数据以及外围设备控制信息等。RIFF为存储这些类型的数据提供了一种方法,RIFF文件所包含的数据类型由该文件的扩展名来标识,能以RIFF文件存储的数据包括:


# 音频视频交错格式数据(.AVI)

# 波形格式数据(.WAV)

# 位图格式数据(.RDI)

# MIDI格式数据(.RMI)

# 调色板格式(.PAL)

# 多媒体电影(.RMN)

# 动画光标(.ANI)

# 其它RIFF文件(.BND)

  RIFF是一种含有嵌套数据结构的二进制文件格式,每个数据结构都称为因一个chunk(块)。Chunk在RIFF文件中没有固定的位置,因而偏移量不能用于定位域值。一个块中的数据包括数据结构、数据流或其它组块(称为子块)等,每个RIFF块都具有如下结构:

typedef struct _Chunk

{

DWORD ChunkId; /*块标志*/

DWORD ChunkSize; /*块大小*/

BYTE ChunkData[ChunkSize]; /*块内容*/

} CHUNK;

  ChunkId由4个ASCII字符组成,用以识别块中所包含的数据。字符RIFF用于标识RIFF数据块,间隔空格在右面是不超过4个字符的ID。由于这种文件结构最初是由Microsoft和IBM为PC机所定义,RIFF文件是按照little-endian字节顺序写入的,而采用big-endian字节顺序的文件则用‘RIFX’作为标志。

  ChunkSize(块大小)是存储在ChunkData域中数据的长度,ChunkId与ChunkSize域的大小则不包括在该值内。

  ChunkData(块内容)中所包含的数据是以字(WORD)为单位排列的,如果数据长度是奇数,则在最后添加一个空(NULL)字节。

  子块(Subchunk)与块具有相同的结构。一个子块就是包含在其它块内部的一个块,只有RIFF文件块‘RIFF’和列表块‘List’才能含有子块,所有其它块仅能含有数据。一个RIFF文件就是一个RIFF块,文件中所有其它块和子块均包含在这个块中。

  WAV文件可以存储大量格式的数据,通常采用的音频编码方式是脉冲编码调制(PCM)。由于WAV格式源自Windows/Intel环境,因而采用Little-Endian字节顺序进行存储。

脉冲编码调制

  Claude E. Shannon于1948年发表的“通信的数学理论”奠定了现代通信的基础。同年
贝尔实验室的工程人员开发了PCM技术,虽然在当时是革命性的,但今天脉冲编码调制被视为是一种非常单纯的无损耗编码格式,音频在固定间隔内进行采集并量化为频带值,其它采用这种编码方法的应用包括电话和CD。PCM主要有三种方式:标准PCM、差分脉冲编码调制(DPCM)和自适应DPCM。在标准PCM中,频带被量化为线性步长的频带,用于存储绝对量值。在DPCM中存储的是前后电流值之差,因而存储量减少了约25%。自适应DPCM改变了DPCM的量化步长,在给定的信造比(SNR)下可压缩更多的信息。

共同的执行过程

  在对WAV音频文件进行编解码过程中,最一致的地方包括采样点和采样帧的处理和转换。一个采样点的值代表了给定时间内的音频信号,一个采样帧由适当数量的采样点组成并能构成音频信号的多个通道。对于立体声信号一个采样帧有两个采样点,一个采样点对应一个声道。一个采样帧作为单一的单元传送到数/模转换器(DAC),以确保正确的信号能同时发送到各自的通道中。

WAVE音频格式的优缺点

  WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。WAV格式的另外一个潜在缺陷是在32位WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。 
                            
                           二 有损与无损格式篇
 1.无损压缩格式FLAC与APE对比

在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩!我们常见到的MP3、WMA、OGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,也就是我们今天所要说的主题内容。无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。目前无损压缩格式有APE、FLAC、WavPack、LPAC、WMALossless、AppleLossless、La、OptimFROG、Shorten,而常见的、主流的无损压缩格式目前只有APE、FLAC。下面就针对这两种无损压缩格式进行一下对比!

    APE是Monkey's Audio,一种无损压缩格式。这种格式的压缩比远低于其他音频格式,但能够做到真正无损,同时其开放源码的特性,也获得了不少音乐发烧友的青睐。在现有不少无损压缩方案中,APE是一种有着突出性能的格式,令人满意的压缩比以及飞快的压缩速度,在国内应用比较广泛,成为了不少朋友私下交流发烧音乐的选择之一。

    FLAC是Free Lossless Audio Codec的简称,是一种非常成熟的无损压缩格式,名气不在APE之下!该格式的源码完全开放,而且兼容几乎所有的操作系统平台。它的编码算法相当成熟,已经通过了严格的测试,当在编码损坏时依然能正常播放。另外,该格式是最先得到广泛硬件支持的无损格式,世界知名数码产品如:Rio公司的硬盘随身听Karma,建伍的车载音响MusicKeg以及PhatBox公司的数码播放机都能支持FLAC格式。

    
    前面已经说明,无损压缩是在保证不损失源文件所有码率的前提下,将音频文件压缩的更小,也就是说这两种音频格式都能保证源文件码率的无损。但两种压缩格式毕竟为两种压缩算法,下面列举一下两种压缩格式的异同点:

相同点:

    一、压缩比决定无损压缩文件所占存储空间

    FLAC与AEP的压缩比基本相同,FLAC的压缩比为58.70%,而APE的压缩比则要更高一些,为55.50%,都能压缩到接近源文件一半大小。

    二、编码速度考验用户的耐心,速度快者优

    非常值得赞扬的是,FLAC与APE的编码速度都相差无几,这是因为两者的压缩技术是开源的,开发者可以借鉴两者在编码上的不同优势进行开发,不过目前编码速度最快的是WavPack和Shorten两种无损压缩格式,但这两种格式的非开源性限制了其普及。

    三、平台的支持决定普及度

    音频压缩不但需要硬件的支持,也需要的软件的支持,因此能够被更广泛的平台支持,也就意味着被更多用户使用。FLAC与APE在这方面做的都非常出色,能够兼容所有系统平台,现在无论您是Windows用户还是众多版本的Linux用户,哪怕您是Mac OS的忠实FANS,都无需担心无法使用FLAC或APE。

    四、两者的开源特性,完全免费的技术

    两者的开源特性,意味着任何组织或个人都可以免费使用这两种压缩技术,任何组织或个人都可以修改和发布基于这两种技术的新产品,这给众多MP3厂商降低成本提供了有力保障,且消费者也能够以相对低廉的价格购买到只有世界级MP3(例如:iPod支持ALAC)才支持的无损压缩音频、CD级的音质表现!

不同点:

    一、自我纠错能力,谁更人性化?

    很多消费者都经历过MP3的爆音问题,然后归咎于MP3质量有问题,其实,很大一部分爆音是因为音频压缩过程中,编码的微小损坏,造成在解码时,处理出来的数据与音频不一致,导致爆音现象。无损格式压缩的不好也会导致编码损坏,而在处理这种问题时,FLAC的会以静音方式代替有损部分,而APE的处理则与常见的有损压缩格式处理的方式相同,以爆音方式代替有损部分。这一点FLAC设计的更人性化!

    二、优化的编码结构,决定了解码的速度!

    由于编码方式的不同,将影响两种无损压缩格式的解码速度,通常FLAC的解码速度比APE快30%,这是因为,FLAC只需执行整数运算,而无需执行占用系统更高频率和更大数据处理量的浮点运算。基于这一点,一般硬件均可完美实现实时解码。

    三、方便的资源获取,意味着能够得到更广泛的应用与支持

    无论FLAC还是APE,在资源获取上,两者都能通过网络搜索轻松获得!

    通过以上的对比,相信很多用户对FLAC和APE的认识更加深了一些,单从技术角度讲,FLAC要明显比APE优秀,原因在于,FLAC是第一个开源的且被世界公认的无损压缩格式,有来自世界各地的顶尖级开发高手对FLAC进行免费的开发与技术完善,同时,FLAC有广泛的硬件平台的支持,几乎所有采用便携式设计的高端解码芯片都能够支持FLAC格式的音乐,FLAC第三个优势在于:优秀的编码使得硬件在解码时只需采用简单的整数运算即可,这将大大降低所占用的硬件资源!不过两种公开的技术具有极强的互补性,任何一方都不可能全面超越另一方!

                

 2.主流音频格式浅析之一 有损压缩篇

·谁说MP3播放器好就行了? 
 
   随着MP3播放器的普及,越来越多的MP3走进我的视线,在选择一款自己喜欢的MP3播放器的同时,不知道各位玩家有没有想过,我们每天听的都是些怎样的音乐呢?

  我们都知道MP3播放器的音质相当重要,没有好的音质表现,外观再漂亮的MP3都称不上完美;可如果只有好的工具,显然还是不够的,音源方面也是不容忽视的,那么我们对每天听的那些音乐又有多少了解?它们都有那些格式?孰优孰劣?

  我想可能有玩家会说,MP3播放器,播放的不就是MP3么?如果这样想,那您就大错特错了——是的,MP3确实是MP3播放器支持的最基本格式,可除了MP3,我们还有更多可以选择的数字音频格式:

  数字音频格式,最早指的是CD;而CD经过压缩之后,才产生了林林总总的数码随身听适用音频格式。这里所说的压缩,是指把PCM编码的或WAV格式的音频流经过特殊的压缩处理,转换成其他格式,从而达到缩小文件体积、节省空间的效果,而这种压缩大致上又可以分为两类:有损压缩的和无损压缩。

  有损压缩是指经过压缩后产生的新文件所保留的声音信号相对于原来的PCM/WAV格式的信号而言有所削减;无损压缩是指经过压缩后产生的新文件所保留的声音信号相对于原来的PCM/WAV格式的信号而言完全相同,没有削减。当然,我们这里所说的无损压缩,和自然、真实的声音相比还是有损的——作为数字音频格式,只能做到无限接近于无损,想要完全做到无损显然是不可能的。所以一般来说,都以PCM作为最高的保真水平。

MP3和WMA 有谁不支持么? 
 
 
  先来说说有损压缩格式吧。

  我们目前能得到的比较流行的有损压缩格式主要有MP3、WMA、OGG、MP3pro、AAC、VQF、ASF等。

  MP3格式。自不待言,这是最为我们广大玩家熟知的音频格式,也是最为流行的音频格式,我们在网络上能找到的音频文件大都是MP3格式的。MP3全称MPEG Audio Laye-3,是由德国夫朗和费研究院(Faunhofe IIS)和法国汤姆逊(Thomson)公司于1993年推出的杰作。

  早期的MP3编码技术并不完善,很长的一段时间以来,大多数人都使用128Kbps的CBR(固定编码率)来对MP3文件进行编码,直到近年VBR(可变编码率)和ABR(平均编码率)压缩方式的出现,MP3文件的音质才取得了长足进步,目前MP3格式编码比特率最高可达320Kbps,其音质绝非128Kbps可比。

  鉴于MP3格式大家都很熟悉,笔者这里就不再赘述。

  WMA格式。相信绝大多数玩家手中的MP3播放器都支持这种格式,WMA和MP3同样是MP3播放器所支持的最基本格式。WMA全称Windows Media Audio,看名字就知道是微软的杰作,相对于MP3来说,WMA最大的特点就是有极强的可保护性,从某种程度上我们也可以说,WMA就是针对MP3没有版权保护的缺点而推出的,因此WMA广受唱片公司欢迎。

  从文件体积和音质上来看,文件比特率小于128Kbps时,WMA格式文件体积比MP3格式小,音质也要优于后者;文件比特率大于128Kbps时,MP3格式文件的音质则要更胜一筹。

   鉴于MP3格式文件编码比特率的提高,320Kbps的MP3文件音质要优于WMA格式;而网络上的音源也要远多于后者,对于追求音质的玩家来说,笔者认为MP3格式是更好的选择。

MP3pro和OGG 不能只看到流行 
 
 
  上文介绍的是两种最常见的音频格式。当然,除了MP3和WMA,我们还有其它选择:

  MP3pro格式。上文笔者说过,MP3在很长一段时间以来编码技术并不完善,仅能达到128Kbps的编码比特率,而音质更佳、文件体积更小、又有版权保护的WMA格式的问世,对其造成了很大的威胁,并大有淘汰MP3格式文件的趋势。面对这样的严峻形式,德国夫朗和费研究院(Faunhofe IIS)和法国汤姆逊(Thomson)公司又携手发布了一种新的音频格式——MP3pro。

  MP3pro是对MP3格式的改良,其编码算法要比MP3复杂得多。MP3pro分两层编码,简单的说,它是在MP3的基础上再与SB频段复制技术进行混合编码。这种格式在低比特率的时候压缩率非常高,同比特率的MP3pro文件体积要比MP3和WMA都小得多,而音质却是三者之最!不仅如此,MP3pro格式文件扩展名同MP3一样,都是.mp3,也就是说它还兼容MP3格式文件。

  小令点评:从技术上讲,MP3pro是一种非常优秀的编码方式,同时凌驾于MP3和WMA之上;但遗憾的是它高昂的专利费限制了它的流行。当然,Thomson的玩家就不在此列了,因为Thomson的播放器可以很好的支持MP3pro格式。

  OGG格式。OGG全称OGG Vobis,是一种免费的开源音频格式。它最出众之处就是支持多声道,而不像MP3只能支持双声道。多声道音乐的优点是非常明显的,它可以带给玩家更强烈的现场感,欣赏电影和交响乐时尤其有优势。

  除了多声道,OGG格式相较MP3格式的另一大优势是在文件体积相对较小的情况下实现更好的音质。Q0(64Kbps码率)品质的OGG格式文件就能达到128Kbps码率MP3格式文件的音质,可以节省约一半的存储空间;而Q10(500Kbps)品质的OGG格式文件的音质与无损压缩的CD级WAV格式文件处于同一水平,而文件大小却只有WAV格式文件的三分之一左右。可以看出,OGG的编码格式比MP3要先进,它同MP3一样支持VBR(可变比特率)和ABR(平均比特率)两种编码方式,还具有比特率缩放功能,可以不用重新编码便可调节文件的比特率。

  小令点评:OGG格式所采用的压缩技术比MP3好,但比MP3pro差一些。随着它的流行,以后用随身听来听DTS编码的多声道作品将不再是梦想。其多声道、免费、开源等特点使它很有可能成为一个新的流行音频格式,现在已有不少MP3播放器可以支持OGG格式文件。

  以上四种有损压缩的音频格式是较为常见,影响力也较大的,除此之外还有ASF、VQF、AAC等其它音频格式,但都影响不大,音源也较少。其中AAC(即Advance Audio Coding),是杜比试验室的作品,支持的量化级和采样率都很高,同OGG一样支持多声道,音质佳;但是由于其对硬件要求相对较高,因此目前为止只有iPod支持这种格式。

现在市面上的MP3播放器大多都支持MP3和WMA格式,无疑MP3更加流行,允为目前最为流行的音频文件格式;MP3pro格式则由于其高昂的专利费流传不广;从目前来看最有发展空间的还是OGG格式,不少MP3播放器厂商也开始在其产品中支持OGG格式,但在短期内它还无法取代MP3的地位。



主流音频格式浅析之二 无损压缩篇

 3.无损,就是无损 APE格式 
 
   在《主流音频格式浅析之一 有损压缩篇》中笔者为大家简单的介绍了几种较为常见的有损压缩音频格式,它们也是广大玩家MP3播放器中音乐的“中坚力量”,尤其是MP3格式,更是占据了其中的大半壁江山。

  但对于很多对音质比较挑剔的玩家,尤其是发烧级玩家来说,有损压缩音频文件的音质远远不能满足他们的要求,这时无损压缩就显得非常必要了,今天笔者为大家简单的介绍几种能在MP3播放器上播放的无损压缩音频格式,对音质要求较高的玩家不妨看一下。

  相对于有损压缩的一些格式,无损压缩格式对很多玩家来说还比较陌生,事实上无损压缩的技术已经相当成熟,今天笔者将介绍其中几种比较常见的格式:

  APE格式。说起无损压缩,就不能不提APE格式。APE是目前流行的、由Monkey's Audio出品的一种数字音乐文件格式。与MP3、OGG这类有损压缩方式不同,APE是目前世界上惟一得到公认的音频无损压缩格式,也就是说当您将从音频CD上读取的音频数据文件压缩成APE格式后,还可以再将APE格式的文件还原,而还原后的音乐文件与压缩前一模一样,没有任何损失!由于APE的采样率高达800kbps~1400kbps,接近于音乐CD的1411.2kbps,远远高于MP3的128kbps,因此它在压缩后的音质和源文件音质几乎毫无差异,其音质之佳已经过了严格的盲听测试,得到了全世界发烧友的公认,这些都是其它压缩方式所无法比拟的。
                                                              在APE出现之前,人们都认为以CD或者WAV来保存自己喜欢的音乐是最好的方法;但APE的出现,足以使他们改变这种看法,因为APE既可以保持音乐信号的无损,又可以以比WAV高得多的压缩率(接近2:1)压缩文件,而且可以无须解压直接播放。由于压缩后的APE文件只有源文件一半左右大小,因此它受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的玩家来说,APE可以帮助他们节约大量的资源和时间。
元器件数据手册、IC替代型号,打造电子元器件IC百科大全!

相关文章