锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

MP3参数,格式,术语有关一切内容详解

时间:2022-10-09 03:00:00 kh系列交流电流变送器as4n胆电容精密电阻thick咖啡机用铝电解电容器2s9分压电阻aac过载继电器

了解评价文章的专业术语:


音域: 乐器或人声可以达到最高音和最低音之间的范围。

音色: 声音的基本属性之一,如二胡,琵琶是不同的音色。

音染: 音乐自然中性的对立面,即声音染上了节目本身节目本身所没有的一些特征。例如,通过在罐子里说话获得的声音是典型的声音染色。声音染色表明重放信号中有更多(或减少)的成分,这显然是一种扭曲。

失真:设备输出不能完全复制其输入,导致波形畸变或信号成分增减。

动态:允许记录最大信息与最小信息之比。

瞬态响应:设备跟踪音乐中突发信号的能力。瞬态响应良好的设备应立即响应信号,信号停止,永不拖延。(典型乐器:钢琴)

信噪比:又称信噪比,信号的有用成分与杂音的强度对比常用分贝数表示。设备的信噪比越高,噪声就越小。

空气感:用于表示高音的开阔,或是声场中在乐器之间有空间间隔的声学术语。此时,高频响应可延伸到15kHz-20kHz。反义词有灰暗(dull)”和“厚重(thick)”。

低频延伸:指音响器材所能重放的最低频率。系用于测定在重放低音时音响系统或音箱所能下潜到什么程度的尺度。比方说,小型超低音音箱的低频延伸可以到40Hz,大型超低音箱潜入16Hz

亮:指突出4kHz-8kHz在高频段,谐波相对强于基波。明亮本身没有问题。现场演奏的音乐会有明亮的声音。问题是,如果太明亮(甚至咆哮),它就会很烦人。

瞬态:如果声音增然增大或减小,如果声音增大 / 声压到声压所需的时间越少,瞬态越好,实际表现为声音能够接受而不混淆。

动态:最小声压或功率、电压与最大声压的比例,量化是动态范围。

音色:声音的趋势,如高频清晰或低频强度或强烈的声音跳跃。在一定程度上,音色是好是坏,完全取决于个人偏好。

声音丰满:指高、中、低音的比例适当,高音适中,中音充足,听起来有弹性。 有层次:有层次的声音是指重放声能真正反映乐队的整体感。

清晰:是指语言的可懂度高,音乐层次分明。

平衡:指音乐各声部的比例协调,左右声道的一致性。

丰满:指中音充足,高音适中,声音适中,听起来温暖、舒适、有弹性。

强度:指声音坚实有力,能呼之欲出感,同时能反映声源的动态范围。

园润:是指声音优美,有光泽而不尖噪。

柔和:指声音松弛不紧,高音不刺耳,听起来悦耳舒适。

融合:指声音能整体融合,整体感和群体感好。

nbsp;

 

 

  

真实感:是指声音能保持原声音的特点。

 

 

 

  

临场感:重放声音时使人有身临其境的感觉。

 

 

 

  

立体感:指声音有空间感,声象方位其本准确,并有宽度感和纵深感。

 

 

 

  

总印象:是指对声音的总体感觉。

 

 

 

 

一 音频编码篇

 

 通常我们采用脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

 

 

 

1、什么是采样率和采样大小(位/bit)?

 

 

 

  频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线的点进行采样。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。光有频率信息是不够的,我们还必须获得该频率的能量值并量化,用于表示信号强度。量化电平数为2的整数次幂,我们常见的CD16bit的采样大小,即216次方。采样大小相对采样率更难理解,因为要显得抽象点,举个简单例子:假设对一个波进行8次采样,采样点分别对应的能量值分别为A1-A8,但我们只使用2bit的采样大小,结果我们只能保留A1-A84个点的值而舍弃另外4个。如果我们进行3bit的采样大小,则刚好记录下8个点的所有信息。采样率和采样大小的值越大,记录的波形更接近原始信号。

 

 

 

2、有损和无损

 

 

 

  根据采样率和采样大小可以得知,相对自然界的信号,音频编码最多只能做到无限接近,至少目前的技术只能这样了,相对自然界的信号,任何数字音频编码方案都是有损的,因为无法完全还原。在计算机应用中,能够达到最高保真水平的就是PCM编码,被广泛用于素材保存及音乐欣赏,CDDVD以及我们常见的WAV文件中均有应用。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。我们而习惯性的把MP3列入有损音频编码范畴,是相对PCM编码的。强调编码的相对性的有损和无损,是为了告诉大家,要做到真正的无损是困难的,就像用数字去表达圆周率,不管精度多高,也只是无限接近,而不是真正等于圆周率的值。

 

 

 

3、为什么要使用音频压缩技术

 

 

 

  要算一个PCM音频流的码率是一件很轻松的事情,采样率值×采样大小值×声道数bps。一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的WAV文件,它的数据速率则为 44.1K×16×2 =1411.2 Kbps。我们常说128KMP3,对应的WAV的参数,就是这个1411.2 Kbps,这个参数也被称为数据带宽,它和ADSL中的带宽是一个概念。将码率除以8,就可以得到这个WAV的数据速率,即176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M,这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。由于用途和针对的目标市场不一样,各种音频压缩编码所达到的音质和压缩比都不一样,在后面的文章中我们都会一一提到。有一点是可以肯定的,他们都压缩过。

 

 

 

4、频率与采样率的关系

 

 

 

  采样率表示了每秒对原始信号采样的次数,我们常见到的音频文件采样率多为44.1KHz,这意味着什么呢?假设我们有2段正弦波信号,分别为20Hz20KHz,长度均为一秒钟,以对应我们能听到的最低频和最高频,分别对这两段信号进行40KHz的采样,我们可以得到一个什么样的结果呢?结果是:20Hz的信号每次振动被采样了40K/20=2000次,而20K的信号每次振动只有2次采样。显然,在相同的采样率下,记录低频的信息远比高频的详细。这也是为什么有些音响发烧友指责CD有数码声不够真实的原因,CD44.1KHz采样也无法保证高频信号被较好记录。要较好的记录高频信号,看来需要更高的采样率,于是有些朋友在捕捉CD音轨的时候使用48KHz的采样率,这是不可取的!这其实对音质没有任何好处,对抓轨软件来说,保持和CD提供的44.1KHz一样的采样率才是最佳音质的保证之一,而不是去提高它。较高的采样率只有相对模拟信号的时候才有用,如果被采样的信号是数字的,请不要去尝试提高采样率。

 

 

 

  因为,根据耐奎斯特采样理论,你的采样频率必须是信号最高频率的两倍。例如,音频信号的频率一般达到20Hz,因此其采样频率一般需要40Hz。 而人耳收听的范围只能到23Khz以下,所以CD的采样率才是44.1Khz22Khz×2=44Khz,考虑到一定的余量采用44.1Khz.

 

 

 

5、流特征

 

 

 

  随着网络的发展,人们对在线收听音乐提出了要求,因此也要求音频文件能够一边读一边播放,而不需要把这个文件全部读出后然后回放,这样就可以做到不用下载就可以实现收听了。也可以做到一边编码一边播放,正是这种特征,可以实现在线的直播,架设自己的数字广播电台成为了现实。

 

 

 

 

 

WAVE文件的编解码器

 

WAV文件格式是一种由微软和IBM联合开发的用于音频数字存储的标准,它采用RIFF文件格式结构,非常接近于AIFFIFF格式。多媒体应用中使用了多种数据,包括位图、音频数据、视频数据以及外围设备控制信息等。RIFF为存储这些类型的数据提供了一种方法,RIFF文件所包含的数据类型由该文件的扩展名来标识,能以RIFF文件存储的数据包括:

 

 

 

 

 

# 音频视频交错格式数据(.AVI)

 

 

 

# 波形格式数据(.WAV)

 

 

 

# 位图格式数据(.RDI)

 

 

 

# MIDI格式数据(.RMI)

 

 

 

# 调色板格式(.PAL)

 

 

 

# 多媒体电影(.RMN)

 

 

 

# 动画光标(.ANI)

 

 

 

# 其它RIFF文件(.BND)

 

 

 

  RIFF是一种含有嵌套数据结构的二进制文件格式,每个数据结构都称为因一个chunk()ChunkRIFF文件中没有固定的位置,因而偏移量不能用于定位域值。一个块中的数据包括数据结构、数据流或其它组块(称为子块)等,每个RIFF块都具有如下结构:

 

 

 

typedef struct _Chunk

 

 

 

{

 

 

 

DWORD ChunkId; /*块标志*/

 

DWORD ChunkSize; /*块大小*/

 

BYTE ChunkData[ChunkSize]; /*块内容*/

 

} CHUNK;

 

 

 

  ChunkId4ASCII字符组成,用以识别块中所包含的数据。字符RIFF用于标识RIFF数据块,间隔空格在右面是不超过4个字符的ID。由于这种文件结构最初是由MicrosoftIBMPC机所定义,RIFF文件是按照little-endian字节顺序写入的,而采用big-endian字节顺序的文件则用‘RIFX’作为标志。

 

 

 

  ChunkSize(块大小)是存储在ChunkData域中数据的长度,ChunkIdChunkSize域的大小则不包括在该值内。

 

 

 

  ChunkData(块内容)中所包含的数据是以字(WORD)为单位排列的,如果数据长度是奇数,则在最后添加一个空(NULL)字节。

 

 

 

  子块(Subchunk)与块具有相同的结构。一个子块就是包含在其它块内部的一个块,只有RIFF文件块‘RIFF’和列表块‘List’才能含有子块,所有其它块仅能含有数据。一个RIFF文件就是一个RIFF块,文件中所有其它块和子块均包含在这个块中。

 

 

 

  WAV文件可以存储大量格式的数据,通常采用的音频编码方式是脉冲编码调制(PCM)。由于WAV格式源自Windows/Intel环境,因而采用Little-Endian字节顺序进行存储。

 

 

 

脉冲编码调制

 

 

 

  Claude E. Shannon1948年发表的“通信的数学理论”奠定了现代通信的基础。同年贝尔实验室的工程人员开发了PCM技术,虽然在当时是革命性的,但今天脉冲编码调制被视为是一种非常单纯的无损耗编码格式,音频在固定间隔内进行采集并量化为频带值,其它采用这种编码方法的应用包括电话和CDPCM主要有三种方式:标准PCM、差分脉冲编码调制(DPCM)和自适应DPCM。在标准PCM中,频带被量化为线性步长的频带,用于存储绝对量值。在DPCM中存储的是前后电流值之差,因而存储量减少了约25%。自适应DPCM改变了DPCM的量化步长,在给定的信造比(SNR)下可压缩更多的信息。

 

 

 

共同的执行过程

 

 

 

  在对WAV音频文件进行编解码过程中,最一致的地方包括采样点和采样帧的处理和转换。一个采样点的值代表了给定时间内的音频信号,一个采样帧由适当数量的采样点组成并能构成音频信号的多个通道。对于立体声信号一个采样帧有两个采样点,一个采样点对应一个声道。一个采样帧作为单一的单元传送到数/模转换器(DAC),以确保正确的信号能同时发送到各自的通道中。

 

 

 

WAVE音频格式的优缺点

 

 

 

  WAV音频格式的优点包括:简单的编/解码(几乎直接存储来自模/数转换器(ADC)的信号)、普遍的认同/支持以及无损耗存储。WAV格式的主要缺点是需要音频存储空间。对于小的存储限制或小带宽应用而言,这可能是一个重要的问题。WAV格式的另外一个潜在缺陷是在32WAV文件中的2G限制,这种限制已在为SoundForge开发的W64格式中得到了改善。

 

 

 

二 有损与无损格式篇1.无损压缩格式FLACAPE对比

 

 

 

在音频压缩领域,有两种压缩方式,分别是有损压缩和无损压缩!我们常见到的MP3WMAOGG被称为有损压缩,有损压缩顾名思义就是降低音频采样频率与比特率,输出的音频文件会比原文件小。另一种音频压缩被称为无损压缩,也就是我们今天所要说的主题内容。无损压缩能够在100%保存原文件的所有数据的前提下,将音频文件的体积压缩的更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。目前无损压缩格式有APEFLACWavPackLPACWMALosslessAppleLosslessLaOptimFROGShorten,而常见的、主流的无损压缩格式目前只有APEFLAC。下面就针对这两种无损压缩格式进行一下对比!

 

 

 

APEMonkey's Audio,一种无损压缩格式。这种格式的压缩比远低于其他音频格式,但能够做到真正无损,同时其开放源码的特性,也获得了不少音乐发烧友的青睐。在现有不少无损压缩方案中,APE是一种有着突出性能的格式,令人满意的压缩比以及飞快的压缩速度,在国内应用比较广泛,成为了不少朋友私下交流发烧音乐的选择之一。

 

 

 

FLACFree Lossless Audio Codec的简称,是一种非常成熟的无损压缩格式,名气不在APE之下!该格式的源码完全开放,而且兼容几乎所有的操作系统平台。它的编码算法相当成熟,已经通过了严格的测试,当在编码损坏时依然能正常播放。另外,该格式是最先得到广泛硬件支持的无损格式,世界知名数码产品如:Rio公司的硬盘随身听Karma,建伍的车载音响MusicKeg以及PhatBox公司的数码播放机都能支持FLAC格式。

 

 

 

 

 

前面已经说明,无损压缩是在保证不损失源文件所有码率的前提下,将音频文件压缩的更小,也就是说这两种音频格式都能保证源文件码率的无损。但两种压缩格式毕竟为两种压缩算法,下面列举一下两种压缩格式的异同点:

 

 

 

相同点:

 

 

 

一、压缩比决定无损压缩文件所占存储空间

 

 

 

FLACAEP的压缩比基本相同,FLAC的压缩比为58.70%,而APE的压缩比则要更高一些,为55.50%,都能压缩到接近源文件一半大小。

 

 

 

二、编码速度考验用户的耐心,速度快者优

 

 

 

非常值得赞扬的是,FLACAPE的编码速度都相差无几,这是因为两者的压缩技术是开源的,开发者可以借鉴两者在编码上的不同优势进行开发,不过目前编码速度最快的是WavPackShorten两种无损压缩格式,但这两种格式的非开源性限制了其普及。

 

 

 

三、平台的支持决定普及度

 

 

 

音频压缩不但需要硬件的支持,也需要的软件的支持,因此能够被更广泛的平台支持,也就意味着被更多用户使用。FLACAPE在这方面做的都非常出色,能够兼容所有系统平台,现在无论您是Windows用户还是众多版本的Linux用户,哪怕您是Mac OS的忠实FANS,都无需担心无法使用FLACAPE

 

 

 

四、两者的开源特性,完全免费的技术

 

 

 

两者的开源特性,意味着任何组织或个人都可以免费使用这两种压缩技术,任何组织或个人都可以修改和发布基于这两种技术的新产品,这给众多MP3厂商降低成本提供了有力保障,且消费者也能够以相对低廉的价格购买到只有世界级MP3(例如:iPod支持ALAC)才支持的无损压缩音频、CD级的音质表现!

 

 

 

不同点:

 

 

 

一、自我纠错能力,谁更人性化?

 

 

 

很多消费者都经历过MP3的爆音问题,然后归咎于MP3质量有问题,其实,很大一部分爆音是因为音频压缩过程中,编码的微小损坏,造成在解码时,处理出来的数据与音频不一致,导致爆音现象。无损格式压缩的不好也会导致编码损坏,而在处理这种问题时,FLAC的会以静音方式代替有损部分,而APE的处理则与常见的有损压缩格式处理的方式相同,以爆音方式代替有损部分。这一点FLAC设计的更人性化!

 

 

 

二、优化的编码结构,决定了解码的速度!

 

 

 

由于编码方式的不同,将影响两种无损压缩格式的解码速度,通常FLAC的解码速度比APE30%,这是因为,FLAC只需执行整数运算,而无需执行占用系统更高频率和更大数据处理量的浮点运算。基于这一点,一般硬件均可完美实现实时解码。

 

 

 

三、方便的资源获取,意味着能够得到更广泛的应用与支持

 

 

 

无论FLAC还是APE,在资源获取上,两者都能通过网络搜索轻松获得!

 

 

 

通过以上的对比,相信很多用户对FLACAPE的认识更加深了一些,单从技术角度讲,FLAC要明显比APE优秀,原因在于,FLAC是第一个开源的且被世界公认的无损压缩格式,有来自世界各地的顶尖级开发高手对FLAC进行免费的开发与技术完善,同时,FLAC有广泛的硬件平台的支持,几乎所有采用便携式设计的高端解码芯片都能够支持FLAC格式的音乐,FLAC第三个优势在于:优秀的编码使得硬件在解码时只需采用简单的整数运算即可,这将大大降低所占用的硬件资源!不过两种公开的技术具有极强的互补性,任何一方都不可能全面超越另一方!

 

 

 

 

 

 

 

2.主流音频格式浅析之一 有损压缩篇

 

 

 

·谁说MP3播放器好就行了?

 

 

 

  随着MP3播放器的普及,越来越多的MP3走进我的视线,在选择一款自己喜欢的MP3播放器的同时,不知道各位玩家有没有想过,我们每天听的都是些怎样的音乐呢?

 

 

 

  我们都知道<

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章