随着个人电脑的发明,标志着人类的信息接收从模拟变成数字化,尽管数字信号并不能被人类直接感受,但通过计算机设备接收和转译后传播,让人们清晰接收到和原始信息一模一样的信号,备受震撼。同样,声音的存储方式也从爱迪生发明的模拟记录,进化成只有“1和0”的数字符号,通过机器的转译,却能完汁完味记录和重放,而且随着当年帝盟公司把MP3格式的音频格式发扬光大,人们顿时对数字音频的需求日益强烈。
随着计算机处理能力和网络传播速度的几何级发展,“无损”音频也被一众音响发烧友所热捧,其优秀的编码格式和完整被保留的丰富数据,被强大运算能力的计算机转译还原出“丝毫不差”的原生声音。今天小灵和大家聊聊目前我们经常接触到的无损音频格式到底有哪些,以及他们自身又具备怎样的优缺点而被追捧或者被嫌弃。
一、音频基础概念
1、声音:声音是由物体振动产生的声波,通过介质(空气或固体、液体)传播并能被人或动物听觉器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音是声波通过任何物质传播形成的运动。作为一种波,频率在20 Hz~20 kHz之间的声波是可以被人耳识别的。
2、采样频率:采样频率定义每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。通俗的讲采样频率是指计算机每秒钟采集多少个声音样本。自然界的声音是模拟信号,这种模拟信号被相关设备通过“采样”、“量化”后,以数字的方式存放在计算机中。根据奈奎斯特采样理论:只要采样频率不低于声音信号最高频率的两倍,采样得到的数字信号就能保真地记录、还原声音。既然人耳能听到音频信号频率大约在20Hz-20KHz之间,根据奈奎斯特采样理论,如果采样频率大于40KHz,那么得到的数字信号就可以高保真的记录模拟信号,就能“HiFi”了。
常见音频格式采样率
3、量化精度:样本大小是用每个声音样本的位数bit/s表示,反映度量声波幅度的精度。样本位数的大小影响到声音的质量,位数越多,则精度越高,声音的质量越高,而需要的存储空间也越多。
4、编码:编码是指用二进制数来表示每个采样的量化值。如果量化是均匀的, 又采用自然二进制数表示, 这种编码方法就是脉冲编码调制(PCM), 这是一种最简单粗暴却效率最高的编码方法。
常见编码技术
二、无损压缩格式 VS 有损压缩格式
1、无损压缩和有损压缩的定义与区别
相对自然界的声音,任何数字音频编码方案都是有损的,因为用什么方法都无法还原无法完全还原。能够达到最高保真水平的就是PCM编码,CD中采用的就是这种编码格式。因此,PCM约定俗成了无损编码,因为PCM代表了数字音频中最佳的保真水准,并不意味着PCM就能够确保信号绝对保真,PCM也只能做到最大程度的无限接近。
简单来说,有损压缩就是为了获得更小的体积,删除一些不太重要的数据来压缩文件;无损压缩就是通过优化排列方式来达到压缩目的。有人这样举例子:有一篇文章,3000字,有损压缩就是删除1000个不太重要的词和句子,意思不变,无论如何已删除的都系都无法恢复;无损则是通过文章排版,优化篇幅,解压缩之后,还能获得完整的WAV数据。
2、有损音乐格式及优缺点分析
有损音乐格式主要有:MP3、WMA、AAC等等,都是为了更小的体积对文件进行了不可恢复的压缩,看频谱就可以知道,上半部分都被切掉了。
320bps MP3的频谱
3、无损音乐格式:WAV、AIFF、FLAC、APE、ALAC等等,详细介绍及理由见下文
三、几种无损音乐格式 详细介绍及优缺点分析
首先说一下,WAV和AIFF本质上是一个东西,两者只是封装工艺不同。WAV、AIFF是CD的数字记录,基本上是由CD转成数字形式所得到的文件;而APE、FLAC等是对WAV文件进行无损压缩后得到的,即再加工得到。所以,wav是无损音乐文件,而APE、FLAC等则是无损压缩音乐文件。WAV可以直接播放,APE、FIAC等其他压缩格式则需要经过解压(解码)还原成WAV才能播放。
1、WAV:WAV是微软研究出来的一种无损音乐格式,被Windows广泛应用。标准格式化的WAV文件和CD格式一样,也是44.1kHz取样频率,16bit/s量化,声音质量和CD是相同的。
WAV的优点就是声音还原比较真实,由于是微软WINDIOS的原生音频格式,因此播放起来不用还原。缺点主要有两个,第一是文件很大,相无损压缩格式大了差不多一倍,第二是不能写入标签和封面,虽然可以强制写入,但是换了播放器就什么都没了。
2、AIFF:AIFF也是一种文件格式存储的数字音频(波形)格式。本质上和WAV是一个东西,AIFF出来的还更早点,两者只是封装工艺不同,WAV是微软的,AIFF是苹果的,仅此而已。
但AIFF的优点好像更加明显,第一,声音还原比较真实,播放起来不用加压缩;第二是最重要的,AIFF可以方便快捷的添加标签、封面等信息,在任何播放设备上都可以通用,最关键的是可以通过MatriTunes软件配合itunes 批量添加AIFF文件的标签和封面。
3、APE:APE是通过Monkey’s Audio这个软件将无损音频文件压缩后的产物,体积变小了很多。
APE的优点就是文件格式小,开源,资源比较丰富,压缩比55%左右,标签、封面可以完美写入。缺点就是APE文件的容错性较差,和有损格式一样,存在爆音现象,没有多声道支持,没有增益。
4、FLAC:也是一种完全开放的无损压缩格式,和APE相比,FLAC的编码和解码复杂程度要较低(解码运算量小、只需要整数运算),解码速度奇快,通常FLAC的解码速度比APE快30%,标签和封面也可以完美写入。
5、ALAC:即Apple lossless audiocodec的缩写,是苹果公司开发的一种无损音频格式,是对AIFF的压缩,类似于FLAC是对WAV的压缩一样,自然文件小。ALAC同AAC一样是MPEG-4封装,扩展名是m4a。
6、DSD:是Direct Stream Digital的缩写(《敢向PCM格式叫板?——聊聊风头正经的DSD编码格式》),表示直接比特流数字编码,是SACD的编码模式,由Sony与Philips在1996年共同发展的,用1bit比特流的方式取样,采样率2.4MHz(CD 44.1kHz取样的64倍)的高取样方式。DSD的优缺点都很突出,相比WAV,音质确实好多了,当然,前提是你有能够硬解DSD文件的设备,缺点也是,文件太大太大,能硬解DSD的芯片还是少数。
四、无损音乐格式的鉴别方法
无损音乐格式这么好,网上资源这么多,哪些是真的,哪些是假的呢,为什么优点ape文件听起来也就这样呢?这就得好好鉴别了,常见的鉴别方法有以下几种:
1、用耳朵听:好多人都会说,你这是猴子派来的逗比嘛,用耳朵听这不坑爹嘛,要我说对于大部分不是木耳的人来说,用耳朵听真是比较好的方法,当然,前提是你有这个耐心....
2、看频谱:推荐软件-spek 声学频谱分析器。无损音乐的频谱比较饱满,上下频段没有空域,最起码不是劣质音源转制的。 如下图:
真无损音乐的频谱 上下段没有空白
而假的无损最顶端肯定都是一刀切的,因为假无损大多数是由320kbps的mp3转来的,显示的光谱最高只能去到20000Hz,即使将MP3格式再转换为无损格式,光谱也是不会改变的,如下图:
mp3转为wav的假无损频谱
3、傻瓜式:用Loseless Audio Validation Helper(无损音乐验证助手)等等软件傻瓜式校验,如下图:
傻瓜式校验
五、无损音乐格式之间的相互转换(DSD除外)
最后,小灵跟大家分享一下各种音频格式之间的互相转换(PS:如果是有损压缩转换成“无损格式”结果音频也不是无损音源,而是被压缩过后的“无损封装”),音乐格式之间转换的软件很多,这里小灵推荐一个最实用的而且是免费的音乐播放器软件foobar2000,这也是整个音频播放领域最强大(没有之一)的软件,没有之一。操作也很简单,打开foobar2000,添加需要转换的歌曲,全选或单独选中,鼠标右击,选择转换--快捷转换,如下图:
foobar2000转换方法
快捷转换里有各种音频格式可供转换,好多可以编辑具体信息,比如flac可以调整压缩级别,aac、mp3等有损可以选择比特率等等。如下图:
快捷转换里的音频格式
好多人说ALAC格式比较难转换,这里附送ALAC格式的foobar2000设置图:
ALAC格式设置图
来源:灵特电子科技有限公司
https://www.sohu.com/a/207433239_764072