为什么需要超过48k的采样音频格式_录音采样率越高越好吗

博客小编 (80) 2024-06-22 17:01:01

最近在看音频的事情，随便拿点东西出来聊一下，如果说的不对，请用棒槌来打我，这样我晚上睡觉就不用数绵羊了。

我播放一个20HZ~20KHZ的音频，如下图

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第1张

我使用16K的采样率来采集它是声音信号，获取音频如下图

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第2张

我使用48K的采样率来采集它是声音信号，获取如下图

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第3张

总结上面是现象

1、使用16K进行采样获取的音频，最大只能还原 8K的音频信号，后面也有声音，但是已经不是准确的声音了。

2、使用48K进行采样，可以获取到20HZ~20KHZ的完整音频信号。

奈奎斯特采样定理

奈奎斯特采样定理解释了采样率和所测信号频率之间的关系。阐述了采样率fs必须大于被测信号感兴趣最高频率分量的两倍。该频率通常被称为奈奎斯特频率fN。

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第4张

为什么采样的频率要大于两倍的被测试信号频率呢？

为更好理解其原因，让我们来看看不同速率测量的正弦波。

情况A，频率f的正弦波以同一频率采样。这些采样标记在原始信号的左侧，在右侧构建时，信号错误地显示为恒定直流电压。

情况B，采样率是信号频率的两倍。现在信号显示为三角波。这种情况下，f等于奈奎斯特频率，这也是特定采样频率下为了避免混叠而允许的最高频率分量。

情况C，采样率是4f/3。

我们会惊讶的发现一个问题，如果采样率越大，那么想还原信号的真实性就越容易。我们简直就是天才啊~~

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第5张

混叠

当采样频率设置不合理时，即采样频率低于2倍的信号频率时，会导致原本的高频信号被采样成低频信号。如下图所示，灰色信号是原始的高频信号，但是由于采样频率不满足采样定理的要求，导致实际采样点如图中黑色实心点所示，将这些实际采样黑色点连成曲线，可以明显地看出这是一个低频信号。在图示的时间长度内，原始灰色信号有10个周期，但采样后的蓝色信号只有2个周期。也就是采样后的信号频率成分为原始信号频率成分的1/5，这就是所谓的混叠：高频混叠成低频了。

通过我强大的分析发现，要消除混叠，就需要提高采样率，这也是奈奎斯特采样定理出现的原因了。

为什么需要超过48k的采样音频格式_录音采样率越高越好吗 (https://mushiming.com/) 第6张

网上很多观点说，根据采样定理，48K的音频采样率即可无损的表示音频模拟信号（人耳最多可以听到20K的音频），为何还需要96K， 192K等更高的采样率呢？最先我也有这样的疑问，毕竟采样定理是经过数学家证明过的，48K的采样率确实可以无损的表示20K的音频信号，注意是无损，而不是近似！

近日重读《数字音频技术》这本书，豁然开朗了。大家说的没错，采样定理是数学上证明过了的。但是具体到物理的、各种电子设备来实现这个录音过程时，器件本身的各种局限性，决定了48K不能达到理论的音质。

例如，根据采样定理，如果用48K的采样率，那么音频信号就不能超过20K（理论是24K，但为了契合人耳的20K上限，后面统一说20K）。而麦克风或者各种拾音器收集到的模拟信号却包含了很多超出20K的信号。麦克风不是人耳，人耳只能听到最高20K的声音，但是，麦克风的震膜却可以采集到超出20K很多的高频信号。这些超出20K的高频信号必须被过滤掉，否则经过48K的采样率进行采样时，会产生“混叠效应”，因为根据采样定理，48K的采样率最高只能处理20K的信号。

混叠效应，打个比方，当你看高速旋转的风扇、或者车轮时，你会有一种错觉：他们好像在倒着转，这就是混叠效应。在音频系统中，它们会造成非常严重的失真，因为信号采集错了！

因此，电子系统中，必须使用一种滤波器，把麦克风采集到的原始信号中20K以上的高频信号完美的过滤掉，只有这样才能保证符合采样定理。但是这样完美的滤波器只存在数学公式中，现实中要制造这样的滤波器太难了，基本做不到。现实中的滤波器，一方面对于20K以内的信号，并不是完整不变的PASS过去的，而是一条近似水平的波浪线，不同频率点的信号会有不同程度的衰减；另一方面，20K以外的音频信号，并不是说立马就给全部过滤了，它存在一个渐变区域，可能21K， 22K, 23K ... 逐渐给你过滤到0。这样的物理器件，其输出信号，实际上是不完全满足采样定理数学上的严格要求的，因此必然会产生各种各样的噪声。

那么，为了进一步提升音频系统的品质，只有提升采样率了，96K， 192K，也就有他们存在的意义了。

华丽的分割线

即使提升了采样率，还不够，因为要满足采样定理而制造的滤波器，还是太困难了，因此工程师们想了很多办法。超高采样率就是这样，它使用64倍或者128倍20K的采样率进行采样，这样即使原始模拟信号中存在高频信号，也在采样定理的保证下，被无损的采样，而不会发生混叠效应。这就大大降低了对于滤波器的要求了，而且即使滤波器的截止点存在渐变地带，那也是在很高的频率了，引入的混叠效应也发生在很高的频率点，所引入的噪声远远超出人耳的听觉范围。可以这么理解：过采样系统中仍然有噪声，但是它降低了器件的复杂度，而且它把噪声赶到人耳听觉能力以外了。

超高采样率采集到的数据，包含很多高频信号，但是可以使用数字滤波器进行滤波，数字滤波器可以使用各种算法进行计算优化，傅里叶变换等等，把高频信号过滤掉以后，只保留20K以内的音频信号。根据采样定理，再数字重采样到48K的采样率，输出给后续系统进行处理。

超高采样时，就没有必要使用16位或者24位做AD转换了，只是用6位、或1位即可，这个叫做delta-segma转换。

思路至此， DSD格式的音乐就横空出世了，DSD相对于传统的PCM，就是另外一片天地了。

在数字音频领域，常用的采样率有：

8,000 Hz - 电话所用采样率, 对于人的说话已经足够

11,025 Hz

22,050 Hz - 无线电广播所用采样率

32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率

44,100 Hz - 音频CD, 也常用于MPEG-1 音频（VCD, SVCD, MP3）所用采样率

47,250 Hz - Nippon Columbia (Denon)开发的世界上第一个商用 PCM 录音机所用采样率

48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率

50,000 Hz - 二十世纪七十年代后期出现的3M 和Soundstream 开发的第一款商用数字录音机所用采样率

50,400 Hz - 三菱 X-80 数字录音机所用所用采样率

96,000 或者 192,000 Hz - DVD-Audio、一些 LPCM DVD 音轨、BD-ROM（蓝光盘）音轨、和 HD-DVD （高清晰度 DVD）音轨所用所用采样率

2.8224 MHz - SACD、索尼和飞利浦联合开发的称为Direct Stream Digital的1位sigma-delta modulation 过程所用采样率。

THE END

发表回复

请先登录账户再评论哦

为什么需要超过48k的采样音频格式_录音采样率越高越好吗

HDLBits(八)学习笔记——Counters(计数器)

京东应急物资供应链管理平台_京东智慧供应链

vivadoltx文件_tcl脚本语言

什么是覆盖方法_表格怎么覆盖相同内容

推荐文章

Oracle的学习心得和知识总结（六）|Oracle数据库同义词技术详解

发表回复

热门文章

推荐文章

为什么需要超过48k的采样音频格式_录音采样率越高越好吗

HDLBits(八)学习笔记——Counters(计数器)

京东应急物资供应链管理平台_京东智慧供应链

vivadoltx文件_tcl脚本语言

什么是覆盖方法_表格怎么覆盖相同内容

推 荐 文 章

Oracle的学习心得和知识总结（六）|Oracle数据库同义词技术详解

发表回复

热门文章

推荐文章

推荐文章