音频和Midi基础支持

论坛 期权论坛     
选择匿名的用户   2021-5-22 22:08   47   0
第一部分模拟声音-数字声音原理
<br>
p6?_&#64;$tF0&#96; 一、模拟声音数字化原理
<br>
Q bG8p w-\ 声音是通过空气传播的一种连续的波,叫声波。声音的强弱体现在声波压力的大小上,音调的高低体现在声音的频率上。声音用电表示时,声音信号在时间和幅度上都是连续的模拟信号。
<br>
Osx&#43;aa{<!-- -->
<span style="font-size:0px;">Q\*K�X/wEF&#34;Q</span>
<br>
<span style="font-size:0px;">K�M8scD.] It%sR&#34;&#64;</span>
<br>
<span style="font-size:0px;">&#34;y;C*{0W G&#34;|/q]&amp;r</span>
<br>
<span style="font-size:0px;">:FI jeYf(yd_</span>
<br> 图1 模拟声音数字化的过程
<span style="font-size:0px;">O6JTsv AT</span>
<br>   声音进入计算机的第一步就是数字化,数字化实际上就是采样和量化。连续时间的离散化通过采样来实现。
<br>
|{ee*EI;w#n   声音数字化需要回答两个问题:①每秒钟需要采集多少个声音样本,也就是采样频率(fs)是多少,②每个声音样本的位数(bit per sample,bps)应该是多少,也就是量化精度。
<span style="font-size:0px;">H&#39;lY*C&#39;hMhg2M</span>
<br> ? 采样频率
<br>
3p/tP s![Ez   采样频率的高低是根据奈奎斯特理论(Nyquist theory)和声音信号本身的最高频率决定的。奈奎斯特理论指出,采样频率不应低于声音信号最高频率的两倍,这样才能把以数字表达的声音还原成原来的声音。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,一次振动中,必须有2个点的采样,人耳能够感觉到的最高频率为20kHz,因此要满足人耳的听觉要求,则需要至少每秒进行40k次采样,用40kHz表达,这个40kHz就是采样率。我们常见的CD,采样率为44.1kHz。电话话音的信号频率约为3.4 kHz,采样频率就选为8 kHz。
<span style="font-size:0px;">o VD-o X1QxM</span>
<br> ? 量化精度
<span style="font-size:0px;">cY#}VRJQB]/C(L</span>
<br>   光有频率信息是不够的,我们还必须纪录声音的幅度。量化位数越高,能表示的幅度的等级数越多。例如,每个声音样本用3bit表示,测得的声音样本值是在0~8的范围里。我们常见的CD位16bit的采样精度,即音量等级有2的16次方个。样本位数的大小影响到声音的质量,位数越多,声音的质量越高,而需要的存储空间也越多。
<span style="font-size:0px;">2Vq&#39;yvh8UW</span>
<br> ? 压缩编码
<span style="font-size:0px;"> Fp#PADSh</span>
<br> 经过采样、量化得到的PCM数据就是数字音频信号了,可直接在计算机中传输和存储。但是这些数据的体积太庞大了!为了便于存储和传输,就需要进一步压缩,就出现了各种压缩算法,将PCM转换为MP3,AAC,WMA等格式。
<span style="font-size:0px;">!j FD/dt4{1t&amp;|</span>
<br> 常见的用于语音(Voice)的编码有:EVRC (Enhanced Variable Rate Coder) 增强型可变速率编码,AMR、ADPCM、G.723.1、G.729等。常见的用于音频(Audio)的编码有:MP3、AAC、AAC&#43;、WMA等
<span style="font-size:0px;">0]A2Lx6G qO }T</span>
<br> 二、问题
<span style="font-size:0px;">R,y&amp;M$A(jGg</span>
<br> 1、为什么要使用音频压缩技术?
<span style="font-size:0px;">&#96;4I f1B&amp;X&amp;F*H/M</span>
<br> 我们可以拿一个未压缩的CD文件(PCM音频流)和一个MP3文件作一下对比:
<br>
ef/D s3E0q&#64; PCM音频:一个采样率为44.1KHz,采样大小为16bit,双声道的PCM编码CD文件,它的数据速率则为 44.1K×16×2 &#61;1411.2 Kbps,这个参数也被称为数据带宽。将码率除以8 bit,就可以得到这个CD的数据速率,即176.4KB/s。这表示存储一秒钟PCM编码的音频信号,需要176.4KB的空间。
<br>
o hn4S/C |&#34;h[ Z.A MP3音频:将这个WAV文件压缩成普通的MP3,44.1KHz,128Kbps的码率,它的数据速率为128Kbps/8&#61;16KB/s。如下表所示:
<br>
m &#96;-p-J&#34;lC7}P
<br>
;qR5N4~ ]XO t.c H.C Iq 比特率
<br>
-]4V&amp;F-z)pWT:Mp2o 存1秒音频数据所占空间
<br>
E s!Da Ts3CM2t
<br>
&#34;?v,M j%g{<!-- --> CD(线性PCM)
<span style="font-size:0px;">4&#96; V&#34;o(eV$| Xn</span>
<br> 1411.2 Kbps
<br>
;L Q:I,T,]2i%SA6i 176.4KB
<span style="font-size:0px;">$l&amp;zj&#39;o&#34;E&amp;Q;KM0h(]</span>
<br>
<span style="font-size:0px;">E!N%lhD[%Z*oF</span>
<br> MP3
<br>
5butT&#43;lC5G,Ct 128Kbps
<br>
6Xy)Gdw-Y$MaI~4p~ 16KB
<span style="font-size:0px;">\:k,IFIM U</span>
<br>
<br>
F.T&#39;r$BG&#96; AAC
<br>
Lq;C&#96;s uSXO 96Kbps
<span style="font-size:0px;"> m7\[:?(H8Q RQ6T0&#96;j</span>
<br> 12KB
<br>
D&#96;SQ2oNl.T&#43;W%GR
<br>
8M8|1j-}Yh mp3PRO
<span style="font-size:0px;">B&#64;$F0V*s</span>
<br> 64Kbps
<span style="font-size:0px;">*b6o z*u&#43;I9?(MCh</span>
<br> 8KB
<br>
6GP E0OX V}
<br>
QlpYR ? S&#43;rq 表1 相同音质下各种音乐大小对比
<span style="font-size:0px;">gK:Mmq1tm</span>
<br> 2、频率
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP