音频信号处理,又称音频处理,音乐信号处理(英语:Audio signal processing)等,用来调整音乐信号的振幅、频率、波形等信息。利用某些四则运算,升降频,及窗函数,就可以处理出各式各样的声音频号。
| 本条目存在以下问题,请协助 改善本条目或在 讨论页针对议题发表看法。
| 此条目 或许过多或不当使用受著作权保护的文字、图像及多媒体文件。 (2013年5月27日) |
|
透过一些信号处理的技巧,可以从声音频号获取背后所代表的频率高低,做更进一步的分析与应用。
- 当物体发生震动时,就会产生声音,举例来说:当用力挥动手掌时,就会产生声音,以及蚊子翅膀快速震动时,所发出的扰人声音。
- 但是,在上述例子中,所听到的声音是来自于空气震动,而不是因为手掌摆动,
- 原因是人耳可以听到的声音频率介于20Hz到20000Hz之间,所以我们可以听到空气振动产生的声音,却听不到手掌摆动产生的声音,因为摆动的频率不够快。
- 声音频号是一种力学波,因此在传播过程中是一种模拟连续的信号,然而由于人耳是天然的傅里叶变换器,因此音频经过人耳后会变成数字信号。在这些信号中,有三个特征是处理时经常考虑的部分,可以参考下图:
- 音量:从信号来看,音量代表的是信号的振幅,信号振幅越大,所发出的音量也越大。
- 音频:信号的频率,就是所谓的音频,也就是声音震动的频率。其代表的是音调的高低,频率越高,音调就越高。除此之外,乐器所产生的声音频号,并非是单一频率的信号,而是有基带和泛音(倍频)的存在。
- 音色:每一个人或乐器所发出的音色都不一样,从信号上来看,音色就是信号的波形,因此只要利用波形分析,就可以判断出声音的来源,从下图可以看到小提琴跟钢琴的音色差异非常大。
音频的三个特征:音量、音频、音色。
- 音频的文件存储可以分成压缩和无压缩两种,常见的无压缩包案格式为*.wav,而压缩包案格式为*.mp3,关于这一部分的详细资料可以引用音频档案格式。声音档的访问时,主要有三个需要考虑因素:
- 采样率:在信号处理中,采样率所代表的是声音的质量,采样的频率越高,数字信号的波形越接近模拟信号的波形,因此声音的质量也越好。而在做采样时,必须遵守奈奎斯特频率,简单来说,频率在采样时至少要大于原信号频率的2倍,才可以得到有意义的信号,也能还原成原本的信号。
- 声音分辨率:访问信号资料点所用的比特数,即代表其分辨率。所使用的比特数越大,每个资料点的数值就越精确,声音的分辨率也越好。比较16bit与8bit两种访问比特,16bit可以访问到较精确的数值,但是也会花比较大的硬件存储空间。
- 声道:声道就是声音的来源数,常听到的单声道及双声道,代表的是声音是否有立体感。利用两个喇叭,拨放单声道的声音,左右两个喇叭发出的声音完全相同,因此会感觉声音是来自两个喇叭中间,但若是双声道声音,左右两个喇叭发出的声音会有一定差异,因此会觉得声音听起来有立体感。
- 举例来说,借由MATLAB输入指令audioinfo(音频档案名称),可以得到音频档案的相关信息如下图:
- 因为文件格式是*.wav,所以是无压缩 (uncompressed)。
- 声道 (NumChannels): 1
- 采样率 (SampleRate): 44100Hz
- 声音分辨率 (BitsPerSample): 16
执行MATLAB函数:audioinfo(音频档案名称)
- [y, fs] = audioread(文件名):y是声音频号的向量,fs是采样率。
- audioinfo(文件名):回传各种声音文件的相关信息,像是采样率、通道数量、声音分辨率...等。
- sound(y, fs):以fs的频率播放声音频号y。
- wavwrite(y, fs, filename):将y信号,以采样速率fs,写到filename.wav之中。
- Y = fft(y):将时间轴上的信号y,变换为频率轴上的信号Y。