音訊壓縮(區別於動態壓縮)屬於資料壓縮的一種,用以減少音訊串流媒體的傳輸頻寬需求與音訊檔案的儲存大小。按壓縮方法可以分為無失真壓縮和失真壓縮。

無失真音訊壓縮

無失真壓縮雖然縮小音訊的儲存大小,但可以保留原始檔案的所有資訊,在播放上與原始檔案沒有任何差別。可以從以下方面評估:壓縮速度、壓縮比率、解碼速度、軟體硬體支援、穩定性和出錯率。

無失真壓縮是一個可逆的過程,利用資訊冗餘進行資料壓縮。

根據資訊理論中的信源編碼定理:

其中為輸入訊息的長度。

為輸出訊息的長度。

小於兩者的相互資訊,則傳遞的資料會產生錯誤,因此無失真壓縮原是不可能的。

但是現實生活中傳遞的訊息常常會有資訊冗餘的情況,所以無失真壓縮仍是可行。

利用資訊冗餘來進行壓縮的範例如下:

假設今天要傳遞的訊息是一間教室的哪些座位為空位。

相較於傳遞每個座位的個別資訊一連串的訊息,直接傳遞哪幾排座位為空位更能節省訊息的大小。

因此無失真壓縮的壓縮率也跟資料源的一致性有關,一致性越高,壓縮率越高。

Shorten是一種比較早的無失真壓縮格式;後來出現的有Free Lossless Audio Codec(FLAC)、Apple Lossless(ALAC)、Monkey's Audio(APE)和WavPack(WV)。

有損音訊壓縮

失真壓縮,對原始檔案的一些資訊做一些近似處理,以得到更小的檔案。

壓縮後檔案大小約為原本的百分之五到百分之二十(無損檔案壓縮約為原本的百分之五十到百分之六十)。

失真壓縮是一個不可逆的過程,但是有損壓縮將人類心理學、聽覺系統的辨識都納入壓縮結果的考量。

因此雖然壓縮後檔案很小,聆聽者幾乎分辨不出來。

由於有損壓縮的不可回復性,這種格式並不適合用在需要反覆存檔、讀取的工作上。

例如音樂工作者修改樂曲內容,有損壓縮較適合用在最後的使用者上,最常見的失真壓縮演算法如 MP3

有損資料壓縮常用的壓縮方法為修正離散餘弦(MDCT),利用人類聽閾的特性以及聽覺掩蔽,將不重要的聲音資訊捨棄。

結合人類大腦聽覺辨識與人耳聽閾的研究稱為聲心理學。

需要注意的是,雖然失真壓縮在理論上對原始檔案造成損失,但這種損失不一定能被人耳分辨出來。[1]

參考文獻

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.