MPEG-1MPEG組織制定的第一個視頻音頻有損壓縮標準,也是最早推出及應用在市場上的MPEG技術,其原來主要目標是在CD光盤上記錄影像,後來被廣泛應用在VCD光盤。視頻壓縮算法於1990年定義完成。1992年底,MPEG-1正式被批准成為國際標準。

MPEG-1概述

MPEG-1是為CD光盤介質定製的視頻和音頻壓縮格式。一張70分鐘的CD光盤傳輸速率大約在1.4Mbps。而MPEG-1採用了塊方式的運動補償離散餘弦變換DCT)、量化等技術,並為1.2Mbps傳輸速率進行了優化。MPEG-1隨後被Video CD採用作為核心技術。VCD的解析度只有約352×240,並使用固定的比特率(1.15Mbps),因此在播放快速動作的視頻時,由於數據量不足,令壓縮時宏區塊無法全面調整,結果使視頻畫面出現模糊的方塊。因此MPEG-1的輸出質量大約和傳統錄像機VCR相當,這也許是Video CD在發達國家未獲成功的原因。MPEG-1音頻分三代,其中最著名的第三代協議被稱為MPEG-1 Layer 3,簡稱MP3,目前已經成為廣泛流傳的音頻壓縮技術。MPEG-1音頻技術在每一代之間,在保留相同的輸出質量之外,壓縮率都比上一代高。第一代協議MP1被應用在LD作為記錄數字音頻以及飛利浦公司的DGC上;而第二代協議MP2後來被應用於歐洲版的DVD音頻層之一。

MPEG-1具有以下特點:

  • 隨機訪問
  • 靈活的幀率
  • 可變的圖像尺寸
  • 定義了I-幀P-幀B-幀
  • 運動補償可跨越多個
  • 半像素精度的運動向量
  • 量化矩陣
  • GOP結構
  • slice結構

技術細節

輸入視頻格式

MPEG-1規定了以下幾個參數限制:

  • 最大像素數/行:768
  • 最大行數/影格:576
  • 最大影格/秒:30
  • 最大宏塊/影格:396
  • 最大宏塊/秒:9900
  • 最大位元率:1 856 000bps
  • 最大解碼緩衝區尺寸:327680bit。

數據結構和壓縮模式

MPEG-1可以按照分層的概念來理解,一個MPEG-1視頻序列,包含多個GOP,每個GOP包含多個,每個包含多個slice

影格是MPEG-1的一個重要基本元素,一個影格就是一個完整的顯示圖像。影格的種類有四種:

  • I-圖像/影格(節點編碼圖像,intra coded picture)參考圖像,相當於一個固定影像,且獨立於其它的圖像類型。每個圖像群組由此類型的圖像開始。編碼時獨立編碼,僅適用幀內編碼技術,因而解碼時不參考其他幀,類似JPEG編碼。
  • P-圖像/影格(預測編碼圖像,predictive coded picture)包含來自先前的I或P-畫格的差異資訊。編碼時使用運動補償運動估計,採用前向估計,參考之前的I-幀或者P-幀去預測該P格。
  • B-圖像/影格(前後預測編碼圖像,bidirectionally predictive coded pictures)包含來自先前和/或之後的I或P-畫格的差異資訊。編碼也使用運動補償運動估計,預估採用前向估計後向估計或是雙向估計,主要參考前面的或者後面的I格或者P格。
  • D-圖像/影格(指示編碼圖像,DC direct coded picture)用於快速進帶。僅由DC直流分量構造的圖像,可在低比特率的時候做瀏覽用。實際編碼中很少使用。

影格內編碼模式

影格間編碼模式

音頻編碼

Reference: ISO/IEC JTC1/SC29/WG11頁面存檔備份,存於網際網路檔案館) (June 1996)

參見

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.