From Wikipedia, the free encyclopedia
Inter-frame prediction és una tècnica que explota la correlació temporal entre frames consecutius per poder codificar amb el mínim nombre de bits possibles. Per codificar, el que es fa és predir un frame a partir de frames anteriors i/o futurs, aplicant sobre aquests un moviment dictat per uns vectors de moviment. Aquesta tècnica ja es feia servir en anteriors estàndards com MPEG-2.
H.264 és un estàndard de codificació de vídeo que substituirà el MPEG-2. H.264 és una part de MPEG-4 (part 10) que només s'ocupa de la part de codificació de vídeo.
Les millores més importants d'aquesta tècnica en H.264 respecte a anteriors estàndards són:
Particions dels blocs de luminància de 16x16 (MPEG2), 16x8, 8x16, 8x8; en aquest últim cas se'ns permet dividir-ho en nous blocs de 4x8, 8x4, 4x4.
El frame a codificar es divideix en blocs de mida igual a algun dels mostrats a la figura. La predicció de cada bloc seran blocs del mateix mida de les imatges referència aplicant-s'hi un cert desplaçament.
Resolució dels vectors de moviment de fins a un quart de píxel (MPEG-2 permetia una resolució de ½ píxel). Això vol dir que podem buscar un bloc del frame a codificar en altres frames de referència o podem interpolar píxels que no existeixen per a trobar blocs que s'adaptin encara millor al bloc actual. Quan el vector de moviment és un nombre d'unitats enter de mostres significa que el bloc compensat en moviment el podem trobar en les imatges referència. Si el vector de moviment no és enter, la predicció l'obtindrem a partir de píxels interpolats aplicant un filtre interpolador en la direcció horitzontal i vertical.
Els pixels a les half-pixel posicions s'obtenen aplicant un filtre de longitud 6:
H=[1 -5 20 20 -5 1]
Per exemple:
b=A - 5B + 20C+20D+E
Els píxels a les quarter-pixel posicions s'obtenen per interpolació bilineal.
Múltiples referències per estimar el moviment. Permet buscar la millor referència en els 2 possibles buffers (List0 per a imatges passades, List1 per a imatges futures) que tenen fins a 16 frames.
La predicció del bloc es faria mitjançant una suma ponderada dels blocs de les imatge referència. Permet millorar la qualitat de la imatge en escenes on hi ha canvis de pla, zooms, o quan es descobreixen nous objectes en la seqüència.
Els modes Skip Mode i Direct Mode s'usen molt sovint, sobretot amb les B-pictures, i permeten reduir molt la taxa de bits a codificar. Ens referirem a aquests modes quan codifiquem un bloc sense enviar error residual ni vectors de moviment, el codificador només senyalarà que es tracta d'un Skip macroblock. El decodificador deduirà el vector de moviment del bloc codificat amb Direct/Skip Mode a partir d'altres macroblocks ja decodificats.
Hi ha dos modes de deduir el moviment:
Aquests modes s'utilitzen en zones de la imatge uniformes on no hi ha gaire moviment.
Els blocs de color rosa corresponen a blocs codificats amb Direct/Skip Mode. Com es pot observar s'utilitzen molt sovint, sobretot amb les B-pictures.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.