Secuencia Kozak

A secuencia Kozak, secuencia consenso Kozak ou consenso Kozak é unha secuencia que aparece no ARNm de eucariotas, ten a secuencia consenso (gcc)gccRccAUGG, e xoga un importante papel na iniciación da tradución de proteínas.^[1] Recibe o seu nome de Marilyn Kozak, que deu a coñecer a secuencia.

A secuencia identifícase pola notación (gcc)gccRccAUGG, que resume os datos analizados por Kozak dunha ampla variedade de fontes (699 en total)^[2] da seguinte maneira:

Unha letra en minúscula denota a base nitroxenada máis común nunha posición na que a base pode variar;
As letras maiúsculas indican bases moi conservadas, é dicir, a secuencia 'AUGG' é constante ou só cambia moi raramente, coa excepción do código 'R' de ambigüidade da IUPAC^[3], que indica que nesa posición unha purina (adenina ou guanina) sempre se conserva (e segundo Kozak a adenina é a purina máis frecuente alí).
A secuencia entre parénteses ((gcc)) ten un significado incerto.

A publicación de Kozak ofrecía datos que se limitaban a un conxunto de vertebrados, como humanos, vacas, gatos, cans, pitos, coellos de indias, hámsteres, ratos, porcos, coellos, ovellas e o anfibio Xenopus.

[1]

[2]

[3]