Secuencia Kozak
From Wikipedia, the free encyclopedia
A secuencia Kozak, secuencia consenso Kozak ou consenso Kozak é unha secuencia que aparece no ARNm de eucariotas, ten a secuencia consenso (gcc)gccRccAUGG, e xoga un importante papel na iniciación da tradución de proteínas.[1] Recibe o seu nome de Marilyn Kozak, que deu a coñecer a secuencia.
A secuencia identifícase pola notación (gcc)gccRccAUGG, que resume os datos analizados por Kozak dunha ampla variedade de fontes (699 en total)[2] da seguinte maneira:
- Unha letra en minúscula denota a base nitroxenada máis común nunha posición na que a base pode variar;
- As letras maiúsculas indican bases moi conservadas, é dicir, a secuencia 'AUGG' é constante ou só cambia moi raramente, coa excepción do código 'R' de ambigüidade da IUPAC[3], que indica que nesa posición unha purina (adenina ou guanina) sempre se conserva (e segundo Kozak a adenina é a purina máis frecuente alí).
- A secuencia entre parénteses ((gcc)) ten un significado incerto.
A publicación de Kozak ofrecía datos que se limitaban a un conxunto de vertebrados, como humanos, vacas, gatos, cans, pitos, coellos de indias, hámsteres, ratos, porcos, coellos, ovellas e o anfibio Xenopus.