Con il termine pseudogene si intende una sequenza di nucleotidi simile a un gene (a livello di struttura), ma priva di alcuna espressione all'interno della cellula. Solitamente si tratta di geni ancestrali che hanno perso la capacità di essere espressi.[1] Sebbene mantengano a volte alcune strutture tipiche dei geni (promotore, isole CpG o siti di splicing), queste sequenze non sono in grado di generare un prodotto proteico funzionale, spesso a causa di mutazioni genetiche consolidatesi durante l'evoluzione: in questi casi sono spesso presenti mutazioni che generano trascritti nonsenso, che non possono essere tradotti a proteina. Se i geni codificano per una molecola attiva come RNA, è possibile che si siano consolidate mutazioni tali da renderlo del tutto inefficace (ciò avviene per molti pseudogeni che si presume codificassero per rRNA).
Il termine pseudogene è stato utilizzato per la prima volta nel 1977 in una pubblicazione di Jacq e colleghi[2], unendo il prefisso pseudo al termine gene.
Sebbene gli pseudogeni siano spesso etichettati come DNA spazzatura, essi contengono all'interno delle loro sequenze informazioni notevoli riguardanti i meccanismi stessi dell'evoluzione. Questo è dovuto al fatto che spesso essi derivano dalla duplicazione ancestrale di un gene funzionale. Così come Charles Darwin ipotizzò per due specie la presenza di un antenato comune, seguito da milioni di anni di evoluzione divergente (che ha condotto alla speciazione), è possibile teorizzare che lo pseudogene e il suo omologo funzionale abbiano condiviso un antenato comune e in seguito siano andati a divergere fino a raggiungere lo stato attuale.
Ogni pseudogene è caratterizzato dalla non-funzionalità e dalla omologia a un secondo gene. Ciò significa che, per quanto ogni pseudogene presenti una sequenza decisamente simile a qualche gene funzionante, esso non è in grado di generare un prodotto funzionale[3].
Gli pseudogeni sono solitamente di difficile individuazione e caratterizzazione, poiché i due caratteri di omologia e non-funzionalità sono usualmente dedotti attraverso analisi di sequenza e non direttamente osservati, dal momento che gli pseudogeni non codificano per prodotti funzionali.
- L'omologia viene solitamente analizzata attraverso allineamenti di sequenza tra il gene funzionale e il presunto pseudogene. Tali allineamenti forniscono solitamente la percentuale di paia di basi identiche. Un'alta identità di sequenza (solitamente compresa tra il 40% e il 100%) è solitamente indicatrice della presenza di un gene progenitore comune.
- La non-funzionalità può manifestarsi in modi differenti. Normalmente, un gene deve essere correttamente processato attraverso numerosi step per essere convertito in una forma funzionale.
- Per ottenere una proteina, per esempio, occorre la trascrizione del gene in un filamento di RNA, il successivo processamento a mRNA, la sintesi proteica e un corretto ripiegamento. In caso di fallimento di uno solo di tali processi, il gene perde ogni possibile funzionalità. Nelle ricerche di nuovi pseudogeni svolte attraverso analisi ad ampio spettro, solitamente si cercano mutazioni puntiformi come la presenza di un codone di stop o di una mutazione frameshift, che generano nella quasi totalità dei casi prodotti proteici non funzionali.
- Gli pseudogeni di geni a RNA sono spesso più semplici da individuare. Molti geni a RNA, infatti, sono presenti in copie multiple. Per individuare gli pseudogeni di un determinato gene a RNA, dunque, è spesso sufficiente ricercare sequenze ad alta identità nelle regioni adiacenti al gene a RNA stesso.
Gli pseudogeni vengono classificati in tre gruppi principali, ognuno con meccanismo di origine e caratteristiche differenti:
- Pseudogeni processati (o retrotrasposti) (Processed pseudogenes in inglese). Negli eucarioti superiori, in particolare nei mammiferi, la retrotrasposizione è un fenomeno piuttosto comune che ha avuto un enorme impatto nella composizione del genoma. Per esempio il 30% - 44% del genoma umano è costituito da elementi ripetuti come le LINE e le SINE (vedi retrotrasposone)[4][5]. Nel processo della retrotrasposizione, una porzione dell'RNA messaggero di un gene viene spontaneamente retrotrascritto in DNA e reinserito nel DNA cromosomico. Sebbene di solito i retrotrasposoni creino copie di sé stessi, è stato dimostrato in vitro che questi elementi possono anche provocare la retrotrascrizione di altri geni a caso, non collegati a essi[6]. Nel momento in cui questi pseudogeni si reinseriscono nel genoma, di solito contengono una coda di poli-A e perdono degli introni, due caratteristiche dei cDNA. Tuttavia, poiché derivano da un mRNA maturo, gli pseudogeni processati perdono anche il promotore, che di solito nei geni normali è sempre presente; per questo motivo questi elementi vengono definiti non funzionanti (dall'inglese dead on arrival, traducibile come prodotto non funzionante alla consegna), perdendo la loro funzionalità con l'evento di retrotrasposizione[7]. Un'altra caratteristica degli pseudogeni processati è la rimozione della porzione 5' terminale relativa alla sequenza di origine, risultato del meccanismo di retrotrasposizione non perfetto che rimuove qualche base[8].
- Pseudogeni non processati (o duplicati) (non-processed pseudogenes in inglese). La duplicazione genica è un altro processo piuttosto comune e importante nell'evoluzione dei genomi. In questo caso, in seguito a duplicazione genica, può originarsi una copia di un gene funzionale. Questa copia poi con il passare delle generazioni può acquisire mutazioni che la rendono non più funzionale. Questi pseudogeni duplicati di solito hanno tutte le caratteristiche di un gene normale, incluso un promotore e una normale struttura esone - introne. La perdita della funzionalità di questo gene-copia di solito non ha un effetto visibile sulla fitness dell'organismo nel quale si trova, visto che vi è almeno una copia del gene funzionale. Secondo alcuni modelli evoluzionari, pseudogeni duplicati in comune tra varie specie indicano la parentela evolutiva tra gli esseri umani e gli altri primati[9].
- Pseudogeni disabilitati o unitari (disabled pseudogenes in inglese). Molte mutazioni impediscono a un gene di essere trascritto o tradotto normalmente, e un gene può perdere la propria funzione o inattivarsi qualora la popolazione fissi queste mutazioni. Questo rappresenta lo stesso meccanismo tramite il quale geni non processati vengono disattivati, sebbene la differenza in questo caso sia che il gene non viene duplicato prima di essere inattivato. Di solito questo tipo di inattivazione sarebbe piuttosto improbabile in una popolazione, ma diversi fattori di dinamica delle popolazioni, tra cui la deriva genetica (genetic drift) o un effetto "collo di bottiglia" o ancora, in alcuni casi, la selezione naturale, possono portare alla fissazione di tale mutazione. Il classico esempio di pseudogene inattivato è il gene che probabilmente codificava per l'enzima L-gulonolattone ossidasi (GLO) nei primati: in ogni mammifero tranne i primati, le cavie e i mammiferi alati questo enzima favorisce la biosintesi di acido ascorbico (vitamina C), mentre negli animali sopraelencati e nell'uomo questo enzima non è attivo[10][11]. Un altro esempio più recente di un gene disabilitato, che porta all'inattivazione di un gene per una caspasi (tramite una mutazione non-senso) può essere trovata in Xue et al. 2006[12].
Gli pseudogeni possono complicare di molto gli studi di genetica molecolare. Per esempio un ricercatore che vuole amplificare un gene tramite reazione a catena della polimerasi può contemporaneamente amplificare uno pseudogene, che ha una sequenza nucleotidica molto simile. Per lo stesso motivo gli pseudogeni vengono talvolta indicati come geni nei sequenziamenti genomici e pongono spesso un problema anche per quei programmi di gene prediction, che spesso li interpretano come geni reali o esoni. È stato anche proposto che l'identificazione di questi elementi possa aiutare a migliorare l'accuratezza di questi metodi di gene prediction[13].
Nel 2003 Hirotsune et al. identificarono uno pseudogene retrotrasposto il cui trascritto era ritenuto avere un'attività regolativa in trans nell'espressione del suo gene omologo, Makorin1, e suggerirono questo come modello generale sotto il quale anche gli pseudogeni hanno un ruolo biologico importante[14]. Altri ricercatori hanno da allora ipotizzato simili ruoli da parte di altri pseudogeni[15]. La scoperta di Hirotsune convinse due biologi molecolari a riguardare con attenzione la letteratura scientifica riguardante gli pseudogeni. A sorpresa di molti i due ricercatori riscontrarono una serie di casi in cui questi elementi giocavano un ruolo importante nella regolazione dell'espressione dei rispettivi geni[16], costringendo il gruppo di Hirotsune a revocare la loro rivendicazione di essere stati i primi a identificare una funzione per gli pseudogeni[17]. Inoltre, nel 2002 le Università di Chicago e di Cincinnati riferirono che uno pseudogene processato chiamato fosfoglicerato mutasi o PGAM3[collegamento interrotto] effettivamente produceva una proteina funzionale[18]. In più nel 2006 la stessa scoperta originale di Hirotsune et al. riguardante Makorin1 è stata messa fortemente in discussione[19]. Così l'allettante possibilità che almeno alcuni pseudogeni possano avere importanti funzioni biologiche viene ora contestata.
(EN) Vanin, E. F. (1985). "Processed pseudogenes: characteristics and evolution". Annu Rev Genet 19: 253-72. PubMed
(EN) Jacq, C., J. R. Miller, et al. (1977). "A pseudogene structure in 5S DNA of Xenopus laevis". Cell 12(1): 109-20.PubMed
(EN) Mighell, A. J., N. R. Smith, et al. (2000). "Vertebrate pseudogenes". FEBS Lett 468(2-3): 109-14. PubMed
(EN) Jurka, J. (2004). "Evolutionary impact of human Alu repetitive elements". Curr Opin Genet Dev 14(6): 603-8.PubMed
(EN) Dewannieux, M. and T. Heidmann (2005). "LINEs, SINEs and processed pseudogenes: parasitic strategies for genome modeling". Cytogenet Genome Res 110(1-4): 35-48. PubMed
(EN)
Dewannieux, M., C. Esnault, et al. (2003). "LINE-mediated retrotransposition of marked Alu sequences". Nat Genet 35(1): 41-8. PubMed
(EN)
Graur, D., Y. Shuali, et al. (1989). "Deletions in processed pseudogenes accumulate faster in rodents than in humans". J Mol Evol 28(4): 279-85.
PubMed PDF
(EN)
Pavlicek, A., J. Paces, et al. (2002). "Length distribution of long interspersed nucleotide elements (LINEs) and processed pseudogenes of human endogenous retroviruses: implications for retrotransposition and pseudogene detection". Gene 300(1-2): 189-94. PubMed
(EN)
Edward E. Max, "Plagiarized Errors and Molecular Genetics: Another Argument in the Evolution-Creation Controversy",
(EN)
Morimitsu Nishikimi et al., "L-gulono-Gamma-Lactone Oxidase, the Key Enzyme for L-Ascorbic Acid Biosynthesis Missing in This Species", Journal of Biological Chemistry 267 (1992): 21967-21972
Morimitsu Nishikimi et al., "Cloning and Chromosomal Mapping of Human Nonfunctional Gene for L-Gulono-Gamma-Lactone Oxidase, the Enzyme for L-Ascorbic Acid Biosynthesis Missing in Man", Journal of Biological Chemistry 269 (1994): 13685-13688
(EN)
Xue, Y., A. Daly, et al. (2006). "Spread of an inactive form of caspase-12 in humans is due to recent positive selection". Am J Hum Genet 78(4): 659-70. PubMed
(EN)
van Baren, M. J. and M. R. Brent (2006). "Iterative gene prediction and pseudogene removal improves genome annotation". Genome Res 16(5): 678-85. PubMed
(EN) Hirotsune, S., N. Yoshida, et al. (2003). "An expressed pseudogene regulates the messenger-RNA stability of its homologous coding gene". Nature 423(6935): 91-6.
PubMed
Svensson, O., L. Arvestad, et al. (2006). "Genome-wide survey for biologically functional pseudogenes". PLoS Comput Biol 2(5): e46.
PubMed
(EN) Evgeniy S. Balakirev and Francisco J. Ayala, "Pseudogenes: Are They ‘Junk’ or Functional DNA?" Annual Review of Genetics 37 (2003): 91-96.
(EN) Shinji Hirotsune et al., "Addendum: An Expressed Pseudogene Regulates the messenger-RNA Stability of Its Homologous Coding Gene", 'Nature' 426 (2003): 100
(EN) Esther Betrán et al., "Evolution of the Phosphoglycerate mutase Processed Gene in Human and Chimpanzee Revealing the Origin of a New Primate Gene", 'Molecular Biology and Evolution' 19 (2002): 654-663
(EN) Gray, T. et al. (2006). "The putatively functional Mkrn1-p1 pseudogene is neither expressed nor imprinted, nor does it regulate its source gene in trans". Proc. Nat. Acad. Sci. USA 103(32):12039-44. Abstract