Loading AI tools
acido nucleico Da Wikipedia, l'enciclopedia libera
L'acido desossiribonucleico o deossiribonucleico (sigla DNA, dall'inglese DeoxyriboNucleic Acid[1][2][3]) è l'acido nucleico che contiene le informazioni genetiche per lo sviluppo, l'omeostasi e la riproduzione di tutti gli esseri viventi conosciuti. Costituisce inoltre la molecola base del funzionamento di una piccola minoranza dei virus.[4]
Dal punto di vista chimico, il DNA è un polimero organico a doppia catena i cui monomeri sono chiamati nucleotidi (desossiribonucleotidi).[5] I nucleotidi sono costituiti da tre componenti fondamentali: un gruppo fosfato, uno zucchero (il deossiribosio) e una base azotata, legata al glicide con un legame N-glicosidico. Le basi azotate che entrano nella formazione dei nucleotidi sono quattro: adenina, timina, citosina e guanina (nell'RNA al posto della timina è presente l'uracile). La doppia catena polinucleotidica del DNA ha struttura antiparallela, spiralizzata e complementare poiché le basi azotate di una catena si accoppiano con l'altra con legami idrogeno secondo lo schema: A-T e G-C.
La sequenza dei nucleotidi costituisce il codice genetico, che è tradotto negli amminoacidi corrispondenti. La sequenza amminoacidica prodotta forma le proteine. Il processo della sintesi proteica avviene tramite la sintesi di una molecola intermedia di RNA (RNA messaggero), che è formata per complementarità con le quattro basi dei nucleotidi del DNA in un processo noto come trascrizione. Il DNA non genera solo filamenti di RNA destinati alla traduzione in aminoacidi, ma anche frammenti in grado di svolgere svariate funzioni biologiche, ad esempio all'interno dei ribosomi, dove l'RNA ha una funzione strutturale.
Negli eucarioti, il DNA si complessa all'interno del nucleo in strutture chiamate cromosomi. Negli altri organismi, privi di nucleo, esso può essere organizzato in cromosomi o meno (nei batteri è presente un'unica molecola di DNA circolare a doppia catena). All'interno dei cromosomi, le proteine della cromatina come gli istoni, le coesine e le condensine organizzano il DNA e lo avvolgono in strutture ordinate. Queste strutture guidano l'interazione tra il codice genetico e le proteine responsabili della trascrizione, contribuendo al controllo della trascrizione genica. Nel corso della mitosi avviene la replicazione del DNA, con cui l'informazione genica è trasmessa integralmente nel passaggio tra diverse generazioni cellulari.
Il DNA fu inizialmente isolato dal biochimico svizzero Friedrich Miescher, il quale, nel 1869, individuò una sostanza microscopica contenuta nel pus di bende chirurgiche utilizzate. Dal momento che tale molecola aveva la sua localizzazione nel nucleo, egli la chiamò nucleina.[6] Nel 1919 Phoebus Levene individuò la struttura del nucleotide, composta da base azotata, zucchero e fosfato.[7] Levene suggerì che il DNA consistesse in un filamento di nucleotidi legati tra loro attraverso i fosfati. Egli, però, era convinto che tale filamento fosse corto e che le basi fossero disposte secondo un preciso ordine ripetuto. Nel 1937 William Astbury presentò i primi risultati di alcuni studi di diffrazione a raggi X, i quali dimostrarono che il DNA ha una struttura estremamente regolare[8]. Nel 1944 Erwin Schrödinger asserì che, visto che secondo la fisica quantistica i sistemi di pochi atomi hanno un comportamento disordinato, il materiale genetico doveva essere costituito da una grande molecola non ripetitiva, sufficientemente stabile da mantenere l'informazione genetica, chiamata "cristallo aperiodico".[9]
Nel 1928 Frederick Griffith scoprì che i caratteri della forma smooth ("liscia") di Pneumococcus potevano essere trasferiti alla forma rough ("rugosa"), miscelando i resti di batteri smooth morti con batteri rough vivi.[10] Questo sistema, pur non fornendo nessuna evidenza su quale fosse la sostanza che determinava il cambiamento, mostrava che qualcosa potesse trasportare l'informazione genetica dai resti dei batteri morti a quelli vivi. Si parlò quindi di un principio trasformante in grado di modificare i batteri vivi. Nel 1943 Oswald Theodore Avery dimostrò, in un celebre esperimento insieme a Colin MacLeod e Maclyn McCarty, che il DNA è il principio trasformante alla base di questo fenomeno.[11] Il ruolo del DNA nell'ereditarietà è stato provato, infine, nel 1953 da Alfred Hershey e Martha Chase attraverso un altro classico esperimento, che dimostrò che il materiale genetico del fago T2 è effettivamente il DNA.[12]
Il 1953 è anche l'anno in cui, attraverso ulteriori immagini da diffrazione a raggi X[13] realizzate da Rosalind Franklin, chimica-fisica inglese, James Watson e Francis Crick presentarono[13], sulla rivista Nature, quello che è oggi accertato come il primo modello accurato della struttura del DNA,[14] ovvero il modello a doppia elica. A disegnarne il bozzetto fu Odile Speed, pittrice e moglie di Crick. Le evidenze sperimentali a supporto del modello di Watson e Crick furono riportate in una serie di cinque articoli pubblicati sullo stesso numero di Nature.[15] Tra questi figurava l'articolo della Franklin e di Raymond Gosling, che conteneva i dati di diffrazione a raggi X, fondamentale per sostenere il modello.[16][17] Tale numero conteneva anche un articolo sulla struttura del DNA scritto da Maurice Wilkins.[18] Nel 1962, dopo la morte di Rosalind Franklin (a causa di un tumore provocato, probabilmente, dalle alte dosi di raggi X a cui si era esposta nel corso dei suoi esperimenti), Watson, Crick e Wilkins ricevettero congiuntamente il Premio Nobel per la medicina.[19] Dal momento che la scoperta del modello si basò essenzialmente sui dati di Rosalind Franklin, ancora oggi esistono pareri molto eterogenei nella comunità scientifica su chi avrebbe dovuto ricevere tale premio.
In un'importante presentazione del 1957, Crick propose il dogma centrale della biologia molecolare, che fissa le relazioni tra DNA, RNA e proteine.[20] La conferma finale del meccanismo di replicazione basato sulla struttura a doppia elica fu fornita nel 1958 dall'esperimento di Meselson-Stahl.[21] Un successivo lavoro di Crick dimostrò come il codice genetico fosse basato su triplette di basi non sovrapposte, permettendo a Har Gobind Khorana, Robert Holley e Marshall Warren Nirenberg di decifrarlo.[22] Queste scoperte sono alla base della moderna biologia molecolare.
Nel 1961 Marshall Nirenberg e Severo Ochoa scoprono che ogni tripletta di nucleotidi codifica per uno specifico amminoacido.
Il DNA è un lungo polimero costituito da unità ripetute di nucleotidi.[23][24] La catena del DNA è larga tra i 22 e i 26 ångström (da 2,2 a 2,6 nanometri) e ogni unità nucleotidica è lunga 3,3 ångstrom (0,33 nanometri).[25] Sebbene ogni unità occupi uno spazio decisamente ridotto, la lunghezza dei polimeri di DNA può essere sorprendentemente elevata, dal momento che ogni filamento può contenere diversi milioni di nucleotidi. Ad esempio, il più grande cromosoma umano (il cromosoma 1) contiene quasi 250 milioni di paia di basi.[26]
Negli organismi viventi, il DNA non è quasi mai presente sotto forma di singolo filamento, ma come una coppia di filamenti saldamente associati tra loro.[14][27] Essi si intrecciano tra loro a formare una struttura definita doppia elica. Ogni nucleotide è costituito da uno scheletro laterale, che ne permette il legame covalente con i nucleotidi adiacenti, e da una base azotata, che instaura legami idrogeno con la corrispondente base azotata presente sul filamento opposto. Il composto formato da una base azotata legata allo zucchero è definito nucleoside; un nucleotide è invece un nucleoside a cui sono legati uno o più gruppi fosfato.[28]
La struttura laterale del DNA è composta da unità ripetute e alternate di gruppi fosfato e di 2-deossiribosio,[29] uno zucchero pentoso (a cinque atomi di carbonio) che si lega ai fosfati adiacenti attraverso legami fosfodiesterici presso il terzo e il quinto carbonio; in pratica, ogni molecola di fosfato forma un ponte molecolare collegando, attraverso legami fosfodiesterici, il carbonio in posizione 3′ di una molecola di deossiribosio con quello in posizione 5′ dello zucchero successivo. Conseguenza di questi legami asimmetrici è che ogni filamento di DNA ha un senso, determinato dalla direzione dei legami fosfodiesterici. Le basi azotate, invece, si uniscono in posizione 1' dello zucchero desossiribosio con legami N-glicosidici. In una doppia elica, il senso di un filamento è opposto a quello del filamento complementare. Per tale motivo, i due filamenti che costituiscono una doppia elica sono detti antiparalleli. Le estremità asimmetriche di un filamento di DNA sono definite estremità 5′ (cinque primo) ed estremità 3′ (tre primo). La principale differenza tra il DNA e l'RNA è lo zucchero pentoso utilizzato: l'RNA, infatti, utilizza il ribosio.[27]
La doppia elica del DNA è stabilizzata dai legami idrogeno che si instaurano tra le basi azotate presenti sui due filamenti.[30] Le quattro basi che sono presenti nel DNA sono l'adenina (abbreviata con la lettera A), la citosina (C), la guanina (G) e la timina (T). Tutte e quattro le basi hanno struttura eterociclica, ma adenina e guanina sono, dal punto di vista strutturale, derivate della purina, e pertanto dette basi puriniche, mentre citosina e timina sono correlate alla pirimidina e dette basi pirimidiniche.[27] Esiste una quinta base, di tipo pirimidinico, chiamata uracile (U), ma essa non è di norma presente nelle catene di DNA. L'uracile è altresì presente nei filamenti di RNA al posto della timina, dalla quale si differenzia per la mancanza di un gruppo metile. L'uracile è presente nel DNA solo come prodotto della degradazione della citosina. Solo nel batteriofago PBS1 tale base può essere utilizzata all'interno del DNA.[31] Al contrario, è molto più frequente individuare la timina all'interno di molecole di RNA, a causa della metilazione enzimatica di diversi uracili. Questo evento avviene solitamente a carico di RNA con funzione strutturale o enzimatica (rRNA e tRNA).[32]
La doppia elica è una spirale destrorsa. Con l'avvitarsi su sé stessi dei due filamenti, restano esposti dei solchi tra i diversi gruppi fosfato. Il solco maggiore è largo 22 Å, mentre il solco minore è largo 12 Å.[33] La differente ampiezza dei due solchi si traduce concretamente in una differente accessibilità delle basi, a seconda che si trovino nel solco maggiore o minore. Proteine che legano il DNA, come i fattori di trascrizione, dunque, solitamente prendono contatto con le basi presenti nel solco maggiore.[34][35]
Ogni tipo di base presente su un filamento forma un legame con la base posta sul filamento opposto. Tale evento è noto come appaiamento complementare. Le basi puriniche formano legami idrogeno con le basi pirimidiniche: A può legare solo T e G può legare solo C. L'associazione di due basi viene comunemente chiamata paio di basi ed è l'unità di misura maggiormente utilizzata per definire la lunghezza di una molecola di DNA. Dal momento che i legami idrogeno non sono covalenti, essi possono esser rotti e riuniti in modo relativamente semplice, poiché questi sono legami ad alta energia. I due filamenti possono essere allontanati tra loro, come avviene per una cerniera, sia dalle alte temperature sia da un'azione meccanica (come avviene durante la replicazione del DNA).[36] Conseguenza di questa complementarità è che tutte le informazioni contenute nella doppia elica possono essere duplicate a partire da entrambi i filamenti, evento fondamentale per una corretta replicazione del DNA.[23]
I due tipi di paia di basi formano un numero differente di legami idrogeno: A e T ne formano due, G e C tre. Per tale motivo, la stabilità del legame GC è decisamente maggiore di quello AT. Di conseguenza, la stabilità complessiva di una molecola di DNA è direttamente correlata alla frequenza di GC presenti nella molecola stessa, nonché alla lunghezza dell'elica: una molecola di DNA è dunque tanto più stabile quanto più contiene GC ed è lunga.[37] Un'altra conseguenza di tale evento è il fatto che le regioni di DNA che devono essere separate facilmente contengono un'elevata concentrazione di A e T, come avviene ad esempio per il Pribnow box dei promotori batterici, la cui sequenza è infatti TATAAT.[38]
In laboratorio, la stabilità dell'interazione tra filamenti è misurata attraverso la temperatura necessaria a rompere tutti i legami idrogeno, chiamata temperatura di melting (o Tm). Quando tutti i legami idrogeno sono rotti, i singoli filamenti si separano e possono assumere strutture molto variegate.[39]
La stabilizzazione della doppia elica, in ogni caso, non è dovuta ai soli legami idrogeno, ma anche a interazioni idrofobiche e di pi stacking.[40]
Una sequenza di DNA è definita senso se la sua sequenza è la stessa del relativo mRNA. La sequenza posta sul filamento opposto è invece detta antisenso. Dal momento che le RNA polimerasi lavorano producendo una copia complementare, il filamento necessario per la trascrizione è l'antisenso. Sia nei procarioti sia negli eucarioti vengono prodotte numerose molecole di RNA antisenso a partire dalle sequenze senso. La funzione di questi RNA non codificanti non è stata ancora completamente chiarita.[41] Si ritiene che gli RNA antisenso possano giocare un ruolo nella regolazione dell'espressione genica.[42]
Esistono alcune sequenze di DNA, sia in procarioti sia in eucarioti (ma soprattutto nei plasmidi e nei virus) in cui la differenza tra sequenze senso e antisenso è meno chiara, dal momento che le sequenze di alcuni geni si sovrappongono tra loro.[43] In questi casi, dunque, alcune sequenze rivestono un doppio compito: codificare una proteina se lette in direzione 5'→3′ su un filamento; codificarne un'altra se lette sull'altro (sempre in direzione 5'→3′). Nei batteri, questa sovrapposizione genica è spesso coinvolta nella regolazione della trascrizione,[44] mentre nei virus il fenomeno è dovuto alla necessità di contenere in un piccolo genoma un'elevata quantità di informazioni.[45] Un altro modo di ridurre le dimensioni genomiche è quello individuato da altri virus, che contengono molecole di DNA lineare o circolare a singolo filamento.[46][47]
Il DNA può essere distorto come avviene per una corda attraverso un processo definito superavvolgimento. Quando il DNA è in uno stato rilassato, un filamento percorre un giro completo intorno all'asse ogni 10,4 paia di basi. Se invece il DNA è distorto, il numero di basi può aumentare o diminuire.[48] Lo stato di superavvolgimento in cui si trova una molecola di DNA è definito topologia. Se il DNA si avvolge nella direzione dell'elica, si parla di superavvolgimento positivo, con le basi strette tra loro in modo più marcato. In caso contrario, si parla di superavvolgimento negativo. In natura, la maggior parte delle molecole di DNA presentano un lieve superavvolgimento negativo, introdotto da enzimi definiti topoisomerasi.[49] Questi enzimi sono anche necessari in processi come la trascrizione e la replicazione del DNA, dal momento che sono in grado di risolvere gli stress topologici indotti dai processi stessi.[50]
Il DNA esiste in diversi tipi di conformazioni. Esse sono denominate A-DNA, B-DNA, C-DNA, D-DNA,[51] E-DNA,[52] H-DNA,[53] L-DNA,[51] P-DNA[54] e Z-DNA.[29][55] In ogni caso, solo le conformazioni A-DNA, B-DNA e Z-DNA sono state osservate nei sistemi biologici naturali. La conformazione del DNA può dipendere dalla sequenza, dal superavvolgimento, dalla presenza di modificazioni chimiche delle basi o dalle condizioni del solvente, come la concentrazione di ioni metallici.[56] Di tali conformazioni, la conformazione B è la più frequente nelle condizioni standard delle cellule.[57] Le due conformazioni alternative sono differenti dal punto di vista della geometria e delle dimensioni.
La forma A è un'ampia spirale destrorsa (il solco minore è largo ma poco profondo, quello maggiore è più stretto e profondo), con un passo di 2,9 nm (circa 11 bp) e un diametro di 2,5 nm. Tale conformazione è presente in condizioni non fisiologiche, quando il DNA viene disidratato. In condizioni fisiologiche, questa conformazione caratterizza gli eteroduplex di DNA e RNA e i complessi formati dalle associazioni DNA-proteina.[58][59]
La conformazione Z è tipica invece delle sequenze che presentano modificazioni chimiche come la metilazione, e dei tratti di DNA ricchi di basi C e G. Essa assume un andamento sinistrorso, opposto rispetto alla conformazione B.[60] Ha un passo di 4,6 nm e un diametro di 1,8 nm, il solco maggiore più superficiale e quello minore più stretto; deve il suo nome all'andamento a zig-zag che la caratterizza. Queste strutture inusuali possono essere riconosciute da specifiche Z-DNA-binding proteins, con conseguenze notevoli nella regolazione della trascrizione, anche se non ne sono stati trovati esempi in natura.[61]
Le regioni terminali dei cromosomi lineari sono sequenze ripetute dette telomeri. La funzione principale di tali regioni è quella di permettere alla cellula di replicare le estremità dei cromosomi senza che ci sia perdita di informazioni geniche, dal momento che le DNA polimerasi coinvolte nella replicazione del DNA non sono in grado di replicare le estremità 3' dei cromosomi.[63] Se un cromosoma non avesse telomeri, infatti, diventerebbe un po' più corto a ogni replicazione, con il rischio di perdere sequenze codificanti. Attraverso un particolare tipo di DNA polimerasi (detto telomerasi), invece, i telomeri mantengono costantemente la loro lunghezza, proteggendo così la parte interna del cromosoma. Nelle cellule umane, i telomeri sono composti da alcune migliaia di ripetizioni di una semplice sequenza costituita da TTAGGG.[64]
Questa sequenza ricca in guanina può stabilizzare le estremità dei cromosomi formando strutture insolite, composte da unità di quattro basi azotate al posto delle canoniche due. Ciò è dovuto all'interazione tra quattro guanine, che formano una struttura planare che si impila sopra ad altre strutture dello stesso tipo, a ottenere un filamento stabile definito G-quadruplex structure.[65] Tali strutture sono stabilizzate dalla formazione di legami idrogeno che si instaurano tra le sommità delle basi e dalla chelazione con uno ione metallico, situato al centro di ogni unità di quattro basi.[66]
Oltre a queste, i telomeri generano anche strutture circolari, chiamate telomere-loops o T-loops. In questo caso, il singolo filamento di DNA si piega a formare ampie circonferenze, stabilizzate da proteine specifiche che legano i telomeri.[67] Al termine del T-loop, il singolo filamento di DNA prende contatto con un doppio filamento, che si apre e forma una struttura a tripla elica. Questa struttura è chiamata displacement-loop o D-loop.[65]
L'espressione genica di un determinato locus è influenzata dalla struttura che la cromatina assume presso il locus stesso. Regioni eterocromatiniche (caratterizzate da un'espressione scarsa o assente) sono estesamente metilate sulle citosine. La metilazione della citosina, ad esempio, è fondamentale per l'inattivazione del cromosoma X.[68] Il livello medio di metilazione è molto variabile tra i diversi organismi: Caenorhabditis elegans non presenta metilazione delle citosine, mentre i vertebrati mostrano livelli maggiori, con circa l'1% del genoma contenente 5-metilcitosina.[69] La 5-metilcitosina, essendo suscettibile di deaminazione spontanea, è una base presso cui l'incidenza di mutazioni è elevatissima.[70]
Ulteriori modificazioni di basi sono la metilazione dell'adenina (presente nei batteri) e la glicosilazione dell'uracile che produce le cosiddette basi J nei cinetoplastidi.[71][72]
Il DNA può essere alterato dall'azione di numerosi agenti, genericamente definiti mutageni; è fondamentale notare però come una mutazione -ovverosia un cambiamento raro, casuale, che alteri la sequenza di basi azotate- non sia necessariamente un evento pernicioso ma anzi sia alla base dell'evoluzione: suddetta mutazione dovrà però farsi spazio nella fittissima rete cibernetica cellulare nonché nell'ambiente nel quale vive e opera l'organismo vivente in questione; qualora vengano superati questi punti di restrizione (altamente selettivi vista la loro complessità intrinseca, la stragrande maggioranza delle mutazioni difatti si rivela non vantaggiosa o anche neutra), si avrà un organismo arricchito dalla mutazione. Tra gli agenti alteranti figurano ad esempio agenti ossidanti, agenti alchilanti e anche radiazioni ad alta energia, come i raggi X e gli UV.
Il tipo di danno causato al DNA dipende dal tipo di agente: gli UV, ad esempio, danneggiano il DNA generando la formazione di dimeri di timina, costituiti da ponti aberranti che si instaurano tra basi pirimidiniche adiacenti.[74] Agenti ossidanti come i radicali liberi o il perossido di idrogeno, invece, producono danni di tipo più eterogeneo, come modificazioni di basi (in particolare di guanine) o rotture del DNA a doppio filamento.[75] Secondo diversi studi, in ogni cellula umana almeno 500 basi al giorno sono sottoposte a danni ossidativi.[76][77] Di tali lesioni, le più pericolose sono le rotture a doppio filamento, dal momento che tali danni sono i più difficili da riparare e costituiscono l'origine primaria delle mutazioni puntiformi e frameshift che si accumulano sulle sequenze genomiche, nonché delle traslocazioni cromosomiche.[78]
Molti agenti devono il loro potere mutageno alla capacità di intercalarsi tra due basi azotate consecutive. Gli intercalanti sono tipicamente molecole planari e aromatiche, come l'etidio, la daunomicina, la doxorubicina o la talidomide. Perché un intercalante possa trovare posto tra le due basi, occorre che la doppia elica si apra e perda la sua conformazione standard. Tali modifiche strutturali inibiscono sia la trascrizione sia la replicazione del DNA e aumentano la possibilità di insorgenza di mutazioni. Per tale motivo, gli intercalanti sono considerati molecole cancerogene, come dimostrato da numerosi studi su molecole come il benzopirene, l'acridina, l'aflatossina e il bromuro di etidio.[79][80][81] In ogni caso, proprio grazie alla loro capacità di inibire trascrizione e replicazione, tali molecole sono anche utilizzate in chemioterapia per inibire la rapida crescita delle cellule neoplastiche.[82]
Negli eucarioti, il DNA è solitamente presente all'interno di cromosomi lineari (circolari nei procarioti). La somma di tutti i cromosomi di una cellula ne costituisce il genoma; il genoma umano conta circa 3 miliardi di paia di basi contenute in 46 cromosomi.[83]
La disposizione finale a cromosomi segue precise regole gerarchiche di impacchettamento. Nelle cellule, infatti, il doppio filamento di DNA non può essere disposto a casaccio, ma deve seguire precise regole di ordinamento. Tali accorgimenti si rivelano necessari perché la lunghezza dei filamenti di DNA è solitamente molto elevata e creerebbe seri problemi alla cellula ospite. Ad esempio, il cromosoma di Escherichia coli, il procariote più studiato nella storia della biomedicina, misura circa 1 mm. In una cellula lunga solo 2 µm, come quella di E. coli, la disposizione casuale di un cromosoma del genere potrebbe generare problemi. Se una molecola di questa lunghezza si disponesse casualmente, infatti, ci sarebbe bisogno di una cellula grande almeno 1000 volte tanto. Le modalità di impacchettamento sono differenti tra gli organismi procarioti e quelli eucarioti.
Nella maggior parte delle cellule batteriche il DNA è disposto su un unico cromosoma circolare (e presenta, come molti altri batteri, un'unica origine di replicazione), come previsto da numerosi esperimenti di linkage e infine evidenziato in cellule cresciute con timina marcata con tritio.
I meccanismi messi in atto dalla cellula procariote per ridurre lo spazio necessario consistono anzitutto nel mascheramento delle cariche negative presenti sul DNA attraverso la sua associazione con poliammine cariche positivamente, come la spermina e la spermidina. Oltre a queste, il DNA procariote prende contatto anche con numerose piccole proteine, che compattano la struttura complessiva del DNA. Tra di esse, figura H-NS, un dimero con funzioni molto simili agli istoni eucariotici. In ogni cellula di E. coli esistono in media 20000 molecole di H-NS, che si dispongono lungo il DNA a distanza di circa 400 bp.
Il DNA di E. coli è inoltre molto superavvolto. Tale fenomeno contribuisce ulteriormente al compattamento del DNA, permettendo a esso di disporsi comodamente all'interno della cellula.
Negli eucarioti l'impacchettamento è ottenuto attraverso diversi accorgimenti. Il DNA è associato a un gran numero di proteine: l'associazione complessiva DNA-proteine è definita cromatina, la cui struttura è ampiamente conservata tra tutti gli organismi eucarioti.
Le proteine cromatiniche più abbondanti sono gli istoni, una famiglia di polipeptidi basici presenti nel nucleo. Le principali proteine istoniche sono H1, H2A, H2B, H3 e H4. La basicità degli istoni è dovuta alla grande quantità di amminoacidi carichi positivamente (lisina e arginina), in grado di instaurare interazioni elettrostatiche con i gruppi fosfato del DNA. Le proteine istoniche sono anche pesantemente modificate, proprio sui residui carichi, da modificazioni post-traduzionali, tra cui l'aggiunta di acetili, di fosfati e di metili, che neutralizzano la carica positiva o la rendono negativa.
Le sequenze amminoacidiche di quattro dei cinque istoni (H2A, H2B, H3 e H4) sono altamente conservate, anche tra specie molto diverse. La sequenza di H1 presenta invece maggiori variazioni lungo l'evoluzione: in alcuni organismi, H1 non è nemmeno presente in tutti i tessuti (ad esempio negli eritrociti degli uccelli H1 è sostituita da un sesto istone, chiamato H5). La presenza di differenti H1, in ogni caso, non modifica sostanzialmente la struttura complessiva dell'apparato istonico (definito nucleosoma), che resta ampiamente conservato nell'architettura nella quasi totalità degli eucarioti.
Nel genoma, l'informazione è conservata in sequenze di DNA chiamate geni. La trasmissione dell'informazione contenuta nei geni è garantita dalla presenza di sequenze di basi azotate complementari. Infatti, durante la trascrizione, l'informazione può essere facilmente copiata in un filamento complementare di RNA. Solitamente, tale copia di RNA è utilizzata per sintetizzare una proteina, attraverso un processo definito traduzione (o sintesi proteica). In alternativa, una cellula può semplicemente duplicare l'informazione genetica attraverso un processo definito replicazione del DNA.
Negli organismi eucarioti, il DNA genomico è localizzato all'interno del nucleo cellulare, nonché in piccole quantità all'interno di mitocondri e cloroplasti. Nei procarioti, il DNA è invece racchiuso in un organello irregolare, privo di membrana, contenuto nel citoplasma, chiamato nucleoide.[84] L'informazione è contenuta all'interno dei geni, unità ereditarie in grado di influire sul fenotipo dell'organismo. Ogni gene contiene un open reading frame (regione in grado di essere trascritta a RNA) e una regione regolatoria, costituita sia da un promotore sia da enhancers.
In molte specie, solo una piccola frazione della sequenza totale di un genoma può essere trascritta e tradotta. Ad esempio, solo l'1,5% del genoma umano è costituito da esoni codificanti una proteina, mentre più del 50% consiste di sequenze ripetute di DNA non codificante.[85] La ragione per cui ci sia una tale quantità di DNA non codificante non è tuttora completamente chiara ed è stata definita come enigma del C-value.[86] In ogni caso, le sequenze di DNA che non codificano una proteina possono essere trascritte in RNA non codificante, coinvolto nella regolazione dell'espressione genica.[87]
Alcune sequenze non codificanti ricoprono un ruolo strutturale per i cromosomi. Le regioni telomeriche e centromeriche contengono solitamente pochissimi geni, ma sono necessarie per la funzione e la stabilità dei cromosomi.[89] Nell'uomo, grandi quantità di DNA non codificante si ritrovano negli pseudogeni, copie di geni rese inattive dalla presenza di una mutazione.[90] Queste sequenze sono considerate come fossili molecolari, anche se esistono evidenze secondo le quali si può ipotizzare che siano una sorta di materiale grezzo necessario per la creazione di nuovi geni attraverso i processi di duplicazione genica e di evoluzione divergente.[91]
Un gene è una sequenza di DNA che contiene le informazioni in grado di influire sulle caratteristiche del fenotipo dell'organismo. All'interno di un gene, la sequenza di basi di DNA è utilizzata come stampo per la sintesi di una molecola di RNA che, nella maggior parte dei casi, è tradotta in una molecola peptidica.
Il meccanismo attraverso il quale la sequenza nucleotidica di un gene è copiata in un filamento di RNA è detto trascrizione e avviene per mezzo dell'enzima RNA polimerasi. Il filamento di RNA può andare incontro a destini differenti: alcune molecole di RNA hanno funzioni di tipo strutturale (come quelle che si trovano all'interno del ribosoma) o catalitica (molecole note come ribozimi); la funzione più nota è tuttavia quella della traduzione in proteine tramite la produzione mRNA. Il processo di traduzione avviene nel citoplasma, dove gli mRNA si associano ai ribosomi, ed è mediato dal codice genetico. Il ribosoma permette la lettura sequenziale dei codoni del mRNA, favorendone il riconoscimento e l'interazione con specifici tRNA, molecole che trasportano gli amminoacidi corrispondenti a ogni singolo codone.
Il codice genetico consiste di parole di tre lettere chiamate codoni, costituite dalla sequenza di tre nucleotidi (ad esempio ACU, CAG, UUU), presenti sull'mRNA, ognuna delle quali è associata a un particolare amminoacido. Ad esempio la timina ripetuta in una serie di tre (UUU) codifica la fenilalanina. Utilizzando gruppi di tre lettere si possono avere fino a 64 combinazioni diverse (), in grado di codificare i venti diversi amminoacidi esistenti. Poiché esistono 64 triplette possibili e solo 20 amminoacidi, il codice genetico è detto ridondante (o degenere): alcuni amminoacidi possono infatti essere codificati da più triplette diverse. Non è invece vero il contrario: a ogni tripletta corrisponderà un solo amminoacido (senza possibilità di ambiguità). Esistono infine tre triplette che non codificano alcun amminoacido, ma rappresentano codoni di stop (o nonsense), ovvero indicano il punto in cui, all'interno del gene, termina la sequenza che codifica la proteina corrispondente: si tratta dei codoni UAA, UGA e UAG.
La divisione cellulare, necessaria a un organismo per crescere e vivere, richiede una duplicazione del DNA cellulare, in modo che le cellule figlie possano avere la stessa informazione genetica della cellula madre. La struttura a doppia elica del DNA permette un meccanismo estremamente semplice per la replicazione del DNA. I due filamenti, infatti, sono separati e da ognuno viene creato un filamento complementare, per opera di un enzima chiamato DNA polimerasi. Con questo meccanismo, le basi presenti sul filamento figlio sono determinate da quelle presenti sul filamento parentale: è proprio attraverso questo meccanismo che le cellule figlie presentano genoma identico alla cellula madre (salvo errori avvenuti durante il processo, che portano alla comparsa di mutazioni). Tale tipo di replicazione, che porta a doppie eliche costituite da un filamento preesistente e uno neoformato è detta semiconservativa.
Per iniziare la replicazione, occorre anzitutto l'apertura della forca replicativa, attraverso la parziale denaturazione del DNA a doppia elica, portata a termine dalle elicasi e dalle single-strand-binding proteins (SSBPs): le elicasi sono enzimi che separano attivamente i due filamenti usando l'energia dell'ATP; le SSBPs sono in grado di mantenere la denaturazione del DNA legandosi esclusivamente alle porzioni a singolo filamento e stabilizzandole. Nelle molecole di DNA circolari dei procarioti si ha una sola regione di origine della replicazione dalla quale partono due forche replicative (la struttura prende il nome di bolla di replicazione). Quando le due forche si incontrano dal lato opposto la replicazione è completata. Negli eucarioti la replicazione di ogni cromosoma inizia invece in più punti.
Le DNA polimerasi, enzimi capaci di costruire una nuova catena solo in direzione 5'-3', sono stati individuati per la prima volta da Arthur Kornberg, il quale, grazie a un suo famoso esperimento,[92] identificò la DNA polimerasi I in Escherichia coli. La reazione della DNA polimerasi è diretta dallo stampo, perché produce un nuovo filamento di DNA esattamente complementare a uno preesistente che funge, appunto, da stampo. La DNA polimerasi non è in grado di iniziare la sintesi di un filamento ex novo, mentre può allungare un filamento polinucleotidico preesistente. In una cellula in replicazione, dunque, è indispensabile la presenza di un filamento preesistente (detto primer), che consiste solitamente in un breve segmento di RNA complementare allo stampo, sintetizzato da enzimi specifici detti primasi.
Dal momento che le DNA polimerasi sono in grado di svolgere la loro attività solo in direzione 5'-3', esse hanno messo a punto diversi meccanismi per copiare i due filamenti della doppia elica.[93] Un filamento (chiamato filamento guida) può essere replicato in modo quasi continuo, man mano che viene esposto, l'altro (filamento lento) risulta invece disseminato da brevi filamenti di DNA di nuova sintesi (i frammenti di Okazaki), ognuno dei quali presenta un innesco iniziale di RNA. I nuovi filamenti devono essere quindi completati mediante la rimozione degli inneschi da parte di endonucleasi e il riempimento degli spazi rimasti per opera di polimerasi di riparazione. Successivamente tutti questi frammenti di DNA di nuova sintesi del filamento lento vengono legati dalle DNA ligasi.
Tutte le funzioni del DNA dipendono dalle sue interazioni con specifiche proteine. Tali interazioni possono sia essere aspecifiche, sia prevedere un legame estremamente specifico della proteina a una singola sequenza di DNA. Sono numerosi anche gli enzimi che possono legare il DNA e, tra questi, sono particolarmente importanti le polimerasi che copiano le sequenze nella trascrizione e nella replicazione del DNA.
Le proteine strutturali che legano il DNA sono esempi delle interazioni aspecifiche tra DNA e proteine. All'interno dei cromosomi, il DNA è associato a complessi di natura proteica, che si organizzano tra loro a formare una struttura compatta chiamata cromatina. Negli eucarioti, questa struttura presuppone il legame del DNA a piccoli complessi proteici basici chiamati istoni; nei procarioti, invece, sono coinvolti diversi tipi di differenti proteine.[94][95] Gli istoni formano un complesso a forma di disco chiamato nucleosoma, che instaura interazioni di tipo ionico (tra i residui basici degli istoni e lo scheletro fosforico acido del DNA) con circa duecento paia di basi di DNA, che si avvolgono intorno al disco formando due giri completi, indipendentemente dalla sequenza che li caratterizza.[96] Questi residui basici possono subire metilazioni, fosforilazioni e acetilazioni:[97] tali modificazioni chimiche alterano l'interazione tra gli istoni e il DNA, rendendolo così più o meno accessibile ai fattori di trascrizione e modulando la velocità della trascrizione stessa.[98]
Altre DNA-binding proteins (DNAbp) di tipo aspecifico, anch'esse presenti nella cromatina, sono le high-mobility group proteins, che legano preferenzialmente il DNA ripiegato o distorto.[99] Queste proteine hanno un ruolo fondamentale nel ripiegamento delle file di nucleosomi e nel loro impacchettamento all'interno di strutture cromatiniche più complesse.[100]
Un ulteriore gruppo di DNAbp sono le single-strand-binding proteins (SSBP), che si legano esclusivamente a una molecola di DNA a singolo filamento. Nell'uomo, la RPA (replication protein A) è il membro meglio caratterizzato di questa famiglia ed è essenziale per la maggior parte dei processi che richiedono una separazione della doppia elica, tra cui la replicazione del DNA, la sua ricombinazione e la sua riparazione.[101] Queste DNAbp sono in grado di stabilizzare la forma a singolo filamento, impedendo che la molecola si ripieghi a formare stem loops o venga degradata dall'azione delle nucleasi.
A differenza di quelle finora presentate, esistono anche numerose proteine che legano specificamente determinate sequenze di DNA. Quelle maggiormente studiate sono i fattori di trascrizione (TF), proteine in grado di regolare la trascrizione. Ognuna di esse si lega a una o più sequenze specifiche, poste solitamente nei pressi del promotore di un gene, attivando o inibendo la trascrizione del gene stesso. Tale processo viene svolto attraverso due tipi di meccanismo: anzitutto, i TF sono in grado di legare, direttamente o attraverso proteine adattatrici, la RNA polimerasi responsabile della trascrizione, localizzandola presso il sito di inizio della trascrizione e favorendone dunque l'avvio;[103] un'altra modalità consiste nel legame tra i TF ed enzimi in grado di modulare metilazioni e acetilazioni degli istoni presenti presso il promotore, modificando dunque l'accessibilità di quella regione alla polimerasi.[104]
Dal momento che un TF può avere numerose sequenze bersaglio, cambiamenti di attività di un TF possono avere effetti sull'espressione di migliaia di geni.[105] Di conseguenza, queste proteine sono spesso i bersagli finali delle cascate di trasduzione del segnale, che mediano le risposte cellulari agli stimoli interni ed esterni alla cellula. La specificità dei TF per il DNA è legato ai contatti multipli che si instaurano tra la proteina e il solco maggiore, dove le basi azotate sono maggiormente accessibili.[34]
Le nucleasi sono enzimi in grado di tagliare filamenti di DNA, dal momento che catalizzano l'idrolisi del legame fosfodiesterico. Le nucleasi che idrolizzano il DNA partendo dai nucleotidi situati alle estremità dei filamenti sono definite esonucleasi. Sono endonucleasi, invece, quelle che tagliano direttamente all'interno del filamento. Le nucleasi più utilizzate in biologia molecolare, dette enzimi di restrizione, tagliano il DNA in corrispondenza di specifiche sequenze. L'enzima EcoRV, ad esempio, riconosce la sequenza di sei basi 5′-GAT|ATC-3′ ed effettua il taglio presso la linea verticale. In natura, questo enzima protegge i batteri dalle infezioni fagiche, digerendo il DNA del fago quando esso fa il suo ingresso nella cellula batterica.[107] Generalmente, le nucleasi di restrizione riconoscono particolari sequenze nucleotidiche palindromiche, note come siti di restrizione, nelle quali la stessa sequenza si ripete in direzioni opposte sulle due eliche complementari, e quindi producono dei tagli su entrambi i filamenti. Tali enzimi sono utilizzati ampiamente nelle tecniche che prevedono il subclonaggio di DNA all'interno di vettori. Si crede che le sequenze palindromiche possano essere, oltre a siti di restrizione, anche segnali di riconoscimento per alcune proteine di regolazione oppure segnalare il sito di avvio della replicazione del DNA.
Le DNA ligasi sono enzimi in grado di riunire filamenti di DNA precedentemente tagliati o spezzati, utilizzando energia chimica proveniente da ATP o da NAD.[108] Le ligasi sono particolarmente importanti nella replicazione del filamento lento, dal momento che esse riuniscono i frammenti di Okazaki in un filamento unico. Esse rivestono un ruolo importante anche nella riparazione del DNA e nella ricombinazione genetica.[108]
Le topoisomerasi sono enzimi che presentano sia un'attività nucleasica sia una ligasica. Queste proteine sono in grado di modificare le proprietà topologiche del DNA. Alcune di esse svolgono tale funzione tagliando l'elica di DNA e permettendole di ruotare, riducendo il suo grado di superavvolgimento, per poi procedere alla ligazione delle due estremità.[49] Altre topoisomerasi sono invece in grado di tagliare l'elica e far passare attraverso il sito di rottura una seconda elica, prima di ligare il filamento spezzato.[109] Le topoisomerasi sono necessarie per molti processi che coinvolgono il DNA, come ad esempio la replicazione del DNA e la trascrizione.[50]
Le elicasi sono proteine in grado di utilizzare l'energia chimica presente nei nucleosidi trifosfato, soprattutto ATP, per rompere i legami idrogeno che si instaurano tra le basi azotate, permettendo l'apertura della doppia elica di DNA in singoli filamenti.[110] Questi enzimi sono essenziali per la maggior parte dei processi biologici che coinvolgono enzimi che richiedono un diretto contatto con le basi del DNA.
Le polimerasi sono enzimi che sintetizzano catene polinucleotidiche a partire dal nucleoside trifosfato. Esse funzionano aggiungendo nucleotidi al 3′-OH del precedente nucleotide presente sul filamento. Come conseguenza di ciò, tutte le polimerasi lavorano in direzione 5′-3′.[111] Nel sito attivo di questi enzimi, il nucleoside trifosfato si appaia a un nucleotide presente su un filamento usato come stampo: ciò permette alle polimerasi di sintetizzare in modo accurato filamenti fedelmente complementari agli stampi. Le polimerasi sono classificate sulla base del tipo di stampo che utilizzano.
La replicazione del DNA richiede una DNA polimerasi DNA-dipendente, in grado cioè di realizzare una perfetta copia di una sequenza di DNA. L'accuratezza è fondamentale in questo processo, motivo per cui molte di queste polimerasi presentano anche un'attività di proofreading (dall'inglese, correzione di bozze). Esse sono infatti in grado di rilevare un errore di appaiamento (o mismatch) tra basi azotate e attivare un'azione 3' o 5' esonucleasica per rimuovere la base scorretta.[112] Nella maggior parte degli organismi, le DNA polimerasi funzionano all'interno di un più ampio complesso proteico definito replisoma, che consiste anche di numerose subunità accessorie come ad esempio le elicasi.[113]
Le DNA polimerasi RNA-dipendenti sono una classe di polimerasi specializzate nella sintesi di una copia di DNA, usando come stampo un frammento di RNA. Tra di esse figurano la trascrittasi inversa, un enzima virale coinvolto nell'infezione dei retrovirus, e la telomerasi, necessaria per la replicazione dei telomeri.[63][114] La telomerasi è una polimerasi inusuale, dal momento che contiene una sequenza stampo di RNA all'interno della propria struttura.
La trascrizione è invece svolta da RNA polimerasi DNA-dipendenti, che legano il DNA presso il promotore di un gene e separano i due filamenti. Successivamente, l'enzima genera una molecola di mRNA fino al raggiungimento del terminatore, dove si interrompe la trascrizione e l'enzima si distacca dal DNA. Come avviene per le DNA polimerasi DNA-dipendenti, anche queste polimerasi operano all'interno di un ampio complesso proteico, composto di molecole accessorie e regolatorie.[115]
Un filamento di DNA solitamente non interagisce con altri segmenti di DNA e, nelle cellule umane, i differenti cromosomi occupano addirittura regioni separate del nucleo (territori cromosomici).[117] Tale separazione fisica è fondamentale per permettere al DNA di essere un archivio stabile e sicuro dell'informazione genetica. L'interazione tra diversi segmenti di DNA è invece possibile e frequente attraverso il fenomeno del crossing-over, che permette la ricombinazione genetica attraverso la rottura di due eliche, lo scambio di segmenti tra di esse e il ricongiungimento finale.
La ricombinazione permette ai cromosomi di scambiare informazioni genetiche e produrre nuove combinazioni di geni, con il risultato di aumentare l'efficienza della selezione naturale e di facilitare l'evoluzione di nuove proteine.[118] La ricombinazione genetica può anche essere coinvolta nella riparazione del DNA, in particolare come risposta cellulare in seguito a rotture a doppio filamento.[119]
La principale forma di crossing-over cromosomico è la ricombinazione omologa, nella quale i due cromosomi coinvolti condividono sequenze molto simili. Le ricombinazioni non omologhe, invece, possono essere dannose per la cellula, perché in grado di produrre traslocazioni cromosomiche e anomalie genetiche. La reazione di ricombinazione è catalizzata da enzimi noti come ricombinasi.[120] Il primo passaggio del processo di ricombinazione consiste nella rottura a singolo filamento provocata da un'endonucleasi o da un danno al DNA.[121] Una serie di passaggi successivi, in parte catalizzati dalla ricombinasi, porta all'unione tra due eliche attraverso la formazione di una giunzione di Holliday, nella quale un segmento a singolo filamento di ogni elica è appaiato al filamento complementare presente sull'altra elica. La reazione di ricombinazione è quindi interrotta dalla rottura della giunzione e dalla re-ligazione del DNA così ottenuto.[122] L'esistenza della giunzione di Holliday è stata dimostrata da fotografie al microscopio elettronico di molecole di DNA in ricombinazione.
Il DNA contiene l'informazione genetica che permette a tutti gli organismi viventi (esclusi i virus, la cui ammissibilità tra i viventi è tuttavia ampiamente dibattuta) di funzionare, crescere e riprodursi. In ogni caso, non è stato ancora chiarito in quale momento della storia della vita il DNA abbia assunto tale ruolo fondamentale. È generalmente accettato dalla comunità scientifica, infatti, l'ipotesi che il DNA non sia stato il primo acido nucleico a essere utilizzato dai viventi: tale ruolo spetterebbe infatti all'RNA.[123][124] L'RNA potrebbe aver giocato un ruolo centrale del metabolismo cellulare ancestrale, dal momento che può avere sia un ruolo nella conservazione dell'informazione genetica, sia uno catalitico (ad esempio attraverso i ribozimi), sia uno strutturale (all'interno dei ribosomi).[125] Il mondo a RNA, basato su un unico tipo di molecola avente funzioni genetiche, catalitiche e strutturali, potrebbe avere avuto un'influenza sullo sviluppo dell'attuale codice genetico, basato proprio su quattro nucleotidi. Tale numero potrebbe essere un compromesso tra la necessità da una parte di ridurre la quantità di basi possibili, per migliorare l'accuratezza della replicazione, e dall'altra di aumentarla, per incrementare l'efficacia catalitica dei ribozimi.[126]
Non si conoscono fossili di DNA risalenti all'origine della vita (dopo il mondo a RNA) per poterne studiare l'evoluzione molecolare, dal momento che è impossibile recuperare DNA dai fossili. Ciò è dovuto al fatto che il DNA può sopravvivere nell'ambiente per meno di un milione di anni e, se in soluzione, si degrada rapidamente in piccoli frammenti.[127] Sebbene ci siano stati diversi annunci di scoperte di DNA antichissimo, tra cui quella relativa all'isolamento di un batterio vivo da un cristallo di sale risalente a 250 milioni di anni fa,[128] queste affermazioni sono controverse.[129][130]
La moderna biologia e biochimica fa un uso intensivo del DNA. Con il termine di DNA ricombinante ci si riferisce a segmenti di DNA realizzati e assemblati artificialmente. Essi possono essere inseriti all'interno di organismi viventi sotto forma di plasmidi o mediante altri tipi di vettori.[131] Gli organismi così prodotti sono detti geneticamente modificati e possono essere utilizzati per la produzione di proteine ricombinanti, necessarie per la ricerca biomedica,[132] o per le coltivazioni agricole.[133][134]
La medicina forense si serve del DNA, generalmente isolato dal sangue, dalla pelle, dalla saliva, dai capelli e da altri tessuti e fluidi biologici, per identificare i responsabili di atti criminosi, come omicidi o violenze. Il processo utilizzato è il fingerprinting genetico: tale tecnica consiste nel comparare la lunghezza delle sezioni variabili del DNA ripetitivo, come le short tandem repeats e i minisatelliti, che possono risultare molto diverse tra un individuo e l'altro. La comparazione tra due campioni di DNA in esame, non si basa perciò sull'analisi di tutta la sequenza desossiribonucleotidica, ma solo su tali sezioni. Infatti, due individui non legati da rapporti di parentela hanno in comune ben il 99,9% di sequenza di DNA. Tale metodo è solitamente molto affidabile,[135] anche se a volte l'identificazione dei criminali può risultare complicata qualora la scena sia contaminata dal DNA di diverse persone.[136] Questo metodo, sviluppato nel 1984 dal genetista britannico Sir Alec Jeffreys,[137] fu usato per la prima volta nel 1988 per incriminare Colin Pitchfork. Nella pratica attuale, spesso i sospettati sono invitati a fornire un campione di DNA per il confronto con eventuali reperti biologici presenti sulla scena del delitto. Il fingerprinting genetico può essere utilizzato anche per identificare le vittime di incidenti di massa.
L'acquisizione del DNA senza consenso viene indicato con il termine di gene theft.
La bioinformatica è una branca della biologia che comprende la manipolazione, la ricerca e il data mining dei dati relativi a sequenze di DNA. Lo sviluppo di tecniche utili a immagazzinare e ricercare sequenze di DNA, infatti, ha condotto ad ampi sviluppi dell'informatica applicata alla biologia molecolare, specialmente per quanto riguarda gli algoritmi di ricerca di stringhe e l'apprendimento automatico.[138] Gli algoritmi di ricerca (o appaiamento) di stringhe, in grado di individuare la presenza di una sequenza di lettere all'interno di sequenze molto più ampie, furono inizialmente sviluppati per la ricerca di specifiche sequenze nucleotidiche.[139]
Esistono da molto tempo, ovviamente, semplici algoritmi in grado di affrontare questi problemi (quelli presenti, ad esempio, negli editor di testo), ma l'analisi del DNA, che si presenta come composto di sole quattro lettere, richiede programmi più elaborati. Il problema immediatamente correlato dell'allineamento di sequenze si pone come obiettivo quello di identificare le sequenze omologhe e individuare le specifiche mutazioni che le rendono differenti. Queste tecniche, in particolare l'allineamento di sequenze multiple, sono utilizzate per studiare le relazioni filogenetiche e la funzione delle proteine.[140] Esistono anche algoritmi di ricerca genetica.
La grande quantità di dati ottenuta da progetti come il progetto genoma umano è infatti di difficile utilizzo senza una prima analisi che permetta di localizzare i geni e le regioni regolatorie sui cromosomi. Tali algoritmi, dunque, sono in grado di riconoscere regioni putative di presenza di geni codificanti RNA o proteine.[141]
Il DNA è stato utilizzato in informatica per la prima volta per risolvere un semplice problema di cammino hamiltoniano, un problema NP-completo.[143] Il calcolo attraverso il DNA è più vantaggioso rispetto a quello classico per via elettronica sia dal punto di vista dell'energia consumata, sia da quello dello spazio utilizzato: strutture di questo genere sono infatti in grado di svolgere calcoli in modalità parallele che permettono di risolvere agevolmente numerosi altri problemi quali la simulazione di macchine astratte, il problema di soddisfacibilità booleana e la versione bounded del problema del commesso viaggiatore.[144] Grazie alla sua compattezza, il DNA presenta anche un ruolo (almeno teorico) nel campo della crittografia, nella quale permetterebbe in particolare la costituzione e l'utilizzo efficiente di cifrari di Vernam sicuri.[145]
Il DNA è utilizzato anche nel campo delle nanotecnologie poiché presenta proprietà di riconoscimento molecolare che lo rendono in grado di auto-assemblarsi in strutture complesse di tipo bidimensionale o poliedrico. Tali assemblati sono utilizzati con funzioni essenzialmente strutturali e non come vettori di informazione biologica.[146]
Dal momento che il DNA è sottoposto nel tempo a mutazioni che vengono ereditate, esso contiene informazioni preziose che possono essere utilizzate dai genetisti per studiare l'evoluzione degli organismi e la loro filogenesi.[148] Sulla base delle diverse mutazioni presenti in geni estremamente conservati tra gli organismi (oppure, tramite algoritmi comparativi bioinformatici più avanzati, confrontando direttamente interi genomi) i genetisti sono in grado di ricostruire alberi filogenetici in grado di descrivere l'evoluzione di diverse specie anche molto diverse tra loro.[149][150] Studiando le mutazioni accumulatesi nel tempo, è anche possibile ricostruire alberi che descrivano l'evoluzione all'interno di famiglie di proteine.
Comparando le sequenze di DNA all'interno di una stessa specie, inoltre, è possibile studiare la storia genetica di particolari popolazioni. Ciò presenta una notevole rilevanza sia per analisi ecologiche sia per studi antropologici: il DNA è stato usato, ad esempio, per ricostruire la vicenda delle dieci tribù perdute d'Israele.[151]
Nel 1987 Tamar Barkay descrisse il metodo di estrazione diretta del DNA ambientale, eDNA[152].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.