GC-sadržaj (G≡C) ili guaninsko-citozinski sadržaj – u molekulskoj biologiji i genetici – je relativna zastupljenost (obično procenat) dušičnih baza u molekulama DNK ili RNK koje su ili guaninske (G ) ili citozinske (C) .[1] Ova mjera ukazuje na udio G i C baza od četiri ukupno moguće, uključujući također adeninsku i timinsku u DNK, odnosno adeninsku i uracilsku u RNK.

Thumb
Nukleotidne veze sa A–T i G≡C parove. Strelice pokazuju na vodikove veze

GC-sadržaj može se prikazati za određeni fragment DNK ili RNK ili za čitav genom. Kada se odnosi na fragment, može označavati GC-sadržaj pojedih gena ili njihovih dijelov (domena), grupe gena ili genskih klastera, nekodirajući regija ili sintetskih oligonukleotid a kao što je prajmer.

Struktura

Kvalitativno, guanin (G) i citozin (C) su u specifičnoj međusobnoj vodikovoj vezi, dok se adenin (A) specifično veže za timin (T) u DNKs, a uracilom (U) u RNK. Kvantitativno, svaki G–C bazni par međusobno drže trostruke veze, dok se bazni parovi AT i AU drže zajedno pomoću dvostruke vodikove veze. Da bi se naglasila ova razlika, osnovni parovi su često predstavljeni kao G≡C, nasuprot A = T ili A = U.

Thumb
Prostorni model DNK – dvostruka zavojnica: vodikove veze nastaju između komplementarnih parova baza u dvostrukom lancu

DNK s malim sadržajem veza GC manje je stabilna od one s visokim sadržajem ovog para; međutim, same vodikove veze nemaju posebno značajan uticaj na molekulsku stabilnost, koja je umjesto toga uglavnom počiva na interakcijama slaganja baza.[2] Unatoč većoj termostabilnosti dodeljenoj nukleinskoj kiselini sa visokim sadržajem GC, primijećeno je da se najmanje neke vrste bakterija sa visokim sadržajem GC u molekulama sa DNK lakše podvrgavaju autolizi, čime se smanjuje dugovječnost ćelije per se.[3] Zbog termostabilnosti G–C parova, pretpostavljalo se da je visok sadržaj GC neophodan za prilagođavanje visokim temperaturama, ali ova hipoteza pobijena je 2001.[4] Uprkos tome, pokazalo se da postoji jaka korelacija između optimalnog rasta prokariota pri višim temperaturama i sadržaja GC strukturnih RNK, kao što je ribosomna RNK, transportna RNK i mnoge druge nekodirajuće RNK.[4][5] Baznini parovi A–U manje su stabilni od G–C parova baza, što strukture RNK sa visokim sadržajem GC čini otpornijim na efekte visokih temperatura.

U nedavno vrijeme pokazano je da je najvažniji faktor koji doprinosi toplinskoj stabilnosti dvolančanih nukleinskih kiselina zapravo posljedica slaganja baza susjednih baza, a ne broja međusobnih vodikovih veza . GC parovi imaju povoljniju energiju slaganja nego za parove AT ili AU, zbog relativnog položaja egzocikličkih grupa. Pored toga, postoji korelacija između redoslijeda slaganja baza i termostabilnosti molekule u cjelini.[6]

Određivanje

GC-sadržaj se obično izražava kao procentna vrijednost, ali ponekad i kao omjer (nazvan G + C odnos ili GC-omjer). Procent GC-sadržaja izračunava se kao: [7]

dok se odnos AT/GC izračunava kao:[8]

.

Procenti GC sadržaja, kao i G/C odnos, mogu se mjeriti na nekoliko načina, ali jedan od najjednostavnijih metoda je merenje temperatura topljenja dvostruke zavojnice DNK, pomoću spektrofotometrije. Apsorbancija DNK na talasnoj dužini od 260 nm prilično se naglo povećava kada se dvolančana molekula DNK razdvoji u dvije pojedinačne niti (polulanca) kada se dovoljno zagrije.[9] Kao najčešći protokol za određivanje GC-odnosa, za veliki broj uzoraka koristi protočna citometrija.[10]

Alternativno, ako je ispitivana molekula DNK ili RNA koja pouzdano sekvencirana, tada se sadržaj GC može precizno izračunati jednostavnom aritmetikom ili upotrebom različitih javno dostupnih softverskih alata, kao što bespatni onlajn kalkolator .

Genomski sadržaj

Varijacije unutar genoma

Utvrđeno je da je GC-omjer u genomu izrazito varijabilan. Ove varijacije unutar genoma složenijih organizama rezultiraju mozaičnom formacijom s otočićima pod nazivom izohore.[11] Ovo rezultira varijacijama intenziteta bojenja u hromosomima.[12] Izohore bogate GC parovima tipski uključuju mnoge gene koji kodiraju proteine u sebi, pa stoga određivanje omjera GC ovih specifičnih regija doprinosi mapirranju genomskih regija bogatih genima.[13][14]

Kodirajuće sekvence

Unutar dugog područja genomske sekvence, geni se često karakteriziraju višim sadržajem GC za razliku od pozadinskog sadržaja GC za čitav genom. Dokazi o odnosu GC sa odnosom dužine kodirajuće regije gena pokazali su da je dužina kodirajuće sekvence direktno proporcionalna veličini sadržaja G + C.[15] Ovo ukazuje na činjenicu da stop kodon ima pristranost prema A i T nukleotidima, i, prema tome, što je kraća sekvenca, veća je AT pristranost (bias).[16]

Poređenje više od 1.000 ortolognih gena kod sisara, pokazalo je značajne varijacije unutar genomskog položaj trećeg kodona GC, u rasponu od manje od 30% do više od 80%.

Varijacija među genomima

Utvrđeno je da je sadržaj GC kod različitih organizama varijabilan, a predviđa se da će procesu doprinijeti varijacija u selekciji, mutacijskoj pristranosti i pristranim rekombinacijama vezanaim za popravak DNK.[17]

Prosječni sadržaj GC u ljudskim genomima kreće se od 35% do 60% u fragmentima od 100 Kb, sa prosjekom od 41%.[18] Sadržaj GC kvasaca (Saccharomyces cerevisiae) je 38%,[19] a onaj kod drugog uobičajenog modelnog orgsnizma, Arabidopsis thaliana, je 36%.[20] Zbog prirode genetičkog koda, gotovo je nemoguće da organizam ima genom sa sadržajem GC koji se približava ili 0% ili 100%. Međutim, vrsta s izuzetno niskim sadržajem GC je Plasmodium falciparum (GC% = ~ 20%),[21] i često je uobičajeno pozivanje na takve primjere kao da su AT bogati umjesto GC-siromašni.[22]

Nekoliko vrsta sisara (npr. rovka, mikrošišmiš, tenrek i zec) nezavisno su podvrgnute značajnom povećanju sadržaja GC u njihovim genima. Ove promjene sadržaja GC povezane su s vrstama osobine životne povijesti (npr. tjelesna masa ili dugovječnost) i veličina genoma,[23] a mogu biti povezane s molekulskim fenomenom koji se naziva GC-pristrana konverzija gena.[24]

Primjena

Molekulska biologija

U eksperimentima s lančane poimerazne reakcije (PCR), sadržaj GC kratkih oligonukleotida poznatih kao začetnice često se koristi za predviđanje njihove temperatura žarenja na DNK predlošku. Viši nivo sadržaja GC ukazuje na relativno višu temperaturu topljenja.

Biositematika

Rješavanje problema vrste u taksonomiji neeukariota doveo je do različitih prijedloga za klasifikaciju bakterija, a ad hoc odbor za pomirenje pristupa bakterijskoj sistematici preporučio je upotrebu GC omjera u hijerarhijskoj klasifikaciji na višem nivou.[25] Naprimjer Actinobacteria su okarakterizirane kao bakterije sa visokim sadržejem para GC.[26] Kod Streptomyces coelicolor A3(2), GC-sadržaj je 72%.[27]

Softverski alati

GCSpeciesSorter [28] i TopSort[29] su softverski alati za klasifikaciju vrsta na osnovu njihovih GC-sadržaja.

Također pogledajte

Reference

Vanjski linkovi

Wikiwand in your browser!

Seamless Wikipedia browsing. On steroids.

Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.

Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.