GC含量
来自维基百科,自由的百科全书
GC含量(GC-content,guanine-cytosine content)是分子生物学和遗传学的术语,指研究对象(例如放线菌)的全基因组(DNA 或 RNA 分子)或其片段中,含氮碱基鸟嘌呤(G)或胞嘧啶(C)任何一个所占的百分比。一种生物的基因组或特定DNA、RNA片段有特定的GC含量。

在DNA链中G和C是以三个氢键相连,而T和A则是两个氢键相连的。氢键的多少体现连接的能量,氢键多的不容易被打断。
在双链DNA中,腺嘌呤与胸腺嘧啶(A/T)之比,以及鸟嘌呤与胞嘧啶(G/C)之比都是1。但是,(A+T)/(G+C)之比则随DNA的种类不同而异。GC含量愈高,DNA的密度也愈高,同时热及碱不易使之变性,因此利用这一特性便可进行DNA的分离或测定。
测定GC含量的方法有:Tm法,HPLC法
结构
定性来看,鸟嘌呤(G)和胞嘧啶(C)会彼此以特定的氢键结合,而腺嘌呤(A)则会在DNA中与胸腺嘧啶(T)以及在RNA中与尿嘧啶(U)以特定的氢键结合。从数量上来看,每个GC碱基对是由三个氢键结合在一起,而AT和AU碱基对则是由两个氢键结合在一起。为了强调这种差异,通常会以“G≡C”与“A=T”或“A=U”来表示碱基配对。
GC含量低的DNA比GC含量高的DNA稳定性差;但氢键本身对分子稳定性的影响并不特别显著,分子稳定性主要由碱基堆积的分子交互作用所引起。 [1]尽管GC含量高的核酸具有更高的热稳定性,但据观察,至少一些具有高GC含量DNA的细菌物种更容易发生自溶,从而缩短了细胞本身的寿命。 [2]由于GC对的热稳定性,人们曾推测高GC含量是适应高温的必要条件,但这项假设在2001年被推翻。 [3]即便如此,已有研究表明,原核生物在较高温度下的最佳生长与核糖体RNA、转移RNA和许多其他非编码RNA等结构RNA的GC含量之间存在很强的相关性。 [3][4] AU碱基对的稳定性低于GC碱基对,这使得高GC含量的RNA结构更能抵抗高温的影响。
最近的研究显示,造成双链核酸热稳定性的最重要因素,其实是由于相邻碱基的堆叠,而非碱基间氢键的数量。由于外环基团的相对位置,GC对的堆叠能比AT或AU对的堆叠能更有利。此外,碱基堆叠的顺序与整个分子的热稳定性之间存在相关性。
应用
在聚合酶链式反应 (PCR) 实验中,通常使用称为引物的短寡核苷酸的 GC 含量来预测其与模板DNA的退火温度。 GC含量越高,熔化温度越高。
许多定序技术,例如Illumina定序,在读取高GC含量序列时遇到困难。已知鸟类基因组有许多这样的部分,导致了“缺失基因”的问题。这些基因预计会在进化和表型中存在,但从未被测序——直到使用改进的方法。[5]
非真核生物分类学中的物种问题导致了细菌分类的各种建议,1987年细菌系统学方法协调特设委员会建议在更高级别的层次分类中使用GC比率。[6] 例如,放线菌门 (Actinomycetota) 被描述为“高GC含量细菌”。 [7] 在天蓝色链霉菌 (Streptomyces albidoflavus) A3(2)中,GC含量为72%。 [8]随着更可靠、现代的分子系统学方法的使用,放线菌门的GC含量定义已被废除,并且已经发现了该演化支的低GC细菌。[9]
参考文献
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.