Remove ads
DNA;編碼用於所有已知生物和許多病毒的發育和功能的遺傳指令的分子 来自维基百科,自由的百科全书
去氧核糖核酸(英語:deoxyribonucleic acid,縮寫:DNA)又稱去氧核醣核酸,是一種生物大分子,可組成遺傳指令,引導生物發育與生命機能運作。主要功能是資訊儲存,可比喻為「藍圖」或「配方」[1]。其中包含的指令,是建構細胞內其他的化合物,如蛋白質與核醣核酸所需。帶有蛋白質編碼的DNA片段稱為基因。其他的DNA序列,有些直接以本身構造發揮作用,有些則參與調控遺傳訊息的表現。
DNA是一種長鏈聚合物,組成單位稱為核苷酸,而糖類與磷酸藉由酯鍵相連,組成其長鏈骨架。每個糖單位都與四種鹼基裡的其中一種相接,這些鹼基沿著DNA長鏈所排列而成的序列,可組成遺傳密碼,是蛋白質氨基酸序列合成的依據。讀取密碼的過程稱為轉錄,是根據DNA序列複製出一段稱為RNA的核酸分子。多數RNA帶有合成蛋白質的訊息,另有一些本身就擁有特殊功能,例如核糖體RNA、小核RNA與小干擾RNA。
在細胞內,DNA能組織成染色體結構,整組染色體則統稱為基因組。染色體在細胞分裂之前會先行複製,此過程稱為DNA複製。對真核生物,如動物、植物及真菌而言,染色體是存放於細胞核內;對於原核生物而言,如細菌,則是存放在細胞質中的擬核裡。染色體上的染色質蛋白,如組織蛋白,能夠將DNA組織並壓縮,以幫助DNA與其他蛋白質進行交互作用,進而調節基因的轉錄。
一股脫氧核醣核酸上所具有的各類型含氮鹼基,都只會與另一股上的一個特定類型鹼基產生鍵結。此種情形稱為互補性鹼基配對。嘌呤與嘧啶之間會形成氫鍵,在一般情況下,A只與T相連,而C只與G相連。因此排列於雙螺旋上的核苷酸,便以這種稱為鹼基對的方式相互聯結。除此之外,與脫氧核醣核酸序列無關的疏水性效應,以及π重疊效應所產生的力,也是兩股脫氧核醣核酸能維持結合狀態的原因[2]。由於氫鍵比共價鍵更容易斷裂,這使雙股脫氧核醣核酸可能會因為機械力或高溫作用,而有如拉鍊一般地解開[3],這種現象被稱為DNA變性。由於互補的特性,使位於雙股序列上的訊息,皆以雙倍的形式存在,這種特性對於脫氧核醣核酸複製過程來說相當重要。互補鹼基之間可逆且具專一性的交互作用,是生物脫氧核醣核酸所共同擁有的關鍵功能[4]。
兩種不同的鹼基對分別是以不同數目的氫鍵結合:A-T之間有兩條;G-C之間則有三條(如本段上方左圖所示)。多一條氫鍵使GC配對的穩定性高於AT配對,也因此兩股脫氧核醣核酸的結合強度,是由GC配對所佔比例,以及雙螺旋的總長度來決定。當脫氧核醣核酸雙螺旋較長且GC含量較高時,其雙股之間的結合能力較強;長度較短且AT含量較高時,結合能力則較弱[5]。雙螺旋上有某些部位必須能夠輕易解開,這些部位通常含有有較多的AT配對,例如細菌啟動子上一段含有TATAAT序列的普里布諾盒[6]。在實驗室中,若找出解開氫鍵所需的溫度,也就是所謂熔點(Tm),便能計算出兩股之間的結合強度。當脫氧核醣核酸雙螺旋上所有的鹼基配對都解開之後,溶液中的兩股脫氧核醣核酸將分裂成獨立的分子。單股脫氧核醣核酸分子並無固定的形體,但仍有某些形狀較為穩定且常見[7]。
脫氧核醣核酸是一種由核苷酸重複排列組成的長鏈聚合物[4][8],寬度約22到24埃(2.2到2.4納米),每一個核苷酸單位則大約長3.3埃(0.33納米)[9]。在整個脫氧核醣核酸聚合物中,可能含有數百萬個相連的核苷酸。例如人類細胞中最大的1號染色體中,就有2億2千萬個鹼基對[10]。通常在生物體內,脫氧核醣核酸並非單一分子,而是形成兩條互相配對並緊密結合[11][12],且如藤蔓般地纏繞成雙螺旋結構的分子。每個核苷酸分子的其中一部分會相互連結,組成長鏈骨架;另一部分稱為鹼基,可使成對的兩條脫氧核醣核酸相互結合。所謂核苷酸,是指一個核苷加上一個或多個磷酸基團,核苷則是指一個鹼基加上一個糖類分子[13]。
脫氧核醣核酸骨架是由磷酸與醣類基團交互排列而成[14]。組成脫氧核醣核酸的糖類分子為環狀的2-脫氧核醣,屬於五碳糖的一種。磷酸基團上的兩個氧原子分別接在五碳糖的3號及5號碳原子上,形成磷酸雙酯鍵。這種兩側不對稱的共價鍵位置,使每一條脫氧核醣核酸長鏈皆具方向性。雙螺旋中的兩股核苷酸互以相反方向排列,這種排列方式稱為反平行。脫氧核醣核酸鏈上互不對稱的兩末端一邊叫做5'端,另一邊則稱3'端。脫氧核醣核酸與RNA最主要的差異之一,在於組成糖分子的不同,DNA為2-脫氧核醣,RNA則為核醣[12]。
項目 | DNA | RNA | 解說 |
---|---|---|---|
組成主幹之糖類分子[12] | 2-去氧核糖和磷酸 | 核糖和磷酸 | |
骨架結構 | 規則的[需要較佳來源][15]:50雙螺旋結構[16] | 單螺旋結構[需要較佳來源][16] 或莖環結構[17] | 即脫氧核糖核酸由兩條脫氧核苷酸鏈構成,而核糖核酸由一條核糖核苷酸鏈構成。[15]:49 |
核苷酸數 | 通常上百萬 | 通常數百至數千個 | |
鹼基種類[18][16] | 腺嘌呤(A)··· 胸腺嘧啶(T) 胞嘧啶(C)··· 鳥嘌呤(G) |
腺嘌呤(A)··· 尿嘧啶(U) 胞嘧啶(C)··· 鳥嘌呤(G) |
除部分例外,DNA為胸腺嘧啶(5-甲基尿嘧啶),RNA為尿嘧啶,使RNA更易被水解。 |
五碳糖種類[16] | 脫氧核醣 | 核醣 | |
五碳糖連接組成分 | 氫原子 | 羥基 | 在五碳糖的第二個碳原子上連接的組成分不同。 |
存在於(對於真核細胞而言)[16] | 細胞核(少量存在於線粒體、葉綠體) | 細胞質 |
兩股脫氧核醣核酸長鏈上的鹼基以氫鍵相互吸引,使雙螺旋形態得以維持。這些鹼基可分為兩大類,以5角及6角雜環化合物組合而成的一類稱為嘌呤;只有一個6角雜環的則稱為嘧啶[13]。組成脫氧核醣核酸的鹼基,分別是腺嘌呤(adenine,縮寫A)、胞嘧啶(cytosine,C)、鳥嘌呤(guanine,G)與胸腺嘧啶(thymine,T)。鹼基、糖類分子與磷酸三者結合之後,便成為完整的核苷酸。還有一種鹼基稱為尿嘧啶(uracil,U),此種鹼基比胸腺嘧啶少了一個位於環上的甲基,一般出現在RNA分子中,角色相當於脫氧核醣核酸裡的胸腺嘧啶。通常在脫氧核醣核酸中,它會作為胞嘧啶的分解產物,或是CpG島中還未經甲基化的胞嘧啶突變產物。少見的例外發現於一種稱為PBS1的細菌病毒,此類病毒的脫氧核醣核酸中含有尿嘧啶[19]。在某些特定RNA分子的合成過程中,會有許多尿嘧啶在酵素的作用下失去一個甲基,因而轉變成胸腺嘧啶,這種情形大多出現於一些在構造上具有功能,或者具有酵素能力的RNA上,例如轉運RNA與核糖體RNA[20]。
兩股脫氧核醣核酸長鏈會以右旋方式交互纏繞成雙螺旋結構,因為以磷酸聯結而成的骨架位於外部,且兩股之間會留下一些空隙,因此位於螺旋內部的鹼基,即使從螺旋外側依然可見(如右方動畫)。雙螺旋的表面有兩種凹槽(或稱「溝」):較大的寬22埃;較小的寬12埃[22]。由於各個鹼基靠近大凹槽的一面較容易與外界接觸,因此如轉錄因子等能夠與特定序列結合的蛋白質與鹼基接觸時,通常是作用在靠近大凹槽的一面[23]。
一股脫氧核醣核酸上所具有的各類型含氮鹼基,都只會與另一股上的一個特定類型鹼基產生鍵結。此種情形稱為互補性鹼基配對。嘌呤與嘧啶之間會形成氫鍵,在一般情況下,A只與T相連,而C只與G相連。因此排列於雙螺旋上的核苷酸,便以這種稱為鹼基對的方式相互聯結。除此之外,與脫氧核醣核酸序列無關的疏水性效應,以及π重疊效應所產生的力,也是兩股脫氧核醣核酸能維持結合狀態的原因[2]。由於氫鍵比共價鍵更容易斷裂,這使雙股脫氧核醣核酸可能會因為機械力或高溫作用,而有如拉鍊一般地解開[3],這種現象被稱為DNA變性。由於互補的特性,使位於雙股序列上的訊息,皆以雙倍的形式存在,這種特性對於脫氧核醣核酸複製過程來說相當重要。互補鹼基之間可逆且具專一性的交互作用,是生物脫氧核醣核酸所共同擁有的關鍵功能[4]。
兩種不同的鹼基對分別是以不同數目的氫鍵結合:A-T之間有兩條;G-C之間則有三條(如本段上方左圖所示)。多一條氫鍵使GC配對的穩定性高於AT配對,也因此兩股脫氧核醣核酸的結合強度,是由GC配對所佔比例,以及雙螺旋的總長度來決定。當脫氧核醣核酸雙螺旋較長且GC含量較高時,其雙股之間的結合能力較強;長度較短且AT含量較高時,結合能力則較弱[5]。雙螺旋上有某些部位必須能夠輕易解開,這些部位通常含有有較多的AT配對,例如細菌啟動子上一段含有TATAAT序列的普里布諾盒[6]。在實驗室中,若找出解開氫鍵所需的溫度,也就是所謂熔點(Tm),便能計算出兩股之間的結合強度。當脫氧核醣核酸雙螺旋上所有的鹼基配對都解開之後,溶液中的兩股脫氧核醣核酸將分裂成獨立的分子。單股脫氧核醣核酸分子並無固定的形體,但仍有某些形狀較為穩定且常見[7]。
一般來說,當一段脫氧核醣核酸序列之mRNA為轉譯成蛋白質的RNA序列時,稱為「正義」(sense),而相對並互補的另一股序列,則稱為「反義」(anti-sense)。由於RNA聚合酶的作用方式,是根據模板上的訊息來合成一段與模板互補的RNA片段,因此正義mRNA的序列實際上與脫氧核醣核酸上的正義股相同。在同一股脫氧核醣核酸上,可能同時會有屬於正義和反義的片段。此外,反義RNA在原核生物或真核生物體內皆存在,但是其功能尚未明瞭[24]。有研究認為,反義RNA可利用RNA與RNA之間的鹼基配對,來調控基因的表現[25]。
少數屬於原核生物、真核生物、質體或病毒的脫氧核醣核酸序列(後兩者較前兩者多),會由於正義股與反義股之間的差異難以區分,而產生重疊基因[26],這類脫氧核醣核酸序列具有雙重功能,一方面能以5'往3'的方向合成蛋白質,另一方面也能以相反方向合成另一個蛋白質。這種重疊現象一方面在細菌體內參與調控基因的轉錄[27],一方面則在較小的病毒基因組中,扮演增加訊息量的角色[28]。為了縮減基因組的大小,也有某些病毒以線狀或環狀的單股脫氧核醣核酸作為遺傳物質[29][30]。
脫氧核醣核酸鏈在雙螺旋基礎上如繩索般扭轉的現象與過程稱為DNA超螺旋。當脫氧核醣核酸處於「鬆弛」狀態時,雙螺旋的兩股通常會延著中軸,以每10.4個鹼基對旋轉一圈的方式扭轉。但如果脫氧核醣核酸受到扭轉,其兩股的纏繞方式將變得更緊或更鬆[31]。當脫氧核醣核酸扭轉方向與雙股螺旋的旋轉方向相同時,稱為正超螺旋,此時鹼基將更加緊密地結合。反之若扭轉方向與雙股螺旋相反,則稱為負超螺旋,鹼基之間的結合度會降低。自然界中大多數的脫氧核醣核酸,會因為拓撲異構酶的作用,而形成輕微的負超螺旋狀態[32]。拓撲異構酶同時也在轉錄作用或DNA複製過程中,負責紓解脫氧核醣核酸鏈所受的扭轉壓力[33]。
脫氧核醣核酸有多種不同的構象,其中有些構象之間在構造上的差異並不大。目前已辨識出來的構象包括:A-DNA、B-DNA、C-DNA、D-DNA[34]、E-DNA[35]、H-DNA[36]、L-DNA[34]、P-DNA[37]與Z-DNA[14][38]。不過以現有的生物系統來說,自然界中可見的只有A-DNA、B-DNA與Z-DNA。脫氧核醣核酸所具有的構象可根據脫氧核醣核酸序列、超螺旋的程度與方向、鹼基上的化學修飾,以及溶液狀態,如金屬離子與多胺濃度來分類[39]。三種主要構象中以B型為細胞中最常見的類型[40],與另兩種脫氧核醣核酸雙螺旋的差異,在於其幾何形態與尺寸。
其中A型擁有較大的寬度與右旋結構,小凹槽較淺且較寬,大凹槽則較深較窄。A型一般存在於非生理狀態的脫水樣本中,在細胞中則可能為脫氧核醣核酸與RNA混合而成的產物(類似酵素及脫氧核醣核酸的複合物)[41][42]。若一段脫氧核醣核酸上的鹼基受到一種稱為甲基化的化學修飾,將使其構型轉變成Z型。此時螺旋形式轉為左旋,與較常見的右旋B型相反[43]。某些專門與Z-脫氧核醣核酸結合的蛋白質可辨識出這種少見的結構,此外Z型脫氧核醣核酸可能參與了轉錄作用的調控[44]。
線狀染色體的末端有一段稱端粒的特殊區域,由於一般參與複製脫氧核醣核酸的酶無法作用於染色體的3'端,因此這些端粒的主要功能,是使細胞能利用一種稱為端粒酶的酶來複製端粒[46]。如果端粒消失,那麼複製過程將使染色體長度縮小。因此這些特化的端帽能保護染色體結尾不被外切酶破壞,並阻止細胞中的DNA修復系統將其視為需修正的損毀位置[47]。在人類細胞中,端粒是由重複出現數千次TTAGGG序列的單股脫氧核醣核酸所組成[48]。
這些序列富含鳥嘌呤,可形成一種由四個鹼基重疊而成的特殊結構,使染色體末端較為穩定。四個鳥嘌呤可構成一個平面,並且重疊於其他平面之上,產生穩定的G-四聯體結構[49]。鹼基與位在四個鹼基中心的金屬離子螯合物之間,是經由氫鍵結合以穩定結構。左圖顯示由上方觀看人類端粒中的四聯體,圖中可見每四個鹼基為一組,共三層鹼基重疊而成的單股脫氧核醣核酸環狀物。在鹼基環繞的中心,可見三個螯合在一起的鉀離子[50]。也有其他類型的結構存在,例如中心的四個鹼基,除了可以是屬於單一的一股脫氧核醣核酸之外,也可能是由多條平行的脫氧核醣核酸各自貢獻一個鹼基而形成。
端粒另外還可形成一種大型環狀結構,稱為端粒環或T環(T-loop)。是由單股脫氧核醣核酸經過端粒結合蛋白的作用之後,捲曲而成的一個大迴圈[51]。在T環長鏈最前端的地方,單股的脫氧核醣核酸會附著在雙股脫氧核醣核酸之上,破壞雙螺旋脫氧核醣核酸與另一股的鹼基配對,形成一種稱為替代環或D環的三股結構[49]。
基因的表現,受染色體上的染色質結構與異染色質(基因無表現或低表現)區域裡的胞嘧啶甲基化所影響。舉例而言,當胞嘧啶受到甲基化時,會轉變成5-甲基胞嘧啶,此作用對於X染色體的去活化、銘印和保護脫氧核醣核酸分子不被內切酶所切斷(存在例外)而言相當重要[52]。甲基化的程度在不同生物之間有所差異,如秀麗隱桿線蟲便缺乏胞嘧啶甲基化,而在脊椎動物體內則較常出現,大約有1%的脫氧核醣核酸為5-甲基胞嘧啶[53]。5-甲基胞嘧啶容易因自然發生的脫氨作用而變成胸腺嘧啶,也因此使甲基化的胞嘧啶成為突變熱點[54],這也解釋了為什麼胞嘧啶和鳥嘌呤會集中出現在CpG島里,因為那裡的甲基化作用被壓制,沒有甲基化的胞嘧啶所產生的突變產物並非胸腺嘧啶,而是尿嘧啶。因為尿嘧啶會相對容易地被更正過來,所以CpG島內胞嘧啶不易形成突變而會被保留下來。其他的鹼基修飾還包括細菌的腺嘌呤甲基化,以及使動質體(一種生物)的尿嘧啶轉變成「J-鹼基」的糖基化等[55][56]。
有許多不同種類的突變原可對DNA造成損害,其中包括氧化劑、烷化劑,以及高頻電磁輻射,如紫外線與X射線。不同的突變原對DNA造成不同類型的損害,舉例而言,紫外線會造成胸腺嘧啶二聚體的形成,並與相鄰的鹼基產生交叉,進而使DNA發生損害[58]。另一方面,氧化劑如自由基或過氧化氫,可造成多種不同形態的損害,尤其可對鳥苷進行鹼基修飾,並且使雙股分解[59]。根據估計,在一個人類細胞中,每天大約有500個鹼基遭受氧化損害[60][61]。在各種氧化損害當中,以雙股分解最為危險,此種損害難以修復,且可造成DNA序列的點突變、插入與刪除,以及染色體易位[62]。
許多突變原可嵌入相鄰的兩個鹼基對之間,這些嵌入劑大多是芳香性分子及平面分子,包括乙錠、道諾黴素、阿黴素與沙利竇邁。必須先使鹼基之間的空隙變大,才能使嵌入劑置入鹼基對之間,整體而言,脫氧核醣核酸會因為雙螺旋解開而扭曲變形。結構改變會使轉錄作用與脫氧核醣核酸複製過程受到抑制,進而導致毒害與突變。因此脫氧核醣核酸嵌入劑通常也是致癌物,常見的例子有二醇環氧苯並芘、吖啶、黃麴毒素與溴化乙錠等[63][64][65]。但是這些物質也因為能夠抑制脫氧核醣核酸的轉錄與複製,而可應用於化學治療中,用以抑制癌症細胞的快速生長情形[66]。
脫氧核醣核酸於真核生物細胞內,通常是以長條狀染色體形式存在;在原核生物細胞內則是環狀染色體。細胞內的所有染色體合稱基因組。人類基因組中大約有30億個鹼基對,共組成了46個染色體[67]。脫氧核醣核酸所攜帶的訊息,是以脫氧核醣核酸序列形式,保存於一些稱為基因的片段中。基因中的遺傳訊息是經由互補的鹼基配對來傳遞,例如在轉錄作用中,細胞裡的RNA核苷酸會與互補的脫氧核醣核酸結合,複製出一段與脫氧核醣核酸序列互補的RNA序列。一般來說,這段RNA序列將會在轉譯作用中,經由RNA之間的互補配對,合成出相對應的蛋白質序列。另一方面,細胞也可以在稱為脫氧核醣核酸複製的過程中,單純地複製其自身的遺傳訊息。
真核生物的基因組脫氧核醣核酸主要存放於細胞核中,此外也有少量位於粒線體或葉綠體內。原核生物的脫氧核醣核酸則是保存在形狀不規則的類核(nucleoid)當中[68]。基因是脫氧核醣核酸的一段區域,保存了基因組裡的遺傳訊息,是遺傳的單位,影響了生物個體的特定表徵。基因中含有可轉錄的開放閱讀框架,以及一些可調節開放閱讀框架表現的調控序列,如啟動子與強化子。
許多物種的基因組都只有一小部分可編譯成蛋白質。以人類為例,在人類的基因組中只有1.5%屬於含有蛋白質編碼的外顯子,另有超過50%屬於無編碼的重複序列[69]。真核生物基因組中如此大量的非編碼DNA,以及物種之間不尋常的基因組大小或C值差異,長久以來一直是個難題,人們稱之為「C值謎」[70]。不過這些不含蛋白質編碼的脫氧核醣核酸序列,仍可能合成出具有功能的非編碼RNA分子,用以調控基因表現[71]。
染色體中的某些非編碼脫氧核醣核酸序列,本身具有結構上的功能。例如一般只帶有少量基因的端粒與著絲粒,對於染色體的穩定性及機能而言顯得相當重要[47][73]。人類體內有一類大量存在的非編碼脫氧核醣核酸,稱為偽基因,是一些因突變累積而變得殘缺無用的基因複製品[74]。這些序列通常只可算是分子化石,不過有時候也會因為基因重複與趨異演化,而成為新基因裡的新遺傳物質[75]。
基因是指一段含有遺傳訊息,且可影響生物體表現型的脫氧核醣核酸序列。基因裡的脫氧核醣核酸鹼基序列決定了信使RNA的序列,而信使RNA的序列又決定了蛋白質的序列。轉譯作用可依據基因所含有的核苷酸序列,以及遺傳密碼規則,生產出對應的蛋白質氨基酸序列。遺傳密碼的組成單位稱為密碼子,是含有三個字母的「指令」,這些單位則由三個核苷酸組成,例如ACT、CAG或TTT。
在轉錄作用中,基因裡的密碼子會在RNA聚合酶的作用下,複製成為信使RNA。之後核醣體會幫助帶著氨基酸的轉移RNA與信使RNA進行鹼基配對,進而將信使RNA解碼。由於組成密碼子的鹼基共有四種,且以三字母為一單位,因此可能存在的密碼子一共有64種(43)。與這些密碼子對應的標準氨基酸有20種,因此大多數氨基酸對應了一種以上的密碼子。另外有三個密碼子稱為「終止密碼子」或「無義密碼子」,是編碼區域的末端,分別是TAA、TGA與TAG,這是屬於DNA上的終止密碼。而在mRNA上的則是UAG、UAA與UGA。當轉譯到達這三組密碼子時就會停止轉譯,並進行下一步的修飾。
生物個體成長需要經歷細胞分裂,當細胞進行分裂時,必須將自身基因組中的脫氧核醣核酸複製,才能使子細胞擁有和親代相同的遺傳訊息。脫氧核醣核酸的雙股結構可供脫氧核醣核酸複製機制進行,在此複製過程中,兩條長鏈會先分離,之後一種稱為DNA聚合酶的酵素,會分別以兩條長鏈為依據,合成出互補的脫氧核醣核酸序列。酵素可找出正確的外來互補鹼基,並將其結合到模板長鏈上,進而製造出新的互補長鏈。由於脫氧核醣核酸聚合酶只能以5'到3'的方向合成脫氧核醣核酸鏈,因此雙螺旋中平行但方向相反的兩股,具有不同的合成機制[76]。舊長鏈上的鹼基序列決定了新長鏈上的鹼基序列,使細胞得以獲得完整的脫氧核醣核酸複製品。
脫氧核醣核酸若要發揮其功用,必須仰賴與蛋白質之間的交互作用,有些蛋白質的作用不具專一性,有些則只專門與個別的脫氧核醣核酸序列結合。聚合酶在各類酵素中尤其重要,此種蛋白質可與脫氧核醣核酸結合,並作用於轉錄或脫氧核醣核酸複製過程。
結構蛋白可與脫氧核醣核酸結合,是非專一性脫氧核醣核酸-蛋白質交互作用的常見例子。染色體中的結構蛋白與脫氧核醣核酸組合成複合物,使脫氧核醣核酸組織成緊密結實的染色質構造。對真核生物來說,染色質是由脫氧核醣核酸與一種稱為組織蛋白的小型鹼性蛋白質所組合而成;而原核生物體內的此種結構,則摻雜了多種類型的蛋白質[77][78]。雙股脫氧核醣核酸可在組織蛋白的表面上附著並纏繞整整兩圈,以形成一種稱為核小體的盤狀複合物。組織蛋白裡的鹼性殘基,與脫氧核醣核酸上的酸性糖磷酸骨架之間可形成離子鍵,使兩者發生非專一性交互作用,也使複合物中的鹼基序列相互分離[79]。在鹼性氨基酸殘基上所發生的化學修飾有甲基化、磷酸化與乙醯化等[80],這些化學作用可使脫氧核醣核酸與組織蛋白之間的作用強度發生變化,進而使脫氧核醣核酸與轉錄因子接觸的難易度改變,影響轉錄作用的速率[81]。其他位於染色體內的非專一性脫氧核醣核酸結合蛋白,還包括一種能優先與脫氧核醣核酸結合,並使其扭曲的高移動性群蛋白[82]。這類蛋白質可以改變核小體的排列方式,產生更複雜的染色質結構[83]。
脫氧核醣核酸結合蛋白中有一種專門與單股脫氧核醣核酸結合的類型,稱為單股脫氧核醣核酸結合蛋白。人類的複製蛋白A是此類蛋白中獲得較多研究的成員,作用於多數與解開雙螺旋有關的過程,包括脫氧核醣核酸複製、重組以及脫氧核醣核酸修復[84]。這類結合蛋白可固定單股脫氧核醣核酸,使其變得較為穩定,以避免形成莖環(stem-loop),或是因為核酸酶的作用而水解。
相對而言,其他的蛋白質則只能與特定的脫氧核醣核酸序列進行專一性結合。大多數關於此類蛋白質的研究集中於各種可調控轉錄作用的轉錄因子。這類蛋白質中的每一種,都能與特定的脫氧核醣核酸序列結合,進而活化或抑制位於啟動子附近序列的基因轉錄作用。轉錄因子有兩種作用方式,第一種可以直接或經由其他中介蛋白質的作用,而與負責轉錄的RNA聚合酶結合,再使聚合酶與啟動子結合,並開啟轉錄作用[86]。第二種則與專門修飾組織蛋白的酵素結合於啟動子上,使脫氧核醣核酸模板與聚合酶發生接觸的難度改變[87]。
由於目標脫氧核醣核酸可能散佈在生物體中的整個基因組中,因此改變一種轉錄因子的活性可能會影響許多基因的運作[88]。這些轉錄因子也因此經常成為信號傳遞過程中的作用目標,也就是作為細胞反映環境改變,或是進行分化和發育時的媒介。具專一性的轉錄因子會與脫氧核醣核酸發生交互作用,使脫氧核醣核酸鹼基的周圍產生許多接觸點,讓其他蛋白質得以「讀取」這些脫氧核醣核酸序列。多數的鹼基交互作用發生在大凹槽,也就是最容易從外界接觸鹼基的部位[89]。
核酸酶是一種可經由催化磷酸雙酯鍵的水解,而將脫氧核醣核酸鏈切斷的酶。其中一種稱為外切酶,可水解位於脫氧核醣核酸長鏈末端的核苷酸;另一種則是內切酶,作用於脫氧核醣核酸兩個端點之間的位置。在分子生物學領域中使用頻率最高的核酸酶為限制內切酶,可切割特定的脫氧核醣核酸序列。例如左圖中的EcoRV可辨識出具有6個鹼基的5′-GAT|ATC-3′序列,並從GAT與ATC之間那條垂直線所在的位置將其切斷。此類酵素在自然界中能消化噬菌體脫氧核醣核酸,以保護遭受噬菌體感染的細菌,此作用屬於限制修飾系統的一部分[91]。在技術上,對序列具專一性的核酸酶可應用於分子選殖與脫氧核醣核酸指紋分析。
另一種酶脫氧核醣核酸連接酶,則可利用來自腺苷三磷酸或煙醯胺腺嘌呤二核苷酸的能量,將斷裂的脫氧核醣核酸長鏈重新接合[92]。連接酶對於脫氧核醣核酸複製過程中產生的延遲股而言尤其重要,這些位於複製叉上的短小片段,可在此酵素作用下黏合成為脫氧核醣核酸模板的完整複製品。此外連接酶也參與了DNA修復與遺傳重組作用[92]。
拓撲異構酶是一種同時具有核酸酶與連接酶效用的酶,可改變脫氧核醣核酸的超螺旋程度。其中有些是先使脫氧核醣核酸雙螺旋的其中一股切開以形成缺口,讓另一股能穿過此缺口,進而減低超螺旋程度,最後再將切開的部位黏合[32]。其他類型則是將兩股脫氧核醣核酸同時切開,使另一條雙股脫氧核醣核酸得以通過此缺口,之後再將缺口黏合[93]。拓撲異構酶參與了許多脫氧核醣核酸相關作用,例如脫氧核醣核酸複製與轉錄[33]。
螺旋酶是分子馬達的一種類型,可利用來自各種核苷三磷酸,尤其是腺苷三磷酸的化學能量,破壞鹼基之間的氫鍵,使DNA雙螺旋解開成單股形式[94]。此類酶參與了大多數關於DNA的作用,且必須接觸鹼基才能發揮功用。
聚合酶是一種利用核苷三磷酸來合成聚合苷酸鏈的酶,方法是將一個核苷酸連接到另一個核苷酸的3'羥基位置,因此所有的聚合酶都是以5'往3'的方向進行合成作用[95]。在此類酶的活化位置上,核苷三磷酸分子會與單股聚合苷酸模板發生鹼基配對,因而使聚合酶能夠精確地依據模板,合成出互補的另一股聚合苷酸。聚合酶可依據所能利用的模板類型來做分類。
在脫氧核醣核酸複製過程中,依賴脫氧核醣核酸模板的DNA聚合酶可合成出脫氧核醣核酸序列的複製品。由於此複製過程的精確性是生命維持所必需,因此許多這類聚合酶擁有校正功能,可辨識出合成反應中偶然發生的配置錯誤,也就是一些無法與另一股配對的鹼基。檢測出錯誤之後,其3'到5'方向的外切酶活性會發生作用,並將錯誤的鹼基移除[96]。大多數生物體內的脫氧核醣核酸聚合酶,是以稱為複製體的大型複合物形式來發生作用,此複合物中含有許多附加的次單位,如DNA夾或螺旋酶[97]。
依賴RNA作為模板的脫氧核醣核酸聚合酶是一種較特別的聚合酶,可將RNA長鏈的序列複製成脫氧核醣核酸版本。其中包括一種稱為逆轉錄酶的病毒酶,此種酶參與了逆轉錄病毒對細胞的感染過程;另外還有複製端粒所需的端粒酶[98][46],本身結構中含有RNA模板[47]。
轉錄作用是由依賴脫氧核醣核酸作為合成模板的RNA聚合酶來進行,此類酶可將脫氧核醣核酸長鏈上的序列複製成RNA版本。為了起始一個基因的轉錄,RNA聚合酶會先與一段稱為啟動子的脫氧核醣核酸序列結合,並使兩股脫氧核醣核酸分離,再將基因序列複製成信使RNA,直到到達能使轉錄結束的終止子序列為止。如同人類體內依賴脫氧核醣核酸模板的脫氧核醣核酸聚合酶,負責轉錄人類基因組中大多數基因的RNA聚合酶II,也是大型蛋白質複合物的一部分,此複合物受到多重調控,也含有許多附加的次單位[99]。
各條脫氧核醣核酸螺旋間的交互作用不常發生,在人類細胞核裡的每個染色體,各自擁有一塊稱作「染色體領域」的區域[101]。染色體之間在物理上的分離,對於維持脫氧核醣核酸資訊儲藏功能的穩定性而言相當重要。
不過染色體之間有時也會發生重組,在重組的過程中,會進行染色體互換:首先兩條脫氧核醣核酸螺旋會先斷裂,之後交換其片段,最後再重新黏合。重組作用使染色體得以互相交換遺傳訊息,並產生新的基因組合,進而增加自然選擇的效果,且可能對蛋白質的演化產生重要影響[102]。遺傳重組也參與脫氧核醣核酸修復作用,尤其是當細胞中的脫氧核醣核酸發生斷裂的時候[103]。
同源重組是最常見的染色體互換方式,可發生於兩條序列相類似的染色體上。而非同源重組則對細胞具有傷害性,會造成染色體易位與遺傳異常。可催化重組反應的酵素,如RAD51[104],稱為「重組酶」。重組作用的第一個步驟,是內切酶作用,或是脫氧核醣核酸的損壞所造成的脫氧核醣核酸雙股斷裂[105]。重組酶可催化一系列步驟,使兩條螺旋結合產生Holliday交叉。其中每條螺旋中的單股脫氧核醣核酸,皆與另一條螺旋上與之互補的脫氧核醣核酸連結在一起,進而形成一種可於染色體內移動的交叉形構造,造成脫氧核醣核酸鏈的互換。重組反應最後會因為交叉結構的斷裂,以及脫氧核醣核酸的重新黏合而停止[106]。
脫氧核醣核酸所包含的遺傳訊息,是所有現代生命機能,以及生物生長與繁殖的基礎。不過目前尚未明瞭在長達40億年生命史中,脫氧核醣核酸究竟是何時出現並開始發生作用。有一些科學家認為,早期的生命形態有可能是以RNA作為遺傳物質[107][108]。RNA可能在早期細胞代謝中扮演主要角色,一方面可傳遞遺傳訊息;另一方面也可作為核醣酶的一部分,進行催化作用[109]。在古代RNA世界裡,核酸同時具有催化與遺傳上的功能,而這些分子後來可能演化成為目前以四種核苷酸組成遺傳密碼的形式,這是因為當鹼基種類較少時,複製的精確性會增加;而鹼基種類較多時,增加的則是核酸的催化效能。兩種可達成不同目的功能最後在四種鹼基的情形下達到最合適數量[110]。
不過關於這種古代遺傳系統並沒有直接證據,且由於脫氧核醣核酸在環境中無法存留超過一百萬年,在溶液中又會逐漸降解成短小的片段,因此大多數化石中並無脫氧核醣核酸可供研究[111]。即使如此,仍有一些聲稱表示已經獲得更古老的DNA,其中一項研究表示,已從存活於2億5千萬年古老的鹽類晶體中的細菌分離出脫氧核醣核酸[112],但此宣布引起了討論與爭議[113][114]。
重組脫氧核醣核酸技術在現代生物學與生物化學中受到廣泛應用,所謂重組DNA,是指集合其他脫氧核醣核酸序列所製成的人造脫氧核醣核酸,可以質粒或以病毒載體搭載所想要的格式,將脫氧核醣核酸轉型到生物個體中[115]。經過遺傳改造處裡之後的生物體,可用來生產重組蛋白質,以供醫學研究使用[116],或是於農業上栽種[117][118]。
法醫可利用犯罪現場遺留的血液、精液、皮膚、唾液或毛髮中的脫氧核醣核酸,來辨識可能的加害人。此過程稱為遺傳指紋分析或脫氧核醣核酸特徵測定,此分析方法比較不同人類個體中許多的重複脫氧核醣核酸片段的長度,這些脫氧核醣核酸片段包括短串聯重複序列與小衛星序列等,一般來說是最為可靠的罪犯辨識技術[119]。不過如果犯罪現場遭受多人的脫氧核醣核酸污染,那麼將會變得較為複雜難解[120]。
首先於1984年發展脫氧核醣核酸特徵測定的人是一名英國遺傳學家阿萊克·傑弗里斯[121]。到了1988年,英國的謀殺案嫌犯科林·皮奇福克,成為第一位因脫氧核醣核酸特徵測定證據而遭定罪者[122]。利用特定類型犯罪者的脫氧核醣核酸樣本,可建立出資料庫,幫助調查者解決一些只從現場採集到脫氧核醣核酸樣本的舊案件。此外,脫氧核醣核酸特徵測定也可用來辨識重大災害中的罹難者[123]。
另外,有保險公司利用DNA鑑識技術,以確認理賠責任歸屬。相關事例包括:年僅16歲的臺灣少年Lien-Yang Lee於2013年9月在澳洲遭遇車禍,他在申報保險理賠時聲稱,事故發生時他是坐後排乘客座上;不過,RACQ保險公司指駕駛座前安全氣囊上血跡的DNA,是屬於Lien-Yang Lee,故推斷在車禍發生時他是坐在前排駕駛座上;故此,RACQ保險公司指他涉及詐欺,拒絕支付相關醫療費用;隨後昆士蘭州高等法院亦於2017年3月確認,Lien-Yang Lee在事故發生時涉及無照駕駛。[124]
由於脫氧核醣核酸在經歷一段時間後會積聚一些具有遺傳能力突變,因此其中所包含的歷史訊息,可經由脫氧核醣核酸序列的比較,使遺傳學家瞭解生物體的演化歷史,也就是種系[125]。這些研究是種系發生學的一部分,也是演化生物學上的有利工具。假如對物種以內範圍的脫氧核醣核酸序列進行比較,那麼群體遺傳學家就可得知特定族群的歷史。此方法的應用範圍可從生態遺傳學到人類學,舉例而言,脫氧核醣核酸證據已被試圖用來尋找失蹤的以色列十支派[126][127]。DNA也可以用來調查現代家族的親戚關係,例如建構莎麗·海明斯與托馬斯·傑斐遜的後代之間的家族關係,研究方式則與上述的犯罪調查相當類似,因此有時候某些犯罪調查案件之所以能解決,是因為犯罪現場的脫氧核醣核酸與犯罪者親屬的脫氧核醣核酸相符[128]。
生物資訊學影響了脫氧核醣核酸序列資料的運用、搜尋與資料挖掘工作,並發展出各種用於儲存並搜尋脫氧核醣核酸序列的技術,可進一步應用於電腦科學,尤其是字串搜尋演算法、機器學習以及資料庫理論[129]。字串搜尋或比對演算法是從較大的序列或較多的字母中,尋找單一序列或少數字母的出現位置,可發展用來搜尋特定的核苷酸序列[130]。在其他如文本編輯器的應用裡,通常可用簡單的演算法來解決問題,但只有少量可辨識特徵的脫氧核醣核酸序列,卻造成這些演算法的運作不良。序列比對則試圖辨識出同源序列,並定位出使這些序列產生差異的特定突變位置,其中的多重序列比對技術可用來研究種系發生關係及蛋白質的功能[131]。由整個基因組所構成的資料含有的大量脫氧核醣核酸序列,例如人類基因組計畫的研究對象。若要將每個染色體上的每個基因,以及負責調控基因的位置都標示出來,會相當困難。脫氧核醣核酸序列上具有蛋白質或RNA編碼特徵的區域,可利用基因識別演算法辨識出來,使研究者得以在進行實驗以前,就預測出生物體內可能表現出來的特殊基因產物[132]。
脫氧核醣核酸最早在運算上應用,是解決了一個屬於NP完全的小型直接漢彌爾頓路徑問題[133]。脫氧核醣核酸可作為「軟體」,將訊息寫成核苷酸序列;並以酵素或其他分子作為「硬體」進行讀取或修飾。舉例來說,作為硬體的限制酶FokI可以搭載一段具有軟體功能的GGATG序列脫氧核醣核酸,再以其他的脫氧核醣核酸片段進行輸入,並與軟硬體複合物產生反應,最後輸出另一段脫氧核醣核酸[134]。這種類似圖靈機的裝置可應用於藥物治療。此外脫氧核醣核酸運算在能源消耗、空間需求以及效率上優於電子電腦,且脫氧核醣核酸運算為具有高度平行(見平行運算)的計算方式。許多其他問題,包括多種抽象機器的模擬、布爾可滿足性問題,以及有界形式的旅行推銷員問題,皆曾利用脫氧核醣核酸運算做過分析[135]。由於小巧緊密的特性,脫氧核醣核酸也成為密碼學理論的一部分,尤其在於能夠利用脫氧核醣核酸有效地建構並使用無法破解的一次性密碼本[136]。
脫氧核醣核酸的分子性質,例如自我組裝特性,使其可用於某些納米尺度的建構技術,例如利用脫氧核醣核酸作為模板,可導引半導體晶體的生長[137]。或是利用脫氧核醣核酸本身,來製成一些特殊結構,例如由脫氧核醣核酸長鏈交叉形成的脫氧核醣核酸「瓦片」(tile)[138]或是多面體[139]。此外也可以做出一些可活動的元件,例如納米機械開關,此機械可經由使脫氧核醣核酸在不同的光學異構物(B型與Z型)之間進行轉變,而使構形發生變化,導致開關的開啟或關閉[140]。還有一種脫氧核醣核酸機械含有類似鑷子的構造,可加入外來脫氧核醣核酸使鑷子開合,並排出廢物脫氧核醣核酸,此時脫氧核醣核酸的作用類似「燃料」[141]。脫氧核醣核酸所建構出來的裝置,也可用來作為上述的脫氧核醣核酸運算工具。
最早分離出脫氧核醣核酸的弗雷德里希·米歇爾是一名瑞士醫生,他在1869年,從廢棄繃帶裡所殘留的膿液中,發現一些只有顯微鏡可觀察的物質。由於這些物質位於細胞核中,因此米歇爾稱之為「核素」(nuclein)[142]。到了1919年,菲巴斯·利文進一步辨識出組成脫氧核醣核酸的鹼基、糖類以及磷酸核苷酸單元[143],他認為脫氧核醣核酸可能是許多核苷酸經由磷酸基團的聯結,而串聯在一起。不過他所提出概念中,脫氧核醣核酸長鏈較短,且其中的鹼基是以固定順序重複排列。1937年,威廉·阿斯特伯里完成了第一張X光繞射圖,闡明了脫氧核醣核酸結構的規律性[144]。
1928年,弗雷德里克·格里菲斯從格里菲斯實驗中發現,平滑型的肺炎球菌,能轉變成為粗糙型的同種細菌,方法是將已死的平滑型與粗糙型活體混合在一起。這種現象稱為「轉型」。但造成此現象的因子,也就是脫氧核醣核酸,是直到1943年,才由奧斯瓦爾德·埃弗里等人所辨識出來[145]。1953年,阿弗雷德·赫希與瑪莎·蔡斯確認了脫氧核醣核酸的遺傳功能,他們在赫希-蔡斯實驗中發現,脫氧核醣核酸是T2噬菌體的遺傳物質[146]。
到了1953年,當時在卡文迪許實驗室的詹姆斯·沃森與佛朗西斯·克里克,依據倫敦國王學院的羅莎琳·富蘭克林所拍攝的X光繞射圖[147]及相關資料,提出了[147]最早的核酸分子結構精確模型,並發表於《自然》期刊[11]。五篇關於此模型的實驗證據論文,也同時以同一主題發表於《自然》[148]。其中包括富蘭克林與雷蒙·葛斯林的論文[149],此文所附帶的X光繞射圖[150],是沃森與克里克闡明脫氧核醣核酸結構的關鍵證據。此外莫里斯·威爾金斯團隊也是同期論文的發表者之一[151]。富蘭克林與葛斯林隨後又提出了A型與B型脫氧核醣核酸雙螺旋結構之間的差異[152]。1962年,沃森、克里克以及威爾金斯共同獲得了諾貝爾生理學或醫學獎[153]。
克里克在1957年的一場演說中,提出了分子生物學的中心法則,預測了脫氧核醣核酸、RNA以及蛋白質之間的關係,並闡述了「轉接子假說」(即後來的tRNA)[154]。1958年,馬修·梅瑟生與富蘭克林·史達在梅瑟生-史達實驗中,確認了脫氧核醣核酸的複製機制[155]。後來克里克團隊的研究顯示,遺傳密碼是由三個鹼基以不重複的方式所組成,稱為密碼子。這些密碼子所構成的遺傳密碼,最後是由哈爾·葛賓·科拉納、羅伯特·W·霍利以及馬歇爾·沃倫·尼倫伯格解出[156]。這些發現代表了分子生物學的誕生。
為了測出所有人類的脫氧核醣核酸序列,人類基因組計畫於1990年代展開。到了2001年,多國合作的國際團隊與私人企業塞雷拉基因組公司,分別將人類基因組序列草圖發表於《自然》[157]與《科學》[158]兩份期刊。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.