Remove ads
包含在生物DNA中的全部遺傳信息 来自维基百科,自由的百科全书
基因組(genome)又稱基因體,在生物學中,是指某一特定物種細胞內或病毒粒子內的一整套遺傳物質(DNA或RNA)。基因組包括基因(編碼區)和非編碼區(ncDNA 或 ncRNA),以及粒線體DNA、葉綠體DNA。1920年,德國漢堡大學植物學教授漢斯·溫克勒(Hans Winkler)首次使用基因組這一名詞。
更精確地講,一個生物體的基因組是指一套染色體中的完整的DNA序列。例如,生物個體體細胞中的二倍體由兩套染色體組成,其中一套DNA序列就是一個基因組。基因組一詞可以特指整套核DNA(例如,核基因組),也可以用於包含自己DNA序列的細胞器基因組,如粒線體基因組或葉綠體基因組。
當人們說一個有性生殖物種的基因組正在測序時,通常是指測定一套常染色體和兩種性染色體的序列,這樣來代表可能的兩種性別。即使在只有一種性別的物種中,「一套基因組序列」可能也綜合了來自不同個體的染色體。通常使用中,「遺傳組成」一詞有時在交流中即指某特定個體或物種的基因組。對相關物種全部基因組性質的研究通常被稱為基因組學,該學科與遺傳學不同,後者一般研究單個或一組基因的性質。
大部分生物體比病毒複雜,除了染色體,有時或總是包含額外的遺傳物質。某些情況下,比如對致病微生物的基因組測序,這裡基因組就包含了在質粒中的遺傳物質。在這種情況下基因組就包含了所有的基因和非編碼DNA。
而對於像人類這樣的脊椎動物,基因組通常指的只是染色體DNA。因此,儘管人類線粒體裡包含了基因,但這些基因並不作為基因組的一部分。事實上,有時候稱線粒體擁有自己的基因組,通常叫做線粒體基因組。
必須指出僅有一個基因組並不能獲得物種的遺傳差異或遺傳多態性。例如,原則上講,人類基因組序列可以僅僅從某個個體的一個細胞的一半DNA中測定。要知道是哪些DNA變異導致特定性狀或疾病則需要進行個體間比較。這一點也解釋了通常使用「基因組」(與通常使用「基因」相提並論)不僅僅指某特定DNA序列,也指某物種整個家族的序列。
儘管這個概念看上去與直覺相牴觸,其實這與說沒有任何一個特定的形狀是印度豹的形狀是相同的概念。印度豹形狀各異,它們的基因組序列也並不相同。然而各動物個體和它們的序列都有共性,因此可以從單一實例中來了解印度豹和「豹性」。
在1976年,比利時根特大學的瓦爾特·菲爾斯第一個完成了一個基因組的完整測序——RNA病毒噬菌體MS2的基因組。次年,弗雷德里克·桑格完成了Φ-X174噬菌體的測序,這是第一個完成測序的DNA基因組,全基因組只有5386個鹼基對[1]。在20世紀90年代中期,生物三域的第一個全基因組測序在很短一段時間內陸續完成。第一個被測序的細菌基因組是流感嗜血桿菌(Haemophilus influenzae),由克雷格·文特爾團隊於1995年完成。幾個月以後,第一個真核生物基因組的測序也由歐洲科學家完成了。它是一種帶有16個染色體的芽殖酵母——釀酒酵母(Saccharomyces cerevisiae),其測序工作開始於80年代中期。很快地在1996年,第一個古菌基因組——詹氏甲烷球菌(Methanococcus jannaschii)基因組也被測序,同樣由克雷格·文特爾團隊完成。
新技術的發展使得測序成本快速地下降,測序耗時也顯著減少,完成全基因組測序的生物越來越多。其他基因組計劃包括小鼠,水稻,擬南芥,河豚和細菌(如大腸桿菌)等皆被完成測序。1990年啟動的人類基因組計劃旨在對人類基因組繪製物理圖譜並測序[2][3]。
新的測序技術,如大規模並行測序也開闢了個人基因組測序作為一種診斷工具的前景。其中標誌性的一步是2007年完成了對DNA雙螺旋結構的發現者之一詹姆斯·杜威·沃森個人的基因組的測序[4]。而測序費用也一直在降低,可能最終測序單個基因組只需要幾千美元。
「基因組構成」(Genome composition)用於描述成一個單倍體基因組的組成,包括基因組大小、非重複DNA和重複DNA所占的比重等。通過不同基因組間的比較研究,科學家可以更好地理解給定基因組的進化史。
當討論基因組的構成時,首先要區別的是原核基因組還是真核基因組,兩者在基因組組成上有很大的不同。在原核生物中,基因組的大部分(85-90%)都是非重複DNA,這意味着其中主要的都是編碼DNA,非編碼區域只占了一小部分[5]。與之相反,真核生物的蛋白質編碼基因有着外顯子-內含子的結構特點,而且存在大量豐富的重複DNA序列。特別是哺乳動物和植物中,基因組的大部分都由重複DNA構成[6]。
大部分的生物體常常攜帶除位於染色體之外的遺傳物質,在有的情況下,例如對致病微生物的基因組測序,「基因組」就包括了位於質粒的額外的遺傳物質。在這種情況下,「基因組」描述的是所有基因以及有潛在功能的非編碼DNA。
在真核生物例如植物、原生生物和動物中,基因組含有特指位於染色體DNA上的信息的意思。所以,即使這些生物含有葉綠體或者線粒體,它們有自己的DNA,但這些DNA所攜帶的信息不被包括在基因組中,事實上,有時我們說線粒體含有自己的基因組,即「線粒體基因組」,而在葉綠體中的被稱為「葉綠體基因組」。
基因組大小是指一種生物單倍體基因組的全部DNA鹼基對數。在原核生物和低等真核生物中,基因組大小與生物形態的複雜性基本呈正相關關係;但是在軟體動物以及其它更高等的真核生物中,這種相關性就不存在了[6][7]。這一現象可能是由基因組中的重複DNA引起。
鑑於基因組如此複雜,一種研究策略就是使生物體在理論上可以生存的條件下減少基因組中的基因數目直至最小。對於單細胞生物和多細胞生物最小基因組的實驗研究已經開展(見發育生物學),這些工作在體內(in vivo)和體外(in silico)進行[8][9]。
這裡列出了一些重要的或有代表性的基因組的大小,更多基因組大小的請見#參見:
類型 | 生物 | 學名 | 基因組大小(鹼基對) | 所含基因數目 | 注 |
---|---|---|---|---|---|
病毒 | 豬圓環病毒I型 | 1,759 | 已知最小的基因組[10] | ||
病毒 | 猿猴病毒SV40 | 5,224 | [11] | ||
病毒 | 噬菌體Φ-X174 | 5,386 | 最早完成測序的DNA基因組[12] | ||
病毒 | 人類免疫缺陷病毒HIV | 9,749 | [13] | ||
病毒 | 噬菌體λ | 48,502 | 常作為重組DNA的克隆載體。[14][15][16] | ||
細菌 | 大腸桿菌 | Escherichia coli | 4.6Mb | 4288 | [17] |
藍細菌 | 原綠球藻 | Prochlorococcus | 1.7Mb | 1884 | 已知最小的藍細菌基因組[18][19] |
變形蟲 | 無恆變形蟲 | Amoeba dubia | 670Gb | 已知的最大基因組[20](但有爭議)[21] | |
植物 | 貝母屬一種 | Fritillary assyriaca | 130Gb | ||
真菌 | 釀酒酵母 | Saccharomyces cerevisiae | 12.1Mb | 6294 | 第一個測序的真核生物基因組,完成於1996年[22] |
線蟲 | 咖啡短體線蟲 | Pratylenchus coffeae | 20Mb | 已知最小的動物基因組[23] | |
線蟲 | 秀麗隱桿線蟲 | Caenorhabditis elegans | 100.3Mb | 19000 | 第一個測序的多細胞生物基因組,完成於1998年12月[24] |
昆蟲 | 黑腹果蠅 | Drosophila melanogaster | 175Mb | 13600 | [25] |
哺乳動物 | 小家鼠 | Mus musculus | 2.7Gb | 20210 | [26] |
哺乳動物 | 人 | Homo sapiens | 3.2Gb | 20000 | [27][28] |
魚類 | 金娃娃(一種河豚) | Tetraodon nigroviridis | 385Mb | 已知最小的脊椎動物基因組約為340Mb[29][30]-385Mb[31] | |
魚類 | 石花肺魚 | Protopterus aethiopicus | 130Gb | 已知最大的脊椎動物基因組 |
非重複DNA的總長除以基因組大小即為非重複DNA比重。蛋白質編碼基因和非編碼RNA基因一般都是非重複的DNA[32]。而更大的基因組並不意味着更多的基因,隨着高等真核生物的基因組大小的增加,非重複DNA的比重相應減少[6]。
不同生物中的非重複DNA的比重會有很大不同,一些原核生物如大腸桿菌幾乎只有非重複DNA,低等真核生物比如秀麗隱桿線蟲和黑腹果蠅的非重複DNA仍比重複DNA多[6][33],而更高等的真核生物的重複DNA比重超過了非重複DNA。在一些植物和兩棲動物中,非重複DNA的比重不超過20%,成了基因組中的少數組分[6]。
串聯重複常由複製時的滑移、不等位的交換和基因轉換引起[35],微衛星和衛星DNA是基因組中的串聯重複序列[36]雖然串聯重複序列在基因組中起很大作用,但是在哺乳動物基因組中卻表現為散在重複序列。
散在重複通常來自轉座子的反轉錄轉座,但也包括蛋白質編碼的基因家族與假基因。轉座子是一類DNA序列,它們能夠在基因組中通過轉錄或逆轉錄,在內切酶的作用下,在其他基因座上出現[5][37],被認為是高等真核生物的進化驅動力之一[38]。轉座子可分為兩大類:I型轉座子(反轉錄轉座子)和II型轉座子(DNA轉座子)[37]。
基因組不僅僅是是生物基因的集合,對其研究和比較能獲得生物演化信息的更多細節。一些基因組性質如「染色體數」(核型)、基因組大小、基因順序、密碼子偏好性與GC含量能反映出現存生物的許多基因組演化信息。
基因複製在基因組形成過程中起重要作用。真核生物的基因組存在大量重複序列。按照不同重複頻率,可分為高度重複序列、中度重複序列、低度重複序列。這些重複序列是生物多樣性的基礎。
基因水平轉移常常用來解釋親緣關係很遠的生物之間為什麼會有很相近的基因。基因水平轉移在微生物之間比較常見。另外,真核生物的核基因組中也有些從葉綠體和線粒體轉移來的基因。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.