全基因組定序 (Whole genome sequencing,WGS )是將一個生物的基因組 完整(或接近完整)定序 的流程。1990年代起陸續有生物的基因組被完整定序,最早被定序完成的生物為流感嗜血桿菌 (1995年),1996年首次有真核生物 (釀酒酵母 )被完整定序。2014年以後全基因組定序逐漸開始被用於臨床用途[ 2] [ 3] [ 4] ,以病人基因組資訊決定其療法,即個人化醫療 [ 5] 。2000年全基因體定序技術獲《科學 》期刊選為該年的年度突破 [ 6] 。
霰彈槍定序法的流程圖
顯示基因定序結果的電泳圖譜 [ 1]
流感嗜血桿菌為第一個被全基因組定序的生物
秀麗隱桿線蟲為第一個被全基因組定序的多細胞生物(動物)
阿拉伯芥為第一個被全基因組定序的植物
1977年,弗雷德里克·桑格 的團隊將ΦX174噬菌體 的基因組完整定序,長5368bp ,是第一個被完整定序的基因組[ 7] [ 8] [ 9] 。1990年代起測序技術逐漸成熟,開始被用於定序生物的完整基因組[ 10] 。第一個被完整定序的生物為流感嗜血桿菌 ,共長183萬bp,於1995年由霰彈槍定序法 完成[ 11] ,隨後有其他細菌 與古菌 的基因組陸續被以相同方法定序。真核生物 的基因組大小則大的多,因此定序較為困難,1996年釀酒酵母 的基因組定序完成,約長1200萬bp,為第一個被完整定序的真核生物[ 12] ;1998年秀麗隱桿線蟲 的基因組被完整定序,為第一個完成定序的多細胞真核生物[ 13] 。真核生物定序的方式除使用霰彈槍定序法外,還用到了細菌人工染色體 (BAC)、酵母菌人工染色體 (YAC)等基因文庫 [ 14] 。
1999年人類22號染色體 (最短的常染色體 )被定序發表[ 15] ;2000年黑腹果蠅 的基因組被完整定序,為第二種被完整定序的動物[ 16] ,同年阿拉伯芥 的基因組定序也告完成,是第一個被完整定序的植物[ 17] 。2001年人類基因組計劃 發表人類基因組 的定序草圖(draft)[ 18] ,2003年宣告真染色質 的序列皆定序完成[ 19] [ 20] ,2021年發表定序程度達「完整」的基因組[ 21] [ 22] ;2002年小鼠 的基因組也被定序發表[ 23] 。目前已有上千種生物的基因組被完整定序。2005年起桑格定序 等傳統的定序方法逐漸被Illumina染料定序 、焦磷酸測序 、SMRT定序 與奈米孔洞測序 等次世代定序 (NGS)技術取代(但仍使用霰彈槍定序法的策略,將基因組打碎成許多片段後分別完成定序,再進行組裝)。[ 24] [ 25]
2001年至2019年一次人類全基因組定序的費用變化
已有許多公司嘗試將全基因組定序商業化以作研究或臨床用途[ 26] ,包括Illumina [ 27] 、Knome [ 28] 、Sequenom [ 29] 、454生物科學 [ 30] 、Pacific Biosciences [ 31] 、Complete Genomics [ 32] 、Helicos Biosciences [ 33] 、GE Global Research (通用電氣 的研發部門)、Affymetrix 、IBM 、Intelligent Bio-Systems[ 34] 、Life Technologies、Oxford Nanopore Technologies [ 35] 與華大基因 等[ 36] [ 37] [ 38] 。2010年代晚期全基因組定序一次約要價1000美元,許多公司正試圖將成本進一步降低[ 39] ,2017年華大基因的全基因組定序收費已降為一人600美元[ 40] ,2019年Veritas Genetics 也將費用降至一人599美元[ 41]
全基因組關聯分析(GWAS)的結果(曼哈頓圖 )示意圖
在生醫研究中,全基因組定序可被用於全基因組關聯分析 (GWAS)以尋找基因組中與特定疾病相關的單核苷酸多態性 (SNP)位點[ 42] 。
全基因組定序在醫療上也有很大的應用價值,2009年Illumina即推出了用於臨床醫療的全基因組分析套件,供醫師在不知病人病因、傳統療法均效果不彰時使用[ 43] 。因近年來全基因組定序的費用大幅下降,其應用潛力也大幅增加。2011年布萊根婦女醫院 與哈佛醫學院 創立了Genomes2People(G2P)計劃,旨在將基因定序整合進臨床醫療[ 44] 。
人類全基因組定序可能伴隨一些倫理議題,此技術雖有診斷出疾病的潛力[ 45] ,但也有造成基因歧視 、私隱外洩(特別是未成年人 的私隱[ 46] )與心理上負面影響之風險[ 47] 。另外當一個人接受全基因組定序時,除了自己基因組的資訊外,還可能得知其近親的基因組資訊,進而推得他們過去、現在或未來的健康狀況[ 48] ,因此接受定序者是否應與近親分享定序的結果也是一倫理議題,若其帶有一與某疾病相關的突變,卻不願與近親分享此資訊,則醫療人員可能面臨預防醫療與病人私隱的兩難[ 45] 。科學研究中的全基因組定序也可能有私隱外洩的疑慮,因學術研究發表時通常需要將病人的基因型 的資訊發表到公開數據庫,此資訊雖為匿名,但在疾病或突變相當罕見的情況下仍有可能使病人被認出[ 45] 。
最早被全基因組定序完成的人是克萊格·凡特 [ 49] [ 50] [ 51] 與詹姆斯·杜威·沃森 [ 52] [ 53] [ 54] ,於2007年完成(覆蓋度 分別為7.5與7.4),2008年又有一名匿名的中國漢族 人(覆蓋度為36)[ 55] 、尼日利亞 約魯巴人 (覆蓋度為30)[ 56] 、荷蘭的女性遺傳學家瑪喬琳·克里克 (為首位基因組被完整定序的女性,覆蓋度7至8)[ 57] [ 58] 與一高加索人種 的白血病 女性患者基因組被定序完成[ 59] 。史蒂夫·喬布斯 為最早被全基因組定序的20人之一,有消息指其花費高達10萬美元[ 60] 。截至2012年6月共有69個人接近完整的基因組序列數據向大眾公開[ 61] 。2013年11月有一西班牙 家庭在接受23andMe 與華大基因定序後,將全家的全基因組序列以共享創意公有領域 授權條款公開,是第一個公開的家族全基因組序列數據[ 62] 。
Nones, K; Waddell, N; Wayte, N; Patch, AM; Bailey, P; Newell, F; Holmes, O; Fink, JL; Quinn, MC; et al. Genomic catastrophes frequently arise in esophageal adenocarcinoma and drive tumorigenesis . Nature Communications. 2014-10-29, 5 : 5224. Bibcode:2014NatCo...5.5224N . PMC 4596003 . PMID 25351503 . doi:10.1038/ncomms6224 .
van El, CG; Cornel, MC; Borry, P; Hastings, RJ; Fellmann, F; Hodgson, SV; Howard, HC; Cambon-Thomsen, A; Knoppers, BM; Meijers-Heijboer, H; Scheffer, H; Tranebjaerg, L; Dondorp, W; de Wert, GM. Whole-genome sequencing in health care. Recommendations of the European Society of Human Genetics . European Journal of Human Genetics. June 2013,. 21 Suppl 1: S1–5. PMC 3660957 . PMID 23819146 . doi:10.1038/ejhg.2013.46 .
Brownlee, George G. Frederick Sanger CBE CH OM. 13 August 1918 – 19 November 2013. Biographical Memoirs of Fellows of the Royal Society. 2015, 61 : 437–466. doi:10.1098/rsbm.2015.0013 .
al.], Bruce Alberts ... [et. Molecular biology of the cell 5th. New York: Garland Science. 2008: 551. ISBN 978-0-8153-4106-2 .
Fleischmann, R.; Adams, M.; White, O; Clayton, R.; Kirkness, E.; Kerlavage, A.; Bult, C.; Tomb, J.; Dougherty, B.; Merrick, J.; al., e. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd. Science. 1995-07-28, 269 (5223): 496–512. Bibcode:1995Sci...269..496F . PMID 7542800 . doi:10.1126/science.7542800 .
Goffeau, A.; Barrell, B. G.; Bussey, H.; Davis, R. W.; Dujon, B.; Feldmann, H.; Galibert, F.; Hoheisel, J. D.; Jacq, C.; Johnston, M.; Louis, E. J.; Mewes, H. W.; Murakami, Y.; Philippsen, P.; Tettelin, H.; Oliver, S. G. Life with 6000 Genes . Science. 1996-10-25, 274 (5287): 546–567. Bibcode:1996Sci...274..546G . PMID 8849441 . S2CID 16763139 . doi:10.1126/science.274.5287.546 . (原始內容存檔 (PDF) 於2016-03-07).
Bio-IT World . Bio-IT World. 2008-10-06 [2009-02-23 ] . (原始內容存檔 於2009-02-17).
Yano, K; Yamamoto, E; Aya, K; Takeuchi, H; Lo, PC; Hu, L; Yamasaki, M; Yoshida, S; Kitano, H; Hirano, K; Matsuoka, M. Genome-wide association study using whole-genome sequencing rapidly identifies new genes influencing agronomic traits in rice.. Nature Genetics. August 2016, 48 (8): 927–34. PMID 27322545 . S2CID 22427006 . doi:10.1038/ng.3596 .
Ayday E; De Cristofaro E; Hubaux JP; Tsudik G. The Chills and Thrills of Whole Genome Sequencing. 2015. arXiv:1306.1264 [cs.CR ].
Levy S, Sutton G, Ng PC, Feuk L, Halpern AL, Walenz BP, Axelrod N, Huang J, Kirkness EF, Denisov G, Lin Y, MacDonald JR, Pang AW, Shago M, Stockwell TB, Tsiamouri A, Bafna V, Bansal V, Kravitz SA, Busam DA, Beeson KY, McIntosh TC, Remington KA, Abril JF, Gill J, Borman J, Rogers YH, Frazier ME, Scherer SW, Strausberg RL, Venter JC. The diploid genome sequence of an individual human . PLOS Biol. September 2007, 5 (10): e254. PMC 1964779 . PMID 17803354 . doi:10.1371/journal.pbio.0050254 .
Wheeler DA; Srinivasan M; Egholm M; Shen Y; Chen L; McGuire A; He W; Chen YJ; Makhijani V; Roth GT; Gomes X; Tartaro K; Niazi F; Turcotte CL; Irzyk GP; Lupski JR; Chinault C; Song XZ; Liu Y; Yuan Y; Nazareth L; Qin X; Muzny DM; Margulies M; Weinstock GM; Gibbs RA; Rothberg JM. The complete genome of an individual by massively parallel DNA sequencing. Nature. 2008, 452 (7189): 872–6. Bibcode:2008Natur.452..872W . PMID 18421352 . doi:10.1038/nature06884 .
Wang J; Wang, Wei; Li, Ruiqiang; Li, Yingrui; Tian, Geng; Goodman, Laurie; Fan, Wei; Zhang, Junqing; Li, Jun; Zhang, Juanbin, Juanbin; Guo, Yiran, Yiran; Feng, Binxiao, Binxiao; Li, Heng, Heng; Lu, Yao, Yao; Fang, Xiaodong, Xiaodong; Liang, Huiqing, Huiqing; Du, Zhenglin, Zhenglin; Li, Dong, Dong; Zhao, Yiqing, Yiqing; Hu, Yujie, Yujie; Yang, Zhenzhen, Zhenzhen; Zheng, Hancheng, Hancheng; Hellmann, Ines, Ines; Inouye, Michael, Michael; Pool, John, John; Yi, Xin, Xin; Zhao, Jing, Jing; Duan, Jinjie, Jinjie; Zhou, Yan, Yan; et al. The diploid genome sequence of an Asian individual . Nature. 2008, 456 (7218): 60–65. Bibcode:2008Natur.456...60W . PMC 2716080 . PMID 18987735 . doi:10.1038/nature07484 .
Corpas, Manuel; Cariaso, Mike; Coletta, Alain; Weiss, David; Harrison, Andrew P; Moran, Federico; Yang, Huanming. A Complete Public Domain Family Genomics Dataset. 2013-11-12. bioRxiv 10.1101/000216 .