Remove ads
来自维基百科,自由的百科全书
人类基因组计划(英语:Human Genome Project,缩写:HGP)是一项规模高,跨国跨学科的科学探索巨型工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的六十亿对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。基因组计划是人类为了探索自身的奥秘所迈出的重要一步。截至2005年,人类基因组计划的测序工作已经基本完成(92%)。其中,2001年人类基因组工作草图的发表(由公共基金资助的国际人类基因组计划和私人企业塞雷拉基因组公司各自独立完成,并分别公开发表)被认为是人类基因组计划成功的里程碑。大多数政府资助的测序是在美国,英国,日本,法国,德国和中国的20所大学和研究中心进行[1]。
此条目需要补充更多来源。 (2015年2月28日) |
国际人类基因组计划的启动的重要原因是美国能源部的推动。1984年,在美国犹他州的Alta,由美国政府资助的旨在讨论日益发展的DNA重组技术的会议上,科学家们第一次讨论了人类基因组测序的价值。[2]而首次对于人类基因组测序的可行性进行认真的探讨是在1986年由罗伯特·辛舍梅(Robert Sinsheimer)主持的会议上。[3]与会者的发言:“这计划(人类基因组启动计划)的最终目标是了解人类基因组”,“就像了解人类身体构造对于目前医学发展的贡献,对人类基因组的了解将对医学和其他健康科学研究提供必不可少的支持”。随后,美国健康与环境研究项目主任查尔斯·德利斯决定对人类基因组启动计划进行资助,用于发展关键性技术与资源。[4][5][6]
1988年,人类基因组计划再次得到显著的推动,DNA双螺旋结构的发现者和诺贝尔生理学或医学奖的获得者詹姆斯·沃森领导着美国国家卫生研究院中新成立的研究中心,加入了这个计划。对于人类基因组计划,沃森的评价是:“不尽快将它(人类基因组计划)完成将是非常不道德”,[7]“能让我的科学生涯从双螺旋(指的是组成人类染色体的单倍体中的核苷酸序列组成)跨越到人类基因组是我的荣幸”。[8]但1992年沃森于该计划的领导角色被弗朗西斯·柯林斯取代。
1990年,人类基因组计划由美国能源部和国家卫生研究院投资,预期在15年内完成。随后,该计划扩展为国际合作的计划,英国、日本、法国、德国和中国先后加入,形成了国际基因组测序联盟。为了协调各国人类基因组研究,1988年在维克多·马克库斯克等科学家的倡导下,国际人类基因组组织(HUGO)宣告成立。[4]
在国际人类基因组计划(以下简称“国际计划”)启动八年后的1998年,美国科学家克莱格·文特尔创办了一家名为塞雷拉基因组(Celera Genomics)的私立公司,邀聘具基因测序之父的陈奕雄博士担任首席科学家,开展独立的人类基因组计划。与国际人类基因组计划相比,该公司希望能以更快的速度和更少的投资(3亿美元,仅为国际计划的十分之一)来完成此项工程。塞雷拉基因组的另起计划被认为对人类基因组计划是一件好事,因为塞雷拉基因组的竞争促使国际人类基因组计划不得不改进其策略,进一步加速其工作进程,使得人类基因组计划得以提前完成。
基于对基因结构的了解及对电子机具的认识,陈奕雄博士的团队采用了更快速同时更具风险的技术全基因组霰弹枪测序法,进而创造出全世界第一台全自动测序仪ABI3600。霰弹枪测序法的思想是将基因组打断为数百万个DNA片段,然后用一定的算法将片段的序列信息重新整合在一起,从而得到整个基因组序列。为了提高这一方法的效率,1990年代,测序和片段信息整合达到了自动化。这一方法虽然已被用于序列长达6百万个碱基对的细菌基因组测序,但对于人类基因组中30亿碱基对的序列测定,这一技术能否成功在当时还未有定论。
塞雷拉基因组一开始宣称只寻求对200至300个基因的专利权保护,但随后又修改为寻求对“完全鉴定的重要结构”的总共100至300个靶基因进行知识产权保护。1999年,塞雷拉申请对6500个完整的或部分的人类基因进行初步专利保护;批评者认为这一举动将阻碍遗传学研究。[9]此外,塞雷拉建立之初,同意与国际计划分享数据,但这一协定很快就因为塞雷拉拒绝将自己的测序数据存入可以自由访问的公共数据库GenBank而破裂。虽然塞雷拉承诺根据1996年百慕大协定每季度发表他们的最新进展(国际计划则为每天),但不同于国际计划的是,他们不允许他人自由发布或无偿使用他们的数据。
2000年,经美国国家卫生研究院院长科林斯与赛雷拉公司集团协调后,由美国总统克林顿牵着两个团队领导人的手,宣布人类基因体计划完成,其所有人类基因组数据为人类共同财富,不允许专利保护,且必须对所有研究者公开,[10]塞雷拉最后决定将数据公开。但这一事件也导致塞雷拉的股票价格一路下挫,并使倚重生物技术股的纳斯达克指数受到重挫。
人类基因组计划的分阶段目标如下[6]:
国际计划的资金主要来源于美国国家卫生研究院和英国慈善机构威康信托基金会,后者资助了位于英国的桑格研究中心和其他一些国家的研究机构。
国际人类基因组测序联盟的所用于测序的基因组取样于一大批捐献者的血液和精子。只有少量的样品被用做DNA测序,又由于捐献者的身份是保密的,因此无论是捐献者或是科学家都不知道用于测序的DNA是来自哪些人。来自不同文库的DNA被克隆后用于整个计划,大多数文库由彼得·杨(Pieter J. de Jong)博士完成。科学家使用来自于两名男性和两名女性(捐献者中随机选出)的血液中的白细胞,从中取得分离的DNA文库。由于质量较高,文库之一的RP11被较多地使用。有非正式的报道(在基因组计划的团体内部也盛行的说法)指出用于国际基因组计划的大部分DNA来自于住在纽约州布法罗的一名男性捐献者(编号为RP11)。[11]
塞雷拉基因组计划使用的DNA样品来源于五名捐献者。塞雷拉基因组的首席科学家克莱格·文特尔在一篇写给《科学》杂志的公开信中承认他本人是捐献者之一。[12]
在国际计划中,基因组被分割成多个片断(长度接近150,000个碱基对)。由于这些片断能被插入细菌中,并利用细菌的DNA复制机器进行复制,因此被称为细菌人工染色体。通过对每一个这样的片断分别应用“霰弹枪测序法”,最终将这些片断通过配对末端法(pair-end)以及其他许多定位数据重新组装在一起从而获得完整的基因组。[13]这一手段是先将基因组分成相对较大的片断,并且在对片断进行测序前将其定位到每条染色体对应位置,所以被称为“分级霰弹枪测序法”。
塞雷拉基因组尝试用全基因组霰弹枪测序法并且没有使用附加的定位拼接。[14]但他们由于利用了少量的公共数据来完成计划而招致他人诟病。[15]
关于如何界定人类基因组测序完成,有多种定义。根据不同的定义,人类基因组的测序是否完成有不同的看法。曾有多个大众媒体报道人类基因组计划“完成”,而且由国际人类基因组计划所采用的定义,基因组的测序已经完成。有统计数据显示,[16]截至2003年底,绝大部分的人类基因组已获得测定;但基因组中仍有许多的区域未获得测序。这其中的首要原因是在每条染色体的中心区域(称为着丝粒)含有大量重复DNA序列,用目前的技术进行测序的难度较大。着丝粒含有数百万(可能接近千万)的碱基对,其中的大多数完全没有得到测序。第二个原因是在染色体末端区域(称为端粒)同样含有高度重复的DNA序列。而且在46条染色体中,其末端大都不完整,因此无法精确地知道在端粒前还有多少序列;与着丝粒的情况类似,目前的技术很难测定这些序列。第三个原因是在每个人的基因组中都含有多个包含多基因家族成员的位点,这些位点的测序问题用霰弹枪测序法难以解决,而包含于这些位点中的多基因家族成员往往编码具有重要免疫功能的蛋白质。对于前两个原因,可以通过发展新的技术来解决测序问题。除了以上区域,还有一些间隙散布于基因组中,部分间隙较大,但有希望在数年内解决。总而言之,对于全基因组的大小的估计显示了92%的基因组已经获得测定,余下的高度重复的DNA序列不大可能含有基因,但在完成所有的测序之前,没有什么是确定无误的。
该项目无法对所有人类细胞中发现的DNA进行测序。它只对基因组的真染色质区域进行测序,这些区域占人类基因组的92.1%。其他的区域称为异染色质,发现于着丝粒和端粒中,而该计划并未对此测序[17]。人类基因组计划(HGP)于2003年4月宣布完成。人类基因组的初步草图于2000年6月问世,到2001年2月完成并发表了工作草案,随后在2003年4月14日完成了人类基因组的最终测序。虽然有报导称,该方法覆盖了99%的全色人类基因组,准确率为99.99%,但2004年5月27日发表的一份对人类基因组序列的主要质量评估显示,超过92%的样本的准确率超过了99.99%,达到了预期目标[18]。关于HGP的进一步分析和论文不断出现[19]。2009年3月,基因组参考联盟(GRC)发布了一个更精确的人类基因组版本,但仍有300多个漏洞。截至2019年6月,GRC仍指出89个“未解决”的漏洞,其中大多数被标注为“暂停”或“正在调查/审查中”[20]。
破译人类遗传信息,将对生物学,医学,乃至整个生命科学产生无法估量的深远影响。目前基因组信息的注释工作仍然处于初级阶段。随着将来对基因组的理解更加深入,新的知识会使医学和生物技术领域发展更为迅速。基于DNA载有的信息在细胞生命活动中的指导作用,在分子生物学水平上深入了解疾病的产生过程将大力推动新的疗法和新药的开发研究。对于癌症、老年痴呆症等疾病的病因研究也将会受益于基因组遗传信息的破解。事实上,在人类基因组计划完成之前,它的潜在使用价值就已经表现出来。大量的企业,例如巨数遗传公司开始提供价格合宜,而且容易使用的基因检测,其声称可以预测包括乳腺癌、凝血、纤维性囊肿、肝脏疾病在内的很多种疾病。[43]。
此外,人类基因组计划将促成医学界的“个人化制药”的发展。对病人的整个基因序列的了解有助于医疗人员相应地提供最适合有效的帮助。的确,发展DNA科技将使得复制病人的基因组成本降低,相应的检查费用也会大大减少。
人类基因组计划对许多生物学研究领域有切实的帮助。例如,当科研人员研究一种癌症时,通过人类基因组计划所提供的信息,可能会找到某个,或些相关基因。如果在互联网上访问由人类基因组信息而建立的各种数据库,可以查询到其他科学家相关的文章,包括基因的DNA,cDNA碱基顺序,蛋白质立体结构、功能,多态性,以及和人类其他基因之间的关系。也可找到和小鼠、酵母、果蝇等对应基因的进化关系,可能存在的突变及相关的信号传导机制。人类基因组计划对与肿瘤相关的癌基因,肿瘤抑制基因的研究工作,起到了重要的推动作用。
分析不同物种的DNA序列的相似性会给生物进化和演变的研究提供更广阔的路径。事实上,人类基因组计划提供的数据揭示了许多重要的生物进化史上的里程碑事件。如核糖体的出现,器官的产生,胚胎的发育,脊柱和免疫系统等都和DNA载有的遗传信息有密切关系。
人类遗传信息也为考古学,犯罪学以及社会执法提供了极大的帮助。例如,分子人类学家通过母系遗传的线粒体DNA以及父系遗传的染色体Y确定了非洲确实是人类起源的摇篮。DNA证明了早在6万年前人类始祖便从非洲大陆迁徙到其他大洲的事实;大陆之间数列的异同也使得分子系统学家了解家族及个人的家谱关系。此外,通过收录已知犯人的DNA序列,有关政府加速了判别及震慑罪犯的措施。此执法方式被证明十分有成效但也常因迅速误判无辜嫌疑人而饱受争议。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.