基因
脱氧核糖核酸(DNA)或核糖核酸(RNA)序列内核糖核酸(RNA)或蛋白质的编码产物 / 维基百科,自由的 encyclopedia
基因(英语:gene),在生物学中是指“携带遗传信息的基本物质单位”(基本遗传单位)。而自从确定遗传信息的分子载体为核酸后,基因即指能够遗传且具功能性的一段DNA或RNA序列,详细来说,其为DNA或RNA大分子内一段编码基因产物(RNA或蛋白质)的合成的核苷酸序列。
弄清其序列本身的过程叫基因测序。基因的结构由增强子、启动子及蛋白编码序列等组成,即基因产物可以是蛋白质(蛋白质编码基因)及RNA,从而控制生物个体的性状(差异)表现。在一个个体当中所有的基因总和叫基因组。在一个物种中所有等位基因的总合叫基因库。在大多数真核生物中,基因分为细胞核基因及线粒体基因,绿色植物的叶绿体也含有独立于细胞核的叶绿体基因组。人类约有两万至两万五千个基因。[1]
在真核生物中,染色体在体细胞中是成对存在的。每条染色体上都带有一定数量的基因。一个基因在细胞有丝分裂时有两个对列的位点,称为等位基因,分别来自父与母。依所携带性状的表现,又可分为显性基因和隐性基因。
一般来说,同一生物体中的每个细胞体都含有相同的基因(除了已经分化的免疫细胞),但并不是每个细胞中的所有基因携带的遗传信息都会被表现出来。控制基因表达的因素分为传统的遗传学(增强子,启动子序列相关)因素及表观遗传学(DNA甲基化,组蛋白乙酰化和脱乙酰化及RNA干扰相关)因素。职司不同功能的细胞或不同的细胞类型中,活化而表现的基因也不同。在某一细胞类型当中所有被表达的基因叫转录组,所有编码蛋白质的基因叫蛋白质组。通过即时聚合酶链式反应或染色质免疫沉淀-测序可得到转录组及蛋白质组的信息。用电脑处理基因序列的学科叫生物信息学。
人类基因组计划(human genome project, HGP)是一项规模宏大,跨国跨学科的生物信息学项目。其宗旨在于测定组成人类染色体(指单倍体)的30亿个碱基对形成的核苷酸序列,从而绘制人类基因组图谱,并且识别其载有的基因,达到破译人类遗传信息的最终目的。该计划起始于公元1990年,并于公元2000年完成。
“基因(gene)”一词由丹麦植物学家、植物生理学家和遗传学家威廉·约翰森于1909年提出。[2]它的灵感来自古希腊语:γόνος(gonos),意味着后代和繁殖。