蛋白质家族
具有共同進化起源的一組蛋白質,反映在它們的序列相似性上 / 维基百科,自由的 encyclopedia
蛋白质家族(英语:Protein family)是一组与演化相关的蛋白质。在许多情况下,蛋白质家族具有相应的基因家族,其中每个基因编码具有1:1关系的相应蛋白质。
术语“蛋白质家族”的“家族”(Family)不应该与“科 (生物)”(英语:Family (biology))混淆,因为“科 (生物)”用于生物分类学。
家族中的蛋白质来自共同的祖先(见同源),通常具有相似的三维结构,功能和显着的序列相似性。其中最重要的是序列相似性(通常是氨基酸序列),因为它是同源的最严格指标,因此是共同祖先的最清晰的指标。使用序列比对方法评估一组序列之间的相似性的重要性存在相当完善的框架。不共享共同祖先的蛋白质不太可能显示统计学上显着的序列相似性,使序列比对成为识别蛋白质家族成员的有力工具。
有时候,家族有时被分组成更大的演化支称为蛋白质超家族,基于结构和机械相似性,即使没有可识别的序列同源性。
目前,已经定义了超过60,000个蛋白质家族[1],尽管在“蛋白质家族”定义中的歧义导致不同的研究人员在得到的蛋白质家族总数上有数量的变化。