Loading AI tools
mutation génétique caractérisée par le doublement du matériel génétique sur un chromosome De Wikipédia, l'encyclopédie libre
En génétique, la duplication génétique correspond à la multiplication de matériel génétique sur un chromosome. Il existe plusieurs mécanismes qui résultent de la duplication soit d'une large portion chromosomique, soit d'un gène ou bien d'une suite nucléotidique. Ces remaniements du génome représentent un moteur important dans l'évolution des génomes. Le doublement d'un gène crée une copie supplémentaire dégagée de la pression de sélection, ce qui peut permettre à la copie de muer à nouveau sans conséquences nuisibles à l'organisme. C'est un des mécanismes importants de l'évolution moléculaire.
Cependant, dans de nombreux cas, ces altérations sont responsables de maladies génétiques à cause du surplus de données génétiques conduisant à des problèmes au cours du développement. De plus, l'amplification génique peut contribuer à la croissance d'une tumeur. Par exemple l'oncogène C-myc est souvent amplifié dans de nombreuses tumeurs[1],[2].
Au cours de leur évolution, plusieurs espèces eucaryotes ont subi une duplication complète de leur génome ; on parle alors de paléopolyploïdie. Par exemple, chez la Levure du boulanger (Saccharomyces cerevisiae), le génome s'est dupliqué il y a 100 millions d'années[3].
Il existe deux mécanismes permettant la duplication complète d'un génome :
Le génome de nombreuses plantes est polyploïde. On peut citer le blé qui est hexaploïde (6 copies de son génome). En 2007, une collaboration franco-italienne a permis de séquencer le génome de la vigne (Vitis vinifera) : l'ancêtre des plantes dicotylédones a subi plusieurs évènements de duplication de son génome après la divergence des monocotylédones et des dicotylédones ; la plante ancestrale dicotylédone devait être hexaploïde. L'hypothèse émise serait que cette duplication du génome est à l'origine de la radiation des plantes dicotylédones[4].
Le génome des Vertébrés a de même fait l'objet de trois multiplications[5] :
La duplication des génomes est rare car la modification de la dose génique chez un embryon est souvent létale. Par contre, 30 à 80 % des plantes sont polyploïdes et l'explosion du nombre d'espèces chez les angiospermes corrèle avec la duplication complète du génome d'une plante ancestrale. Cela s'explique par une plus grande tolérance au changement du nombre de chromosomes chez les angiospermes par rapport aux animaux[6]. Des duplications du génome récentes datant de moins de 150 ans ont été identifiées chez de nombreuses plantes tels que chez les salsifis où les espèces Tragopogon mirus et Tragopogon miscellus sont apparues il y a environ 80 ans par allotétraploïdie. Ces découvertes permettent de comprendre les conséquences phénotypiques et génétiques du changement de ploïdie[7].
De nombreuses preuves s'accumulent démontrant que pendant l'évolution des vertébrés plusieurs duplications complètes du génome ont eu lieu. Après l'explosion cambrienne il y a environ 450 millions d'années, une première duplication du génome d'un ancêtre des Chordés a eu lieu suivi environ 10 millions d'années plus tard au début de la période Dévonienne d'une deuxième duplication complète du génome. À la fin du Dévonien, une troisième duplication du génome a eu lieu chez les poissons à nageoires rayonnées.
Les premières estimations du nombre de gènes chez l'Homme ont montré que le génome des vertébrés est plus complexe que celui des invertébrés. Pour expliquer l'augmentation de la taille des génomes de vertébrés, Susumu Ohno proposa en 1970 que le génome des vertébrés est le résultat d'une ou plusieurs duplications complètes du génome[8]. Aujourd'hui, cette hypothèse est connue sous le nom d'hypothèse 2R (2 Round) car elle stipule qu'il y a 450 millions d'années une espèce vertébrée ancestrale a subi deux évènements de duplication du génome[9]. Au cours des années 90, cette hypothèse fut extrêmement discutée car les vestiges des duplications géniques disparaissent avec l'évolution. Cependant, aujourd'hui cette hypothèse a recueilli de nombreuses preuves génétiques et phylogénétiques[10]. Un des premiers arguments fut l'absence de liaison entre la plupart des gènes paralogues. En effet, à la suite d'une duplication segmentale les gènes dupliqués sont présents sur le même chromosome et donc génétiquement liés. Par contre, à la suite d'une duplication du génome, les gènes dupliqués se trouvent sur des chromosomes différents. Enfin, l'argument majeur en faveur de l'hypothèse 2R est venu de l'étude des complexes de gènes Hox qui suivent la règle 4:1 c'est-à-dire qu'il existe un complexe Hox chez les invertébrés et quatre complexes Hox chez la plupart des vertébrés qui serait le résultat de deux événements de duplication du génome.
Un complexe Hox est un ensemble de gènes homéotiques groupés sur un chromosome codant des facteurs de transcription essentiels à l'établissement de l'axe antéro-postérieur et l'identité segmentaire chez les animaux. Les quatre complexes Hox chez l'Homme sont sur les chromosomes 2, 7, 12 et 17. À proximité de chaque complexe se trouve un gène paralogue appartenant à la famille Dlx, Collagen et/ou ErbB. Ainsi, le paralogon Hox correspond aux complexes Hox associés aux gènes paralogues situés à proximité du complexe Hox. La présence de plusieurs gènes paralogues à proximité des complexes Hox est un argument majeur de l'hypothèse 2R. Cependant, des analyses phylogénétiques ont montré que certains gènes paralogues et les gènes Hox avaient une histoire évolutive différente ce qui contredit l'hypothèse 2R. Récemment, une étude propose que deux translocations réciproques au sein des complexes Hox intervenues après la deuxième duplication complète du génome expliqueraient les différences d'évolution au sein du paralogon Hox[11].
En 1998, sept complexes Hox ont été identifiés chez le poisson zèbre Danio rerio. Les auteurs de cette étude proposèrent qu'après les deux duplications de génome survenues chez un vertébré ancestral, un troisième évènement de duplication du génome eut lieu spécifiquement chez les poissons téléostéens qui donna huit complexes Hox suivi de la perte d'un complexe Hox[12].
En 2005, une équipe canadienne démontra qu'il existait chez le saumon de l'Atlantique et la truite en arc-en-ciel qui appartiennent à la famille des salmonidés, quatorze complexes Hox suggérant une nouvelle duplication du génome spécifique de la famille des salmonidés[13].
La duplication est parfois décrite comme une trisomie partielle. Il existe 2 types de duplication :
On peut également distinguer les duplications :
De nombreux syndromes résultent de la duplication d'un segment de chromosome, tel que le syndrome de Beckwith-Wiedemann ou la maladie de Charcot-Marie-Tooth type 1. Bien que souvent délétère pour un organisme, l'analyse des génomes de nombreuses espèces, et notamment le génome humain, a révélé la présence de nombreuses régions dupliquées.
Le séquençage et l'analyse du génome humain ont révélé que de grosses portions de chromosomes étaient similaires[14]. 400 segments de chromosomes pendant l'évolution des primates ont subi de nombreux évènements de duplication intrachromosomiques (entre chromosomes identiques) et interchromosomiques (entre chromosomes différents) dont certaines, qui représentent 5 % du génome, sont spécifiques du génome humain. Ces segments dupliqués de chromosome sont localisés préférentiellement près des télomères et des centromères. Par ailleurs, ces régions dupliquées sont sensibles aux réarrangements chromosomiques et sont le site de cassures de translocations, délétions ou inversions[15]. Cependant, bien que délétères, les fragments de chromosomes dupliqués sont proportionnellement transcriptionnellement plus actifs que les régions uniques des génomes de primate. De plus, ces duplications répétées ont créé de nouvelles familles géniques uniques chez les hominoïdes[16].
8,8 % du chromosome 15 correspond à des segments de chromosomes dupliqués dont 50 % sont des duplications intrachromosomiques[17]. Par exemple, dans la région 15q, une séquence « cœur » de 2920 paires de base a été identifiée. Elle est répétée 37 fois sur le chromosome 15, 2 fois sur le chromosome Y et une fois sur le chromosome 2 et 10. L'analyse des différentes séquences de cette portion de chromosome « cœur » a permis de récapituler l'histoire de cette séquence puisque le génome du chien et de la souris ne contiennent qu'une seule copie de cette séquence « cœur » sur le chromosome correspondant au chromosome 2 humain. Ainsi, cette séquence a été copiée par rétrotransposition sur le chromosome 10, puis un fragment plus important de 15 Kilobases a été copié sur le chromosome 15. Ce segment d'ADN de 15 Kb s'est ensuite dupliqué plusieurs fois sur le chromosome 15. Les deux copies de la séquence « cœur » initiale sur le chromosome Y est le résultat de la copie d'une séquence de 40 kb originaire du chromosome 15. Comme mentionné précédemment, les régions dupliquées sont des portions de chromosome fragiles et sensibles aux réarrangements chromosomiques. Les délétions chromosomiques dans la région dupliquée 15q11-q13 sont la cause des syndromes Prader-Willi et Angelman.
Le syndrome de Beckwith-Wiedemann est caractérisé par une grande taille, une macroglossie et une organomégalie, et résulte dans un grand nombre de cas d'une duplication de la région terminale du chromosome 11 paternel. Cette région chromosomique contient deux gènes essentiels à la régulation de la croissance; les gènes IGF2 et H19. IGF2 est un facteur de croissance stimulant la prolifération cellulaire et H19 code un ARN non codant. L'expression de ces gènes est extrêmement régulée par un mécanisme complexe d'empreinte parentale. Sur le chromosome maternel, le gène IGF2 est réprimé et H19 est exprimé alors que sur le chromosome paternel, le gène IGF2 est exprimé et H19 réprimé. Le syndrome résulte d'une duplication partielle de la partie terminale du chromosome 11 paternel. Cette duplication apporte une copie supplémentaire du gène IGF2 sur le chromosome 11 conduisant à une augmentation de la production du facteur de croissance IGF2.
Un gène particulier peut être dupliqué au cours de l'évolution. Il existe quatre principaux mécanismes permettant la duplication d'un gène ou de quelques gènes :
Les duplications de gènes sont des évènements extrêmement fréquents. Ainsi, le nombre de répétitions d'un même gène peut varier entre les individus de la même espèce, formant ainsi un polymorphisme du nombre de répétitions. L'augmentation du nombre de gènes est cependant contrebalancée par une perte de gènes elle aussi assez forte, principalement par dérive génétique, mais aussi par contre-sélection de l'augmentation de la concentration en protéines générée par l'augmentation du nombre de gènes codant cette protéine.
Il existe cinq scénario évolutifs faisant suite à une duplication génique :
Au cours de l'évolution des génomes, les gènes peuvent fusionner ou bien se fissurer. Une des conséquences de la subfonctionnalisation d'un gène dupliqué peut être la fission d'un gène en deux gènes différents. En effet, dans le cas où le gène originel code une protéine avec deux domaines fonctionnels distincts notés I et II, l'un des gènes dupliqués accumule des mutations (dégénération) dans la région correspondant au domaine II alors que le second gène accumule des mutations dans la région correspondant au domaine I. Il en résulte un gène 1 codant une protéine avec le domaine I et un second gène codant une protéine avec le domaine II. Ce mécanisme de fission génique a été mis en évidence chez la drosophile au cours de l'étude du gène Monkey-king[20].
L'isolement reproductif est un processus essentiel à la spéciation car elle permet d'amorcer la divergence et le maintien d'espèces distinctes. Si deux espèces proches sont adaptées à des environnements différents, leurs hybrides seront moins bien adaptés à ces environnements : on parle de faiblesse hybride. Ce phénomène peut être expliqué par le modèle Dobzhansky-Muller d'incompatibilité génique développé par Theodosius Dobzhansky en 1936 et Herman Joseph Müller en 1942. La redécouverte des travaux de William Bateson a amené certains auteurs à parler de modèle Bateson-Dobzhansky-Muller[21]. Le modèle propose que les interactions épistatiques négatives entre deux locus conduit à la faiblesse hybride. En 2000, Michael Lynch et Allan G. Force ont adapté le modèle d'incompatibilité génique à la duplication génique[22]. Ils proposèrent qu'à la suite d'une duplication génique, la perte génique réciproque est un facteur entrainant l'isolement reproductif. Ainsi, ce modèle expliquerait la corrélation entre des évènements de duplication complète du génome et la radiation évolutive de certains phyla. Par exemple, il a été démontré que chez l'ancêtre de la levure de boulanger, qui a subi une duplication complète du génome, la perte rapide des gènes dupliqués a favorisé l'émergence de nombreuses espèces de levures par un mécanisme d'incompatibilité génique[23].
Les microARNs sont des ARN simple-brins de 21-23 nucléotides de long qui régulent l'expression génique post-transcriptionnellement. Chez la plante Arabidopsis thaliana, il existe une classe de microARNs qui présentent une forte homologie de séquence avec leurs gènes cibles et apparurent récemment au cours de l'évolution. Ces microARNs sont le résultat de duplications géniques inversées.
La duplication en tandem d'exons correspond à une duplication interne d'un exon au sein du même gène. Ce type de duplication est une source d'innovation importante car il permet de générer au sein d'une même protéine de nouvelles fs. Une analyse complète des génomes d'Homo sapiens, de Drosophila melanogaster et du ver Caenorhabditis elegans ont montré 12291 cas de duplication en tandem d'exons. L'analyse des régions introniques a également mis en évidence 4660 exons dupliqués non caractérisés. Parmi ces exons potentiels, 35,1 % sont retrouvés dans les banques de données d'EST confirmant leur rôle potentiel[24].
La réplication de ces paires de base est à l'origine de nombreuses maladies génétiques tels que le Syndrome de l'X fragile ou bien la Chorée de Huntington. Chez la bactérie Streptococcus pneumoniae, la duplication de 18 paires de base dans le gène rplV qui code la protéine ribosomique L22 est responsable de la résistance au macrolide. Cette duplication génère une duplication de 6 acides aminés à proximité du site d'interaction de la macrolide sur la sous-unité 23S du ribosome bloquant ainsi l'interaction de l'antibiotique avec le ribosome[25].
L'analyse des génomes procaryotes a révélé de nombreux gènes paralogues. Suivant les espèces bactériennes, la proportion de gènes paralogues varie de 7 % du génome chez Rickettsia conorii à 41 % chez Streptomyces coelicolor. Sur l'ensemble des 106 génomes bactériens séquencés en 2004, en moyenne 25 % du génome bactérien est constitué de gènes paralogues. Il existe également une corrélation très forte entre la taille du génome bactérien et la proportion de gènes dupliqués[26].
Il existe trois mécanismes de duplication génique chez les procaryotes :
Chez Escherichia coli K12, 16 % des gènes homologues sont xénologues suggérant que le transfert horizontal de gène a un faible impact sur la proportion de gènes paralogues. En moyenne, 15 % des gènes paralogues sont organisés en tandem suggérant des évènements de duplication génique en tandem qui peuvent résulter en la duplication d'opéron.
Chez les procaryotes, aucune duplication ancestrale complète du génome n'a été mise en évidence. Cependant, certaines bactéries sont polyploïdes au cours d'un stade de développement telles que Buchnera aphidicola dont le nombre de copies du génome varie en fonction du stade de développement de son hôte, le puceron vert du bois[27].
La plupart des génomes eucaryotes portent un nombre important de gènes dupliqués fonctionnels dont une grande majorité serait apparue il y a 10 à 100 millions d'années[28]. À la suite d'événements massifs de duplication, de l'ordre de 20 à 50 % des gènes dupliqués sont conservés. Cette conservation suggère l'existence d'un mécanisme de sélection naturelle qui compenserait la production de pseudogènes. Après une duplication, il peut y avoir une séparation des fonctions ancestrales entre les deux copies, par exemple dans des tissus différents (phénomène dit de sous-fonctionnalisation) ; une apparition d'une nouvelle fonction pour une des copies (phénomène dit de néofonctionnalisation) ; chaque copie peut connaître une perte ou une réduction de l'expression de ses fonctions par des mutations dégénératives[29].
L'évolution du génome bactérien est profondément influencée par des échanges géniques entre différentes espèces bactériennes. En effet, l'évolution des voies métaboliques chez E.coli résulte principalement d'échanges géniques horizontaux[30].Cependant, la duplication génique semble également contribuer à l'évolution bactérienne. Les gènes préférentiellement dupliqués sont impliqués dans le métabolisme des acides aminés, des ions inorganiques et la régulation transcriptionnelle. Chez certaines espèces, l'expansion génique d'une catégorie de gènes a été proposée comme étant une adaptation évolutive. Par exemple, la complexité de la paroi bactérienne chez les mycobactéries peut être expliquée par une duplication spécifique à ce genre bactérien des gènes impliqués dans le métabolisme et le transport des lipides.
Les bactéries peuvent s'adapter à la toxicité d'un antibiotique grâce à une grande batterie de mécanismes résultant soit de mutations ponctuelles ou bien d'un transfert horizontal de gènes. Les mécanismes principaux de résistance sont :
L'adaptation d'une bactérie à un antibiotique s'effectue en deux étapes :
Les amplifications géniques sont instables et peuvent être perdues en absence de pression de sélection par recombinaison homologue. Ainsi, les gènes dupliqués peuvent être maintenus dans des souches bactériennes où la protéine Rec A est déficiente. Cependant, il existe des mécanismes de perte de gènes dupliqués indépendants de Rec A qui sont peu connus[31].
Au début des années 1970, la découverte des plasmides R porteurs de gènes de résistances aux antibiotiques a permis de mettre en évidence pour la première fois le rôle de la duplication génique dans le phénomène de résistance aux antibiotiques. Le plasmide NR1 augmente en taille chez Proteus mirabilis en présence de faible concentration de chloramphénicol, streptomycine et sulfonamide. La région amplifiée du plasmide est appelée déterminant-r (r pour résistance) et est flanquée par des séquences répétées directes IS1 (Insertion Sequence 1) qui permettent l'amplification de la région grâce aux homologies de séquence entre les séquences IS1 entrainant une recombinaison homologue entre chromatides sœurs[32],[33]. Dans de nombreuses bactéries, la résistance associée à l'amplification génique sur un plasmide est souvent associée à la présence de séquence IS. Cependant, il existe quelques cas où des régions homologues imparfaites peuvent permettre l'amplification de gènes de résistances tel que l'amplification du gène tetL sur le plasmide pAMα1 qui confère la résistance à la tétracycline chez Enterococcus faecalis[34].
L'amplification des gènes chromosomique est similaire à celle observée sur les plasmides bactériens. Par exemple, il a été observé une amplification de la β-lactamase chez Escherichia coli et Yersinia enterocolitica conférant une résistance aux β-lactamines par des mécanismes dépendants et indépendants de la protéine Rec A[35]. Cependant, il existe des exemples particuliers où seulement quelques paires de base sont dupliquées. Chez Staphylococcus aureus et Yersinia enterocolitica, la duplication du site d'entrée du ribosome du gène de résistance aux macrolides appelé ermA (pour erythromycin resistance methylase A) entraine une stimulation de la traduction de ermA[36]. Enfin chez la bactérie Streptococcus pneumoniae, la duplication de 18 paires de base dans le gène rplV qui code la protéine ribosomique L22 est responsable de la résistance aux macrolides. Cette duplication génère une duplication de 6 acides aminés à proximité du site d'interaction de la macrolide sur la sous-unité 23S du ribosome bloquant ainsi l'interaction de l'antibiotique avec le ribosome[25]. La plupart des amplifications géniques conférant des résistances aux antibiotiques ont été induites dans les laboratoires de recherche. Au cours d'essai clinique, l'identification d'amplification génique est assez rare probablement due à l'instabilité des amplifications géniques. Lors d'un criblage de souches de Streptococcus agalactiae, deux souches résistantes aux sulfonamides et au triméthoprime ont été isolées avec une amplification contenant l'opéron folCEPBK impliqué dans la synthèse de la vitamine B9[37].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.