C1 - Nouvelles techniques d\'exploration du génome PDF

Title C1 - Nouvelles techniques d\'exploration du génome
Author Grant Talbot
Course Génétique
Institution Université Le Havre Normandie
Pages 7
File Size 454.6 KB
File Type PDF
Total Downloads 93
Total Views 144

Summary

C1 - Nouvelles techniques d'exploration du génome...


Description

UE spé : GENETIQUE

COURS

Nouvelles techniques d’exploration du génome : HISTOIRE DE LA GENETIQUE : La génétique au-delà de la génétique médicale, est en fait une discipline récente. Séquencer un génome humain a nécessité 10 ans (en débutant en 1994 et achevé en 2003). Si, jusqu’en 2004, la génétique était une génétique qui s’intéressait à des régions du patrimoine, il y a eu une rupture technologique à partir de 2004 et on est passé dans une phase génomique : nous avons des techniques qui permettent d’étudier la totalité des génomes dans leur complexité. Il existe deux méthodes d’exploration du génome :  les puces à ADN ou CGH  et le séquençage de nouvelle génération (il est possible maintenant de séquencer un génome humain en quelques semaines pour un millier d’euros).  Ce sont des méthodes globales et non spécifiques. TAILLE DES GENOMES :

Levure S. Cerevisiae Nématode C. elegans Mouche D. melanogaster Homo sapiens Plante Paris japonica

Taille (pb) 1,3 x 107 1 x 108 1,5 x 108 3 milliards 149 x 109

Nombre de gènes 6 000 19 000 13 000 23 000

L’espèce humaine : 3 milliards de paire de base (environ 23 000 gènes). Lorsqu’on parle de génome, c’est l’ensemble de la pelote d’ADN alors que si l’on veut être stricte le génome désigne l’ensemble des gènes. Il représente 25% de l’ADN nucléaire. L’exome (l’ensemble des exons) est de 160 000 exons des 23 000 gènes. Cela représente 34Mb (34 millions de base) soit 1,2% du génome. L’espèce humaine n’est pas la plus complexe (la plante Paris japonica possède 149 milliards de paire de base). La complexité augmente avec les eucaryotes. Homo sapiens est une espèce complexe. I.

La CGH : Comparative Genomic Hybridization

C’est donc la première méthode :  aujourd’hui utilisée en routine  qui n’est pas une méthode ciblée sur une région génomique  qui analyse l’ensemble du génome. CGH = hybridation à l’échelon génomique de type comparative. La CGH utilise les puces à ADN. L’objectif de la CGH est de déterminer pour chacun de nos segments génomiques et en particulier chacun de nos gènes, le nombre de copies (pèse le nombre de copies). Elle remplace dans une majorité des cas, le caryotype. Les éléments nécessaires à une CGH :  C’est une méthode comparative, donc on a besoin de deux types d’ADN :  un ADN à analyser  un ADN contrôle qui possède a priori le nombre « normal » de copies de segments géniques. La notion de contrôle et donc de normalité n’a aucun sens en génétique. On fait donc un mélange : on prend une dizaine d’ADN que l’on mélange.

Page 1 sur 7

UE spé : GENETIQUE 

COURS

Chaque ADN sera fragmenté et l’ensemble des fragments de l’ADN provenant soit de l’ADN témoin, soit de l’ADN analysé, seront colorés avec des fluorophores. On a besoin de deux fluorophores :  En vert, tous les fragments d’ADN venant du sujet-contrôle  En rouge, l’ensemble des fragments d’ADN à analyser.

Donc pour une CGH :  Le 1er élément utilisé : deux types d’ADN (l’ADN analysé et l’ADN contrôle) respectivement marqué avec deux fluorophores et donc c’est bien l’ADN qui est marqué.  Le 2ème élément utilisé est représentatif de l’essor technologique et qui est le produit des nanotechnologies : c’est la puce à ADN. C’est une lame de verre. C’est en fait une lame qui est percée de puits microscopiques (d’un très grand nombre de puits, jusqu’au million de puits). C’est le support physique de la réaction.  Dans chacun des puits, on trouve des oligonucléotides (taille variable, environ 60 nt, courte molécule de synthèse qui est une molécule d’ADN simple brin). Dans chaque puit, nous avons un oligonucléotide différent qui représente une séquence unique et qui n’est pas colorié. Chaque oligonucléotide (plus grand que ceux utilisés en PCR : ce sont des 60 mer) va reproduire un petit fragment du génome. Chaque oligonucléotide va représenter une version fragmentée, en pointillée, du génome humain, une petite région du patrimoine génétique humain. Le principe de la CGH est de procéder à une hybridation comparative : ce qui va être utilisé comme sonde est l’ensemble des fragments d’ADN colorés en vert et en rouge. Pour réaliser une hybridation qui consiste à la construction d’une double chaine d’ADN, il faut que les partenaires soient simple brin : les oligonucléotides sont simples brins et pour que l’ensemble des fragments d’ADN témoins ou du sujet à analyser colorés soit prêt à être hybrider, il suffit de les chauffer et de les dénaturer et on obtient des fragments d’ADN simple brin coloriés en rouge ou en vert. On dépose sur la lame avec la même quantité, l’ADN témoin fragmenté simple brin et coloré en vert et l’ADN à analyser fragmenté, simple brin et coloré en rouge. On parle d’hybridation comparative, car l’ensemble des sondes se déposent sur la lame. Après cette opération, ne resteront que les fragments qui sont hybridés de façon spécifique. Si pour un segment génomique donné, on a la même quantité d’ADN, (même nombre de copie entre le tube contrôle et le tube à analyser) alors ces ADN s’hybrideront avec la même force sur l’oligonucléotide correspondant. Ainsi on aura la même quantité de rouge et de vert qui s’hybrideront et la superposition des 2 donne une couleur jaune orangé (le signal est une couleur).

Si à l’inverse, dans l’ADN à analyser il y a défaut de gène, on a moins de rouge donc plus de copies vertes et on aura un signal vert qui témoigne d’une délétion. S’il y a un excès de copies dans l’ADN à analyser, on aura un signal rouge. A l’issue d’une hybridation, on a un aspect en nid d’abeille. La lecture se fait par un scanner qui fait une lecture et détecte la couleur de chaque puit. Comme on connait, pour chaque puit, l’identité du nucléotide, on pourra avoir une vue panoramique du génome. 244k = 60 mer = 244 000 oligonucléotides en routine = 244 000 puits MicroArrays Agilent = Sureprint Technology (HP) : synthèse des oligonucléotides de 60 mer sur lame : détournement de l’utilisation des imprimantes pour fabriquer des lames de puces à ADN. Le scanner, en quelques heures, analyse toute l’hybridation sur la lame et va présenter les résultats : un caryotype virtuel. Sur la barre en pointillé, chaque rond correspond à une sonde. Pour chaque sonde proche de la barre en pointillé (= 1), l’hybridation s’est effectué de même force donc nombre de copies normale. S’il y a un excès de vert alors hybridation préférentiel de l’ADN témoin donc cela traduit un déficit du nombre de copie (délétion). Si on a un excès de rouge, alors il y a un excès du nombre de copies. L’ordinateur permet de dire l’identité de l’oligonucléotide et donc des gènes. Page 2 sur 7

UE spé : GENETIQUE

COURS

Cette CGH est une méthode très puissante. Les inventions technologiques ne sont pas extraordinaires, mais assez simple dans leur idée mais leur fonction est extraordinaire. L’idée du colorage préférentiel fonctionne très bien. Actuellement, l’examen de référence est la CGH et non le caryotype. Un certain nombre de maladies est dû à un excès de copies. Résumé : La CGH : méthode d’hybridation comparative dans laquelle ce sont les ADN que l’on analyse qui sont coloriés et non les oligonucléotides qui représentent en pointillé l’ensemble du génome et c’est la déviation d’une couleur qui nous indique s’il existe une délétion ou un gain de copies. Cette méthode ne permet pas de séquencer mais permet de déterminer pour n’importe quelle région génomique s’il y a le nombre attendu de copies ou une anomalie (délétion ou duplication à l’origine de maladies). La CGH est une méthode pangénomique car elle englobe l’intégralité de la molécule d’ADN et aussi une méthode quantitative. APPORT DE LA CGH : DETECTION DES CNV L’importance de la variabilité de nos gènes est une idée récente (2004). Pour beaucoup de nos gènes et de façon générale de nos segments génomiques, le nombre de copies est très variable : 0, 1, 2, 3, 4, 5 jusqu’à 8. Avoir un nombre de copies de nos gènes différents de 2 n’est pas anormale. Toute variation du génome (CNV) n’est pas anormale. Donc l’intérêt de la CGH a été de nous faire découvrir ce type de polymorphisme : CNV (Copie Number Variation : variabilité du nombre de copies de gènes). Le nombre de copies est variable et est une source majeure de polymorphisme : plusieurs milliers de CNV par personne (1000 CNVs par génome). Une variation du nombre de copies peut être délétère ou pas. Sur le plan de la taille, elle est extrêmement variable. Ces variations de copies peuvent correspondre à 50 pb à quelques Mb : 1 ou plusieurs gènes. Cette variabilité du génome humain est spécifique des primates et va continuer à augmenter. Ces CNV parfois contiennent des gènes et à ce moment-là, ce sont des gènes sélectionnés dans l’évolution. Ce sont des gènes impliqués :  Adaptation alimentaire  perception sensorielle  détoxification  réponse immunitaire Les CNV sont des variations normales du nombre de copies, source majeure de polymorphisme et dont l’importance a été révélée par la CGH. C’est un mécanisme clé de l’adaptabilité d’ homo sapiens à l’environnement :  Infections +++  Modifications des comportements alimentaires On sait maintenant que la plupart des polymorphismes sont apparus récemment. L’explosion démographique qui date de 10 000 ans a été à l’origine d’une grande variabilité à l’origine de différence entre les groupes de population. Les CNV peuvent ne pas être impliqué dans des maladies génétiques mais une combinaison des CNV peut avoir un rôle dans les maladies multifactorielles : autisme, schizophrénie, maladie auto-immunes. APPORT DE LA CGH : CARACTERISATION DES MALADIES GENOMIQUES L’apport de la CGH dans le domaine des maladies génétiques : la CGH est un instrument de routine pour détecter des maladies génétiques, maladies intermédiaires qui se situent entre les maladies chromosomiques et les maladies géniques : les maladies génomiques qui touche un segment de chromosome et concerne un ou plusieurs gènes.

Page 3 sur 7

UE spé : GENETIQUE

COURS

Parfois un CNV peut être à l’origine de maladies génomiques (duplication de segment génomique) dans le cadre :  de retard mental +++  des syndromes polymalformatifs ++  de mort fœtale in utero  de fausses couches récidivantes La CGH peuvent donc détecter des variations normales ou délétères et faire le diagnostic de maladies génomiques. Lorsqu’on parle de maladie génétique, on a tendance à considérer qu’elles sont dues à une cause génétique. Le déterminisme n’est pas simple : c’est un déterminisme oligogénétique (double combinaison pour un certain nombre de maladies génétiques 1 CNV + 1 CNV ou 1 CNV + 1 SNV, etc). Un CNV qui est à l’origine d’un retard mental, n’aura pas le même impact d’une famille à l’autre. Les variations du nombre de copies peuvent être à l’origine de maladies génétiques (maladies génomiques) et contribueront à un déterminisme oligogénétique. II.

La révolution du séquençage de nouvelle génération (New Generation Sequencing, NGS) :

Les nouvelles technologies apparaissent en 2005. Depuis 2007, ces appareils sont arrivés en masse dans les laboratoires et ont la possibilité de séquencer l’intégralité du génome en quelques semaines pour un millier d’euros. Aujourd’hui en génétique médicale, en génomique, toute la biologie du vivant, ce séquençage de nouvelle génération ou NGS est la plus grande évolution technologique au cours des dix dernières années. On change d’ordre de grandeur. Cette technique a été développée en 2009. Elle est à l’origine de la médecine génomique qui est l’optimisation du diagnostic des maladies, du traitement des maladies, et de la prévention des maladies en fonction des variations génétiques individuelles (maladies génétiques, cancer). Avant le NGS, le séquençage était ciblé, on amplifiait une région d’intérêt puis on analysait par la méthode de Sanger. En Sanger, on analyse par 500 paires de bases. En 2013, lorsque l’on dit que l’on séquence l’intégralité du génome, ce n’est pas tout à fait exact : le symbole de la NGS est l’exome c'est-à-dire l’ensemble des exons d’un gène. L’exome humain : Il y en a environ 160 000 exons = 30 Mb = 30 millions de paires de base alors que le génome humain complet = 3 milliards de paire de base donc les exons représente 1,2% du génome humain. Ces techniques permettent d‘analyser l’exome humain qui fait donc 30 Mégabase. Dans le NGS, chaque base est lue de multiple fois pour plus de sécurité, au moins une centaine de fois : c’est la notion de profondeur du séquençage. Avec une profondeur de 100, l’exome humain qui fait 30 Mb, fait 3000 Mb soit 3 Gb. Les appareils de séquençage génèrent des données de l’ordre du Gigabase donc de l’ordre du milliard de base même si on se limite à l’exome. En passant du séquençage de Sanger au séquençage de nouvelle génération, on perd la notion de paire de base ou de kilo paire de base mais on est passé à la notion de Mb ou de Gb : on augmente d’un facteur un million. Ces technologies de nouvelles générations sont essentielles, elles permettent une analyse globale de l’exome ou du génome. La puissance de ces analyses a pour intérêt d’appréhender la complexité du génome humain dans sa totalité mais aussi d’analyser en masse simultanément plusieurs gènes. La NGS est une méthode d’analyse pangénomique et qualitative.

Page 4 sur 7

UE spé : GENETIQUE

COURS

Etapes du NGS : 1. Constitution d’une librairie de fragments d’ADN 2. Amplification clonale de tous les fragments : chaque fragment d’ADN est amplifié de façon sectorisée 3. Séquençage parallèle en masse et de multiples fois 50x, 100x, 1000x (profondeur) : tous les fragments amplifiés sont séquencés en masse de façon parallèle 4. Analyse bio-informatique 1. Préparation d’une bibliothèque de fragments d’ADN : fragmentation de l’ADN On a l’ADN d’un individu : l’exome. La 1ère étape est de fragmenter de façon contrôlée et on utilise pour ça un sonicateur qui émet des ultrasons pour casser l’ADN. Après avoir généré ces fragments, on va ajouter des adaptateurs qui sont des oligonucléotides de synthèse double brins et dont on connait leur séquence. Le but est que chaque fragment d’ADN aura une séquence nucléotidique connu. Puis enrichissement par capture des régions d’intérêt : Dans cette étape, on réalise un enrichissement par capture des régions qui nous intéressent. Si on souhaite séquencer les exomes, seulement les exons qui nous intéressent. La capture ciblée s’effectue par hybridation. Il faut pour capturer, utiliser des hameçons qui reproduisent les fragments d’ADN. Ces hameçons sont les cRNA (molécule d’ARN) : ils permettent d’hybrider avec plus de force les séquences d’ADN. Dans cette phase de capture, on va procéder à une capture par hybridation en phase liquide. On va dénaturer l’ADN et on va ajouter les différentes sondes qui contiennent les différentes régions d’ADN : on aura une hybridation entre chaque hameçon. Une fois que l’hybridation a eu lieu, on peut piéger les hameçons qui ont retenus les fragments d’ADN avec des aimants. Une fois que l’on a nos segments piégés sur les hameçons, il suffit de les chauffer pour les libérer (et les dénaturer en simple brin). La taille fait aux alentours de 200 paires de base. C’est un enrichissement et non une sélection

Résumé : Dans cette étape de préparation de librairie, l’ADN a été fragmenté et sur chaque fragment d’ADN a été ajouté un adaptateur et après, on a réalisé un enrichissement des régions d’intérêt. Cet enrichissement se fait par hybridation en phase liquide avec des hameçons qui permettent de piéger tous les exons du génome humain ou d’aller séquencer des gènes qui nous intéressent (les introns aussi si l’on veut). 2. Amplification clonale C’est cette étape qui est à l’origine du saut technologique. A l’issue de la préparation de l’ARN, on aura seulement les fragments d’ADN enrichis qu’il faut amplifier de façon clonale. 2 méthodes pour amplifier :  l’amplification clonale en émulsion dans microréacteurs :  l’amplification en ponts sur phase solide (technique prédominante)

Page 5 sur 7

UE spé : GENETIQUE

COURS

L’amplification clonale en émulsion dans microréacteurs :   

si l’on pulvérise de l’huile dans de l’eau, on aura des microgouttelettes d’huile et on fait en sorte qu’il y ait tous les réactifs pour les PCR dans chaque bulle d’huile. On forme des billes de « gouttelette d’huile » piégeant plusieurs fragments d’ADN liés aux adaptateurs par émulsion dans le but de procéder à l’amplification massive. méthode efficace mais ce n’est pas la méthode la plus utilisée pour des raisons de reproductibilité.

L’amplification en ponts sur phase solide : C’est la plus diffusée. La séparation de chaque fragment d’ADN est faite sur un support solide. Celui-ci possède des pics et chaque pic correspond à un oligonucléotide. Il y en a deux types (deux couleurs). Ils jouent le rôle d’hameçons fixes et ils correspondent à la séquence des adaptateurs. On dépose les fragments d’ADN sur la lame pour les piéger grâce aux pics complémentaires de l’adaptateur. Puis, on fait une étape de synthèse par le biais de la température pour avoir une extension complémentaire. Au bout d’un certain temps, la molécule se recourbe et va se fixer sur l’adaptateur correspondant. Cela forme un pont (ou cluster avec environ 600 000 clusters/mm²). Il peut alors y avoir une hybridation dans l’autre sens. A partir d’un fragment d’ADN, on peut donc en obtenir deux identiques. Eux peuvent reformer des ponts et ainsi de suite. Etapes de génération des clusters : hybridation, amplification, linéarisation puis blocage 3’ et hybridation Primer séquence

Les deux principes essentiels du NGS sont :  la séparation clonale  la lame va être introduite dans un séquenceur de nouvelle génération. La 2 ème étape qui est à l’origine d’une avancée technologique dans la technique de séquençage, on utilise des analogues aux didésoxyribonucléotides mais qui sont réversibles. Page 6 sur 7

UE spé : GENETIQUE

COURS

3. Séquençage parallèle en masse : Cette méthode permet de séquencer les 160 000 exons de l’exome humain. Chaque nucléotide étant séquencé plusieurs fois, on séquence des milliards de paires de base. L’élément qui a été un progrès est le fait de séparer chaque fragment de façon clonale et de les cloner séparément. Lorsqu’on va faire du séquençage, on va avoir besoin d’une amorce d’une séquence. L’avantage technologique de cette méthode est que l’on va utiliser des nucléotides artificiels : des didésoxyribonucléotides fluorescents. Ici, les nucléotides que l’on va utiliser vont permettre un arrêt de l’élongation mais un arrêt transitoire et réversible. Ce sont des nucléotides réversibles et cela permet de conserver chaque brin en extension. Cycle 1 :  ajout des réactifs de séquençage  incorporation de dNTP bloqué fluorescent réversible  détection du signal  clivage du bloqueur et du groupement fluorescent C’est une lecture de fluorescence en temps réel, par traitement informatique complexe. Il y a une émission à chaque nucléotide incorporé, et en fonction de la couleur du signal on peut déterminer quel est le nucléotide incorporé. Résumé :  Amplification par séquençage de masse avec amplification clonale préalable  et utilisation de nucléotides artificiels réversibles.

4. Analyse bio-informatique : Le séquençage à haut débit a sacralisé l’entrée en masse de toute la bio-informatique. On a besoin d’une aide informatique considérable. Toutes les données séquencées sont dans une armoire qui est 4 fois plus grande que le séquenceur luimême. L’informatique va d’abord sortir la séquence, puis elle va vérifier la qualité, puis être capable de faire un alignement des séquences (chaque nucléotide doit être reconnu comme un nucléotide humain) puis il y aura un travail qui va permettre d’analyser les données. L’expertise informatique est indispensable. On a besoin de l’informatique pour l’annotation des nucléotides, la filtration dans les données, la comparaison et le stockage des données.

Page 7 sur 7...


Similar Free PDFs