Titulaire(s) : UNIVERSITE D'AUVERGNE - CLERMONT I Etablissement public,UNIVERSITE BLAISE PASCAL - CLERMONT-FERRAND II Etablissement public, CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE Etablissement public.
Demande(s) d’extension
Mandataire(s) : PONTET ALLANO & ASSOCIES.
METHODE DE DETECTION ET D'IDENTIFICATION IN VITRO D'UN OU PLUSIEURS MICRO-ORGANISMES IMPLIQUES DANS LE PROCESSUS DE DEGRADATION, DE MODIFICATION OU DE SEQUESTRATION D'UN OU PLUSIEURS CONTAMINANTS PRESENTS DANS UN ECHANTILLON BIOLOGIQUE.
FR 3 055 338 - A1
La présente invention concerne une méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, modification ou séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique, mettant en oeuvre une méthode de capture de gènes couplée à du séquençage haut-débit, la méthode de capture de gènes permettant la capture de fragments d'ADN ayant une longueur d'au moins 6 000 paires de bases.
METHODE DE DETECTION ET D’IDENTIFICATION IN VITRO D’UN OU PLUSIEURS MICRO-ORGANISMES IMPLIQUES DANS LE PROCESSUS DE DEGRADATION, DE MODIFICATION OU DE SEQUESTRATION D’UN OU PLUSIEURS CONTAMINANTS PRESENTS DANS UN ECHANTILLON BIOLOGIQUE.
DOMAINE TECHNIQUE
La présente invention concerne une méthode à haut débit de détection et d’identification in vitro d’un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d’un ou plusieurs contaminants présents dans un échantillon biologique.
ARRIERE-PLAN TECHNOLOGIQUE
Les micro-organismes, par leurs capacités d’adaptation liées à la diversité de leurs capacités métaboliques, jouent un rôle fondamental dans tous les processus biologiques. Ils interviennent notamment au niveau des changements globaux, comme le réchauffement climatique, en partie occasionné par les émissions croissantes de méthane dans l’atmosphère, mais également dans la réduction des pollutions résultant de la dispersion de molécules comme les Hydrocarbures Aromatiques Polycycliques (HAP). Ainsi, les communautés microbiennes participent à réduire ou à augmenter les effets délétères de l’anthropisation des écosystèmes. A ce jour, il est difficile d’évaluer la diversité microbienne des écosystèmes, dans la mesure où ces écosystèmes comprennent une quantité importante de micro-organismes différents, dont la plupart sont encore non cultivables ou non caractérisés. Les méthodes utilisées classiquement pour étudier les micro-organismes nécessitent d’isoler et de cultiver au préalable le microorganisme. De nouvelles techniques de séquençage (Séquençage de nouvelle génération (NGS)) permettent aujourd’hui d’étudier directement l’ADN total extrait d’un environnement. Ces technologies, de par leur très haut-débit et leur coût réduit, permettent l’obtention d’une information de séquence très importante et extraite à partir de communautés microbiennes complexes. Cependant, pour explorer les environnements dans leur globalité, l’effort de séquençage reste encore insuffisant même avec les capacités actuelles des NGS. De même, la quantité importante de données générées, tout comme la taille réduite des lectures ou encore le taux d’erreur de séquençage restent des problèmes majeurs pour les étapes d’assemblage. Compte-tenu de ces inconvénients majeurs, il est impossible avec les techniques actuelles d’identifier avec précision tous les micro-organismes, suite à la caractérisation de gènes jouant le rôle de marqueurs phylogénétiques ou de marqueurs fonctionnels. Ces mêmes difficultés voient le jour pour la caractérisation ciblée de grandes régions génomiques regroupant plusieurs marqueurs géniques, voire pour la reconstruction de génomes complets.
La demande internationale WO2015/105993 (AgBiome Inc) décrit une méthode d’identification de gènes d’intérêts mettant en oeuvre une étape de capture de gènes par hybridation, suivie d’une étape de séquençage pour identifier lesdits gènes d’intérêts dans un échantillon environnemental. Toutefois, la méthode décrite dans la demande internationale WO2015/105993 nécessite l’utilisation de sondes chevauchantes pour procéder à la capture de fragments d’ADN et est limitée à la capture de fragments d’ADN de longueur maximale égale à 1800 nucléotides. De plus, l’approche ne permet pas forcément d’identifier des gènes complets et encore moins des séquences nucléiques comprenant plusieurs gènes, voire de nouveaux gènes ou des génomes complets. La méthode décrite dans la demande internationale WO2015/105993 ne permet que d’identifier des gènes proches des gènes ciblés, ni même d’identifier de gènes divergents, voire de nouveaux gènes.
Par conséquent, il apparaît nécessaire de disposer d’une méthode à haut débit permettant d’évaluer la diversité microbienne des écosystèmes en détectant et en identifiant de manière plus spécifique et plus sensible les populations de microorganismes impliqués dans les processus de dégradation, de modification ou de séquestration d’un ou plusieurs contaminants, avec notamment les micro-organismes appartenant à la biosphère rare et les populations microbiennes non cultivables à ce jour.
DESCRIPTION DETAILLEE
Les demandeurs proposent donc une nouvelle méthode de détection et d’identification in vitro d’un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d’un ou plusieurs contaminants présents dans un échantillon biologique.
Un objet de l’invention est donc une méthode de détection et d’identification in vitro d’un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d’un ou plusieurs contaminants présents dans un échantillon biologique, ladite méthode comprenant les étapes suivantes :
a) la préparation d’un mélange de sondes capables de cibler spécifiquement un ou plusieurs gènes d’intérêts impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants,
b) la préparation d’une banque de fragments d’ADN à partir de l’échantillon biologique, lesdits fragments d’ADN contenus dans la banque ayant une longueur d’au moins 6 000 paires de bases,
c) l’hybridation des fragments d’ADN obtenu à l’étape b) par mise en contact desdits fragments d’ADN avec le mélange de sondes de l’étape a),
d) la capture des complexes d’hybridation de l’étape c),
e) le séquençage des fragments d’ADN capturés à l’étape d),
f) la reconstruction des gènes d’intérêts et/ou du génome du ou des microorganismes à partir des fragments d’ADN capturés séquencés de l’étape e), et
g) l’identification du ou des micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l’échantillon biologique.
La méthode selon l’invention permet de capturer des fragments d’ADN ayant une longueur d’au moins 6 000 paires de bases. Grâce à cette nouvelle méthode, les inventeurs sont capables d’identifier à la fois les séquences connues et inconnues d’un ou plusieurs gènes d’intérêts impliqués dans les processus de dégradation dudit ou desdits contaminants, de reconstruire de grands fragments de génomes contenant le ou les gènes d’intérêts, et d’identifier le ou les micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l’échantillon biologique. Cette méthode, tout en permettant d’explorer de manière exhaustive la diversité génétique de gènes d’intérêts, présente l’avantage d’assurer l’identification des régions flanquantes associées aux séquences ciblées. Il est alors possible, par la caractérisation de grandes régions d’ADN, de mettre en évidence des organisations génomiques connues ou inconnues, voire de reconstruire de nouveaux génomes et donc d’identifier de nouveaux micro-organismes avec de nouveaux gènes pouvant avoir un rôle dans une voie métabolique donnée. De plus, la présente méthode permet de s’affranchir de l’utilisation de sondes chevauchantes. De ce fait, il n’est pas nécessaire d’avoir une connaissance initiale exhaustive de la séquence complète des gènes à capturer. L’approche permet de révéler des gènes inconnus.
La méthode selon l’invention est capable de détecter et d’identifier un ou plusieurs microorganismes impliqués dans le processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants chimiques présents dans un échantillon biologique. Par « micro-organisme » ou « microbe », il est entendu tout organisme unicellulaire eucaryote (protiste), tel que les champignons dont les levures, les microalgues, les protozoaires, ou procaryote, tel que les bactéries et les archées. Avantageusement, les micro-organismes selon l’invention peuvent être des bactéries, en particulier les bactéries exprimant le ou les gènes d’intérêt recherchés. Avantageusement, les bactéries selon l’invention peuvent être des bactéries Gram positif (monoderme), Gram négatif (diderme), à paroi résistante de type BAAR (Bactéries Acido Alcoolo Résistantes) comme les mycobactéries ou sans paroi comme les mycoplasmes. A titre d’exemple, on peut citer les bactéries de la famille des Shingomonadaceae, en particulier Sphingobium indicum, les bactéries de la famille des Burkholderiaceae, en particulier Burkholderia xenovorans, les bactéries de la famille des Dehalococcoidaceae, en particulier Dehalococcoides ethenogenes, ou les bactéries de la famille des Pseudomonadaceae, en particulier Pseudomonas mendocina.
Par « dégradation », il est entendu toute réaction consistant à transformer le contaminant en une autre molécule présentant d’autres propriétés, voire en une molécule n’ayant pas de propriété de toxicité.
Par « modification », il est entendu toute réaction consistant à modifier les propriétés du contaminant.
Par « séquestration », il est entendu toute réaction permettant de complexer le contaminant, le rendant ainsi inactif.
Par « contaminants», il est entendu toute substance naturelle ou synthétique non naturellement présente dans l’environnement. Dans un mode de réalisation particulièrement avantageux de l’invention, les contaminants peuvent être des contaminants chimiques ou des contaminants biologiques.
Dans un mode de réalisation particulièrement avantageux de l’invention, les contaminants chimiques sont choisis dans le groupe comprenant : les solvants chlorés, les retardateurs de flamme comme le tetrabromobisphenol-A ou les polybromo diphenyl ethers (PBDE), les BTEX (benzène, toluène, éthylbenzène et xylène), le cumène, les pesticides, les hydrocarbures aliphatiques et polycycliques, les dioxines, les furanes, les polychlorodibenzofuranes, le chlorobenzène, les polychlorobiphényles, les carbazoles, les perfluorocarbures (PFC), les déchets plastiques, les produits pharmaceutiques dont les antibiotiques, les produits cosmétiques, les contaminants inorganiques comme l’arsenic, le mercure, le plomb, le perchlorate ou les nanomatériaux comme les nano fibres de carbone. A titre d’exemples de solvants chlorés, il est possible de citer le perchloroéthylène, le trichloroéthylène, le dichloroéthylène. A titre d’exemple de pesticides, il est possible de citer les pesticides chlorés, tel que l’hexaclhorocyclohexane. A titre d’exemple d’hydrocarbures polycycliques, il est possible de citer le benzo[a]pyrène, le naphtalène, le phénanthrène.
Dans un mode de réalisation avantageux de l’invention, les contaminants biologiques peuvent être des toxines, comme par exemple des toxines bactériennes, telles que les shigatoxines, des mycotoxines de champignons, telles que l’aflatoxine ou l’ochratoxine, des toxines provenant d’algues ou biotoxines marines telles que l’acide domoïque, l’acide okadaïque et leurs dérivés, des toxines provenant de plantes, telles que l’hypoglycine et les glycoalcaloïdes.
Par « échantillon biologique », il est entendu tout échantillon comprenant l’ADN d’au moins un micro-organisme. Dans un mode de réalisation avantageux de l’invention, l’échantillon biologique peut être un échantillon environnemental. Avantageusement, l’échantillon environnemental peut être un échantillon de sol, avantageusement un échantillon de sol de forêt, un échantillon de terre agricole cultivée ou non cultivée, un échantillon de sol industriel, un échantillon de sol non anthropisé, un échantillon de sol gelé (permafrost), un échantillon de sédiments ; un échantillon d’eau, avantageusement un échantillon d’eau de rivière, un échantillon d’eau provenant d’un étang, un échantillon d’eau de lac, un échantillon d’eau d’une retenue artificielle, un échantillon d’eau de systèmes de distribution, un échantillon d’eau de systèmes de climatisation, un échantillon d’eau de mer, un échantillon d’océan, un échantillon d’eau de station d’épuration, un échantillon d’eaux usées, un échantillon d’eau potable, un échantillon d’eaux usées industrielles, un échantillon d’eau de sources, un échantillon de nappes phréatiques, un échantillon d’aquifères, un échantillon d’eau gelé (glaciers, banquise, iceberg), un échantillon d’atmosphère, un échantillon d’air, un échantillon de plante, un échantillon provenant d’un aliment, comme par exemple les crustacés, un échantillon de matières premières agricoles, comme par exemple les ensilages, les céréales un échantillon de digesteur naturel .comme par exemple l’intestin ou le rumen, ou artificiel, tel qu’un méthaniseur.
Avantageusement, l’échantillon environnemental comprend l’ADN d’au moins un microorganisme, avantageusement d’au moins deux micro-organismes différents, avantageusement d’au moins trois micro-organismes différents, avantageusement d’au moins quatre micro-organismes différents, avantageusement d’au moins cinq microorganismes différents, avantageusement d’au moins dix micro-organismes différents, avantageusement d’au moins 20 micro-organismes différents, avantageusement d’au moins 25 micro-organismes différents, avantageusement d’au moins 30 micro-organismes différents, avantageusement d’au moins 50 micro-organismes différents, avantageusement d’au moins 75 micro-organismes différents, avantageusement d’au moins 100 micro-organismes différents, avantageusement d’au moins 200 microorganismes différents, avantageusement d’au moins 300 micro-organismes différents, avantageusement d’au moins 400 micro-organismes différents, avantageusement d’au moins 500 micro-organismes différents, avantageusement d’au moins 600 microorganismes différents, avantageusement d’au moins 700 micro-organismes différents, avantageusement d’au moins 800 micro-organismes différents, avantageusement d’au moins 900 micro-organismes différents avantageusement d’au moins 1000 microorganismes différents, avantageusement d’au moins 2000 micro-organismes différents, avantageusement d’au moins 3000 micro-organismes différents, avantageusement d’au moins 5000 micro-organismes différents ou plus.
La méthode mise au point par les inventeurs ne nécessite pas au préalable d’échantillons purifiés de micro-organismes mais est capable d’identifier des séquences d’ADN de gènes d’intérêts, dont les produits participent aux processus de dégradation, modification ou séquestration des contaminants, directement à partir de mélanges non caractérisés de populations de micro-organismes, à partir d'échantillons biologiques bruts où les échantillons biologiques sont recueillis et non soumis à une purification préalable. De cette manière, la méthode selon l’invention est capable d’identifier des séquences d’ADN de gènes et des variants connus ou inconnus de ceux-ci au travers de l’interrogation de l’ADN de micro-organismes non cultivables ou de micro-organismes qui sont difficiles à cultiver.
Gènes d’intérêt
Des séquences d’ADN connues de gènes d’intérêts ou des variants de celles-ci, mais également des séquences d’ADN inconnues de gènes d’intérêt ou des variants de cellesci peuvent être détectées et identifiées par la méthode selon l’invention. Au sens de la présente invention, il est entendu par « séquence d’ADN de gène d’intérêt », la séquence d’ADN de gène connu ou inconnu.
Dans un mode de réalisation selon l’invention, les gènes d’intérêts peuvent être les gènes codant pour les enzymes de dégradation des contaminants chimiques ou biologiques.
Dans un mode de réalisation selon l’invention, les gènes d’intérêts peuvent être choisis dans le groupe comprenant : les gènes codant pour les dioxygénases, les gènes codant pour les déhalogénases, les gènes codant pour les cytochromes P450, les gènes codant pour les enzymes lignolytiques, les gènes codant pour les hydrogénases et les gènes codant pour les enzymes de dégradation des toxines, en particulier des hydrolases, des décarboxylases, des glycosylases.
La méthode selon l’invention peut identifier des variants de séquences d’ADN connues ou inconnues provenant de plusieurs familles de gènes d'intérêts. Au sens de la présente invention, le terme « variants » ou « gène variant » se réfère aux gènes montrant des similarités plus ou moins importantes. Bien que l'expression d'un variant puisse être modifiée par rapport à celui du gène d'intérêt, le variant peut conserver la même fonction que le gène d'intérêt ou aboutir à de nouvelles fonctions. Par exemple, un variant peut avoir une expression accrue, une expression réduite, un spectre d'expression différent (par exemple, pour un gène de toxine insecticide), ou toute autre modification de l'expression par rapport au gène d'intérêt ciblé. De manière générale, par « variant » il est entendu des séquences sensiblement similaires. Pour des polynucléotides, un variant comprend une délétion et/ou une insertion d’un ou plusieurs nucléotides à un ou plusieurs sites dans le polynucléotide natif, ou une substitution d’un ou plusieurs nucléotides à un ou plusieurs sites dans le polynucléotide natif voire des modifications chimiques de type méthylation ou autres. Il est entendu par « polynucléotide natif » ou « polynucléotide de type sauvage », un polynucléotide qui comprend une séquence nucléotidique naturelle. Pour les séquences codant des protéines, les variants peuvent être des variants dits « conservateurs », qui en raison de la dégénérescence du code génétique codent pour la séquence d’acides aminés native du produit du gène d’intérêt ; des variants alléliques naturels, tels que ceux qui peuvent être identifiés par des techniques bien connues de l’homme du métier, comme par exemple par amplification par polymérisation en chaîne (PCR) ou les techniques d’hybridation ou de séquençage direct sans a priori-, des variants obtenus de manière artificielle, comme notamment ceux générés par mutagénèse aléatoire ou dirigée mais codant toujours pour le produit du gène d’intérêt ou montrant des similarité des séquences de structure. Avantageusement, le variant présente au moins environ 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% d'identité avec la séquence nucléotidique du gène d’intérêt.
Sondes
Dans un mode de réalisation de l’invention, la méthode utilise des sondes de capture spécifiques des gènes d’intérêts ou des variants connus ou inconnus de ceux-ci. Au sens de la présente invention, il est entendu par « sonde », un polynucléotide capable de s’hybrider avec la séquence du gène d’intérêt ou un variant connu ou inconnu de celui-ci. Les sondes peuvent être des séquences d’ARN ou d’ADN, chevauchantes, contiguës ou séquentielles. Dans un mode de réalisation avantageux de l’invention, les sondes sont des séquences d’ARN simple brin capables de s’hybrider à la séquence du gène d’intérêt par complémentarité des nucléotides. A titre d’exemple, la séquence d’ARN de la sonde est complémentaire de la séquence ADN issue du fragment du gène d’intérêt. Dans un mode de réalisation particulièrement avantageux, les sondes selon l’invention sont des séquences d’ARN simple brin non chevauchantes. Dans un mode de réalisation avantageux, les sondes sont capables de cibler spécifiquement un ensemble de séquences connues ou inconnues de gènes d’intérêts, les séquences connues ou inconnues de gènes d’intérêts pouvant être des séquences d’ADN ou d’ARN ou d’ADNc.
Dans un mode de réalisation avantageux selon l’invention, les sondes ont une longueur d’au moins 20 nucléotides contigus, avantageusement d’au moins 30 nucléotides contigus, avantageusement d’au moins 40 nucléotides contigus, avantageusement d’au moins 50 nucléotides contigus, avantageusement d’au moins 60 nucléotides contigus, avantageusement d’au moins 70 nucléotides contigus, avantageusement d’au moins 80 nucléotides contigus, avantageusement au moins 90 nucléotides contigus, avantageusement au moins 100 nucléotides contigus, avantageusement au moins 110 nucléotides contigus, avantageusement au moins 120 nucléotides contigus, avantageusement au moins 130 nucléotides contigus, avantageusement au moins 140 nucléotides contigus, avantageusement au moins 150 nucléotides contigus.
Avantageusement, la séquence des sondes peut comprendre 20 à 150 nucléotides contigus, avantageusement 70 à 150 nucléotides contigus, avantageusement 100 à 140 nucléotides contigus, avantageusement 110 à 120 nucléotides contigus, avantageusement 70 à 90 nucléotides contigus. De manière particulièrement avantageusement, les sondes ont une longueur de 80 nucléotides contigus.
Dans un mode de réalisation avantageux selon l’invention, les sondes peuvent être complémentées avec un marqueur détectable pour permettre la capture du complexe d’hybridation comprenant la sonde hybridée au fragment d’ADN du gène d’intérêt ou du variant connu ou inconnu de celui-ci. Dans un mode de réalisation particulièrement avantageux, les sondes sont marquées avec de la biotine, un haptène ou un marqueur d’affinité, ou sont générées par polymérisation ou transcription en utilisant des oligonucléotides biotinylés. Dans un mode de réalisation encore plus avantageux, les sondes sont biotinylées. Dans un mode de réalisation encore plus avantageux, les sondes sont des sondes ARN simple brin biotinylées ayant une longueur de 80 nucléotides. Dans un mode de réalisation encore plus avantageux, les sondes ARN simple brin sont biotinylées aléatoirement sur la totalité de leur séquence.
Les sondes oligonucléotidiques peuvent inclure des adaptateurs nécessaires pour l’amplification par PCR, et/ou l’ajout d’un promoteur T7 pour la transcription de la sonde en ARN. Dans un mode de réalisation particulièrement avantageux, les sondes comprennent un adaptateur A de séquence SEQ ID No.1 et un adaptateur B de séquence SEQ ID No.2, l’adaptateur A étant placé à l’extrémité 5’ de la séquence de la sonde et l’adaptateur B étant placé l’extrémité 3’ de la séquence de la sonde. La sonde peut également inclure un promoteur, en position 5’ de l’adaptateur A, ou en 3’ de l’adaptateur B, comme par exemple le promoteur T7, de séquence SEQ ID No.3.
Dans un autre mode de réalisation de l’invention, les sondes peuvent être conçues pour reconnaître des séquences d'ADNr 16S, ou toute autre séquence différentielle phylogénétique, afin de capturer des portions suffisantes de l'ADN 16S, nécessaire à l’estimation de la répartition des genres de bactéries présentes dans l'échantillon biologique.
Dans un mode de réalisation selon l’invention, les sondes oligonucléotidiques, une fois synthétisées, sont amplifiées à l’aide des adaptateurs A et B pour rajouter le promoteur T7, puis purifiées. L’homme du métier saura utiliser toutes les méthodes adéquates pour l’amplification et la purification. Avantageusement, les sondes peuvent être amplifiées en utilisant le kit Platinium Taq DNA Polymerase High Fidelity commercialisé par la société Invitrogen et peuvent être purifiées en utilisant le kit MinElute PCR purification commercialisé par la société Qiagen. Les sondes sont ensuite transcrites in vitro grâce au promoteur T7, afin d’obtenir les sondes ARN biotinylées. L’homme du métier saura utiliser toutes les méthodes adéquates pour transcrire les sondes bioyinylées et les purifier. Avantageusement, la transcription in vitro peut être réalisée en utilisant le kit MEGAScript ίο commercialisé par la société Ambion et des dUTP biotinylés commercialisés par la société Tebu-Bio. Les sondes ARN biotinylées peuvent ensuite être purifiées en utilisant le kit RNeasy plus commercialisé par la société Qiagen. Dans un mode de réalisation selon l’invention, des sondes spécifiques de différents gènes peuvent être utilisées de manière simultanée pour s’hybrider avec les fragments d’ADN ou ARN ou d’ADNc préparés à partir de l’échantillon biologique. Par exemple, pour l’analyse d’un échantillon biologique, des sondes conçues pour chaque gène d’intérêt peuvent être combinées pour former un mélange de sondes, en amont ou au moment de la mise en contact des sondes avec la banque de fragments d’ADN obtenus à partir de l’échantillon biologique.
Dans un autre mode de réalisation avantageux selon l’invention, les sondes sont conçues pour capturer les séquences correspondantes aux gènes codant pour les enzymes de dégradation des contaminants chimiques, en particulier aux gènes codant pour les dioxygénases, aux gènes codant pour les déhalogénases, aux gènes codant pour les cytochromes P450, aux gènes codant pour les enzymes lignolytiques, aux gènes codant pour les hydrogénases et aux gènes codant pour les enzymes de dégradation des contaminants biologiques, en particulier aux gènes codant pour les enzymes de dégradation des toxines.
Au sens de la présente invention, un « mélange de sondes » se réfère à un ensemble de sondes conçues pour être spécifiques d’un ou de différents gènes d'intérêts et ses variants connus ou inconnus appartenant à un pathogène cible particulier et / ou un ensemble de sondes conçues pour être spécifiques d’un ou de différents gènes d’intérêts appartenant à des pathogènes cibles différents.
Dans un mode de réalisation particulièrement avantageux de l’invention, le mélange de sondes peut comprendre au moins une sonde, avantageusement au moins 2 sondes, avantageusement au moins 3 sondes différentes, avantageusement au moins 4 sondes différentes , avantageusement au moins 5 sondes différentes, avantageusement au moins 10 sondes différentes, avantageusement au moins 20 sondes différentes, avantageusement au moins 30 sondes différentes, avantageusement au moins 40 sondes différentes, avantageusement au moins 50 sondes différentes, avantageusement au moins 60 sondes différentes, avantageusement au moins 70 sondes différentes, avantageusement au moins 80 sondes différentes, avantageusement au moins 90 sondes différentes, avantageusement au moins 100 sondes différentes, avantageusement au moins 200 sondes différentes, avantageusement au moins 300 sondes différentes, avantageusement au moins 400 sondes différentes, avantageusement au moins 500 sondes différentes, avantageusement au moins 600 sondes différentes, avantageusement au moins 700 sondes différentes, avantageusement au moins 800 sondes différentes, avantageusement au moins 900 sondes différentes, avantageusement au moins 1000 sondes différentes, avantageusement au moins 1200 sondes différentes, avantageusement au moins 1400 sondes différentes, avantageusement au moins 1500 sondes différentes, avantageusement au moins 1600 sondes différentes, avantageusement au moins 1700 sondes différentes, avantageusement au moins 1800 sondes différentes, avantageusement au moins 1900 sondes différentes, avantageusement au moins 2000 sondes différentes, avantageusement au moins 3000 sondes différentes, avantageusement au moins 5000 sondes différentes.
Avantageusement, au moins 1000 sondes différentes sont présentes dans le mélange de sondes de l’étape a).
De manière encore plus avantageuse, au moins 1500 sondes différentes sont présentes dans le mélange de sondes de l’étape a). De manière encore plus avantageuse, 2000 sondes différentes sont présentes dans le mélange de sondes de l’étape a).
Dans un mode de réalisation particulièrement avantageux de l’invention, le mélange de sondes comprend entre 1 et 5000 sondes différentes, avantageusement entre 100 et 4500 sondes différentes, avantageusement entre 500 et 4000 sondes différentes, avantageusement entre 1000 et 4000 sondes différentes, avantageusement entre 1500 et 3000 sondes différentes, avantageusement entre 1600 et 2500 sondes différentes, avantageusement entre 1900 et 2100 sondes différentes.
Dans un mode de réalisation particulièrement avantageux de l’invention, le mélange de sondes peut être spécifique d'au moins 1, avantageusement au moins 2, avantageusement au moins 10, avantageusement au moins 50, avantageusement au moins 100, avantageusement au moins 150, avantageusement au moins 200, avantageusement au moins 250, avantageusement au moins 300, avantageusement au moins 500. Avantageusement, le mélange de sondes est spécifique d’au moins un gène d’intérêt.
Dans un mode de réalisation particulièrement avantageux de l’invention, le nombre de gènes d’intérêt ciblés par le mélange de sondes est compris entre 1 et 500 gènes d’intérêt, avantageusement entre 1 et 400 gènes d’intérêt, avantageusement entre 1 et 3500 gènes d’intérêt, avantageusement entre 1 et 300 gènes d’intérêt.
Au sens de la présente invention, une sonde spécifique d’un gène et de l’ensemble de ses variants connus ou inconnus est conçue pour hybrider l’ensemble des gènes et des variants connus ou inconnus de ce gène présents au sein de l’échantillon biologique. Une sonde est donc spécifique de l’ensemble des variants d’un gène d’intérêt. Dans un mode de réalisation avantageux, les séquences des sondes sont conçues pour cibler les gènes d'intérêts et leurs variants connus ou inconnus en utilisant des outils logiciels tels que KASpOD ou HiSpOD.
Dans un mode de réalisation avantageux selon l’invention, la sonde est capable de s’hybrider avec un fragment d’ADN ou d’ ADNc du gène d’intérêt et de ses variants connus ou inconnus d’une longueur d’au moins 6 000 nucléotides, avantageusement 20 000 nucléotides encore plus avantageusement 50 000 nucléotides, jusqu’à la longueur totale de la séquence nucléotidique du génome d’intérêt.
Préparation d’une banque de fragments d’ADN à partir de l’échantillon biologique
Pour obtenir la banque de fragments d’ADN capable d’être hybridée par les sondes telles que décrites ci-dessus, l’échantillon biologique contenant les ADNs d’au moins deux micro-organismes différents doit être préparé en vue de l’étape d’hybridation. L’extraction de l’ADN à partir de l’échantillon biologique peut être réalisée par n’importe quelle technique bien connue de l’homme du métier, permettant d’extraire de l’ADN de taille compatible avec la taille des fragments à capturer en vue de l’étape d’hybridation. Avantageusement, l’extraction de l’ADN à partir de l’échantillon biologique peut être réalisée en utilisant des kits d’extraction d’ADN disponibles dans le commerce, comme par exemple les kits : Bacterial Genomic DNA Mini-prep Kit commercialisé par BayGene/Sigma-Aldrich ; BACMAX DNA purification kit commercialisé par Epicentre Biotechnologies/ Cambio ; PowerSoil DNA isolation kit commercialisé par MO BIO Laboratories Inc ; PowerMax Soil DNA Isolation Kit commercialisé par MO BIO Laboratories Inc ; UltraClean Microbial DNA Isolation Kit commercialisé par MO BIO Laboratories Inc.
Dans un mode de réalisation avantageux de l’invention, l’ADN extrait est ensuite fragmenté en fragments d’ADN de longueur spécifique. Avantageusement l’ADN est fragmenté en fragments ayant une longueur d’au moins 6 000 paires de bases, avantageusement d’au moins 20 000 paires de bases, avantageusement d’au moins 50 000 paires de bases. La fragmentation de l’ADN peut être réalisée par n’importe quelle technique connue de l’homme du métier permettant d’obtenir des fragments d’ADN ayant la longueur désirée. Avantageusement, les fragments d’ADN selon l’invention sont obtenus en utilisant le kit g-TUBE commercialisé par la société Covaris. Dans un mode de réalisation particulièrement avantageux de l’invention, les fragments d’ADN ont soit une longueur de 6 000 paires de bases, soit une longueur de 20 000 paires de bases d’ADN, soit une longueur de 50 000 paires de bases d’ADN. Au sens de la présente invention, il est entendu par « banque de fragments d’ADN » ou « banque », un ensemble de fragments d’ADN ayant la même longueur, lesdits fragments d’ADN étant obtenus à partir de l’échantillon biologique. Dans un mode de réalisation particulier de l’invention, trois banques de fragments d’ADN sont obtenues à partir de l’échantillon biologique : une banque dite « 6kb » comprenant des fragments d’ADN ayant une longueur de 6 000 paires de bases, une banque dite « 20kb » comprenant des fragments d’ADN ayant une longueur de 20 000 paires de bases et une banque dite « 50kb » comprenant des fragments d’ADN ayant une longueur de 50 000 paires de bases. Dans un mode de réalisation particulièrement avantageux de l’invention, la banque de fragments d’ADN comprend des fragments d’ADN ayant une longueur d’au moins 6 000 paires de bases, avantageusement au moins 20 000 paires de bases, avantageusement au moins 50 000 paires de bases.
Dans un mode de réalisation avantageux, la méthode selon l’invention peut en outre comprendre une étape sélection de taille des ADN fragmentés. Avantageusement, l’étape de sélection peut être réalisée avec le système BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience.
Dans un mode de réalisation avantageux de l’invention, les banques d’ADN peuvent être enrichies par amplification, notamment par amplification isotherme par déplacement de brin, permettant d’enrichir d’au moins 1,5 fois, avantageusement au moins 2 fois, avantageusement au moins 5 fois, avantageusement au moins 10 fois, avantageusement au moins 20 fois, avantageusement au moins 50 fois, avantageusement au moins 100 fois, avantageusement au moins 1000 fois la population cible de fragments d’ADN. Avantageusement, l’amplification de la banque peut être réalisée avec le kit IliustraGenomPhi V2 DNA Amplification commercialisé par la société GE Healthcare.
Dans un mode de réalisation avantageux, la méthode selon l’invention peut en outre après l’étape d’amplification, comprendre une étape sélection de la taille des banques de fragments d’ADNs amplifiées. Avantageusement, l’étape de sélection de la taille des banques de fragments d’ADNs amplifiées peut être réalisée avec le système BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience.
Avantageusement, cette étape de sélection de la taille des banques de fragments d’ADNs amplifiées permet de conserver uniquement les fragments d’ADN amplifiés ayant soit une longueur moyenne de 6 000 paires de bases, soit une longueur moyenne de 20 000 paires de bases, soit une longueur moyenne de 50 000 paires de bases d’ADN
Hybridation et capture des fragments d’ADN
Hybridation
Les sondes peuvent être mélangées à la banque de fragments d’ADN préalablement à l’étape d’hybridation par n’importe quel moyen connu de l’homme du métier. La quantité de sondes ajoutées à la banque de fragments d’ADN doit être suffisante pour permettre la fixation des fragments d’ADN des gènes d’intérêts ou de ces variants. Dans un mode de réalisation avantageux selon l’invention, la quantité de sondes introduite dans le mélange est supérieure à la quantité de la banque. Le rapport sonde/banque pour l’hybridation est d’environ 1:1, avantageusement d’environ 250:1, avantageusement d’environ 1000:1, avantageusement d’environ 20000 :1 ou supérieur.
Dans un mode de réalisation avantageux selon l’invention, l’étape c) d’hybridation est réalisée en solution ou sur support solide. Avantageusement, l’étape d’hybridation est réalisée en solution. Dans un mode de réalisation avantageux selon l’invention, l’étape d’hybridation est réalisée dans des conditions stringentes.
Dans un mode de réalisation particulier, la banque de fragments d’ADN ou d’ARN est hybridée avec les sondes pendant une durée d’au moins 16 heures, avantageusement d’au moins 20 heures, encore plus avantageusement d’au moins 24 heures, et à une température d’au moins 45°C, avantageusement d’au moins 50°C, avantageusement d’au moins 55°C, avantageusement d’au moins 60°C, encore plus avantageusement d’au moins 65°C. Dans un mode de réalisation particulièrement avantageux, la banque de fragments d’ADN ou d’ARN est hybridée avec les sondes pendant 24 heures à une température de 65°C. Avantageusement, le tampon d’hybridation peut comprendre un tampon à base d’un mélange de chlorure de sodium, d’EDTA et de phosphate, commercialisé sous le nom tampon SSPE (« Saline-Sodium Phosphate-EDTA Hybridization Buffer »), une solution Denhardt’s, de l’EDTA, un tampon SDS, de l’EDTA et de l’eau. Avantageusement, le tampon d’hybridation utilisé dans la présente invention pour l’étape d’hybridation comprend du SSPE 20X à une concentration de 10X, du Denhardt’s 50Xà une concentration de 10X, de l’EDTA 0,5mM pH 8 à une concentration de 10mM, du SDS 10% à une concentration de 0,2% et de l’eau.
Capture
Après l'hybridation, les sondes biotinylées peuvent être séparées en fonction de la présence du marqueur détectable, et les sondes et les fragments d’ADN non liés sont éliminés dans des conditions de lavage appropriées. Seuls sont conservés les fragments d'ADN qui se sont hybridés spécifiquement avec les sondes biotinylées. Les complexes d’hybridation peuvent être capturés et purifiés à partir du mélange de sondes non liées et des fragments d'ADN non liés de la banque. Par exemple, les complexes d’hybridation peuvent être capturés à l'aide d'une molécule de streptavidine fixée à une phase solide, telle qu'une bille ou une bille magnétique. Dans un mode de réalisation particulièrement avantageux selon l’invention, les complexes d’hybridation sont capturés au moyen de des billes magnétiques recouvertes de streptavidine, avantageusement en utilisant 500ng de billes Dynabeads M-280 (Life technologies).
Dans un mode de réalisation avantageux selon l’invention, l’étape d) de capture est suivie de trois étapes de lavage pour éliminer les sondes et les fragments d’ADN non liés mettant en oeuvre trois tampons de lavage différents.
Avantageusement, le premier lavage est réalisé en utilisant un tampon de lavage comprenant du chlorure de sodium, avantageusement à une concentration comprise entre 0,5M et 1,5M, avantageusement à une concentration de 1M, du Tris-HCI, avantageusement à une concentration comprise entre 5mM et 15mM, avantageusement à une concentration de 10mM, et de l’EDTA, avantageusement à une concentration comprise entre 0,5mM et 1,5mM, avantageusement à une concentration de 1 mM. Avantageusement, le premier lavage est réalisé à température ambiante, avantageusement à une température comprise entre 25°C et 30°C. Avantageusement, le premier lavage est réalisé à un pH compris entre 7,0 et 8,0, avantageusement à un pH de 7,5.
Avantageusement, le deuxième lavage est réalisé en utilisant un second tampon d’élution comprenant du SSC 20X (SSC 20X = 3M NaCI, 0,3M citrate de sodium), avantageusement à une concentration comprise entre 0,5X et 1,5X, avantageusement à une concentration de 1X et du SDS 10%, avantageusement à une concentration comprise entre 0,05% et 0,15%, avantageusement à une concentration de 0,1%. Avantageusement, le second lavage est réalisé à température ambiante, avantageusement à une température comprise entre 25°C et 30°C.
Avantageusement, le troisième lavage est réalisé en utilisant un troisième tampon d’élution comprenant du SSC 20X, avantageusement à une concentration comprise entre 0,05X et 0,15X, avantageusement à une concentration de 0,1 X et du SDS 10%, avantageusement à une concentration comprise entre 0,05% et 0,15%, avantageusement à une concentration de 0,1%. Avantageusement, le troisième lavage est réalisé à une température comprise entre 30°C et 80°C, avantageusement à une température comprise entre 40°C et 75°C, avantageusement à une température comprise entre 50 °C et 70°C, avantageusement à une température de 65°C.
Dans un mode de réalisation avantageux selon l’invention, les étapes de lavage de capture peut être suivie d’une étape d’élution par dénaturation chimique à la soude, permettant de séparer les complexes d’hybridation et ainsi libérer les fragments d’ADN capturés. Avantageusement, cette étape permet de séparer les sondes des fragments d’ADN capturés, en sédimentant les billes magnétiques recouvertes de streptavidine sur lesquelles sont fixées les sondes. Les fragments d’ADN capturés sont ensuite récupérés dans le surnageant. Dans un mode de réalisation avantageux, l’étape d’élution peut être réalisée en incubant les billes magnétiques recouvertes de streptavidine sur lesquelles sont fixés les complexes d’hybridation en présence de soude à une concentration comprise entre 0,01 M et 1M, avantageusement entre 0,05M et 0,5 M, avantageusement 0,1M, pendant au moins 5 minutes, avantageusement 10 minutes, à température ambiante. Les billes magnétiques recouvertes de streptavidine sédimentent et le surnageant est ensuite récupéré. Un tampon Tris-HCI, avantageusement à une concentration comprise entre 0,5 M et 1,5M, avantageusement à une concentration de 1M, à pH 7,5 est ensuite ajouté au surnageant.
Dans un mode de réalisation avantageux selon l’invention, l’étape d’élution peut être suivie d’une étape de purification des fragments d’ADN capturés. Avantageusement, l’étape de purification peut être réalisée avec le kit Microcon DNA flast flow PCR grade, centrifugal filters, dual cycle ETO treated, commercialisé par la société Merck Millipore.
Amplification des fragments d’ADN capturés
Dans un mode de réalisation avantageux, la méthode selon l’invention peut en outre comprendre une étape d’amplification des fragments d'ADN résultant de l’étape c) de capture. Avantageusement, l’amplification de la banque peut être réalisée avec le kit WustraGenomPhi V2 DNA Amplification commercialisé par la société GE Healthcare.
Sélection des fragments d’ADN capturés en fonction de leur taille
Dans un mode de réalisation avantageux, la méthode selon l’invention peut en outre comprendre une étape sélection des fragments d’ADN capturés en fonction de leur taille résultant de l’étape c) de capture. Avantageusement, l’étape de sélection peut être réalisée avec le sysème BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience. Avantageusement, cette étape de sélection permet de conserver uniquement les fragments d’ADN ayant soit une longueur de 6 000 paires de bases, soit une longueur de 20 000 paires de bases d’ADN, soit une longueur de 50 000 paires de bases d’ADN ou d’ARN ou d’ADNc.
La distribution de la taille des ADNs capturés peut ensuite être évaluée en utilisant le kit Agilent DNA 12000 commercialisé par la société Agilent.
Séquençage des fragments d’ADN capturés
Les fragments d'ADN capturés peuvent ensuite être séquencés par n’importe quelle technique bien connue de l’homme du métier. Le séquençage des fragments d’ADN capturés peut être réalisé en utilisant les systèmes de séquençage à haut débit commercialisé par la société Illumina Inc., par exemple le système MiSeq ou HiSeq. Toutes les plates-formes connues de l’homme du métier, telles que les plates-formes de première génération telle que Sanger, de deuxième génération telle que Illumina (MiniSeq, MiSeq, NextSeq, HiSeq, Synthetic Long Read, 10XGenomics) ou 454 (Roche) ou SOLiD (Thermo Fisher) ou Ion Torrent (Thermo Fisher) ou Gene Reader (Qiagen) ou Complété Genomics (GGI) et de troisième génération telles que Pacific BioSciences (RSII ou Sequel) ou Oxford Nanopore (MinlON ou PromethlON) tout comme les nouvelles plates-formes en développement (GenapSys, Genia, Firefly, NanoString Technologies, GnuBio, Electron Optica) peuvent être utilisées pour séquencer les fragments d'ADN capturés. Selon la méthode de séquençage utilisée, l’homme du métier sera en mesure de construire les banques adaptées à partir des fragments d’ADN capturés.
Reconstruction de grands fragments de génome
Les séquences des différents fragments d’ADN de gènes d'intérêt peuvent être assemblées par tout moyen connu de l’homme du métier. Les séquences des différents fragments d’ADN des gènes d'intérêt peuvent être assemblées pour reconstruire la séquence totale du gène d'intérêt, ou un variant connu ou inconnu de celui-ci. Les séquences des différents fragments d’ADN des gènes d'intérêt peuvent être assemblées pour reconstruire la séquence totale du gène d'intérêt, ou un variant connu ou inconnu de celui-ci et les régions flanquantes associées aux séquences ciblées voire la totalité du génome dans lequel est localisé le gène d’intérêt. Dans certains modes de réalisation, les séquences sont assemblées à l'aide des outils de bio-informatiques, comme par exemple IDBA-UD, Spades, MetaVelvet. Après l'assemblage, les séquences des gènes d'intérêts, ou des variants connu ou inconnu de ceux-ci, sont confirmées par comparaison des séquences contre des bases de données de séquences connues, telle que la base GenBank du NCBI ou ENA de l’EMBL, afin de caractériser les niveaux de similarité avec les séquences connues du gène d'intérêt, ou un variant de celui-ci.
Dans un mode de réalisation particulièrement avantageux de l’invention, la méthode de détection et d’identification in vitro d’un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d’un ou plusieurs contaminants présents dans un échantillon biologique, ladite méthode comprenant les étapes suivantes :
a) la préparation d’un mélange d’au moins quatre sondes capables de cibler spécifiquement un ou plusieurs gènes d’intérêts impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants,
b) la préparation d’une banque de fragments d’ADN à partir de l’échantillon biologique, lesdits fragments d’ADN contenus dans la banque ayant une longueur d’au moins 6 000 paires de bases,
c) l’hybridation des fragments d’ADN obtenu à l’étape b) par mise en contact desdits fragments d’ADN avec le mélange de sondes de l’étape a),
d) la capture des complexes d’hybridation de l’étape c),
e) le séquençage des fragments d’ADN capturés à l’étape d),
f) la reconstruction des gènes d’intérêts et/ou du génome du ou des microorganismes à partir des fragments d’ADN capturés séquencés de l’étape e), et
g) l’identification du ou des micro-organismes impliqués dans les processus de 5 dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l’échantillon biologique.
Les exemples qui suivent illustrent l’invention.
EXEMPLES
Exemple 1 : Identification de micro-organismes présents dans l’échantillon de sol
Isolement de l’ADN :
Un échantillon de sol contaminé par l’hexachlorocyclohexane (HCH) a été collecté dans une ancienne usine de production de produits chimiques, et l’ADN génomique contenu dans l’échantillon de sol a été extrait en utilisant le kit PowerSoil DNA Isolation de MoBio.
Préparation des sondes :
Un jeu de 4 sondes ARN simple brin biotinylées ayant une longueur de 80 nucléotides a été déterminé en utilisant les logiciels KASpOD (K-mer based Algorithm for high-Specific
Oligonucleotide Design) (Parisot N et al., 2012, vol 28, pages 3161-3162) et HiSpOD (High Spécifie Oligo Design) (Dugat-Bony E et al. , Bioinformatics, 2011, vol 27,pages 641-648) (SEQ ID No.4, 5, 6 et 7). Les sondes sont non chevauchantes et réparties de façon uniforme sur la séquence complète du gène linA, codant pour une déhydrogénase impliquée dans les premières étapes de la voie de dégradation du HCH. Les séquences des adaptateurs A (SEQ ID No.1), et B (SEQ ID No.2) ont été ajoutées à chaque extrémité des sondes en vue de l’amplification par PCR. Le promoteur T7 (SEQ ID No.3) a été ajouté en amont de l’adaptateur A par PCR avec le kit Platinium Taq DNA Polymerase High Fidelity (Invitrogen) en utilisant des amorces s’hybridant sur les Adaptateurs A et B (SEQ ID No. 1 et 2). Les produits PCR obtenus ont été purifiés avec le kit MinElute PCR purfication (Qiagen). Les sondes ARN simple brin biotinylées ont été synthétisées par transcription in vitro en utilisant le kit MEGAScript commercialisé par la société Ambion et des dUTP biotinylés (Tebu-Bio), et ont été purifiées avec le kit RNeasy plus (Qiagen).
|
SEQ ID No. |
Séquences des sondes |
|
1
(Adaptateur A) |
ATCGCACCAGCGTGT |
|
2
(Adaptateur B) |
CACTGCGGCTCCTCA |
|
3
(Promoteur T7) |
GGATTCTAATACGACTCACTATAGGG |
|
4 |
ATGAGTGATCTAGACAGACTYGCAAGCCGGGCYGCGATTCAGGACC
TCTACTCTGACMAGCTCATTGSCGTAGWCAAGCG |
|
5 |
GTAGAGTGGACCRTTGAGGGAATCGGCMCCTACAAGRGYCCGGAA
GGCGCSCTCGATTTGGYCAATAACGTANTCTGGCCAA |
|
6 |
G TTGGAA TTTG TGAGCGCGGACA WGG TAAA TGGTA TTGGCGACGTC
CTTYKCC TYGGAAA TCTCG TCGAAGSTAA TCAGTCG |
|
7 |
G TGCGCCG TGACGGGG TG TGGAAGYTCTYTAAGCBCAACGBA TGCA
YGAACTATTTCACCCCGCWGGCCGGYATTCATTTCG |
Tableau 1 : Séquences des adaptateurs du promoteur et des sondes capables de s’hybrider au gène Un A
Préparation des banques de fragments d’ADN :
Banque de 20 kb :
4 pg d’ADN obtenu à partir de l’échantillon de sol ont été fragmentés à une taille de 20 kb en utilisant le kit g-TUBE (Covaris). Les fragments d’une taille de 20 kb (+/- 2kb) ont été sélectionnés avec le système BluePippin (Sage Science). Les fragments ont été amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25-6600-32, GE Healthcare). Les fragments amplifiés d’une taille de 20 kb (+/- 2kb) ont à nouveau été sélectionnés avec le système BluePippin (Sage Science).
Hybridation et Capture :
Pour chaque capture, 2,5 pg d’ADN de sperme de saumon fragmenté (Salmon Sperm DNA, sheared (ref AM9680, Ambion)) et 2 pg de banque ont été mélangés, dénaturés pendant 5 minutes à 95°C, incubés pendant 5 minutes à 65°C avant l’ajout de 13pl de tampon d’hybridation préchauffé à 65°C (SSPE 10 mol/L, Denhardt’s 10 mol/L L, EDTA 10 mM, pH8 et SDS 0,2 %) et de 500 ng de sondes ARN biotinylées également préchauffées à 65°C. Après l’hybridation à 65°C pendant 24 heures, les complexes d’hybridation (sonde/banque) sont capturés en utilisant 500 ng de billes de magnétiques recouvertes de streptavidine (Dynabeads M-280 Streptavidin (ref 11205D, Life Technologies)) préalablement lavées. Les billes sont sédimentées en utilisant un banc magnétique (Ambion) et lavées trois fois à température ambiante avec 500 pl de 1 mol/L SSC/0,1% SDS et puis trois fois à 65°C avec 500pl de 0,1 mol/L SSC/0,1% SDS préchauffé. Les fragments d’ADN capturés sont élués avec 50pl de NaOH à 0,1M. Après la sédimentation des billes, le surnageant contenant l’ADN est transféré dans un tube stérile contenant 70pl de Tris-HCI à 1M, pH 7,5. Les fragments d’ADN capturés sont ensuite purifiés en utilisant le Kit Microcon DNA Fast Flow PCR Grade, Centrifugal Filters,
Dual Cycle ETO Treated (ref MRCF0R100ET, Merck Millipore). Les fragments d’ADN sont ensuite amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25-660032, GE Healthcare).
Séquençage des fragments d’ADN capturés
Les fragments d’ADN capturés ont été séquencés en utilisant le séquenceur MiSeq 2x300 bp d’Illumina après une étape préalable de de construction de librairie de séquençage selon le protocole Nextera en accord avec les instructions du fabricant.
Résultats obtenus
La présente méthode a permis la détection et l’identification de 7 espèces bactériennes contenues dans l’échantillon de sol possédant le gène linA et donc capables de dégrader le HCH, il s’agit des espèces : Sphingobium indicum, Sphingobium japonicum, Sphingobium baderi, Sphingobium sp. TKS, Sphingobium sp. MI1205, Novosphingobium barchaimii et Sphingomonas sp. MM-1. Pour ces espèces, la méthode a permis la reconstruction complète du gène linA mais aussi de ses régions flanquantes. Ainsi, des séquences génomiques de plusieurs de dizaines de kb et des plasmides complets de plus de 70kb ont pu être reconstruites par assemblage, permettant d’identifier les bactéries possédant le gène linA. Elles ont également révélé la présence d’autres gènes potentiellement impliqués dans la dégradation du HCH, notamment les gènes linB, linC et linD de la voie de dégradation du HCH.