WO2018041749A1 - Methode de detection et d'identification in vitro d'un ou plusieurs micro-organismes impliques dans le processus de degradation, de modification ou de sequestration d'un ou plusieurs contaminants presents dans un echantillon biologique - Google Patents
Methode de detection et d'identification in vitro d'un ou plusieurs micro-organismes impliques dans le processus de degradation, de modification ou de sequestration d'un ou plusieurs contaminants presents dans un echantillon biologique Download PDFInfo
- Publication number
- WO2018041749A1 WO2018041749A1 PCT/EP2017/071490 EP2017071490W WO2018041749A1 WO 2018041749 A1 WO2018041749 A1 WO 2018041749A1 EP 2017071490 W EP2017071490 W EP 2017071490W WO 2018041749 A1 WO2018041749 A1 WO 2018041749A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- probes
- advantageously
- dna
- dna fragments
- genes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
Definitions
- the present invention relates to a high throughput method for detecting and identifying in vitro one or more microorganisms involved in the process of degradation, modification or sequestration of one or more contaminants present in a biological sample.
- Micro-organisms by their adaptability linked to the diversity of their metabolic capacities, play a fundamental role in all biological processes. They contribute to the good functioning of all ecosystems. However, anthropization can lead to imbalances in microbial communities, thus contributing to global changes, such as global warming, partly caused by increasing emissions of methane into the atmosphere. Conversely, microorganisms can help reduce pollution resulting from the dispersion of molecules such as Polycyclic Aromatic Hydrocarbons (PAHs). Thus, microbial communities help reduce or increase the deleterious effects of anthropogenic ecosystems. To date, it is difficult to assess the microbial diversity of ecosystems, as these ecosystems include a significant amount of different micro-organisms, most of which are still uncultivable or uncharacterized.
- PAHs Polycyclic Aromatic Hydrocarbons
- NGS Next Generation Sequencing
- International Application WO2015 / 105993 (AgBiome Inc) describes a method for identifying genes of interest implementing a step of gene capture by hybridization, followed by a sequencing step for identifying said genes of interest in a sample environmental.
- the method described in International Application WO2015 / 105993 requires the use of complementary overlapping probes of reference gene sequences to capture DNA fragments, and is limited to capturing DNA fragments of length maximum equal to 1800 nucleotides.
- the approach does not necessarily allow to identify complete genes let alone nucleic sequences comprising several genes, or even new genes or complete genomes.
- the applicants therefore propose a novel method for detecting and identifying in vitro one or more microorganisms involved in the process of degradation, modification or sequestration of one or more contaminants present in a biological sample.
- An object of the invention is therefore a method for detecting and identifying in vitro one or more microorganisms involved in the process of degradation, modification or sequestration of one or more contaminants present in a biological sample, said method comprising the following steps:
- step c) hybridizing the DNA fragments obtained in step b) by contacting said DNA fragments with the probe mixture of step a),
- the method according to the invention makes it possible to capture DNA fragments having a length of at least 6,000 base pairs. Thanks to this new method, the inventors are able to identify both the known and unknown sequences of one or more genes of interest characterizing the microorganisms involved in the degradation processes of said contaminant or contaminants, to reconstruct large fragments of genomes containing the gene or genes of interest, and to identify the microorganism (s) involved in the processes of degradation, modification or sequestration of the one or more contaminants present in the biological sample.
- This method while allowing a comprehensive exploration of the genetic diversity of genes of interest, the advantage of ensuring the identification of the flanking regions associated with the targeted sequences.
- the present method makes it possible to dispense with the use of overlapping probes and complementary sequences of references. As a result, it is not necessary to have an exhaustive initial knowledge of the complete sequence of genes to be captured. The approach makes it possible to reveal unknown genes thanks to the exploratory character of the probes resulting in their degeneration at particular positions.
- microorganism or “microbe” is meant any unicellular eukaryotic (protist) organism, such as fungi including yeasts, microalgae, protozoa, or prokaryotes, such as bacteria and archaea.
- the microorganisms according to the invention may be bacteria, in particular the bacteria expressing the gene or genes of interest sought.
- the bacteria according to the invention may be Gram-positive bacteria (monoderm), gram-negative bacteria (epidermis), resistant-walled type BAAR (acidic Acido Alcoholic Resistant bacteria) such as mycobacteria or without a wall such as mycoplasma.
- Gram-positive bacteria nonoderm
- gram-negative bacteria epidermis
- resistant-walled type BAAR acidic Acido Alcoholic Resistant bacteria
- mycobacteria or without a wall such as mycoplasma.
- bacteria of the family Burkholderiaceae in particular Burkholderia xenovorans
- bacteria of the family Dehalococcoidaceae in particular Dehalococcoides ethenogenes
- bacteria of the Pseudomonadaceae family in particular Pseudomonas mendocina.
- degradation is meant any reaction consisting in transforming the contaminant into another molecule having other properties, or even a molecule having no toxicity property.
- modification is meant any reaction consisting in modifying the properties of the contaminant.
- the contaminants may be chemical contaminants or biological contaminants.
- the chemical contaminants are chosen from the group comprising: chlorinated solvents, flame retardants such as tetrabromobisphenol-A or polybrominated diphenyl ethers (PBDEs), BTEX (benzene, toluene) , ethylbenzene and xylene), cumene, pesticides, aliphatic and polycyclic hydrocarbons, dioxins, furans, polychlorinated dibenzofurans, chlorobenzene, polychlorinated biphenyls, carbazoles, perfluorocarbons (PFCs), plastic wastes, pharmaceuticals of which antibiotics, cosmetics, inorganic contaminants such as arsenic, mercury, lead, perch
- chlorinated solvents it is possible to mention perchlorethylene, trichlorethylene, dichloroethylene.
- pesticides include chlorinated pesticides, such as hexaclocyclohexane.
- polycyclic hydrocarbons it is possible to mention benzo [a] pyrene, naphthalene and phenanthrene.
- the biological contaminants may be toxins, such as, for example, bacterial toxins, such as shigatoxins, fungus mycotoxins, such as aflatoxin or ochratoxin, toxins derived from algae or marine biotoxins such as domoic acid, okadaic acid and their derivatives, toxins from plants, such as hypoglycine and glycoalkaloids.
- bacterial toxins such as shigatoxins, fungus mycotoxins, such as aflatoxin or ochratoxin
- toxins derived from algae or marine biotoxins such as domoic acid, okadaic acid and their derivatives
- toxins from plants such as hypoglycine and glycoalkaloids.
- the biological sample may be an environmental sample.
- the environmental sample may be a soil sample, advantageously a forest soil sample, a sample of cultivated or non-cultivated agricultural land, an industrial soil sample, a non-anthropized soil sample, a frozen soil sample ( permafrost), a sample of sediments; a water sample, preferably a river water sample, a water sample from a pond, a lake water sample, a water sample of an artificial reservoir, a water sample distribution systems, a sample of water from air conditioning systems, a sample of seawater, an ocean sample, a sample of water from a treatment plant, a sample of water wastewater, a sample of drinking water, a sample of industrial wastewater, a source water sample, a groundwater sample, a sample of aquifers, a sample of frozen water (glaciers, sea ice, iceberg) , an air sample,
- a soil sample advantageously a forest soil sample, a sample of cultivated or non-cultivated agricultural land, an industrial soil sample
- the environmental sample comprises the DNA of at least one microorganism, advantageously at least two different microorganisms, advantageously at least three different microorganisms, advantageously at least four different microorganisms, advantageously at least five different microorganisms, preferably at least ten different microorganisms, preferably at least 20 different microorganisms, preferably at least 25 different microorganisms, preferably at least 30 microorganisms.
- different organisms advantageously at least 50 different microorganisms, preferably at least 75 different microorganisms, preferably at least 100 different microorganisms, preferably at least 200 different microorganisms, preferably at least 300 different microorganisms, advantageously at least 400 different microorganisms, advantageously at least 500 different microorganisms preferably at least 600 different microorganisms, preferably at least 700 different microorganisms, preferably at least 800 different microorganisms, preferably at least 900 different microorganisms advantageously at least 1000 micro different organisms, preferably at least 2000 different microorganisms, preferably at least 3000 different microorganisms, preferably at least 5000 different microorganisms or more.
- the method developed by the inventors does not require prior isolation of the microorganisms but is capable of directly identifying from communities DNA sequences of genes of interest characterizing the microorganisms sought, whose Products may participate in the processes of degradation, modification or sequestration of contaminants.
- This method allows directly from unmarked mixtures of microorganism populations, from raw biological samples where biological samples are collected and not subjected to prior purification to remove inhibiting substances such as humic acids or acids. fulvic species present in soil samples, for example, to identify precisely the microorganisms sought.
- the method according to the invention is capable of identifying gene DNA sequences and known or unknown variants thereof by interrogating the DNA of microorganisms of microbial communities, which they are cultivable, difficult to cultivate or not cultivable. .
- the genes of interest may be the genes encoding the degradation enzymes of chemical or biological contaminants but also sequences characterizing the microorganisms carrying the desired activities.
- the genes of interest may be chosen from the group comprising: genes coding for dioxygenases, genes coding for dehalogenases, genes coding for cytochromes P450, genes coding for lignolytic enzymes, genes coding for hydrogenases and genes coding for the degradation enzymes of biological contaminants, in particular genes coding for toxin degradation enzymes, in particular hydrolases, decarboxylases, glycosylases.
- the gene of interest may be the HnA gene.
- the probes may be designed to recognize 16S rDNA sequences, or any other phylogenetic differential sequence such as mcrA, col or ITS genes, in order to capture the sequences necessary for the estimation of the distribution of microorganism species present in the biological sample.
- the probes may be designed to recognize specific sequences of microorganisms involved in the degradation, modification or sequestration of chemical or biological contaminants to capture those sequences necessary for detection and control. identification of these microorganisms of interest in the biological sample.
- the method according to the invention can identify variants of known or unknown DNA sequences from several gene families of interest.
- the term "variants" or "variant gene” refers to genes showing more or less important similarities.
- the expression of a variant may be modified with respect to that of the gene of interest, the variant may retain the same function as the gene of interest or lead to new functions.
- a variant may have increased expression, reduced expression, a different expression spectrum (for example, for an insecticidal toxin gene), or any other modification of the expression relative to the targeted gene of interest.
- variant is meant substantially similar sequences.
- a variant comprises deletion and / or insertion of one or more nucleotides at one or more sites in the native polynucleotide, or substitution of one or more nucleotides at one or more sites in the native polynucleotide or even chemical methylation or other modifications.
- mutant polynucleotide or wild-type polynucleotide is meant a polynucleotide which comprises a natural nucleotide sequence.
- the variants may be so-called “conservative” variants which, because of the degeneracy of the genetic code, encode the native amino acid sequence of the product of the gene of interest; natural allelic variants, such as those that can be identified by techniques well known to those skilled in the art, such as for example by polymerase chain reaction (PCR) or hybridization techniques or direct sequencing without a priori; artificially obtained variants, such as those generated by random or directed mutagenesis but still coding for the product of the gene of interest or showing similarity of the structural sequences.
- PCR polymerase chain reaction
- the variant has at least about 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or 100% identity with the nucleotide sequence of the gene of interest.
- the method utilizes capture probes specific for the genes of interest or known or unknown variants thereof.
- the term "probe” is intended to mean a polynucleotide capable of hybridizing with the sequence of the gene of interest or a known or unknown variant thereof.
- the probes can be RNA or DNA sequences, overlapping, contiguous or sequential.
- the probes are single-stranded RNA sequences capable of hybridizing to the sequence of the gene of interest by complementarity of the nucleotides.
- the RNA sequence of the probe is complementary to the DNA sequence derived from the fragment of the gene of interest.
- the probes according to the invention are non-overlapping single-stranded RNA sequences.
- the probes are exploratory, that is to say, capable of specifically targeting a set of known and unknown sequences of genes of interest, the known and unknown sequences of genes of interest being able to be identical. DNA or RNA sequences or cDNA.
- the probes are non-overlapping and exploratory single stranded RNA sequences.
- the probes have a length of at least 20 contiguous nucleotides, advantageously at least 30 contiguous nucleotides, advantageously at least 40 contiguous nucleotides, advantageously at least 50 contiguous nucleotides , advantageously at least 60 contiguous nucleotides, advantageously at least 70 contiguous nucleotides, advantageously at least 80 contiguous nucleotides, advantageously at least 90 contiguous nucleotides, advantageously at least 100 contiguous nucleotides, advantageously at least 1 10 contiguous nucleotides, advantageously at least 120 contiguous nucleotides, advantageously at least 130 contiguous nucleotides, advantageously at least 140 contiguous nucleotides, advantageously at least 150 contiguous nucleotides or more.
- the sequence of the probes may comprise from 20 to 150 contiguous nucleotides, advantageously from 70 to 150 contiguous nucleotides, advantageously from 100 to 140 contiguous nucleotides, advantageously from 1 to 120 contiguous nucleotides, advantageously from 70 to 90 contiguous nucleotides.
- the probes have a length of 80 contiguous nucleotides.
- the probes may be complemented with a detectable marker to allow the capture of the hybridization complex comprising the probe hybridized to the DNA fragment of the gene of interest or the known or unknown variant of this one.
- the probes are labeled with biotin, a hapten or an affinity tag, or are generated by polymerization or transcription using biotinylated oligonucleotides.
- the probes are biotinylated.
- the probes are biotinylated single-stranded RNA probes having a length of 80 nucleotides.
- the single-stranded RNA probes are biotinylated randomly over their entire sequence.
- Oligonucleotide probes may include adapters necessary for their PCR amplification.
- the probes comprise an adapter A of sequence SEQ ID No.
- the adapter A being placed at the 5 'end of the sequence of the probe and the adapter B being placed at the end 3 'of the sequence of the probe.
- the sequences of the adapters A (SEQ ID No.1) and B (SEQ ID No.2) are added to each end of the probes leading to probes whose sequence is of the "adapter A - probe - adapter B" type.
- the probe may also include a promoter, in position 5 'of the adapter A, or in 3' of the adapter B, for example the T7 promoter, of sequence SEQ ID No.3.
- the oligonucleotide probes are amplified using adapters A and B to add the T7 promoter, and then purified.
- the probes can be amplified using the Platinium Taq DNA Polymerase High Fidelity kit marketed by Invitrogen and can be purified using the MinElute PCR purification kit marketed by Qiagen.
- the probes are then transcribed in vitro using the T7 promoter in the presence of biotinylated dNTPs to obtain the biotinylated RNA probes.
- the in vitro transcription can be carried out using the MEGAScript kit sold by the company Ambion and biotinylated dUTPs marketed by the company Tebu-Bio.
- the biotinylated RNA probes can then be purified using the RNeasy kit sold by the company Qiagen.
- probes specific for different genes can be used simultaneously to hybridize with DNA or RNA or cDNA fragments prepared from the biological sample.
- probes designed for each gene of interest can be combined to form a mixture of probes, upstream of their synthesis, or at the moment of contacting the probes with the probe.
- library of DNA fragments obtained from the biological sample can be combined to form a mixture of probes, upstream of their synthesis, or at the moment of contacting the probes with the probe.
- the probes are designed to capture the sequences corresponding to the genes coding for the degradation enzymes of chemical contaminants, in particular to the genes coding for dioxygenases, to the genes coding for dehalogenases, to the genes coding for cytochromes P450, genes coding for lignolytic enzymes, genes coding for for hydrogenases and genes coding for the degradation enzymes of biological contaminants, in particular genes encoding toxin degrading enzymes.
- a "probe mixture” refers to a set of probes designed to be specific for one or more genes of interest and its known or unknown variants belonging to a particular target microorganism and / or a set of probes designed to be specific for one or more genes of interest belonging to different target microorganisms.
- the probe mixture may comprise at least one probe, advantageously at least two probes, advantageously at least three different probes, advantageously at least four different probes, advantageously at least five different probes, advantageously at least 10 different probes, advantageously at least 20 different probes, advantageously at least 30 different probes, advantageously at least 40 different probes, advantageously at least 50 different probes, advantageously at least 60 different probes, advantageously at least 70 different probes, advantageously at least 80 different probes, advantageously at least 90 different probes, advantageously at least 100 different probes, advantageously at least 200 different probes, advantageously at least 300 different probes, advantageously at least 400 different probes, advantageously at least 500 different probes s, advantageously at least 600 different probes, preferably at least 700 different probes, preferably at least 800 different probes, preferably at least 900 different probes, preferably at least 1000 different probes, preferably at least 1200 different probes, preferably at least 1400 different probes , advantageously at least 1500
- the mixture of probes comprises between 1 and 5000 different probes, advantageously between 100 and 4500 different probes, advantageously between 500 and 4000 different probes, advantageously between 1000 and 4000 different probes, advantageously between 1500 and 3000 different probes, advantageously between 1600 and 2500 different probes, advantageously between 1900 and 2100 different probes.
- the probe mixture may be specific of at least 1, advantageously at least 2, advantageously at least 10, advantageously at least 50, advantageously at least 100, advantageously at least 150, advantageously at least 200, advantageously at least 250, advantageously at least 300, advantageously at least 500 genes of interest.
- the probe mixture is specific for at least one gene of interest.
- the number of genes of interest targeted by the probe mixture is between 1 and 500 genes of interest, advantageously between 1 and 400 genes of interest, advantageously between 1 and 400 genes of interest. 3500 genes of interest, advantageously between 1 and 300 genes of interest.
- the interval between two probes is between 10 base pairs (bp) and 1000 bp, advantageously between 50 bp and 500 bp, advantageously between 100 bp and 450 bp, advantageously between 100 bp and 500 bp.
- bp and 400 bp advantageously between 100 bp and 350 bp, advantageously between 100 and 300 bp, advantageously between 100 bp and 250 bp, advantageously between 100 bp and 200 bp.
- the interval between two probes is between 100 bp and 200 bp.
- a probe specific for a gene and all of its known or unknown variants is designed to hybridize all the genes and known or unknown variants of this gene present in the sample. organic.
- a probe is therefore specific for all the variants of a gene of interest.
- the sequences of the probes are designed to target the genes of interest and their known or unknown variants using software tools such as KASpOD, HiSpOD or ExSpOD.
- the probe is capable of hybridizing with a fragment of DNA, RNA or cDNA of the gene of interest and its known or unknown variants of a length of d at least 6,000 nucleotides, advantageously 20,000 nucleotides more preferably 50,000 nucleotides, up to the total length of the nucleotide sequence of the genome of interest or up to the total length of the nucleotide sequence of interest.
- the biological sample containing the DNAs of at least one microorganism must be prepared for the hybridization step. Extraction of the DNA from the biological sample can be carried out by any technique well known to those skilled in the art, making it possible to extract DNA of size compatible with the size of the fragments to be captured. for the hybridization step.
- the extraction of the DNA from the biological sample can be carried out using commercially available DNA extraction kits, for example kits: Bacterial Genomic DNA Mini-prep Kit marketed by BayGene / Sigma-Aldrich; BACMAX DNA purification kit marketed by Epicenter Biotechnologies / Cambio; PowerSoil DNA isolation kit marketed by MO BIO Laboratories Inc; PowerMax Soil DNA Isolation Kit marketed by MO BIO Laboratories Inc; UltraClean Microbial DNA Isolation Kit marketed by MO BIO Laboratories Inc.
- the extracted DNA is then fragmented into DNA fragments of specific length.
- the DNA is fragmented into fragments having a length of at least 6,000 base pairs, advantageously at least 20,000 base pairs, advantageously at least 50,000 base pairs.
- the fragmentation of the DNA can be carried out by any technique known to those skilled in the art to obtain DNA fragments having the desired length.
- the DNA fragments according to the invention are obtained using the g-TUBE kit marketed by Covaris.
- the DNA fragments have either a length of 6000 base pairs, a length of 20 000 base pairs of DNA, or a length of 50 000 base pairs.
- DNA DNA fragment library or "library” means a set of DNA fragments having the same length, said DNA fragments being obtained from the biological sample.
- the DNA fragments constituting the library have a homogeneous size.
- three libraries of DNA fragments are obtained from the biological sample: a so-called "6kb” library comprising DNA fragments having a length of 6000 base pairs, a so-called “20kb” library comprising DNA fragments having a length of 20,000 base pairs and a so-called “50kb” library comprising DNA fragments having a length of 50,000 base pairs.
- the library of DNA fragments comprises DNA fragments having a length of at least 6,000 base pairs, advantageously at least 20,000 base pairs, advantageously at least 50,000 base pairs.
- the method according to the invention may further comprise a size selection step of the fragmented DNAs.
- the selection step can be carried out with the BluePippin system using the 0.75% Agarose Gel Cassette Mid Range Targets kits, 0.75% Agarose Gel Cassette Low Range Targets or 0.75% Agarose Gel Cassette 50kb marketed by the company SageScience.
- the DNA libraries can be enriched by amplification, in particular by isothermal amplification by strand displacement, making it possible to enrich at least 1.5 times, advantageously at least twice, advantageously at least 5 times, advantageously at least 10 times, advantageously at least 20 times, advantageously at least 50 times, advantageously at least 100 times, advantageously at least 1000 times the target population of DNA fragments.
- the amplification of the library can be carried out with the IHustraGenomPhi V2 DNA Amplification kit marketed by GE Healthcare.
- the method according to the invention may further, after the amplification step, comprise a step of selecting the size of the libraries of amplified DNA fragments.
- the step of selecting the size of the libraries of amplified DNA fragments can be carried out with the BluePippin system using the 0.75% Agarose Gel Cassette Mid Range Targets Kit, 0.75% Agarose Gel Cassette Low Range Targets or 0.75% Agarose Gel Cassette 50kb marketed by the company SageScience.
- this step of selecting the size of the libraries of amplified DNA fragments makes it possible to preserve only the amplified DNA fragments having an average length of 6,000 base pairs, or an average length of 20,000 base pairs, an average length of 50,000 base pairs of DNA
- the probes may be mixed with the DNA fragment library prior to the hybridization step by any means known to those skilled in the art.
- the quantity of Probes added to the DNA fragment library must be sufficient to allow attachment of the DNA fragments of the genes of interest or these variants.
- the number of probes introduced into the mixture is greater than or equal to the number of DNA fragments contained in the bank.
- the probe / DNA fragment ratio for hybridization is about 1: 1, preferably about 250: 1, preferably about 1000: 1, preferably about 20000: 1 or greater.
- the hybridization step c) is carried out in solution or on a solid support.
- the hybridization step is carried out in solution.
- the hybridization step is carried out under stringent conditions.
- the library of DNA, cDNA or RNA fragments is hybridized with the probes for a duration of at least 16 hours, advantageously at least 20 hours, even more advantageously of at least 24 hours, and at a temperature of at least 45 ° C, preferably at least 50 ° C, preferably at least 55 ° C, preferably at least 60 ° C, still more preferably at least minus 65 ° C.
- the fragment library of DNA or RNA is hybridized with the probes for 24 hours at a temperature of 65 ° C.
- the hybridization buffer may comprise a buffer based on a mixture of sodium chloride, EDTA and phosphate, sold under the name SSPE ("Saline-Sodium Phosphate-EDTA Hybridization Buffer") buffer, a solution Denhardt's, EDTA, SDS buffer, EDTA and water.
- SSPE Seline-Sodium Phosphate-EDTA Hybridization Buffer
- the hybridization buffer used in the present invention for the hybridization step comprises 20X SSPE at a concentration of 10X, Denhardt's 50X at a concentration of 10X, 0.5mM EDTA pH 8 at a concentration of 10mM, 10% SDS at a concentration of 0.2% and water.
- the biotinylated probes can be separated according to the presence of the detectable label, and the unbound probes and DNA fragments are removed under appropriate washing conditions. Only those DNA fragments that hybridize specifically with the biotinylated probes are retained.
- the hybridization complexes can be captured and purified from the mixture of unbound probes and unbound DNA fragments of the library.
- the hybridization complexes can be captured using a streptavidin molecule attached to a solid phase, such as a marble magnetic.
- the hybridization complexes are captured by means of streptavidin-coated magnetic beads, advantageously using 500 ng of Dynabeads M-280 beads (Life Technologies).
- step d) of capture is followed by three washing steps to eliminate the probes and unlinked DNA fragments using three different washing buffers.
- the first washing is carried out using a washing buffer comprising sodium chloride, advantageously at a concentration of between 0.5M and 1.5M, advantageously at a concentration of 1M, of Tris-HCl, advantageously at a concentration of between 5 mM and 15 mM, advantageously at a concentration of 10 mM, and EDTA, advantageously at a concentration of between 0.5 mM and 1.5 mM, advantageously at a concentration of 1 mM.
- the first washing is carried out at ambient temperature, advantageously at a temperature of between 25 ° C. and 30 ° C.
- the first washing is carried out at a pH of between 7.0 and 8.0, advantageously at a pH of 7.5.
- the second washing is carried out at ambient temperature, advantageously at a temperature of between 25 ° C. and 30 ° C.
- the third washing is carried out using a third elution buffer comprising 20X SSC, advantageously at a concentration of between 0.05X and 0.15X, advantageously at a concentration of 0.1% and 10% SDS, advantageously at a concentration of between 0.05% and 0.15%, advantageously at a concentration of 0.1%.
- the third washing is carried out at a temperature of between 30 ° C. and 80 ° C., advantageously at a temperature of between 40 ° C. and 75 ° C., advantageously at a temperature of between 50 ° C. and 70 ° C., advantageously at a temperature of 65 ° C.
- the capture washing steps can be followed by an elution step by chemical denaturation with sodium hydroxide, allowing separate the hybridization complexes and thus release the captured DNA fragments.
- this step makes it possible to separate the probes from the captured DNA fragments by sedimenting the streptavidin-coated magnetic beads on which the probes are fixed. The captured DNA fragments are then recovered in the supernatant.
- the elution step can be carried out by incubating the streptavidin-coated magnetic beads on which the hybridization complexes are fixed in the presence of sodium hydroxide at a concentration of between 0.01 M and 1 M, advantageously between 0.05M and 0.5M, advantageously 0.1M, for at least 5 minutes, advantageously 10 minutes, at room temperature.
- the magnetic beads coated with streptavidin sediment and the supernatant is then recovered.
- a Tris-HCl buffer advantageously at a concentration of between 0.5M and 1.5M, advantageously at a concentration of 1M, at pH 7.5 is then added to the supernatant.
- the elution step may be followed by a purification step of the captured DNA fragments.
- the purification step can be carried out with the Microcon DNA flast-flow PCR grade kit, centrifugal filters, ETO treated dual cycle, marketed by Merck Millipore.
- the method according to the invention may further comprise a step of amplification of the DNA fragments resulting from step d) capture.
- the amplification of the library can be carried out with the IHustraGenomPhi V2 DNA Amplification kit marketed by GE Healthcare.
- the method according to the invention may further comprise a step of selecting the captured DNA fragments according to their size resulting from step d) of capture.
- the selection step can be carried out with the BluePippin system using the 0.75% Agarose Gel Cassette Mid Range Targets kit, 0.75% Agarose Gel Cassette Low Range Targets or 0.75% Agarose Gel Cassette 50kb marketed by the company SageScience.
- this selection step makes it possible to preserve only the fragments having either a length of 6,000 base pairs, a length of 20,000 base pairs, or a length of 50,000 base pairs of DNA or RNA or cDNA.
- the size distribution of the captured DNAs can then be evaluated using the Agilent DNA 12000 kit marketed by Agilent.
- the captured DNA fragments can then be sequenced by any technique well known to those skilled in the art. Sequencing of the captured DNA fragments can be performed using the high throughput sequencing systems marketed by Illumina Inc., for example the MiSeq or HiSeq system. All platforms known to those skilled in the art, such as first generation platforms such as Sanger, second generation such as Illumina (MiniSeq, MiSeq, NextSeq, HiSeq, Synthetic Long Read, 10X Genomics) or 454 (Roche) or SOLiD (Thermo Fisher) or Ion Torrent (Thermo Fisher) or Gene Reader (Qiagen) or Complete Genomics (GGI) and third generation such as Pacific BioSciences (RSII or Sequel) or Oxford Nanopore (MinlON, GridION or PromethlON ) as well as new platforms under development (GenapSys, Genia, Firefly, NanoString Technologies, GnuBio, Electron Optica) can be used to sequence captured DNA fragments.
- sequences of the different DNA fragments of the genes of interest can be assembled by any means known to those skilled in the art.
- the sequences of the different DNA fragments of the genes of interest can be assembled to reconstruct the total sequence of the gene of interest, or a known or unknown variant thereof.
- the sequences of the different DNA fragments of the genes of interest can be assembled to reconstruct the total sequence of the gene of interest, or a known or unknown variant thereof and the flanking regions associated with the targeted sequences or even the entire genome. in which the gene of interest is located.
- the sequences are assembled using bioinformatics tools, such as IDBA-UD, Spades, MetaVelvet.
- sequences of the genes of interest, or known or unknown variants thereof are confirmed by comparison of the sequences against databases of known sequences, such as the GenBank NCBI or ENA database.
- EMBL in order to characterize the levels of similarity with the known sequences of the gene of interest, or a variant thereof.
- the method for the detection and in vitro identification of one or more microorganisms involved in the process of degradation, modification or sequestration of one or more contaminants present in a biological sample comprising the following steps: a) preparing a mixture of non-overlapping and exploratory probes capable of specifically targeting one or more genes of interest involved in the processes of degradation, modification or sequestration of said or said contaminants, b) preparing a library of DNA fragments from the biological sample, said DNA fragments contained in the library having a length of at least 6,000 base pairs, c) the hybridization of the DNA fragments obtained in step b) by contacting said DNA fragments with the mixture of probes of step a), d) the capture of the complexes s of hybridization of step c), e) sequencing of the DNA fragments captured in step d), f) the reconstruction of the genes of interest and / or the genome of the microorganism (s) from the fragments captured DNA sequenced from step e), and g)
- FIGURES Figure 1 Agilent profile of the SureSelectXT library of small DNA fragments. The absence of peak / band between size markers (50 and 17000 bp) demonstrates the absence of DNA and thus the failure of the construction of the SureSelectXT bank on the soil sample studied.
- Figure 2 Agilent profile of the Illumina library of small DNA fragments. The presence of a peak / band at 400 bp between the size markers (50 and 17000 bp) shows the presence of DNA to the desired size and thus the successful construction of a DNA library with the TruSeq kit on the soil sample studied.
- Example 1 Identification of micro-organisms capable of degrading HCH in a polluted soil sample
- a soil sample contaminated with hexachlorocyclohexane (HCH) was collected in a former chemical production plant, and the genomic DNA of the microorganisms contained in the soil sample was extracted using the PowerSoil DNA Isolation kit. MOBIO.
- a set of 4 degenerate probes of 80 nucleotides was determined from 145 HnA gene sequences extracted from the GenBank database using KASpOD software (K-mer-based Algorithm for High-Specific Oligonucleotide Design) (Parisot N et al. ., 2012, vol 28, pages 3161-3162) and HiSpOD (High Specifies Oligo Design) (Dugat-Bony E et al., Bioinformatics, 201 1, vol 27, pp. 641-648) (SEQ ID No.4, 5 , 6 and 7).
- the probes are non-overlapping and evenly distributed over the complete sequence of the HnA gene (471 bp), encoding a dehydrogenase involved in the early stages of the HCH degradation pathway.
- the sequences of adapters A (SEQ ID No.1), and B (SEQ ID No.2) were added to each end of the probes for PCR amplification, leading to probes whose sequence is of the type " ATCGCACCAGCGTGT-N80- CACTGCGGCTCCTCA ", where N80 corresponds to the specific sequence of each of the 4 probes.
- Probes with a total length of 1 10 nucleotides were synthesized as single-stranded DNA.
- the T7 promoter (SEQ ID No.3) was added upstream of adapter A by PCR with the Platinium Taq DNA High Fidelity Polymerase Kit (Invitrogen) using primers T7-A and B (SEQ ID No. 8 and 9) respectively hybridizing on adapters A and B (SEQ ID No. 1 and 2).
- the PCR products obtained were purified with the MinElute PCR purification kit (Qiagen).
- Biotinylated single-stranded RNA probes were synthesized by in vitro transcription using the MEGAScript kit (Ambion) and biotinylated dUTPs (Tebu-Bio), and were purified with the RNeasy plus kit (Qiagen).
- Adapter Sequences (SEQ ID No. 1 and 2), Promoter 17 (SEQ ID No. 3), Primers (SEQ ID Nos. 8 and 9), and Probes (SEQ ID Nos. 4 to 7) ) capable of binding to the lin A gene
- 2 .mu.g of the library were mixed with 2.5 .mu.g of salmon sperm DNA (Salmonsperm DNA, Sheared (ref AM9680, Ambion)) and denatured for 5 minutes at 95.degree. C. and then incubated for 5 minutes. minutes at 65 ° C.
- 13 ⁇ l of hybridization buffer (SSPE 10 mol / L, Denhardt's 10 mol / L, 10 mM EDTA, pH 8 and 0.2% SDS) and then 500 ng of biotinylated RNA probes preheated to 65 ° C. C were added to the mixture.
- probe / library hybridization complexes were captured using 500 ng of streptavidin-coated magnetic beads (Dynabeads M-280 Streptavidin (ref 1205D, Life Technologies)) previously washed three times. once with 200 L of 1 M NaCl / 10 mM TE. The beads were washed three times at room temperature with 500 ⁇ l of 1 ⁇ SSC / 0.1% SDS, then three times at 65 ° C. with 500 ⁇ l of pre-heated 0.1 ⁇ SSC / 0.1% SDS. The captured DNA fragments were then eluted with 50 ⁇ l of 0.1 M NaOH.
- the supernatant containing the enriched DNA libraries was transferred to a tube containing 70 ⁇ l of 1 M Tris-HCl. pH 7.5.
- the captured DNA fragments were then purified using the Microcon DNA Fast Flow PCR Grade Kit, Centrifugal Filters, Dual Cycle ⁇ 0 Treated (ref MRCF0R100ET, Merck Millipore) and amplified using the Illustra GenomPhi V2 DNA Amplification Kit (ref. 6600-32, GE Healthcare). Finally, the amplified fragments of a size of 20 kb (+/- 4 kb) were selected with the BluePippin system (Sage Science).
- the captured DNA fragments were sequenced on a Illumina MiSeq 2x300 bp sequencing run after a previous step of constructing the Nextera (Illumina) sequencing library in accordance with the manufacturer's instructions.
- the readings obtained following the sequencing of the DNA libraries of the fragments enriched after capture were filtered according to their quality using the PRINSEQ-lite script (Schmeider, Bioinformatics, 201 1). Thus, 15,141,059 pairs of sequences were obtained.
- the readings were de novo assembled with IDBA-UD v1.1 .2 (Peng, Bioinformatics, 2012).
- the contigs obtained were then subjected to a second assembly using the CAP3 tool (Huang, Genome Research, 1999). Contigs bearing HnA were identified by BLASTN (AltschuI, Journal of Molecular Biology, 1990) and then affiliated using BLASTN against the reference genome base (06/10/14) of the NCBI. Finally, the readings were aligned with Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) against the genomes of the identified species.
- the present method allowed the detection and the identification of 7 bacterial species contained in the soil sample possessing the HnA gene and thus capable of degrading the HCH, it is the species: Sphingobium indicum, Sphingobium japonicum, Sphingobium baderi, Sphingobium sp. TKS, Sphingobium sp. Ml 1205, Novosphingobium barchaimii and Sphingomonas sp. MM-1.
- the method allowed the complete reconstruction of the HnA gene (471 bp) but also of its flanking regions.
- genomic sequences of several tens of kb reconstruction of more than 70 kb of the Novosphingobium barchaimii genome
- complete plasmids greater than 70 kb plasmid pTK4 of Sphingomonas sp.MM1
- plasmid pTK4 of Sphingomonas sp.MM1 could be reconstructed by assembly, allowing identify bacteria with the HnA gene. They also revealed the presence of other genes potentially involved in the degradation of the pollutant, including the HnB, HnC and HnD genes of the HCH degradation pathway.
- the microorganisms involved in the initial degradation of the pollutant or involved in later phases of its degradation could be demonstrated in the soil sample.
- targeted biostimulation approaches can be implemented to promote the growth and action of these microorganisms in polluted soil, ultimately accelerating the degradation of HCH.
- EXAMPLE 2 Identification of microorganisms capable of degrading HCH in a polluted soil sample - Comparison of the capture of large fragments (Example 1) with a commercial hybridization capture kit used for resequencing genomes of isolated organisms
- a set of 15 nucleotide non degenerate probes was determined from a single linA gene reference sequence using SureDesign software (Agilent Technologies) according to the supplier's recommendations (SEQ ID Nos. 10-24). . These probes are overlapping and are spread with a 5X coverage over the entire linA gene. The probes (SEQ ID Nos. 10 to 24) were then synthesized by Agilent Technologies to meet the needs of the SureSelectXT kit.
- the first bank was built according to the supplier's recommendations (SureSelectXT, Agilent Technologies). In summary, 200 ng of DNA was fragmented by ultrasonication at a size of 150-200 bp (Covaris). The fragmented DNA was then repaired, purified with AMPure XP (Beckman Coulter) beads, adenylated 3 ', and again purified with AMPure XP beads. Adapters were then added to the ends of the DNA fragments and the resulting libraries were purified with AMPure XP beads. Finally, the libraries of small DNA fragments obtained were amplified and purified with Ampure XP beads.
- AMPure XP Beckman Coulter
- the quality of the library was finally assessed by Qubit DNA assay (Life Technologies) and Agilent DNA 12000 Agile Migration (Agilent Technologies).
- the second library of small DNA fragments was constructed according to a different protocol that was adapted for the purposes of the study. For this, the DNA extracted from the soil was previously purified twice by ethanol precipitation and then once using the kit. Microcon DNA Fast Flow PCR Grade (Merck Millipore) to remove inhibitory substances present in soil (humic acids) and co-extracted with DNA. The library was then constructed from the purified sample according to the TruSeq protocol (Illumina). In summary, 100 ng of DNA was fragmented by ultrasonication at a size of 350 bp (Covaris) and purified.
- the fragmented DNA was then repaired, purified and adenylated in 3 '. Adapters were then added to the ends of the DNA fragments, and the resulting libraries were purified, amplified, and purified again. The quality of the library was finally assessed by Qubit DNA assay (Life Technologies) and Agilent DNA 12000 Agile Migration (Agilent Technologies).
- the readings obtained following the sequencing of the DNA libraries of the fragments enriched by the SureSelectXT large fragment capture and capture approaches were filtered according to their quality using the PRINSEQ-lite script (Schmeider, Bioinformatics, 201 1). The number of readings was normalized between the two samples for further analysis. Thus, 7,055,800 pairs of readings were obtained for each of the captures. For each sample, the readings were de novo assembled with IDBA-UD v1.1.2 (Peng, Bioinformatics, 2012). The contigs obtained were then subjected to a second assembly using the CAP3 tool (Huang, Genome Research, 1999).
- Contigs carrying HnA were identified by BLASTN (Altschul, Journal of Molecular Biology, 1990) and then affiliated using BLASTN against the reference genome base (06/10/14) of NCBI. The readings were finally aligned with Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) against the genomes of the identified species and the resulting files were formatted with SAMtools v1.3 (Li, Bioinformatics, 2009) to calculate the target gene enrichment.
- the exploratory character allows the enrichment by a same probe of all the variants of the HnA gene, whereas the non degenerate probes of the SureSelect kit can only target variants very close to the reference sequence used to make the determination of the probes.
- the method of synthesis of the probes for capturing large fragments makes it possible to produce a very large number of probes at a very low cost, making it possible to carry out several thousands of captures, unlike the probes of the SureSelectXT kit which can only be used for 16 captures. and are more expensive (Table 3).
- Table 3 Comparative Table of Probes for the Large Fragment Capture Approach and SureSelectXT Capture
- Capture by hybridization requires the prior completion of a step of constructing DNA libraries from the extracted DNA.
- a high quality 20kb library was constructed directly from the DNA extracted from the sample contaminated with HCH.
- the SureSelectXT kit For gene capture with the SureSelectXT kit, a first bank build was performed according to the provider's recommendations. As shown in FIG. 1, the SureSelectXT kit did not make it possible to build a bank of short fragments and thus carry out the capture step. This is probably due to the contamination of the extracted DNA with inhibitory chemical components (eg humic acids) present in the studied soil and found in the sample. These inhibitors are very often found in environmental samples and especially in soil samples, despite the use of extraction methods to eliminate them. Thus, the application of the SureSelectXT kit is limited for applications in environmental diagnostics.
- inhibitory chemical components eg humic acids
- the method of capturing large fragments is not affected by the presence of inhibitors within the initial DNA sample and is therefore perfectly compatible with the environmental diagnosis.
- the method of capturing large DNA fragments was compared to the SureSelectXT capture using the library built with the SureSelectXT kit and the Illumina library constructed after DNA purification using a dedicated protocol respectively. Enrichment was allowed for catches of large DNA fragments and SureSelectXT capture using the Illumina library whose DNA had previously been purified but not using the SureSelectXT library which could not be constructed as previously explained. Indeed, the step of constructing the initial DNA library that failed with the SureSelectXT kit, the second step of capture enrichment also failed, demonstrating the competitive advantage of the process of capturing large DNA fragments compared to the SureSelectXT kit. Only DNAs from the capture of large DNA fragments and SureSelectXT capture with the Illumina library were sequenced and analyzed.
- the enrichment obtained made it possible to highlight the presence of 9 different HnA genes belonging to 7 different bacterial species: Sphingobium indicum, Sphingobium japonicum, Sphingobium baderi, Sphingobium sp. TKS, Sphingobium sp. Ml 1205, Novosphingobium barchaimii and Sphingomonas sp. MM-1 (Table 4).
- barchaimii was not enriched and did not reveal the presence of the species within the sample, and only one of the two chromosomal HnA genes of Sphingobium sp. Ml 1205 has been enriched. The capture of large DNA fragments thus reveals a greater diversity of genes and microorganisms than the SureSelectXT approach.
- Table 4 Number of genes and species bearing HnA identified by both capture approaches.
- the capture method allowed the complete reconstruction of the HnA gene.
- the approach of capturing large DNA fragments made it possible to reconstruct sequences bearing HnA of large sizes of between 1400 bp and 18600 bp (Table 5).
- the genes present in the regions adjacent to HnA could be identified as for example the HnC gene (implicated downstream of HnA in the HCH degradation pathway), dependent TonB receptors, transcriptional regulators, or insertion sequences 6100 (IS6100).
- the SureSelectXT capture only allowed to reconstruct sequences of smaller sizes ranging from 600 bp to 3400 bp (Table 5).
- the longest reconstructed sequence is that which carries the HnA gene that served as a reference for the determination of the probes.
- This difference in size of reconstructed sequences is explained by the size of the fragments enriched by the two approaches.
- the capture of large fragments makes it possible to enrich the target gene and its flanking regions, whereas the SureSelectXT capture is based on the enrichment of small libraries. fragments of a few hundred pb that do not allow to extend the knowledge beyond the target gene.
- Table 5 Comparison of reconstructed sequence sizes carrying HnA by the two capture methods.
- Table 6 Composition of the artificial microbial community
- a set of 15 specific probes (SEQ ID No.25 to 39) of 80 nucleotides targeting the gene of interest was determined, using KASpOD software (K-mer-based Algorithm for High-Specific Oligonucleotide Design) (Parisot N et al., 2012, vol 28, pages 3161-3162) and HiSpOD (High Specifies Oligo Design) (Dugat-Bony E et al., Bioinformatics, 201 1, vol 27, pp. 641-648).
- the sequences of adapters A (SEQ ID No.1), and B (SEQ ID No.2) were added to each end of the probes for PCR amplification, leading to probes whose sequence is of the type " ATCGCACCAGCGTGT-N80-CACTGCGGCTCCTCA ", where N80 corresponds to the specific sequence of each of the 4 probes.
- Probes with a total length of 1 10 nucleotides were synthesized as single-stranded DNA.
- the T7 promoter (SEQ ID No.3) was added upstream of adapter A by PCR with the Platinium Taq DNA High Fidelity Polymerase Kit (Invitrogen) using primers T7-A and B (SEQ ID No.
- RNA probes were synthesized by in vitro transcription using the MEGAScript kit (Ambion) and biotinylated dUTPs (Tebu-Bio), and were purified with the RNeasy plus kit (Qiagen).
- 3 of the library were mixed with 2.5 of salmon sperm DNA (Salmonsperm DNA, Sheared (ref AM9680, Ambion)) and denatured for 5 minutes at 95 ° C. and then incubated for 5 minutes. at 65 ° C.
- 13 ⁇ l of hybridization buffer (SSPE 10 mol / L, Denhardt's 10 mol / L, 10 mM EDTA, pH 8 and 0.2% SDS) and then 500 ng of biotinylated RNA probes preheated to 65 ° C. C were added to the mixture.
- probe / library hybridization complexes were captured using 500 ng of streptavidin-coated magnetic beads (Dynabeads M-280 Streptavidin (ref 1205D, Life Technologies)) previously washed three times. once with 200 L of 1 M NaCl / 10 mM TE. The beads were washed three times at room temperature with 500 ⁇ l of 1 ⁇ SSC / 0.1% SDS, then three times at 65 ° C. with 500 ⁇ l of pre-heated 0.1 ⁇ SSC / 0.1% SDS. The captured DNA fragments were then eluted with 50 ⁇ l of 0.1 M NaOH.
- the supernatant containing the enriched DNA libraries was transferred to a tube containing 70 ⁇ l of 1 M Tris-HCl. pH 7.5.
- the captured DNA fragments were then purified using the Microcon DNA Fast Flow PCR Grade Kit, Centrifugal Filters, Dual Cycle ⁇ 0 Treated (ref MRCF0R100ET, Merck Millipore) and amplified using the Illustra GenomPhi V2 DNA Amplification Kit (ref. 6600-32, GE Healthcare). Finally, the amplified fragments of a size of 20 kb (+/- 4 kb) were selected with the BluePippin system (Sage Science).
- the readings obtained following the sequencing of the enriched DNA libraries were filtered according to their quality using the PRINSEQ-lite script (Schmeider, Bioinformatics, 201 1). Thus, 7,541,179 pairs of sequences were obtained.
- the readings were de novo assembled with IDBA-UD v1.1.2 (Peng, Bioinformatics, 2012).
- the contigs obtained were then subjected to a second assembly using the CAP3 tool (Huang, Genome Research, 1999). Contigs carrying the target gene were identified by BLASTN (Altschul, Journal of Molecular Biology, 1990) and then affiliated using BLASTN against the reference genome base (06/10/14) of the NCBI. Finally, the readings have been aligned with Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) against the reference genome of C. glutamicum.
- the present method allowed the complete reconstruction of the targeted 2751 bp gene encoding the extracellular nuclease of C. glutamicum but also of its flanking regions. Indeed, a contig of 22.4 kb corresponding to a portion of the genome of C. glutamicum carrying the gene of interest could be reconstructed. This was made possible by the targeted enrichment of the gene and adjacent regions which represent 23% of the sequences, whereas the genome of C. glutamicum initially represented only 1% of the community and the reconstructed DNA region represented than 0.006% of all sequences in the microbial community. The enrichment of the target sequence allowing the characterization of the microorganism is therefore of the order of 4000 times.
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
La présente invention concerne une méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, modification ou séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique, mettant en œuvre une méthode de capture de gènes couplée à du séquençage haut-débit, la méthode de capture de gènes permettant la capture de fragments d'ADN ayant une longueur d'au moins 6 000 paires de bases.
Description
METHODE DE DETECTION ET D'IDENTIFICATION IN VITRO D'UN OU PLUSIEURS MICRO-ORGANISMES IMPLIQUES DANS LE PROCESSUS DE DEGRADATION, DE MODIFICATION OU DE SEQUESTRATION D'UN OU PLUSIEURS CONTAMINANTS
PRESENTS DANS UN ECHANTILLON BIOLOGIQUE.
DOMAINE TECHNIQUE
La présente invention concerne une méthode à haut débit de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique.
ARRIERE-PLAN TECHNOLOGIQUE
Les micro-organismes, par leurs capacités d'adaptation liées à la diversité de leurs capacités métaboliques, jouent un rôle fondamental dans tous les processus biologiques. Ils participent au bon fonctionnement de tous les écosystèmes. Cependant, l'anthropisation peut conduire à des déséquilibres des communautés microbiennes participant ainsi aux changements globaux, comme le réchauffement climatique, en partie occasionné par les émissions croissantes de méthane dans l'atmosphère. A l'inverse, les micro-organismes peuvent permettre la réduction des pollutions résultant de la dispersion de molécules comme les Hydrocarbures Aromatiques Polycycliques (HAP). Ainsi, les communautés microbiennes participent à réduire ou à augmenter les effets délétères de l'anthropisation des écosystèmes. A ce jour, il est difficile d'évaluer la diversité microbienne des écosystèmes, dans la mesure où ces écosystèmes comprennent une quantité importante de micro-organismes différents, dont la plupart sont encore non cultivables ou non caractérisés. Les méthodes utilisées classiquement pour étudier les micro-organismes nécessitent d'isoler et de cultiver au préalable le micro-organisme. De nouvelles techniques de séquençage (Séquençage de nouvelle génération (NGS)) permettent aujourd'hui d'étudier directement l'ADN total extrait d'un environnement. Ces technologies, de par leur très haut-débit et leur coût réduit, permettent l'obtention d'une information de séquence très importante et extraite à partir de communautés microbiennes complexes. Cependant, pour explorer les environnements dans leur globalité, l'effort de séquençage reste encore insuffisant même avec les capacités actuelles des NGS. De même, la quantité importante de données générées, tout comme la taille réduite des lectures ou encore le taux d'erreur
de séquençage restent des problèmes majeurs pour les étapes d'assemblage. Compte- tenu de ces inconvénients majeurs, il est impossible avec les techniques actuelles d'identifier avec précision tous les micro-organismes. Il est nécessaire de pouvoir disposer de techniques exhaustives, résolutives et exploratoires permettant de décrire les gènes jouant le rôle de marqueurs phylogénétiques ou de marqueurs fonctionnels. De plus, ces techniques doivent permettre une caractérisation fine des micro-organismes au niveau de la souche nécessitant l'identification ciblée de grandes régions génomiques voire la reconstruction ciblée de génomes et ce quel que soit leur abondance dans les différents environnements explorés. Enfin, quel que soit le niveau de connaissance sur ces micro- organismes, même complètement inconnus, ils doivent pouvoir être finement décrits avec ces approches.
La demande internationale WO2015/105993 (AgBiome Inc) décrit une méthode d'identification de gènes d'intérêts mettant en œuvre une étape de capture de gènes par hybridation, suivie d'une étape de séquençage pour identifier lesdits gènes d'intérêts dans un échantillon environnemental. Toutefois, la méthode décrite dans la demande internationale WO2015/105993 nécessite l'utilisation de sondes chevauchantes complémentaires de séquences de gènes de référence pour procéder à la capture de fragments d'ADN, et est limitée à la capture de fragments d'ADN de longueur maximale égale à 1800 nucléotides. De plus, l'approche ne permet pas forcément d'identifier des gènes complets et encore moins des séquences nucléiques comprenant plusieurs gènes, voire de nouveaux gènes ou des génomes complets. La méthode décrite dans la demande internationale WO2015/105993 ne permet que d'identifier des gènes dont la séquence nucléique est proche des gènes ciblés, et ne permet pas d'identifier des gènes divergents, voire de nouveaux gènes. Par conséquent, il apparaît nécessaire de disposer d'une méthode à haut débit permettant d'évaluer la diversité microbienne des écosystèmes en détectant et en identifiant de manière plus spécifique et plus sensible les populations de micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants, avec notamment les micro-organismes appartenant à la biosphère rare et les populations microbiennes non cultivables à ce jour.
DESCRIPTION DETAILLEE
Les demandeurs proposent donc une nouvelle méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique.
Un objet de l'invention est donc une méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique, ladite méthode comprenant les étapes suivantes :
a) la préparation d'un mélange de sondes capables de cibler spécifiquement un ou plusieurs gènes d'intérêts caractérisant les microorganismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants,
b) la préparation d'une banque de fragments d'ADN à partir de l'échantillon biologique, lesdits fragments d'ADN contenus dans la banque ayant une longueur d'au moins 6 000 paires de bases,
c) l'hybridation des fragments d'ADN obtenu à l'étape b) par mise en contact desdits fragments d'ADN avec le mélange de sondes de l'étape a),
d) la capture des complexes d'hybridation de l'étape c),
e) le séquençage des fragments d'ADN capturés à l'étape d),
f) la reconstruction des gènes d'intérêts et/ou du génome du ou des microorganismes à partir des fragments d'ADN capturés séquencés de l'étape e), et
g) l'identification du ou des micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l'échantillon biologique.
La méthode selon l'invention permet de capturer des fragments d'ADN ayant une longueur d'au moins 6 000 paires de bases. Grâce à cette nouvelle méthode, les inventeurs sont capables d'identifier à la fois les séquences connues et inconnues d'un ou plusieurs gènes d'intérêts caractérisant les microorganismes impliqués dans les processus de dégradation dudit ou desdits contaminants, de reconstruire de grands fragments de génomes contenant le ou les gènes d'intérêts, et d'identifier le ou les micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l'échantillon biologique. Cette méthode, tout en permettant d'explorer de manière exhaustive la diversité génétique de gènes d'intérêts, présente
l'avantage d'assurer l'identification des régions flanquantes associées aux séquences ciblées. Il est alors possible, par la caractérisation de grandes régions d'ADN, de mettre en évidence des organisations génomiques connues ou inconnues, voire de reconstruire de nouveaux génomes et donc d'identifier de nouveaux micro-organismes avec de nouveaux gènes pouvant avoir un rôle dans une voie métabolique donnée. De plus, la présente méthode permet de s'affranchir de l'utilisation de sondes chevauchantes et complémentaires de séquences de références. De ce fait, il n'est pas nécessaire d'avoir une connaissance initiale exhaustive de la séquence complète des gènes à capturer. L'approche permet de révéler des gènes inconnus grâce au caractère exploratoire des sondes se traduisant par leur dégénérescence à des positions particulières.
La méthode selon l'invention est capable de détecter et d'identifier un ou plusieurs microorganismes impliqués dans le processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants chimiques présents dans un échantillon biologique. Par « micro-organisme » ou « microbe », il est entendu tout organisme unicellulaire eucaryote (protiste), tel que les champignons dont les levures, les microalgues, les protozoaires, ou procaryote, tel que les bactéries et les archées. Avantageusement, les micro-organismes selon l'invention peuvent être des bactéries, en particulier les bactéries exprimant le ou les gènes d'intérêt recherchés. Avantageusement, les bactéries selon l'invention peuvent être des bactéries Gram positif (monoderme), Gram négatif (diderme), à paroi résistante de type BAAR (Bactéries Acido Alcoolo Résistantes) comme les mycobactéries ou sans paroi comme les mycoplasmes. A titre d'exemple, on peut citer les bactéries de la famille des Shingomonadaceae, en particulier Sphingobium indicum, les bactéries de la famille des Burkholderiaceae, en particulier Burkholderia xenovorans, les bactéries de la famille des Dehalococcoidaceae, en particulier Dehalococcoides ethenogenes, ou les bactéries de la famille des Pseudomonadaceae, en particulier Pseudomonas mendocina.
Par « dégradation », il est entendu toute réaction consistant à transformer le contaminant en une autre molécule présentant d'autres propriétés, voire en une molécule n'ayant pas de propriété de toxicité. Par « modification », il est entendu toute réaction consistant à modifier les propriétés du contaminant.
Par « séquestration », il est entendu toute réaction permettant de complexer le contaminant, le rendant ainsi inactif.
Par « contaminants», il est entendu toute substance naturelle ou synthétique non naturellement présente dans l'environnement. Dans un mode de réalisation particulièrement avantageux de l'invention, les contaminants peuvent être des contaminants chimiques ou des contaminants biologiques. Dans un mode de réalisation particulièrement avantageux de l'invention, les contaminants chimiques sont choisis dans le groupe comprenant : les solvants chlorés, les retardateurs de flamme comme le tetrabromobisphenol-A ou les polybromo diphenyl ethers (PBDE), les BTEX (benzène, toluène, éthylbenzène et xylène), le cumène, les pesticides, les hydrocarbures aliphatiques et polycycliques, les dioxines, les furanes, les polychlorodibenzofuranes, le chlorobenzène, les polychlorobiphényles, les carbazoles, les perfluorocarbures (PFC), les déchets plastiques, les produits pharmaceutiques dont les antibiotiques, les produits cosmétiques, les contaminants inorganiques comme l'arsenic, le mercure, le plomb, le perchlorate ou les nanomatériaux comme les nano fibres de carbone. A titre d'exemples de solvants chlorés, il est possible de citer le perchloroéthylène, le trichloroéthylène, le dichloroéthylène. À titre d'exemple de pesticides, il est possible de citer les pesticides chlorés, tel que l'hexaclhorocyclohexane. À titre d'exemple d'hydrocarbures polycycliques, il est possible de citer le benzo[a]pyrène, le naphtalène, le phénanthrène.
Dans un mode de réalisation avantageux de l'invention, les contaminants biologiques peuvent être des toxines, comme par exemple des toxines bactériennes, telles que les shigatoxines, des mycotoxines de champignons, telles que l'aflatoxine ou l'ochratoxine, des toxines provenant d'algues ou biotoxines marines telles que l'acide domoïque, l'acide okadaïque et leurs dérivés, des toxines provenant de plantes, telles que l'hypoglycine et les glycoalcaloïdes.
Par « échantillon biologique », il est entendu tout échantillon comprenant l'ADN d'au moins un micro-organisme. Dans un mode de réalisation avantageux de l'invention, l'échantillon biologique peut être un échantillon environnemental. Avantageusement, l'échantillon environnemental peut être un échantillon de sol, avantageusement un échantillon de sol de forêt, un échantillon de terre agricole cultivée ou non cultivée, un échantillon de sol industriel, un échantillon de sol non anthropisé, un échantillon de sol gelé (permafrost), un échantillon de sédiments ; un échantillon d'eau, avantageusement un échantillon d'eau de rivière, un échantillon d'eau provenant d'un étang, un échantillon d'eau de lac, un échantillon d'eau d'une retenue artificielle, un échantillon d'eau de systèmes de distribution, un échantillon d'eau de systèmes de climatisation, un échantillon d'eau de mer, un échantillon d'océan, un échantillon d'eau de station d'épuration, un échantillon d'eaux
usées, un échantillon d'eau potable, un échantillon d'eaux usées industrielles, un échantillon d'eau de sources, un échantillon de nappes phréatiques, un échantillon d'aquifères, un échantillon d'eau gelé (glaciers, banquise, iceberg), un échantillon d'atmosphère, un échantillon d'air, un échantillon de plante, un échantillon provenant d'un aliment, comme par exemple les crustacés, un échantillon de matières premières agricoles, comme par exemple les ensilages, les céréales un échantillon de digesteur naturel , comme par exemple l'intestin ou le rumen, ou artificiel, tel qu'un méthaniseur.
Avantageusement, l'échantillon environnemental comprend l'ADN d'au moins un microorganisme, avantageusement d'au moins deux micro-organismes différents, avantageusement d'au moins trois micro-organismes différents, avantageusement d'au moins quatre micro-organismes différents, avantageusement d'au moins cinq microorganismes différents, avantageusement d'au moins dix micro-organismes différents, avantageusement d'au moins 20 micro-organismes différents, avantageusement d'au moins 25 micro-organismes différents, avantageusement d'au moins 30 micro-organismes différents, avantageusement d'au moins 50 micro-organismes différents, avantageusement d'au moins 75 micro-organismes différents, avantageusement d'au moins 100 microorganismes différents, avantageusement d'au moins 200 micro-organismes différents, avantageusement d'au moins 300 micro-organismes différents, avantageusement d'au moins 400 micro-organismes différents, avantageusement d'au moins 500 micro- organismes différents, avantageusement d'au moins 600 micro-organismes différents, avantageusement d'au moins 700 micro-organismes différents, avantageusement d'au moins 800 micro-organismes différents, avantageusement d'au moins 900 microorganismes différents avantageusement d'au moins 1000 micro-organismes différents, avantageusement d'au moins 2000 micro-organismes différents, avantageusement d'au moins 3000 micro-organismes différents, avantageusement d'au moins 5000 microorganismes différents ou plus.
La méthode mise au point par les inventeurs ne nécessite pas au préalable d'isolement des micro-organismes mais est capable d'identifier directement à partir de communautés des séquences d'ADN de gènes d'intérêts caractérisant les micro-organismes recherchés, dont les produits peuvent participer aux processus de dégradation, modification ou séquestration des contaminants. Cette méthode permet directement à partir de mélanges non caractérisés de populations de micro-organismes, à partir d'échantillons biologiques bruts où les échantillons biologiques sont recueillis et non soumis à une purification préalable pour éliminer des substances inhibitrices telles que les acides humiques ou les acides fulviques présents dans les échantillons de sol par exemple, d'identifier précisément les
micro-organismes recherchés. Ainsi, la méthode selon l'invention est capable d'identifier des séquences d'ADN de gènes et des variants connus ou inconnus de ceux-ci au travers de l'interrogation de l'ADN de micro-organismes de communautés microbiennes, qu'ils soient cultivables, difficiles à cultiver ou non cultivables. . Gènes d'intérêt
Des séquences d'ADN connues de gènes d'intérêts ou des variants de celles-ci, mais également des séquences d'ADN inconnues de gènes d'intérêt ou des variants de celles- ci peuvent être détectées et identifiées par la méthode selon l'invention. Au sens de la présente invention, il est entendu par « séquence d'ADN de gène d'intérêt », la séquence d'ADN de gène connu ou inconnu.
Dans un mode de réalisation selon l'invention, les gènes d'intérêts peuvent être les gènes codant pour les enzymes de dégradation des contaminants chimiques ou biologiques mais aussi des séquences caractérisant les microorganismes portant les activités recherchées.
Avantageusement, les gènes d'intérêts peuvent être choisis dans le groupe comprenant : les gènes codant pour les dioxygénases, les gènes codant pour les déhalogénases, les gènes codant pour les cytochromes P450, les gènes codant pour les enzymes lignolytiques, les gènes codant pour les hydrogénases et les gènes codant pour les enzymes de dégradation des contaminants biologiques, en particulier les gènes codant pour les enzymes de dégradation des toxines, en particulier des hydrolases, des décarboxylases, des glycosylases. Dans un mode de réalisation particulièrement avantageux, le gène d'intérêt peut être le gène HnA.
Dans un autre mode de réalisation de l'invention, les sondes peuvent être conçues pour reconnaître des séquences d'ADNr 16S, ou toute autre séquence différentielle phylogénétique comme les gènes mcrA, col ou les ITS, afin de capturer les séquences nécessaires à l'estimation de la répartition des espèces de microorganismes présentes dans l'échantillon biologique.
Dans un autre mode de réalisation de l'invention, les sondes peuvent être conçues pour reconnaître des séquences spécifiques de microorganismes impliqués dans la dégradation, la modification ou la séquestration de contaminants chimiques ou biologiques afin de capturer ces séquences nécessaires à la détection et l'identification de ces microorganismes d'intérêt dans l'échantillon biologique.
La méthode selon l'invention peut identifier des variants de séquences d'ADN connus ou inconnus provenant de plusieurs familles de gènes d'intérêts. Au sens de la présente invention, le terme « variants » ou « gène variant » se réfère aux gènes montrant des similarités plus ou moins importantes. Bien que l'expression d'un variant puisse être modifiée par rapport à celui du gène d'intérêt, le variant peut conserver la même fonction que le gène d'intérêt ou aboutir à de nouvelles fonctions. Par exemple, un variant peut avoir une expression accrue, une expression réduite, un spectre d'expression différent (par exemple, pour un gène de toxine insecticide), ou toute autre modification de l'expression par rapport au gène d'intérêt ciblé. De manière générale, par « variant » il est entendu des séquences sensiblement similaires. Pour des polynucléotides, un variant comprend une délétion et/ou une insertion d'un ou plusieurs nucléotides à un ou plusieurs sites dans le polynucléotide natif, ou une substitution d'un ou plusieurs nucléotides à un ou plusieurs sites dans le polynucléotide natif voire des modifications chimiques de type méthylation ou autres. Il est entendu par « polynucléotide natif » ou « polynucléotide de type sauvage », un polynucléotide qui comprend une séquence nucléotidique naturelle. Pour les séquences codant des protéines, les variants peuvent être des variants dits « conservateurs », qui en raison de la dégénérescence du code génétique codent pour la séquence d'acides aminés native du produit du gène d'intérêt ; des variants alléliques naturels, tels que ceux qui peuvent être identifiés par des techniques bien connues de l'homme du métier, comme par exemple par amplification par polymérisation en chaîne (PCR) ou les techniques d'hybridation ou de séquençage direct sans a priori; des variants obtenus de manière artificielle, comme notamment ceux générés par mutagénèse aléatoire ou dirigée mais codant toujours pour le produit du gène d'intérêt ou montrant des similarité des séquences de structure. Avantageusement, le variant présente au moins environ 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91 %, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou 100% d'identité avec la séquence nucléotidique du gène d'intérêt.
Sondes
Dans un mode de réalisation de l'invention, la méthode utilise des sondes de capture spécifiques des gènes d'intérêts ou des variants connus ou inconnus de ceux-ci. Au sens de la présente invention, il est entendu par « sonde », un polynucléotide capable de s'hybrider avec la séquence du gène d'intérêt ou un variant connu ou inconnu de celui-ci. Les sondes peuvent être des séquences d'ARN ou d'ADN, chevauchantes, contiguës ou séquentielles. Dans un mode de réalisation avantageux de l'invention, les sondes sont des séquences d'ARN simple brin capables de s'hybrider à la séquence du gène d'intérêt par complémentarité des nucléotides. À titre d'exemple, la séquence d'ARN de la sonde est
complémentaire de la séquence ADN issue du fragment du gène d'intérêt. Dans un mode de réalisation particulièrement avantageux, les sondes selon l'invention sont des séquences d'ARN simple brin non chevauchantes. Dans un mode de réalisation particulièrement avantageux, les sondes sont exploratoires, c'est-à-dire capables de cibler spécifiquement un ensemble de séquences connues et inconnues de gènes d'intérêts, les séquences connues et inconnues de gènes d'intérêts pouvant être des séquences d'ADN ou d'ARN ou d'ADNc. Dans un mode de réalisation encore plus avantageux de la présente invention, les sondes sont des séquences d'ARN simple brin non chevauchantes et exploratoires. Dans un mode de réalisation avantageux selon l'invention, les sondes ont une longueur d'au moins 20 nucléotides contigus, avantageusement d'au moins 30 nucléotides contigus, avantageusement d'au moins 40 nucléotides contigus, avantageusement d'au moins 50 nucléotides contigus, avantageusement d'au moins 60 nucléotides contigus, avantageusement d'au moins 70 nucléotides contigus, avantageusement d'au moins 80 nucléotides contigus, avantageusement au moins 90 nucléotides contigus, avantageusement au moins 100 nucléotides contigus, avantageusement au moins 1 10 nucléotides contigus, avantageusement au moins 120 nucléotides contigus, avantageusement au moins 130 nucléotides contigus, avantageusement au moins 140 nucléotides contigus, avantageusement au moins 150 nucléotides contigus ou plus. Avantageusement, la séquence des sondes peut comprendre 20 à 150 nucléotides contigus, avantageusement 70 à 150 nucléotides contigus, avantageusement 100 à 140 nucléotides contigus, avantageusement 1 10 à 120 nucléotides contigus, avantageusement 70 à 90 nucléotides contigus. De manière particulièrement avantageuse, les sondes ont une longueur de 80 nucléotides contigus. Dans un mode de réalisation avantageux selon l'invention, les sondes peuvent être complémentées avec un marqueur détectable pour permettre la capture du complexe d'hybridation comprenant la sonde hybridée au fragment d'ADN du gène d'intérêt ou du variant connu ou inconnu de celui-ci. Dans un mode de réalisation particulièrement avantageux, les sondes sont marquées avec de la biotine, un haptène ou un marqueur d'affinité, ou sont générées par polymérisation ou transcription en utilisant des oligonucléotides biotinylés. Dans un mode de réalisation encore plus avantageux, les sondes sont biotinylées. Dans un mode de réalisation encore plus avantageux, les sondes sont des sondes ARN simple brin biotinylées ayant une longueur de 80 nucléotides. Dans un mode de réalisation encore plus avantageux, les sondes ARN simple brin sont biotinylées aléatoirement sur la totalité de leur séquence.
Les sondes oligonucléotidiques peuvent inclure des adaptateurs nécessaires pour leur amplification par PCR. Dans un mode de réalisation particulièrement avantageux, les sondes comprennent un adaptateur A de séquence SEQ ID No.1 et un adaptateur B de séquence SEQ ID No.2, l'adaptateur A étant placé à l'extrémité 5' de la séquence de la sonde et l'adaptateur B étant placé à l'extrémité 3' de la séquence de la sonde. Avantageusement, les séquences des adaptateurs A (SEQ ID No.1 ), et B (SEQ ID No.2) sont ajoutées à chaque extrémité des sondes conduisant à des sondes dont la séquence est du type « adaptateur A - sonde - adaptateur B ». La sonde peut également inclure un promoteur, en position 5' de l'adaptateur A, ou en 3' de l'adaptateur B, comme par exemple le promoteur T7, de séquence SEQ ID No.3.
Dans un mode de réalisation selon l'invention, les sondes oligonucléotidiques, une fois synthétisées, sont amplifiées à l'aide des adaptateurs A et B pour rajouter le promoteur T7, puis purifiées. L'homme du métier saura utiliser toutes les méthodes adéquates pour l'amplification et la purification. Avantageusement, les sondes peuvent être amplifiées en utilisant le kit Platinium Taq DNA Polymerase High Fidelity commercialisé par la société Invitrogen et peuvent être purifiées en utilisant le kit MinElute PCR purification commercialisé par la société Qiagen. Les sondes sont ensuite transcrites in vitro grâce au promoteur T7 en présence de dNTP biotinylés, afin d'obtenir les sondes ARN biotinylées. L'homme du métier saura utiliser toutes les méthodes adéquates pour transcrire les sondes bioyinylées et les purifier. Avantageusement, la transcription in vitro peut être réalisée en utilisant le kit MEGAScript commercialisé par la société Ambion et des dUTP biotinylés commercialisés par la société Tebu-Bio. Les sondes ARN biotinylées peuvent ensuite être purifiées en utilisant le kit RNeasy plus commercialisé par la société Qiagen. Dans un mode de réalisation selon l'invention, des sondes spécifiques de différents gènes peuvent être utilisées de manière simultanée pour s'hybrider avec les fragments d'ADN ou ARN ou d'ADNc préparés à partir de l'échantillon biologique. Par exemple, pour l'analyse d'un échantillon biologique, des sondes conçues pour chaque gène d'intérêt peuvent être combinées pour former un mélange de sondes, en amont de leur synthèse, ou au moment de la mise en contact des sondes avec la banque de fragments d'ADN obtenus à partir de l'échantillon biologique.
Dans un autre mode de réalisation avantageux selon l'invention, les sondes sont conçues pour capturer les séquences correspondantes aux gènes codant pour les enzymes de dégradation des contaminants chimiques, en particulier aux gènes codant pour les dioxygénases, aux gènes codant pour les déhalogénases, aux gènes codant pour les cytochromes P450, aux gènes codant pour les enzymes lignolytiques, aux gènes codant
pour les hydrogénases et aux gènes codant pour les enzymes de dégradation des contaminants biologiques, en particulier aux gènes codant pour les enzymes de dégradation des toxines.
Au sens de la présente invention, un « mélange de sondes » se réfère à un ensemble de sondes conçues pour être spécifique d'un ou de différents gènes d'intérêts et ses variants connus ou inconnus appartenant à un microorganisme cible particulier et / ou un ensemble de sondes conçues pour être spécifiques d'un ou de différents gènes d'intérêts appartenant à des microorganismes cibles différents.
Dans un mode de réalisation particulièrement avantageux de l'invention, le mélange de sondes peut comprendre au moins une sonde, avantageusement au moins 2 sondes, avantageusement au moins 3 sondes différentes, avantageusement au moins 4 sondes différentes , avantageusement au moins 5 sondes différentes, avantageusement au moins 10 sondes différentes, avantageusement au moins 20 sondes différentes, avantageusement au moins 30 sondes différentes, avantageusement au moins 40 sondes différentes, avantageusement au moins 50 sondes différentes, avantageusement au moins 60 sondes différentes, avantageusement au moins 70 sondes différentes, avantageusement au moins 80 sondes différentes, avantageusement au moins 90 sondes différentes, avantageusement au moins 100 sondes différentes, avantageusement au moins 200 sondes différentes, avantageusement au moins 300 sondes différentes, avantageusement au moins 400 sondes différentes, avantageusement au moins 500 sondes différentes, avantageusement au moins 600 sondes différentes, avantageusement au moins 700 sondes différentes, avantageusement au moins 800 sondes différentes, avantageusement au moins 900 sondes différentes, avantageusement au moins 1000 sondes différentes, avantageusement au moins 1200 sondes différentes, avantageusement au moins 1400 sondes différentes, avantageusement au moins 1500 sondes différentes, avantageusement au moins 1600 sondes différentes, avantageusement au moins 1700 sondes différentes, avantageusement au moins 1800 sondes différentes, avantageusement au moins 1900 sondes différentes, avantageusement au moins 2000 sondes différentes, avantageusement au moins 3000 sondes différentes, avantageusement au moins 5000 sondes différentes ou plus.
Dans un mode de réalisation particulièrement avantageux de l'invention, le mélange de sondes comprend entre 1 et 5000 sondes différentes, avantageusement entre 100 et 4500 sondes différentes, avantageusement entre 500 et 4000 sondes différentes, avantageusement entre 1000 et 4000 sondes différentes, avantageusement entre 1500 et
3000 sondes différentes, avantageusement entre 1600 et 2500 sondes différentes, avantageusement entre 1900 et 2100 sondes différentes.
Dans un mode de réalisation particulièrement avantageux de l'invention, le mélange de sondes peut être spécifique d'au moins 1 , avantageusement au moins 2, avantageusement au moins 10, avantageusement au moins 50, avantageusement au moins 100, avantageusement au moins 150, avantageusement au moins 200, avantageusement au moins 250, avantageusement au moins 300, avantageusement au moins 500 gènes d'intérêt. Avantageusement, le mélange de sondes est spécifique d'au moins un gène d'intérêt. Dans un mode de réalisation particulièrement avantageux de l'invention, le nombre de gènes d'intérêt ciblés par le mélange de sondes est compris entre 1 et 500 gènes d'intérêt, avantageusement entre 1 et 400 gènes d'intérêt, avantageusement entre 1 et 3500 gènes d'intérêt, avantageusement entre 1 et 300 gènes d'intérêt.
Dans un mode de réalisation avantageux de l'invention, l'intervalle entre deux sondes est compris entre 10 paires de bases (pb) et 1000 pb, avantageusement entre 50 pb et 500 pb, avantageusement entre 100 pb et 450 pb, avantageusement entre 100 pb et 400 pb, avantageusement entre 100 pb et 350 pb, avantageusement entre 100 et 300 pb, avantageusement entre 100 pb et 250 pb, avantageusement entre 100 pb et 200 pb. Dans un mode de réalisation particulièrement avantageux de l'invention, l'intervalle entre deux sondes est compris entre 100 pb et 200 pb.
Au sens de la présente invention, une sonde spécifique d'un gène et de l'ensemble de ses variants connus ou inconnus est conçue pour hybrider l'ensemble des gènes et des variants connus ou inconnus de ce gène présents au sein de l'échantillon biologique. Une sonde est donc spécifique de l'ensemble des variants d'un gène d'intérêt. Dans un mode de réalisation avantageux, les séquences des sondes sont conçues pour cibler les gènes d'intérêts et leurs variants connus ou inconnus en utilisant des outils logiciels tels que KASpOD, HiSpOD ou ExSpOD.
Dans un mode de réalisation avantageux selon l'invention, la sonde est capable de s'hybrider avec un fragment d'ADN, d'ARN ou d'ADNc du gène d'intérêt et de ses variants connus ou inconnus d'une longueur d'au moins 6 000 nucléotides, avantageusement 20 000 nucléotides encore plus avantageusement 50 000 nucléotides, jusqu'à la longueur totale de la séquence nucléotidique du génome d'intérêt ou jusqu'à la longueur totale de la séquence nucléotidique d'intérêt.
Préparation d'une banque de fragments d'ADN à partir de l'échantillon biologique
Pour obtenir la banque de fragments d'ADN capable d'être hybridée par les sondes telles que décrites ci-dessus, l'échantillon biologique contenant les ADNs d'au moins un microorganisme doit être préparé en vue de l'étape d'hybridation. L'extraction de l'ADN à partir de l'échantillon biologique peut être réalisée par n'importe quelle technique bien connue de l'homme du métier, permettant d'extraire de l'ADN de taille compatible avec la taille des fragments à capturer en vue de l'étape d'hybridation. Avantageusement, l'extraction de l'ADN à partir de l'échantillon biologique peut être réalisée en utilisant des kits d'extraction d'ADN disponibles dans le commerce, comme par exemple les kits : Bacterial Genomic DNA Mini-prep Kit commercialisé par BayGene/Sigma-AIdrich ; BACMAX DNA purification kit commercialisé par Epicentre Biotechnologies/ Cambio ; PowerSoil DNA isolation kit commercialisé par MO BIO Laboratories Inc ; PowerMax Soil DNA Isolation Kit commercialisé par MO BIO Laboratories Inc ; UltraClean Microbial DNA Isolation Kit commercialisé par MO BIO Laboratories Inc. Dans un mode de réalisation avantageux de l'invention, l'ADN extrait est ensuite fragmenté en fragments d'ADN de longueur spécifique. Avantageusement l'ADN est fragmenté en fragments ayant une longueur d'au moins 6 000 paires de bases, avantageusement d'au moins 20 000 paires de bases, avantageusement d'au moins 50 000 paires de bases. La fragmentation de l'ADN peut être réalisée par n'importe quelle technique connue de l'homme du métier permettant d'obtenir des fragments d'ADN ayant la longueur désirée. Avantageusement, les fragments d'ADN selon l'invention sont obtenus en utilisant le kit g- TUBE commercialisé par la société Covaris. Dans un mode de réalisation particulièrement avantageux de l'invention, les fragments d'ADN ont soit une longueur de 6 000 paires de bases, soit une longueur de 20 000 paires de bases d'ADN, soit une longueur de 50 000 paires de bases d'ADN. Au sens de la présente invention, il est entendu par « banque de fragments d'ADN » ou « banque », un ensemble de fragments d'ADN ayant la même longueur, lesdits fragments d'ADN étant obtenus à partir de l'échantillon biologique. Dans un mode de réalisation avantageux de l'invention, les fragments d'ADN constituants la banque ont une taille homogène. Dans un mode de réalisation particulier de l'invention, trois banques de fragments d'ADN sont obtenues à partir de l'échantillon biologique : une banque dite « 6kb » comprenant des fragments d'ADN ayant une longueur de 6 000 paires de bases, une banque dite « 20kb » comprenant des fragments d'ADN ayant une longueur de 20 000 paires de bases et une banque dite « 50kb » comprenant des fragments d'ADN ayant une longueur de 50 000
paires de bases. Dans un mode de réalisation particulièrement avantageux de l'invention, la banque de fragments d'ADN comprend des fragments d'ADN ayant une longueur d'au moins 6 000 paires de bases, avantageusement au moins 20 000 paires de bases, avantageusement au moins 50 000 paires de bases. Dans un mode de réalisation avantageux, la méthode selon l'invention peut en outre comprendre une étape sélection de taille des ADN fragmentés. Avantageusement, l'étape de sélection peut être réalisée avec le système BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience. Dans un mode de réalisation avantageux de l'invention, les banques d'ADN peuvent être enrichies par amplification, notamment par amplification isotherme par déplacement de brin, permettant d'enrichir d'au moins 1 ,5 fois, avantageusement au moins 2 fois, avantageusement au moins 5 fois, avantageusement au moins 10 fois, avantageusement au moins 20 fois, avantageusement au moins 50 fois, avantageusement au moins 100 fois, avantageusement au moins 1000 fois la population cible de fragments d'ADN. Avantageusement, l'amplification de la banque peut être réalisée avec le kit IHustraGenomPhi V2 DNA Amplification commercialisé par la société GE Healthcare.
Dans un mode de réalisation avantageux, la méthode selon l'invention peut en outre après l'étape d'amplification, comprendre une étape sélection de la taille des banques de fragments d'ADNs amplifiées. Avantageusement, l'étape de sélection de la taille des banques de fragments d'ADNs amplifiées peut être réalisée avec le système BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience. Avantageusement, cette étape de sélection de la taille des banques de fragments d'ADNs amplifiées permet de conserver uniquement les fragments d'ADN amplifiés ayant soit une longueur moyenne de 6 000 paires de bases, soit une longueur moyenne de 20 000 paires de bases, soit une longueur moyenne de 50 000 paires de bases d'ADN
Hybridation et capture des fragments d'ADN Hybridation
Les sondes peuvent être mélangées à la banque de fragments d'ADN préalablement à l'étape d'hybridation par n'importe quel moyen connu de l'homme du métier. La quantité de
sondes ajoutées à la banque de fragments d'ADN doit être suffisante pour permettre la fixation des fragments d'ADN des gènes d'intérêts ou de ces variants. Dans un mode de réalisation avantageux selon l'invention, le nombre de sondes introduites dans le mélange est supérieur ou égal au nombre de fragments d'ADN contenusdans la banque. Le rapport sondes/fragments d'ADN pour l'hybridation est d'environ 1 :1 , avantageusement d'environ 250:1 , avantageusement d'environ 1000:1 , avantageusement d'environ 20000 :1 ou supérieur.
Dans un mode de réalisation avantageux selon l'invention, l'étape c) d'hybridation est réalisée en solution ou sur support solide. Avantageusement, l'étape d'hybridation est réalisée en solution. Dans un mode de réalisation avantageux selon l'invention, l'étape d'hybridation est réalisée dans des conditions stringentes.
Dans un mode de réalisation particulier, la banque de fragments d'ADN, d'ADNc ou d'ARN est hybridée avec les sondes pendant une durée d'au moins 16 heures, avantageusement d'au moins 20 heures, encore plus avantageusement d'au moins 24 heures, et à une température d'au moins 45°C, avantageusement d'au moins 50°C, avantageusement d'au moins 55°C, avantageusement d'au moins 60°C, encore plus avantageusement d'au moins 65°C. Dans un mode de réalisation particulièrement avantageux, la banque dé fragmente d'ADN ou d'ARN est hybridée avec les sondes pendant 24 heures à une température de 65°C. Avantageusement, le tampon d'hybridation peut comprendre un tampon à base d'un mélange de chlorure de sodium, d'EDTA et de phosphate, commercialisé sous le nom tampon SSPE (« Saline-Sodium Phosphate-EDTA Hybridization Buffer »), une solution Denhardt's, de l'EDTA, un tampon SDS, de l'EDTA et de l'eau. Avantageusement, le tampon d'hybridation utilisé dans la présente invention pour l'étape d'hybridation comprend du SSPE 20X à une concentration de 10X, du Denhardt's 50Xà une concentration de 10X, de l'EDTA 0,5mM pH 8 à une concentration de 10mM, du SDS 10% à une concentration de 0,2% et de l'eau.
Capture
Après l'hybridation, les sondes biotinylées peuvent être séparées en fonction de la présence du marqueur détectable, et les sondes et les fragments d'ADN non liés sont éliminés dans des conditions de lavage appropriées. Seuls sont conservés les fragments d'ADN qui se sont hybridés spécifiquement avec les sondes biotinylées. Les complexes d'hybridation peuvent être capturés et purifiés à partir du mélange de sondes non liées et des fragments d'ADN non liés de la banque. Par exemple, les complexes d'hybridation peuvent être capturés à l'aide d'une molécule de streptavidine fixée à une phase solide, telle qu'une bille
magnétique. Dans un mode de réalisation particulièrement avantageux selon l'invention, les complexes d'hybridation sont capturés au moyen de billes magnétiques recouvertes de streptavidine, avantageusement en utilisant 500ng de billes Dynabeads M-280 (Life technologies). Dans un mode de réalisation avantageux selon l'invention, l'étape d) de capture est suivie de trois étapes de lavage pour éliminer les sondes et les fragments d'ADN non liés mettant en œuvre trois tampons de lavage différents.
Avantageusement, le premier lavage est réalisé en utilisant un tampon de lavage comprenant du chlorure de sodium, avantageusement à une concentration comprise entre 0,5M et 1 ,5M, avantageusement à une concentration de 1 M, du Tris-HCI, avantageusement à une concentration comprise entre 5mM et 15mM, avantageusement à une concentration de 10mM, et de l'EDTA, avantageusement à une concentration comprise entre 0,5mM et 1 ,5mM, avantageusement à une concentration de 1 mM. Avantageusement, le premier lavage est réalisé à température ambiante, avantageusement à une température comprise entre 25°C et 30°C. Avantageusement, le premier lavage est réalisé à un pH compris entre 7,0 et 8,0, avantageusement à un pH de 7,5.
Avantageusement, le deuxième lavage est réalisé en utilisant un second tampon d'élution comprenant du SSC 20X (SSC 20X = 3M NaCI, 0,3M citrate de sodium), avantageusement à une concentration comprise entre 0,5X et 1 ,5X, avantageusement à une concentration de 1 X et du SDS 10%, avantageusement à une concentration comprise entre 0,05% et 0,15%, avantageusement à une concentration de 0,1 %. Avantageusement, le second lavage est réalisé à température ambiante, avantageusement à une température comprise entre 25°C et 30°C.
Avantageusement, le troisième lavage est réalisé en utilisant un troisième tampon d'élution comprenant du SSC 20X, avantageusement à une concentration comprise entre 0,05X et 0,15X, avantageusement à une concentration de 0,1 X et du SDS 10%, avantageusement à une concentration comprise entre 0,05% et 0,15%, avantageusement à une concentration de 0,1 %. Avantageusement, le troisième lavage est réalisé à une température comprise entre 30°C et 80°C, avantageusement à une température comprise entre 40°C et 75°C, avantageusement à une température comprise entre 50 °C et 70°C, avantageusement à une température de 65°C.
Dans un mode de réalisation avantageux selon l'invention, les étapes de lavage de capture peut être suivie d'une étape d'élution par dénaturation chimique à la soude, permettant de
séparer les complexes d'hybridation et ainsi libérer les fragments d'ADN capturés. Avantageusement, cette étape permet de séparer les sondes des fragments d'ADN capturés, en sédimentant les billes magnétiques recouvertes de streptavidine sur lesquelles sont fixées les sondes. Les fragments d'ADN capturés sont ensuite récupérés dans le surnageant. Dans un mode de réalisation avantageux, l'étape d'élution peut être réalisée en incubant les billes magnétiques recouvertes de streptavidine sur lesquelles sont fixés les complexes d'hybridation en présence de soude à une concentration comprise entre 0,01 M et 1 M, avantageusement entre 0,05M et 0,5 M, avantageusement 0,1 M, pendant au moins 5 minutes, avantageusement 10 minutes, à température ambiante. Les billes magnétiques recouvertes de streptavidine sédimentent et le surnageant est ensuite récupéré. Un tampon Tris-HCI, avantageusement à une concentration comprise entre 0,5M et 1 ,5M, avantageusement à une concentration de 1 M, à pH 7,5 est ensuite ajouté au surnageant.
Dans un mode de réalisation avantageux selon l'invention, l'étape d'élution peut être suivie d'une étape de purification des fragments d'ADN capturés. Avantageusement, l'étape de purification peut être réalisée avec le kit Microcon DNA flast flow PCR grade, centrifugal filters, dual cycle ETO treated, commercialisé par la société Merck Millipore.
Amplification des fragments d'ADN capturés
Dans un mode de réalisation avantageux, la méthode selon l'invention peut en outre comprendre une étape d'amplification des fragments d'ADN résultant de l'étape d) de capture. Avantageusement, l'amplification de la banque peut être réalisée avec le kit IHustraGenomPhi V2 DNA Amplification commercialisé par la société GE Healthcare.
Sélection des fragments d'ADN capturés en fonction de leur taille
Dans un mode de réalisation avantageux, la méthode selon l'invention peut en outre comprendre une étape de sélection des fragments d'ADN capturés en fonction de leur taille résultant de l'étape d) de capture. Avantageusement, l'étape de sélection peut être réalisée avec le sysème BluePippin en utilisant les kits 0,75% Agarose Gel Cassette Mid Range Targets, 0,75% Agarose Gel Cassette Low Range Targets ou 0,75% Agarose Gel Cassette 50kb commercialisés par la société SageScience. Avantageusement, cette étape de sélection permet de conserver uniquement les fragments ayant soit une longueur de 6 000 paires de bases, soit une longueur de 20 000 paires de bases, soit une longueur de 50 000 paires de bases d'ADN ou d'ARN ou d'ADNc.
La distribution de la taille des ADNs capturés peut ensuite être évaluée en utilisant le kit Agilent DNA 12000 commercialisé par la société Agilent.
Séquençage des fragments d'ADN capturés
Les fragments d'ADN capturés peuvent ensuite être séquencés par n'importe quelle technique bien connue de l'homme du métier. Le séquençage des fragments d'ADN capturés peut être réalisé en utilisant les systèmes de séquençage à haut débit commercialisé par la société Illumina Inc., par exemple le système MiSeq ou HiSeq. Toutes les plates-formes connues de l'homme du métier, telles que les plates-formes de première génération telle que Sanger, de deuxième génération telle que Illumina (MiniSeq, MiSeq, NextSeq, HiSeq, Synthetic Long Read, 10X Genomics) ou 454 (Roche) ou SOLiD (Thermo Fisher) ou Ion Torrent (Thermo Fisher) ou Gene Reader (Qiagen) ou Complète Genomics (GGI) et de troisième génération telles que Pacific BioSciences (RSII ou Sequel) ou Oxford Nanopore (MinlON, GridION ou PromethlON) tout comme les nouvelles plates-formes en développement (GenapSys, Genia, Firefly, NanoString Technologies, GnuBio, Electron Optica) peuvent être utilisées pour séquencer les fragments d'ADN capturés. Selon la méthode de séquençage utilisée, l'homme du métier sera en mesure de construire les banques adaptées à partir des fragments d'ADN capturés.
Reconstruction de grands fragments de génomes
Les séquences des différents fragments d'ADN des gènes d'intérêt peuvent être assemblées par tout moyen connu de l'homme du métier. Les séquences des différents fragments d'ADN des gènes d'intérêt peuvent être assemblées pour reconstruire la séquence totale du gène d'intérêt, ou un variant connu ou inconnu de celui-ci. Les séquences des différents fragments d'ADN des gènes d'intérêt peuvent être assemblées pour reconstruire la séquence totale du gène d'intérêt, ou un variant connu ou inconnu de celui-ci et les régions flanquantes associées aux séquences ciblées voire la totalité du génome dans lequel est localisé le gène d'intérêt. Dans certains modes de réalisation, les séquences sont assemblées à l'aide des outils de bio-informatique, comme par exemple IDBA-UD, Spades, MetaVelvet. Après l'assemblage, les séquences des gènes d'intérêts, ou des variants connus ou inconnus de ceux-ci, sont confirmées par comparaison des séquences contre des bases de données de séquences connues, telle que la base GenBank du NCBI ou ENA de l'EMBL, afin de caractériser les niveaux de similarité avec les séquences connues du gène d'intérêt, ou un variant de celui-ci.
Dans un mode de réalisation particulièrement avantageux de l'invention, la méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique, ladite méthode comprenant les étapes suivantes : a) la préparation d'un mélange de sondes non chevauchantes et exploratoires capables de cibler spécifiquement un ou plusieurs gènes d'intérêts impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants, b) la préparation d'une banque de fragments d'ADN à partir de l'échantillon biologique, lesdits fragments d'ADN contenus dans la banque ayant une longueur d'au moins 6 000 paires de bases, c) l'hybridation des fragments d'ADN obtenu à l'étape b) par mise en contact desdits fragments d'ADN avec le mélange de sondes de l'étape a), d) la capture des complexes d'hybridation de l'étape c), e) le séquençage des fragments d'ADN capturés à l'étape d), f) la reconstruction des gènes d'intérêts et/ou du génome du ou des microorganismes à partir des fragments d'ADN capturés séquencés de l'étape e), et g) l'identification du ou des micro-organismes, impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants, présents dans l'échantillon biologique.
Les figures 1 à 2 et les exemples 1 à 3 qui suivent illustrent l'invention.
FIGURES Figure 1 : Profil Agilent de la banque SureSelectXT de petits fragments d'ADN. L'absence de pic/de bande entre les marqueurs de taille (50 et 17000 pb) démontre l'absence d'ADN et donc l'échec de la construction de la banque SureSelectXT sur l'échantillon de sol étudié.
Figure 2 : Profil Agilent de la banque Illumina de petits fragments d'ADN. La présence d'un pic/d'une bande à 400 pb entre les marqueurs de taille (50 et 17000 pb) montre la présence
d'ADN à la taille souhaitée et donc la réussite de la construction d'une banque d'ADN avec le kit TruSeq sur l'échantillon de sol étudié.
EXEMPLES
Exemple 1 : Identification de micro-organismes capables de dégrader le HCH dans un échantillon de sol pollué
AI Isolement de l'ADN :
Un échantillon de sol contaminé par l'hexachlorocyclohexane (HCH) a été collecté dans une ancienne usine de production de produits chimiques, et l'ADN génomique des microorganismes contenu dans l'échantillon de sol a été extrait en utilisant le kit PowerSoil DNA Isolation de MoBio.
B/ Détermination et synthèse des sondes :
Un jeu de 4 sondes dégénérées de 80 nucléotides a été déterminé à partir de 145 séquences du gène HnA extraites de la base de données GenBank en utilisant les logiciels KASpOD (K-mer based Algorithm for high-Specific Oligonucleotide Design) (Parisot N et al., 2012, vol 28, pages 3161 -3162) et HiSpOD (High Spécifie Oligo Design) (Dugat-Bony E et al. , Bioinformatics, 201 1 , vol 27, pages 641 -648) (SEQ ID No.4, 5, 6 et 7). Les sondes sont non chevauchantes et réparties de façon uniforme sur la séquence complète du gène HnA (471 pb), codant pour une déhydrogénase impliquée dans les premières étapes de la voie de dégradation du HCH. Les séquences des adaptateurs A (SEQ ID No.1 ), et B (SEQ ID No.2) ont été ajoutées à chaque extrémité des sondes en vue de l'amplification par PCR, conduisant à des sondes dont la séquence est du type « ATCGCACCAGCGTGT-N80- CACTGCGGCTCCTCA », où N80 correspond à la séquence spécifique de chacune des 4 sondes. Les sondes d'une longueur totale de 1 10 nucléotides ont été synthétisées sous forme d'ADN simple brin. Le promoteur T7 (SEQ ID No.3) a été ajouté en amont de l'adaptateur A par PCR avec le kit Platinium Taq DNA Polymerase High Fidelity (Invitrogen) en utilisant des amorces T7-A et B (SEQ ID No. 8 et 9) s'hybridant respectivement sur les adaptateurs A et B (SEQ ID No. 1 et 2). Les produits PCR obtenus ont été purifiés avec le kit MinElute PCR purification (Qiagen). Les sondes ARN simple brin biotinylées ont été synthétisées par transcription in vitro en utilisant le kit MEGAScript (Ambion) et des dUTP biotinylés (Tebu-Bio), et ont été purifiées avec le kit RNeasy plus (Qiagen).
Tableau 1 : Séquences des adaptateurs (SEQ ID No. 1 et 2), du promoteur 17 (SEQ ID No. 3), des amorces (SEQ ID No. 8 et 9), et des sondes (SEQ ID No. 4 à 7) capables de s'hy brider au gène lin A
Pour la construction de la banque, 4 μg d'ADN métagénomique extraits à partir de l'échantillon de sol ont été fragmentés à une taille de 20 kb en utilisant le kit g-TUBE (Covaris). Les fragments d'une taille de 20 kb (+/- 4kb) ont été sélectionnés avec le système BluePippin (Sage Science) puis amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25-6600-32, GE Healthcare). Les fragments amplifiés d'une taille de 20 kb (+/- 4kb) ont à nouveau été sélectionnés avec le système BluePippin (Sage Science) pour obtenir une banque d'ADN de grands fragments de taille homogène. La qualité de la banque a enfin été évaluée par dosage de l'ADN au Qubit (Life Technologies) et migration sur puce Agilent DNA 12000 (Agilent Technologies).
D/ Hybridation et Capture :
Pour réaliser l'hybridation, 2μg de banque ont été mélangés à 2,5 μg d'ADN de sperme de saumon (Salmon Sperm DNA, sheared (ref AM9680, Ambion)) et dénaturés pendant 5 minutes à 95°C puis incubés pendant 5 minutes à 65°C. Au terme de l'incubation, 13μΙ_ de tampon d'hybridation (SSPE 10 mol/L, Denhardt's 10 mol/L, EDTA 10 m M, pH8 et SDS 0,2 %) puis 500 ng de sondes ARN biotinylées préchauffés à 65°C ont été ajoutés au mélange. Après 24 heures d'hybridation à 65°C, les complexes d'hybridation sonde/banque ont été capturés en utilisant 500 ng de billes magnétiques recouvertes de streptavidine (Dynabeads M-280 Streptavidin (ref 1 1205D, Life Technologies)) préalablement lavées trois fois avec 200 L de NaCI 1 M / TE 10mM. Les billes ont été lavées trois fois à température ambiante avec 500 μΙ de SSC 1 X / SDS 0,1 %, puis trois fois à 65°C avec 500μί de SSC 0,1X / 0,1 % SDS préchauffé. Les fragments d'ADN capturés ont ensuite été élués avec 50μί de NaOH à 0,1 M. Après la sédimentation des billes, le surnageant contenant les banques d'ADN enrichies a été transféré dans un tube contenant 70μί de Tris-HCI à 1 M, pH 7,5. Les fragments d'ADN capturés ont ensuite été purifiés en utilisant le Kit Microcon DNA Fast Flow PCR Grade, Centrifugal Filters, Dual Cycle ΕΤ0 Treated (ref MRCF0R100ET, Merck Millipore) puis amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25- 6600-32, GE Healthcare). Enfin, les fragments amplifiés d'une taille de 20 kb (+/- 4 kb) ont été sélectionnés avec le système BluePippin (Sage Science).
El Séguençage des fragments d'ADN capturés
Les fragments d'ADN capturés ont été séquencés sur un « run » de séquençage MiSeq 2x300 bp d'Illumina, après une étape préalable de construction de librairie de séquençage selon le protocole Nextera (Illumina) en accord avec les instructions du fabricant.
FI Traitement des données de séguençage
Les lectures obtenues suite au séquençage des banques d'ADN des fragments enrichis suite à la capture ont été filtrées selon leur qualité en utilisant le script PRINSEQ-lite (Schmeider, Bioinformatics, 201 1 ). Ainsi, 15 141 059 paires de séquences ont été obtenues. Les lectures ont été assemblées de novo avec IDBA-UD v1.1 .2 (Peng, Bioinformatics, 2012). Les contigs obtenus ont ensuite été soumis à un deuxième assemblage en utilisant l'outil CAP3 (Huang, Génome Research, 1999). Les contigs portant
HnA ont été identifiés par BLASTN (AltschuI, Journal of Molecular Biology, 1990) puis affiliés en utilisant BLASTN contre la base de génomes de référence (06/10/14) du NCBI. Enfin, les lectures ont été alignées avec Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) contre les génomes des espèces identifiées.
G/ Résultats obtenus
La présente méthode a permis la détection et l'identification de 7 espèces bactériennes contenues dans l'échantillon de sol possédant le gène HnA et donc capables de dégrader le HCH, il s'agit des espèces : Sphingobium indicum, Sphingobium japonicum, Sphingobium baderi, Sphingobium sp. TKS, Sphingobium sp. Ml 1205, Novosphingobium barchaimii et Sphingomonas sp. MM-1 . Pour ces espèces, la méthode a permis la reconstruction complète du gène HnA (471 pb) mais aussi de ses régions flanquantes. Ainsi, des séquences génomiques de plusieurs de dizaines de kb (reconstruction de plus de 70 kb du génome de Novosphingobium barchaimii) et des plasmides complets de plus de 70kb (plasmide pTK4 de Sphingomonas sp. MM1 ) ont pu être reconstruits par assemblage, permettant d'identifier les bactéries possédant le gène HnA. Elles ont également révélé la présence d'autres gènes potentiellement impliqués dans la dégradation du polluant, notamment les gènes HnB, HnC et HnD de la voie de dégradation du HCH. Ainsi, les microorganismes impliqués dans la dégradation initiale du polluant ou intervenant dans des phases plus tardives de sa dégradation ont pu être mis en évidence dans l'échantillon de sol. Grâce à ces connaissances, des approches de biostimulation ciblée peuvent être mises en œuvre afin de favoriser la croissance et l'action de ces microorganismes dans le sol pollué, pour à terme accélérer la dégradation du HCH.
EXEMPLE 2 : Identification de microorganismes capables de dégrader le HCH dans un échantillon de sol pollué - Comparaison de la capture de grands fragments (Exemple 1 ) avec un kit de capture par hybridation commercial utilisé pour le reséquençage de génomes d'organismes isolés
AI Capture de gènes par hybridation en utilisant le kit SureSelectXT (Agilent Technologies)
Détermination et synthèse des sondes
Un jeu de 15 sondes non dégénérées de 120 nucléotides a été déterminé à partir d'une unique séquence de référence du gène linA en utilisant le logiciel SureDesign (Agilent Technologies) en accord avec les recommandations du fournisseur (SEQ ID No. 10 à 24). Ces sondes sont chevauchantes et sont réparties avec une couverture de 5X sur tout le gène linA. Les sondes (SEQ ID No. 10 à 24) ont ensuite été synthétisées par Agilent Technologies pour répondre aux besoins du kit SureSelectXT.
Tableau 2 : Séquences des sondes SureSelectXT capables de s'hybrider au gène linA.
SEQ ID No. Séquences des sondes
CCGGGCGGTGCGAAATGAATGCCGGCCAGCGGGGTGAAAT
10 AGTTCGTGCATGCGTTGCGCTTAGAGAACTTCCACACCCCGT
CACGGCGCTCATACTCATCCGTGAAGACCGCAGCGATA
GCCGGCCAGCGGGGTGAAATAGTTCGTGCATGCGTTGCGCT
1 1 TAGAGAACTTCCACACCCCGTCACGGCGCTCATACTCATCCG
TGAAGACCGCAGCGATAAGAATCGACTGATTACCTTC
AGTTCGTGCATGCGTTGCGCTTAGAGAACTTCCACACCCCGT
12 CACGGCGCTCATACTCATCCGTGAAGACCGCAGCGATAAGA
ATCGACTGATTACCTTCGACGAGA I I I CCAAGGAGAA
TTAGAGAACTTCCACACCCCGTCACGGCGCTCATACTCATCC
13 GTGAAGACCGCAGCGATAAGAATCGACTGATTACCTTCGACG
AG ATTTC C AAG G AG AAG G AC GTC G C C AATAC C ATTT
ACGGCGCTCATACTCATCCGTGAAGACCGCAGCGATAAGAAT
14 CGACTGATTACCTTCGACGAGA I I I CCAAGGAGAAGGACGTC
GCCAATACCA I I I ACCTTGTCCGCGCTCACAAATTC
AGAATCGACTGATTACCTTCGACGAGATTTCCAAGGAGAAGG
15 ACGTCGCCAATACCA I I I ACCTTGTCCGCGCTCACAAATTCC
AAGCGCAGATTGGTTCCATAATGAATACATTCGTGA
G AC GAG ATTTC C AAG GAG AAG G AC GTC G C C AATAC C ATTTAC
16 CTTGTCCGCGCTCACAAATTCCAAGCGCAGATTGGTTCCATA
ATGAATACATTCGTGAAACATTGGCCAGAGTACGTT
GGACGTCGCCAATACCATTTACCTTGTCCGCGCTCACAAATT
17 CCAAG CG CAGATTG GTTC CATAATG AATACATTCGTG AAACA
TTGGCCAGAGTACGTTATTGGCCAAATCGAGGGCGC
ACCTTGTCCGCGCTCACAAATTCCAAGCGCAGATTGGTTCCA
18 TAATGAATACATTCGTGAAACATTGGCCAGAGTACGTTATTGG
CCAAATCGAGGGCGCCTTCCGGGCCCTTGTAGGTG
CAAG CG CAGATTG GTTC CATAATGAATACATTCGTGAAACATT
19 GGCCAGAGTACGTTATTGGCCAAATCGAGGGCGCCTTCCGG
GCCCTTGTAGGTGCCGATTCCCTCAATGGTCCACTC
AACATTGGCCAGAGTACGTTATTGGCCAAATCGAGGGCGCCT
20 TCCGGGCCCTTGTAGGTGCCGATTCCCTCAATGGTCCACTCT
G C AT CATC C C AC C AAATAG AAG C G AG AC GGCCCTCT
ATTGGCCAAATCGAGGGCGCCTTCCGGGCCCTTGTAGGTGC
21 CG ATTC CCTCAATG GTC CACTCTG CATCATCCCAC CAAATAG
AAGCGAGACGGCCCTCTTGGCGCTTGTCTACGGCAAT
CTTCCGGGCCCTTGTAGGTGCCGATTCCCTCAATGGTCCACT
22 CTGCATCATCCCACCAAATAGAAGCGAGACGGCCCTCTTGG
CG CTTGTCTACG G CAATG AG CTTGTC AG AGTAGAG GT
CCGATTCCCTCAATGGTCCACTCTGCATCATCCCACCAAATA
23 GAAGCGAGACGGCCCTCTTGGCGCTTGTCTACGGCAATGAG
CTTGTCAGAGTAGAGGTCCTGAATCGCGGCCCGGCTT
TGCATCATCCCACCAAATAGAAGCGAGACGGCCCTCTTGGC
24 G CTTGTCTACG G CAATG AG CTTGTCAG AGTAGAG GTCCTGAA
TCGCGGCCCGGCTTGCAAGTCTGTCTAGATCACTCAT
Construction de banques de petits fragments d'ADN
Deux banques de petits fragments compatibles avec le kit SureSelectXT (Agilent Technologies) ont été construites à partir de l'ADN métagénomique extrait de l'échantillon de sol.
La première banque a été construite selon les recommandations du fournisseur (SureSelectXT, Agilent Technologies). En résumé, 200 ng d'ADN ont été fragmentés par ultrasonication à une taille de 150-200 pb (Covaris). L'ADN fragmenté a ensuite été réparé, purifié avec des billes AMPure XP (Beckman Coulter), adénylé en 3', et de nouveau purifié avec des billes AMPure XP. Des adaptateurs ont ensuite été ajoutés aux extrémités des fragments d'ADN et les banques obtenues ont été purifiées avec des billes AMPure XP. Enfin, les banques de petits fragments d'ADN obtenues ont été amplifiées et purifiées avec des billes Ampure XP. La qualité de la banque a enfin été évaluée par dosage de l'ADN au Qubit (Life Technologies) et migration sur puce Agilent DNA 12000 (Agilent Technologies). La seconde banque de petits fragments d'ADN a été construite selon un protocole différent qui a été adapté pour les besoins de l'étude. Pour cela, l'ADN extrait du sol a été au préalable purifié deux fois par précipitation à l'éthanol puis une fois en utilisant le Kit
Microcon DNA Fast Flow PCR Grade (Merck Millipore) pour éliminer les substances inhibitrices présentes dans les sols (acides humiques) et co-extraites en même temps que l'ADN. La banque a ensuite été construite à partir de l'échantillon purifié selon le protocole TruSeq (Illumina). En résumé, 100 ng d'ADN ont été fragmentés par ultrasonication à une taille de 350 pb (Covaris) puis purifiés. L'ADN fragmenté a ensuite été réparé, purifié et adénylé en 3'. Des adaptateurs ont ensuite été ajoutés aux extrémités des fragments d'ADN, puis les banques obtenues ont été purifiées, amplifiées, et de nouveau purifiées. La qualité de la banque a enfin été évaluée par dosage de l'ADN au Qubit (Life Technologies) et migration sur puce Agilent DNA 12000 (Agilent Technologies).
Capture de gènes SureSelectXT
La capture de gènes ciblant le gène HnA a été réalisée sur les deux banques de petits fragments d'ADN selon les recommandations du fournisseur (SureSelectXT, Agilent Technologies). En résumé, 750 ng de banques ont été hybridées pendant 24 h à 65°C avec 20 L de sondes fournies par Agilent Technologies. Suite à l'hybridation, les complexes sonde/banque ont été capturés en utilisant des billes magnétiques recouvertes de streptavidine (Dynabeads MyOne Streptavidin T1 , Life Technologies). Enfin, les banques ont été amplifiées puis purifiées à l'aide de billes Ampure XP (Beckman Coulter). La qualité des banques enrichies a enfin été évaluée par dosage de l'ADN au Qubit (Life Technologies) et migration sur puce Agilent DNA 12000 (Agilent Technologies).
Séguençage des fragments d'ADN capturés
La banque de petits fragments d'ADN obtenue en fin de capture SureSelectXT à partir de la banque TruSeq étant compatible avec les approches de séquençage Illumina, les fragments d'ADN capturés ont été séquencés sur une moitié de « run » de séquençage MiSeq 2x300 pb (Illumina).
B/ Traitement des données de séquençage de capture de grands fragments (ExempleD et SureSelectXT
Les lectures obtenues suite au séquençage des banques d'ADN des fragments enrichis par les approches de capture de grands fragments et de capture SureSelectXT ont été filtrées selon leur qualité en utilisant le script PRINSEQ-lite (Schmeider, Bioinformatics, 201 1 ). Le nombre de lectures a été normalisé entre les deux échantillons pour la suite des analyses. Ainsi, 7 055 800 paires de lectures ont été obtenues pour chacune des captures. Pour
chaque échantillon, les lectures ont été assemblées de novo avec IDBA-UD v1 .1.2 (Peng, Bioinformatics, 2012). Les contigs obtenus ont ensuite été soumis à un deuxième assemblage en utilisant l'outil CAP3 (Huang, Génome Research, 1999). Les contigs portant HnA ont été identifiés par BLASTN (Altschul, Journal of Molecular Biology, 1990) puis affiliés en utilisant BLASTN contre la base de génomes de référence (06/10/14) du NCBI. Les lectures ont enfin été alignées avec Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) contre les génomes des espèces identifiées et les fichiers obtenus ont été formatés avec SAMtools v1.3 (Li, Bioinformatics, 2009) pour calculer l'enrichissement en gène cible.
Cl Résultats obtenus et comparaison avec la méthode de l'exemple 1
Sondes de capture
Alors que seules 4 sondes de 80 nucléotides sont nécessaires à la capture de grands fragments (SEQ ID No. 4 à 7), 15 sondes de 120 nucléotides sont nécessaires à la capture de gènes avec le kit SureSelectXT (SEQ ID No. 8 à 22) (Tableau 2). Ceci s'explique par le fait que les sondes de capture du kit SureSelectXT, initialement développé pour le reséquençage de régions nucléiques connues, sont non dégénérées et chevauchantes (couverture de 5X du gène) de sorte à couvrir l'ensemble du biomarqueur, alors que les sondes de capture de grands fragments sont exploratoires (dégénérées) et réparties de façon homogène sans chevauchements sur toute la longueur du gène HnA (Tableau 2). Le caractère exploratoire permet l'enrichissement par une même sonde de tous les variants du gène HnA, alors que les sondes non dégénérées du kit SureSelect ne peuvent cibler que des variants très proches de la séquence de référence utilisée pour faire la détermination des sondes. De plus, le mode de synthèse des sondes pour la capture de grands fragments permet de produire à moindre coût un très grand nombre de sondes permettant de réaliser plusieurs milliers de captures, contrairement aux sondes du kit SureSelectXT qui ne peuvent être utilisées que pour 16 captures et sont plus onéreuses (Tableau 3). Ainsi, la taille et le nombre réduit de sondes nécessaires à la capture de grands fragments ainsi que leur mode de production conduisent à une réduction des coûts importante pour les sondes comparée à la méthode de capture SureSelectXT.
Tableau 3: Tableau comparatif des sondes nécessaires à l'approche de capture de grands fragments et à la capture SureSelectXT
Construction des banques d'ADN
La capture par hybridation nécessite la réalisation au préalable d'une étape de construction de banques d'ADN à partir de l'ADN extrait. Pour la capture de grands fragments d'ADN, une banque de 20 kb de qualité a été directement construite à partir de l'ADN extrait de l'échantillon contaminé par du HCH.
Pour la capture de gènes avec le kit SureSelectXT, une première construction de banque a été réalisée selon les recommandations du fournisseur. Comme représenté sur la Figure 1 , le kit SureSelectXT n'a pas permis de construire une banque de courts fragments et de ce fait de mener l'étape de capture. Ceci est probablement dû à la contamination de l'ADN extrait par des composants chimiques inhibiteurs (par exemple des acides humiques) présents dans le sol étudié et qui se retrouvent dans l'échantillon. Ces inhibiteurs sont très fréquemment retrouvés au sein d'échantillons environnementaux et particulièrement au sein d'échantillons de sol, et ce malgré l'utilisation de méthodes d'extraction visant à les éliminer. Ainsi, l'application du kit SureSelectXT est limitée pour les applications en diagnostic environnemental.
Pour pouvoir malgré tout évaluer l'efficacité du kit SureSelectXT et le comparer à la méthode de capture de grands fragments, une banque d'ADN a été construite après extraction d'ADN et plusieurs étapes de purification selon le protocole TruSeq d'Illumina, qui permet la construction de banques similaires aux banques SureSelectXT et compatibles avec les étapes ultérieures de capture du kit (Figure 2). Sans les 3 étapes préalables de purification pour éliminer les acides humiques, la construction des banques par cette approche est elle aussi inefficace.
Des étapes de purification complémentaires pourraient être appliquées sur l'échantillon de départ pour réussir la construction de banques compatibles avec l'utilisation du kit
SureSelectXT. Cependant, pour pouvoir réaliser ces étapes supplémentaires de purification, les quantités d'ADN initiales nécessaires sont très importantes (plusieurs μg d'ADN contre 200 ng pour une utilisation normale du kit), et les quantités d'ADN extraites à partir d'échantillons environnementaux sont souvent limitées.
A l'inverse, comme démontré ici, la méthode de capture de grands fragments n'est pas impactée par la présence d'inhibiteurs au sein de l'échantillon d'ADN initial et est donc parfaitement compatible avec le diagnostic environnemental.
Capture de gènes par hybridation
La méthode de capture de grands fragments d'ADN a été comparée à la capture SureSelectXT utilisant la banque construite avec le kit SureSelectXT et la banque Illumina construite après purification d'ADN utilisant un protocole dédié respectivement. Un enrichissement a été permis pour les captures de grands fragments d'ADN et la capture SureSelectXT en utilisant la banque Illumina dont l'ADN avait été préalablement purifié mais pas en utilisant la banque SureSelectXT qui n'a pas pu être construite comme précédemment expliqué. En effet, l'étape de construction de la banque d'ADN initiale ayant échoué avec le kit SureSelectXT, la seconde étape d'enrichissement par capture a elle aussi échoué, démontrant l'avantage concurrentiel du procédé de capture de grands fragments d'ADN par rapport au kit SureSelectXT. Seuls les ADN issus de la capture de grands fragments d'ADN et de la capture SureSelectXT avec la banque Illumina ont donc été séquencés et analysés.
Analyse des données de capture
Le traitement des données de capture de grands fragments d'ADN et de capture SureSelectXT réalisée avec la banque Illumina dont l'ADN avait été préalablement purifié
ciblant le gène HnA a permis de comparer les deux méthodes en termes d'efficacité (enrichissement et taille de fragments reconstruits) et de diversité de séquences cibles. Les résultats montrent en premier lieu que la capture de grands fragments d'ADN permet un meilleur enrichissement que la capture SureSelectXT. En effet, avec la capture SureSelectXT, le gène HnA et les régions flanquantes qui lui sont associées représentent 8,39% des séquences alors qu'ils représentent 26.57% des séquences avec la capture de grands fragments d'ADN. Ainsi, la capture de grands fragments d'ADN permet un meilleur enrichissement du gène cible et de ses régions flanquantes.
Pour la capture de grands fragments d'ADN, l'enrichissement obtenu a permis de mettre en évidence la présence de 9 gènes HnA différents appartenant à 7 espèces bactériennes différentes : Sphingobium indicum, Sphingobium japonicum, Sphingobium baderi, Sphingobium sp. TKS, Sphingobium sp. Ml 1205, Novosphingobium barchaimii et Sphingomonas sp. MM-1 (Tableau 4). La capture SureSelectXT quant à elle n'a permis de révéler la présence que de 7 gènes HnA appartenant à 6 espèces différentes (Tableau 4). En effet, le gène HnA de N. barchaimii n'a pas été enrichi et n'a pas permis de révéler la présence de l'espèce au sein de l'échantillon, et seul un des deux gènes HnA chromosomiques de Sphingobium sp. Ml 1205 a été enrichi. La capture de grands fragments d'ADN permet donc de révéler une diversité de gènes et de microorganismes plus importante que l'approche SureSelectXT.
Tableau 4 : Nombre de gènes et d'espèces portant HnA identifiés par les deux approches de capture.
Pour chacune des espèces identifiées, la méthode de capture a permis la reconstruction complète du gène HnA. Toutefois, l'approche de capture de grands fragments d'ADN a permis de reconstruire des séquences portant HnA de tailles importantes comprises entre 1400 pb et 18600 pb (Tableau 5). Ainsi, les gènes présents dans les régions adjacentes à HnA ont pu être identifiés comme par exemple le gène HnC (impliqué en aval de HnA dans
la voie de dégradation du HCH), des récepteurs TonB dépendants, des régulateurs de transcription, ou encore des séquences d'insertion 6100 (IS6100). La capture SureSelectXT n'a permis quant à elle que de reconstruire des séquences de tailles plus réduites allant de 600 pb à 3400 pb (Tableau 5). Dans ce cas, la séquence la plus longue reconstruite est celle qui porte le gène HnA ayant servi de référence à la détermination des sondes. Cette différence de taille de séquences reconstruites s'explique par la taille des fragments enrichis par les deux approches. En effet, en permettant l'enrichissement direct de longs fragments d'ADN de 20 kb, la capture de grands fragments permet d'enrichir le gène cible et ses régions flanquantes, alors que la capture SureSelectXT repose sur l'enrichissement de banques de petits fragments de quelques centaines de pb qui ne permettent pas d'étendre les connaissances au-delà du gène cible.
Tableau 5 : Comparatif des tailles de séquences reconstruites portant HnA par les deux méthodes de capture.
Conclusion :
Appliquée à un échantillon de sol contaminé au HCH en ciblant le gène HnA, la capture de grands fragments d'ADN a permis de démonter son efficacité et ses avantages comparé aux approches de capture de gènes pour le reséquençage telles que la capture SureSelectXT (Agilent). En effet, la capture de grands fragments d'ADN permet d'enrichir significativement avec un jeu de sondes minimal le gène d'intérêt, de reconstruire des régions d'ADN de plusieurs dizaines de kb portant le gène cible et ses régions flanquantes, et d'en révéler toute la diversité.
EXEMPLE 3 : Identification et détection d'une bactérie capable de dégrader l'arsenic au sein d'une communauté microbienne.
A/ Préparation d'une communauté microbienne artificielle :
Un mélange artificiel de 21 espèces bactériennes et 7 espèces archées (représentant 6 phyla, 13 classes, 19 ordres, 23 familles et 26 genres) dont les génomes sont séquencés, a été réalisé à partir d'ADN génomique extrait de cultures pures des différentes espèces (DSMZ) (Tableau 6). Les abondances des différentes espèces (basées sur le nombre de génomes dans le mélange) ont été définies de sorte à ce que le profil final de la communauté reflète les variabilités d'abondance des espèces dans une communauté microbienne environnementale.
Tableau 6 : Composition de la communauté microbienne artificielle
Espèces N° DSMZ Abondances (%)
Halomicrobium mukohataei 12286 25
Saccharophagus degradans 17024 25
Tsukamurella paurometabola 20162 15
Clostridium acetobutylicum 792 10
Roseobacter denitrificans 7001 5
Novosphingobium pentaromativorans 17173 5
Geobacter lovleyi 17278 3
Ruegeria pomeroyi 15171 3
Desulfovibrio vulgaris subsp. vulgaris 644 2
Pedobacter heparinus 2366 2
Corynebacterium glutamicum
(organisme cible) 20300 1
Cellulomonas flavigena 20109 1
Pseudomonas putida 6125 1
Methanoculleus marisnigri 1498 0.5
Saccharopolyspora erythraea 40517 0.5
Halogeometricum borinquense 1 1551 0.3
Planctomyces limnophilus 3776 0.3
Lactobacillus delbrueckii subsp. bulgaricus 20081 0.2
Methanospirillum hungateii 864 0.1
Lactobacillus brevis 20054 0.07
Methanocorpusculum labreanum 4855 0.01
Flavobacterium psychrophilum 21280 0.01
Streptomyces avermitilis 46492 0.006
Listeria welshimeri 20650 0.002
Sphingobium indicum 16412 0.001
Clostridium leptum 753 0.0008
Methanobrevibacter smithii 861 0.0001
Methanococcus aeolicus 17508 0.0001
B/ Détermination et synthèse des sondes :
Le gène codant une nucléase extracellulaire (ID : 1020538) de Corynebacterium glutamicum, espèce fréquemment retrouvée dans les sols et connue pour sa capacité à dégrader l'arsenic, a été ciblé par des sondes. Ainsi, un jeu de 15 sondes spécifiques (SEQ ID No.25 à 39) de 80 nucléotides ciblant le gène d'intérêt a été déterminé, en utilisant les logiciels KASpOD (K-mer based Algorithm for high-Specific Oligonucleotide Design) (Parisot N et al., 2012, vol 28, pages 3161 -3162) et HiSpOD (High Spécifie Oligo Design) (Dugat-Bony E et al. , Bioinformatics, 201 1 , vol 27, pages 641 -648) .
Tableau 7 : Séquences des sondes capables de s'hybrider au gène ciblé de
Corynebacterium glutamicum.
SEQ ID No. Séquences des sondes
GCCGGTGCAACCGCGGCCAGCCTGGCAGTTGTTCCAGCAGCA
25
ACAGCTAATCCTGCCGGAACCGCTCCTGTCATCAACGA
ATCTACGGAGGCGGTGGAAACAGCGGATCGTTGTTCTCCAAC
26
GACTTCATTGAGCTCTACAACCCAACCTCAGGGGACAT
CAACAACACCGGCGCTCTGCCTACCCCAGACGCCACCGGTAA
27
CTTGGCAATGGGTGCCTCCCAAGGATCAGTTGCACTGA
CTGACTCTGATAACAACTCCGTAGACTTCGAGACTGGAGCTCC
28
AACTCCAACGTCCTCGGGAGGATCCGCTCCTGTTGAC
GCCGTTTACGCAGAAGGTGGCTTCAACGGTTACTACATCCAGA
29
CACCTGGATCTGGTACTGCACCAAAGGTTGCTGGCGA
CTCCTTCACCGTTTCGGACACCGCATTCGAGCCAGTAACCCCA
30
CTCGAACTGGACACCGTTCCTACTGGCGATGACATTC
CCACTCAAATGGTGGCACCGGGAGCCGAAGCGATTGCGTACG
31
AGGCGGAAAACGTCGCAAAGCAAATTACGCTGGATGAC
GTAATCTTCGATTACCGCTACGACCTGTGGAAATTCCAGCCAA
32
CCACCCCTGTCACCGGCAACACCGCAAGCTCCGACCT
AC C AG G CTG C AG C G C ATAC AG G G ATATC AAC AAC AC C C C AGT
33
C AC CGC C AAC AACT GTAAC GTCCGTGGC G CTTAC AC C G
GCGATGACGCACTCAATACCCTCGTCGCAGCACTCAACGAAG
34
CAGTTGGATCCGATCGCTGGGCGGCCGTCGAATCTCCA
C AG C C ACTC G C AC AG G AATTC C AG C C ACTC AAC G AC AG C GAG
35
AAATCCTTCGTCGGCGTAGTCAACCACTTCAAGTCCAA
CAAGCCAATCTTCATCCTCGGCGACACCAACTCCTACGCCAAG
36
GAAACCGCGATGACCACCC 1 1 1 ACGGCGCTGGCTACA
GGGACATCAACGCTGACGAAGCAATCGCATTCGAATACTCCC
37
GTCGACTCAACAACACCTCCGACGTATTCGAGAACAAC
GTTAAGCCAACTGATCCGGTAGAGACCACGGATCCATCTGAG
38
CCAACCGACCCTGCAGAACCTACTGATCCAGCTGAACC
ACGCCACCATTGCAGCAATCATCGCAGCAATCCTAGGTGCCAT
39
TGC 1 1 1 GGCCTTCCAGTTCTTCCCATTCAAGTTCTAA
Les séquences des adaptateurs A (SEQ ID No.1 ), et B (SEQ I D No.2) ont été ajoutées à chaque extrémité des sondes en vue de l'amplification par PCR, conduisant à des sondes dont la séquence est du type « ATCGCACCAGCGTGT-N80-CACTGCGGCTCCTCA », où N80 correspond à la séquence spécifique de chacune des 4 sondes. Les sondes d'une longueur totale de 1 10 nucléotides ont été synthétisées sous forme d'ADN simple brin. Le promoteur T7 (SEQ ID No.3) a été ajouté en amont de l'adaptateur A par PCR avec le kit Platinium Taq DNA Polymerase High Fidelity (Invitrogen) en utilisant des amorces T7-A et B (SEQ ID No. 8 et 9) s'hybridant respectivement sur les Adaptateurs A et B (SEQ ID No. 1 et 2). Les produits PCR obtenus ont été purifiés avec le kit MinElute PCR purification (Qiagen). Les sondes ARN simple brin biotinylées ont été synthétisées par transcription in vitro en utilisant le kit MEGAScript (Ambion) et des dUTP biotinylés (Tebu-Bio), et ont été purifiées avec le kit RNeasy plus (Qiagen).
Cl Préparation des banques de grands fragments d'ADN :
Pour la construction de la banque, 4 μg d'ADN du mélange d'ADN de la communauté artificielle ont été fragmentés à une taille de 20 kb en utilisant le kit g-TUBE (Covaris). Les fragments d'une taille de 20 kb (+/- 4kb) ont été sélectionnés avec le système BluePippin (Sage Science) puis amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25-6600-32, GE Healthcare). Les fragments amplifiés d'une taille de 20 kb (+/- 4kb) ont à nouveau été sélectionnés avec le système BluePippin (Sage Science) pour obtenir une banque d'ADN de grands fragments de taille homogène. La qualité de la banque a enfin été évaluée par dosage de l'ADN au Qubit (Life Technologies) et migration sur puce Agilent DNA 12000 (Agilent Technologies).
D/ Hybridation et Capture :
Pour réaliser l'hybridation, 3 de banque ont été mélangés à 2,5 d'ADN de sperme de saumon (Salmon Sperm DNA, sheared (ref AM9680, Ambion)) et dénaturés pendant 5 minutes à 95°C puis incubés pendant 5 minutes à 65°C. Au terme de l'incubation, 13μΙ_ de tampon d'hybridation (SSPE 10 mol/L, Denhardt's 10 mol/L, EDTA 10 m M, pH8 et SDS 0,2 %) puis 500 ng de sondes ARN biotinylées préchauffés à 65°C ont été ajoutés au mélange. Après 24 heures d'hybridation à 65°C, les complexes d'hybridation sonde/banque ont été capturés en utilisant 500 ng de billes magnétiques recouvertes de streptavidine (Dynabeads M-280 Streptavidin (ref 1 1205D, Life Technologies)) préalablement lavées trois fois avec 200 L de NaCI 1 M / TE 10mM. Les billes ont été lavées trois fois à température ambiante avec 500 μΙ de SSC 1 X / SDS 0,1 %, puis trois fois à 65°C avec 500μί de SSC 0,1X / 0,1 % SDS préchauffé. Les fragments d'ADN capturés ont ensuite été élués avec 50μί de NaOH à 0,1 M. Après la sédimentation des billes, le surnageant contenant les banques d'ADN enrichies a été transféré dans un tube contenant 70μί de Tris-HCI à 1 M, pH 7,5. Les fragments d'ADN capturés ont ensuite été purifiés en utilisant le Kit Microcon DNA Fast Flow PCR Grade, Centrifugal Filters, Dual Cycle ΕΤ0 Treated (ref MRCF0R100ET, Merck Millipore) puis amplifiés en utilisant le Kit Illustra GenomPhi V2 DNA Amplification (ref 25- 6600-32, GE Healthcare). Enfin, les fragments amplifiés d'une taille de 20 kb (+/- 4 kb) ont été sélectionnés avec le système BluePippin (Sage Science).
El Séguençage des fragments d'ADN capturés
Les fragments d'ADN capturés ont été séquencés sur 1/4 de « run » de séquençage MiSeq 2x300 bp d'Illumina, après une étape préalable de construction de librairie de séquençage selon le protocole Nextera (Illumina) en accord avec les instructions du fabricant. FI Traitement des données de séguençage
Les lectures obtenues suite au séquençage des banques d'ADN enrichies ont été filtrées selon leur qualité en utilisant le script PRINSEQ-lite (Schmeider, Bioinformatics, 201 1 ). Ainsi, 7 541 179 paires de séquences ont été obtenues. Les lectures ont été assemblées de novo avec IDBA-UD v1.1.2 (Peng, Bioinformatics, 2012). Les contigs obtenus ont ensuite été soumis à un deuxième assemblage en utilisant l'outil CAP3 (Huang, Génome Research, 1999). Les contigs portant le gène cible ont été identifiés par BLASTN (Altschul, Journal of Molecular Biology, 1990) puis affiliés en utilisant BLASTN contre la base de génomes de référence (06/10/14) du NCBI. Enfin, les lectures ont été alignées avec
Bowtie2 v2.1 .0 (Langmead, Nature Methods, 2012) contre le génome de référence de C. glutamicum.
G/ Résultats obtenus La présente méthode a permis la reconstruction complète du gène ciblé de 2751 pb codant la nucléase extracellulaire de C. glutamicum mais aussi de ses régions flanquantes. En effet, un contig de 22,4 kb correspondant à une portion du génome de C. glutamicum portant le gène d'intérêt a pu être reconstruit. Ceci a été rendu possible grâce à l'enrichissement ciblé du gène et des régions adjacentes qui représentent 23% des séquences alors que le génome de C. glutamicum ne représentait initialement que 1 % de la communauté et que la région d'ADN reconstruite ne représentait que 0,006% de toutes les séquences de la communauté microbienne. L'enrichissement de la séquence cible permettant la caractérisation du micro-organisme est donc de l'ordre de 4000 fois. Ainsi, ce micro-organisme impliqué dans la bioremédiation de l'arsenic a pu être mis en évidence au sein de la communauté étudiée. Appliquée à des échantillons de sol, cette stratégie pourra permettre de détecter et identifier précisément C. glutamicum pour ensuite adapter les stratégies de bioremédiation sur les sites pollués.
Claims
1 . Méthode de détection et d'identification in vitro d'un ou plusieurs micro-organismes impliqués dans le processus de dégradation, de modification ou de séquestration d'un ou plusieurs contaminants présents dans un échantillon biologique, ladite méthode comprenant les étapes suivantes :
a) la préparation d'un mélange de sondes capables de cibler spécifiquement un ou plusieurs gènes d'intérêts impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants,
b) la préparation d'une banque de fragments d'ADN à partir de l'échantillon biologique, lesdits fragments d'ADN contenus dans la banque ayant une longueur d'au moins 6 000 paires de bases,
c) l'hybridation des fragments d'ADN obtenu à l'étape b) par mise en contact desdits fragments d'ADN avec le mélange de sondes de l'étape a), d) la capture des complexes d'hybridation de l'étape c),
e) le séquençage des fragments d'ADN capturés à l'étape d),
f) la reconstruction des gènes d'intérêts et/ou du génome du ou des microorganismes à partir des fragments d'ADN capturés séquencés de l'étape e), et
g) l'identification du ou des micro-organismes impliqués dans les processus de dégradation, de modification ou de séquestration dudit ou desdits contaminants présents dans l'échantillon biologique.
2. Méthode de détection et d'identification selon la revendication 1 , dans laquelle le ou les contaminants sont des contaminants chimiques ou des contaminants biologiques.
3. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 2, dans laquelle l'échantillon biologique est un échantillon environnemental.
4. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 3, dans laquelle les gènes d'intérêts sont choisis dans le groupe comprenant: les gènes codant pour les dioxygénases, les gènes codant pour les déhalogénases, les gènes codant pour les cytochromes P450, les gènes codant pour les enzymes lignolytiques, les gènes codant pour les hydrogènases, les gènes codant pour les
enzymes de dégradation des solvants chlorés et les gènes codant pour les enzymes de dégradation des toxines.
5. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 4, dans laquelle les sondes de l'étape a) sont des sondes ARN simple brin.
6. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 5, dans laquelle les sondes de l'étape a) sont des sondes non chevauchantes et exploratoires.
7. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 6, dans laquelle les sondes de l'étape a) ont une longueur d'au moins 20 nucléotides contigus.
8. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 7, dans laquelle les sondes de l'étape a) sont des sondes ARN biotinylées.
9. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 8, dans laquelle les sondes de l'étape a) comprend un adaptateur A de séquence SEQ ID No.1 et un adaptateur B de séquence SEQ ID No.2, l'adaptateur A étant placé à l'extrémité 5' de la séquence de la sonde et l'adaptateur B étant placé l'extrémité 3' de la séquence de la sonde.
10. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 9, dans laquelle le mélange de sondes de l'étape a) comprend au moins une sonde.
1 1 . Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 10, dans laquelle le mélange de sondes est spécifique d'au moins un gène d'intérêt.
12. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 1 1 , dans laquelle la banque de fragments d'ADN comprend des fragments d'ADN ayant une longueur d'au moins 6000 paires de bases, avantageusement 20 000 paires de bases, avantageusement au moins 50 000 paires de bases.
13. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 12, dans laquelle l'étape c) d'hybridation est réalisée en solution.
14. Méthode de détection et d'identification selon l'une quelconque des revendications 1 à 13, dans laquelle l'étape d) de capture des complexes d'hybridation est réalisée au moyen de billes magnétiques recouvertes de streptavidine.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1658141 | 2016-09-01 | ||
| FR1658141A FR3055338B1 (fr) | 2016-09-01 | 2016-09-01 | Methode de detection et d'identification in vitro d'un ou plusieurs micro-organismes impliques dans le processus de degradation, de modification ou de sequestration d'un ou plusieurs contaminants presents dans un echantillon biologique |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2018041749A1 true WO2018041749A1 (fr) | 2018-03-08 |
Family
ID=57137175
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/EP2017/071490 Ceased WO2018041749A1 (fr) | 2016-09-01 | 2017-08-28 | Methode de detection et d'identification in vitro d'un ou plusieurs micro-organismes impliques dans le processus de degradation, de modification ou de sequestration d'un ou plusieurs contaminants presents dans un echantillon biologique |
Country Status (2)
| Country | Link |
|---|---|
| FR (1) | FR3055338B1 (fr) |
| WO (1) | WO2018041749A1 (fr) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113717260A (zh) * | 2021-08-26 | 2021-11-30 | 广东省科学院微生物研究所(广东省微生物分析检测中心) | 一种多溴联苯醚感受蛋白及其构建的全细胞微生物传感器 |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114250187B (zh) * | 2022-01-12 | 2022-08-12 | 生态环境部华南环境科学研究所 | 一种去除水体中tbbpa的方法、微生物菌株及微生物菌剂 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014143994A2 (fr) * | 2013-03-15 | 2014-09-18 | Good Start Genetics, Inc. | Procédés et compositions pour l'évaluation de marqueurs génétiques |
| US20140274741A1 (en) * | 2013-03-15 | 2014-09-18 | The Translational Genomics Research Institute | Methods to capture and sequence large fragments of dna and diagnostic methods for neuromuscular disease |
| US20150191720A1 (en) * | 2014-01-09 | 2015-07-09 | AgBiome, Inc. | High throughput discovery of new genes from complex mixtures of environmental microbes |
-
2016
- 2016-09-01 FR FR1658141A patent/FR3055338B1/fr active Active
-
2017
- 2017-08-28 WO PCT/EP2017/071490 patent/WO2018041749A1/fr not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2014143994A2 (fr) * | 2013-03-15 | 2014-09-18 | Good Start Genetics, Inc. | Procédés et compositions pour l'évaluation de marqueurs génétiques |
| US20140274741A1 (en) * | 2013-03-15 | 2014-09-18 | The Translational Genomics Research Institute | Methods to capture and sequence large fragments of dna and diagnostic methods for neuromuscular disease |
| US20150191720A1 (en) * | 2014-01-09 | 2015-07-09 | AgBiome, Inc. | High throughput discovery of new genes from complex mixtures of environmental microbes |
| WO2015105993A1 (fr) | 2014-01-09 | 2015-07-16 | AgBiome, Inc. | Recherche à haut débit de nouveaux gènes à partir de mélanges complexes de microbes de l'environnement |
Non-Patent Citations (10)
| Title |
|---|
| ALTSCHUL, JOURNAL OF MOLECULAR BIOLOGY, 1990 |
| CHRISTEL SCHMEISSER ET AL: "Metagenomics, biotechnology with non-culturable microbes", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, SPRINGER, BERLIN, DE, vol. 75, no. 5, 30 March 2007 (2007-03-30), pages 955 - 962, XP019513759, ISSN: 1432-0614, DOI: 10.1007/S00253-007-0945-5 * |
| DUGAT-BONY E ET AL., BIOINFORMATICS, vol. 27, 2011, pages 641 - 648 |
| EKATERINA PROTOZANOVA ET AL: "Fast high-resolution mapping of long fragments of genomic DNA based on single-molecule detection", ANALYTICAL BIOCHEMISTRY, vol. 402, no. 1, 1 July 2010 (2010-07-01), pages 83 - 90, XP055011256, ISSN: 0003-2697, DOI: 10.1016/j.ab.2010.03.024 * |
| HUANG, GENOME RESEARCH, 1999 |
| LANGMEAD, NATURE METHODS, 2012 |
| LI, BIOINFORMATICS, 2009 |
| MARC G. DUMONT ET AL: "Identification of a complete methane monooxygenase operon from soil by combining stable isotope probing and metagenomic analysis", ENVIRONMENTAL MICROBIOLOGY, vol. 8, no. 7, 1 July 2006 (2006-07-01), GB, pages 1240 - 1250, XP055358205, ISSN: 1462-2912, DOI: 10.1111/j.1462-2920.2006.01018.x * |
| PENG, BIOINFORMATICS, 2012 |
| SCHMEIDER, BIOINFORMATICS, 2011 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN113717260A (zh) * | 2021-08-26 | 2021-11-30 | 广东省科学院微生物研究所(广东省微生物分析检测中心) | 一种多溴联苯醚感受蛋白及其构建的全细胞微生物传感器 |
| CN113717260B (zh) * | 2021-08-26 | 2023-05-23 | 广东省科学院微生物研究所(广东省微生物分析检测中心) | 一种多溴联苯醚感受蛋白及其构建的全细胞微生物传感器 |
Also Published As
| Publication number | Publication date |
|---|---|
| FR3055338B1 (fr) | 2020-05-29 |
| FR3055338A1 (fr) | 2018-03-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Liang et al. | Novel phosphate-solubilizing bacteria enhance soil phosphorus cycling following ecological restoration of land degraded by mining | |
| Kaster et al. | Microbial single-cell omics: the crux of the matter | |
| Mu et al. | Bradymonabacteria, a novel bacterial predator group with versatile survival strategies in saline environments | |
| Neufeld et al. | Stable-isotope probing implicates Methylophaga spp and novel Gammaproteobacteria in marine methanol and methylamine metabolism | |
| Khramenkov et al. | A novel bacterium carrying out anaerobic ammonium oxidation in a reactor for biological treatment of the filtrate of wastewater fermented sludge | |
| Ganesh et al. | Metagenomic analysis of size-fractionated picoplankton in a marine oxygen minimum zone | |
| Oh et al. | Microbial community adaptation to quaternary ammonium biocides as revealed by metagenomics | |
| Silva et al. | Identification of genes and pathways related to phenol degradation in metagenomic libraries from petroleum refinery wastewater | |
| Cummings et al. | Broad dissemination of plasmid-mediated quinolone resistance genes in sediments of two urban coastal wetlands | |
| Speksnijder et al. | Recovery of a Nitrosomonas-like 16S rDNA sequence group from freshwater habitats | |
| Kotik et al. | Bacterial communities in tetrachloroethene-polluted groundwaters: a case study | |
| Das et al. | A metagenomic approach to decipher the indigenous microbial communities of arsenic contaminated groundwater of Assam | |
| Herber et al. | A single Thaumarchaeon drives nitrification in deep oligotrophic Lake Constance | |
| Nie et al. | The genome sequence of Polymorphum gilvum SL003B-26A1T reveals its genetic basis for crude oil degradation and adaptation to the saline soil | |
| Decleyre et al. | A doubling of microphytobenthos biomass coincides with a tenfold increase in denitrifier and total bacterial abundances in intertidal sediments of a temperate estuary | |
| Pushpanathan et al. | Microbial bioremediation: a metagenomic approach | |
| Zhou et al. | New PCR primers targeting hydrazine synthase and cytochrome c biogenesis proteins in anammox bacteria | |
| Sánchez et al. | rpoD gene pyrosequencing for the assessment of Pseudomonas diversity in a water sample from the Woluwe River | |
| Bhattarai et al. | Viruses and their interactions with bacteria and archaea of hypersaline Great Salt Lake | |
| Bagi et al. | Abundance and diversity of n-alkane and PAH-degrading bacteria and their functional genes–potential for use in detection of marine oil pollution | |
| Pärnänen et al. | Discovery of bacterial polyhydroxyalkanoate synthase (PhaC)-encoding genes from seasonal Baltic Sea ice and cold estuarine waters | |
| Wang et al. | Elemental sulfur reduction by a deep‐sea hydrothermal vent Campylobacterium Sulfurimonas sp. NW10 | |
| Wang et al. | Microcystin-LR degradation and gene regulation of microcystin-degrading Novosphingobium sp. THN1 at different carbon concentrations | |
| Aoki et al. | Quantitative detection and reduction of potentially pathogenic bacterial groups of Aeromonas, Arcobacter, Klebsiella pneumoniae species complex, and Mycobacterium in wastewater treatment facilities | |
| Anupama et al. | Gene-centric metegenome analysis reveals diversity of Pseudomonas aeruginosa biofilm gene orthologs in fresh water ecosystem |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 17764528 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 17764528 Country of ref document: EP Kind code of ref document: A1 |