[go: up one dir, main page]

WO2012059563A1 - Procede d'analyse genomique - Google Patents

Procede d'analyse genomique Download PDF

Info

Publication number
WO2012059563A1
WO2012059563A1 PCT/EP2011/069374 EP2011069374W WO2012059563A1 WO 2012059563 A1 WO2012059563 A1 WO 2012059563A1 EP 2011069374 W EP2011069374 W EP 2011069374W WO 2012059563 A1 WO2012059563 A1 WO 2012059563A1
Authority
WO
WIPO (PCT)
Prior art keywords
dna
molecules
molecule
signature
dna molecule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/EP2011/069374
Other languages
English (en)
Inventor
Hugues Roest Crollius
Xavier Darzacq
Leila Muresan
Jean-François MARIET
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Institut National de la Sante et de la Recherche Medicale INSERM
Ecole Normale Superieure de Paris
Vivatech Co
Original Assignee
Centre National de la Recherche Scientifique CNRS
Institut National de la Sante et de la Recherche Medicale INSERM
Ecole Normale Superieure de Paris
Vivatech Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS, Institut National de la Sante et de la Recherche Medicale INSERM, Ecole Normale Superieure de Paris, Vivatech Co filed Critical Centre National de la Recherche Scientifique CNRS
Publication of WO2012059563A1 publication Critical patent/WO2012059563A1/fr
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6841In situ hybridisation

Definitions

  • the invention relates to a method for obtaining a specific signature of a DNA molecule. This process notably makes it possible to obtain signatures for long DNA fragments. It also allows the analysis and comparison of genomic differences between different individuals.
  • CNV structural copy genetic alterations
  • CGH comparative genomic hybridization technology
  • CGH on metaphase chromosomes is relatively inexpensive but has limitations. The flow rate and accuracy of this technique are low. Only unbalanced chromosomal changes of more than 1 million bases are detected. Structural chromosomal aberrations such as reciprocal translocations or inversions will not be detected. In addition, this technique does not provide information about ploidy. Thus, tetraploids without unbalanced rearrangements will appear normal.
  • CNV abnormalities are identified by counting the number of aligned fragments at one position and comparing it to the average number of reads aligned per base in the entire genome. If the number of fragments aligned to a region is 0% or 50% of this average, a complete (homozygous) or partial (heterozygous) deletion of the region will be diagnosed. If the number corresponds to 150% or more, we will conclude to a duplication.
  • the present application describes a method for obtaining a specific signature of a DNA molecule.
  • two different molecules will have different signatures.
  • a DNA sequence corresponds to a unique specific signature.
  • the signature obtained by the method according to the invention thus makes it possible to specifically and reproducibly recognize identical DNA molecules and to distinguish different DNA molecules.
  • a first object of the invention therefore relates to a method for obtaining a specific signature of a DNA molecule, comprising:
  • oligonucleotides by hybridization of one or more labeled oligonucleotides, said oligonucleotides being between 10 and 15 nucleotides in size; or
  • Another subject of the invention relates to a method for the identification of a DNA molecule, the method comprising:
  • step i) obtaining the signature of said DNA molecule according to the method described above; and ii) comparing the signature obtained in step i) with predetermined signatures of reference DNA molecules;
  • the invention also relates to a method for identifying a genomic anomaly in a subject, said method comprising:
  • step ii) comparing the signature obtained in step i) with the predetermined signatures of reference DNA molecules from a healthy subject to identify said genomic DNA molecule;
  • genomic abnormality being detected if the signature of the genomic DNA of the subject differs from the signatures of the reference DNA molecules.
  • the method for identifying a genomic anomaly mentioned above further comprises:
  • step i) the signature of several genomic DNA fragments and their concatenation on the basis of overlapping signatures
  • the concatenate (s) being then compared with the reference sequences to identify the said concatenate (s); a genomic abnormality being detected if a concatenate differs from the corresponding reference DNA molecule.
  • the method for identifying a genomic anomaly mentioned above is used to identify a complementary DNA molecule, the signature of said complementary DNA being compared to the signatures of a set of complementary DNA molecule. reference.
  • the subject of the invention is a process for obtaining the nucleotide sequence of a DNA molecule comprising:
  • the detection means used is the TIRF technique coupled to a STORM system.
  • the invention furthermore relates to a method for sorting different DNA molecules contained in a mixture, the method comprising:
  • oligonucleotides by hybridization of one or more labeled oligonucleotides, said oligonucleotides being between 10 and 15 nucleotides in size; or
  • the invention relates to a method for obtaining a specific signature of a DNA molecule. This process comprises:
  • oligonucleotides by hybridization of one or more labeled oligonucleotides, said oligonucleotides being between 10 and 15 nucleotides in size; or
  • the sequence of steps a) and b) can be reversed.
  • the labeling precedes immobilization and stretching of the DNA molecule.
  • the immobilization and stretching of the DNA molecule precedes the labeling of said DNA molecule, in particular in the case of a labeling of the DNA molecule by hybridization with labeled oligonucleotides.
  • the term "signature of a DNA” designates the specific marking obtained along said DNA after optical reading of the signal emitted by the marker employed in step a) of the process according to the invention.
  • the signature can include:
  • Said signature obtained according to the invention is "specific" in that, depending on the primary sequence of said DNA molecule, the probability that two DNA molecules can have the same signature is weak, or even null, unlike the signatures obtained by techniques based on the recognition of consensus sequences.
  • the DNA molecule subjected to the process according to the invention may be any DNA molecule for which obtaining a specific signature is desirable. It can come from a cell of a unicellular or multicellular organism, and in particular be extracted from a sample of cells or tissue of a multicellular organism (for example a sample of hair, skin, blood, etc.). of DNA to be studied may in particular be a molecule of unknown sequence.
  • the DNA subjected to the process according to the invention may be a DNA molecule, in particular a genomic DNA molecule, extracted from a eukaryotic cell (for example a plant, fungus or animal cell, in particular a mammalian cell). , in particular a human) or prokaryotic cell, or a virus, for example a mammalian virus with a DNA genome, in particular a human virus, or a bacteriophage with a DNA genome.
  • the method according to the invention can also be applied to a complementary DNA molecule.
  • the DNA molecule to be studied may also be a DNA molecule isolated or contained in a DNA library.
  • the genomic DNA can in particular come from a patient likely to be suffering from a disease involving an abnormality in his genome, for example a genetic disease or a cancer.
  • the genomic DNA may also come from a healthy subject, in particular with a view to carrying out the process according to the invention to obtain the signatures of "reference" DNA molecules (see below).
  • the method according to the invention may in particular comprise, in a particular embodiment, the prior extraction of the DNA from the cells of the organism whose genome is to be analyzed.
  • the DNA can be extracted from lymphocytes contained in a blood sample. Tissue or cell harvesting techniques (especially by biopsy, smear, blood sampling, etc.) and DNA extraction are well known to those skilled in the art.
  • the genomic DNA can in particular be extracted by alkaline lysis of the cells by taking the necessary precautions during handling to minimize the fragmentation of the DNA molecules.
  • the DNA molecules subjected to the process according to the invention are molecules of high molecular weight, preferably of size greater than 50 kb, in particular greater than 60 kb, in particular greater than 100 kb, more particularly greater than 200 kb.
  • Those skilled in the art can take into account the density of the marking obtained to determine the most suitable fragment size.
  • a specific signature can in particular be obtained for a 60 kb fragment for a labeling density of 50% of one of the four bases of the DNA (A, T, C or G), that is to say for a labeling of 12.5% of the DNA molecule on average.
  • Those skilled in the art are aware of the techniques for obtaining DNA molecules of suitable size.
  • this operation can be carried out by isolating the cells in agarose blocks in which the solutions of cell lysis and DNA digestion are diffused, followed by a separation of the DNA molecules by electrophoresis, the cutting out of the cells.
  • an agarose block corresponding to the desired size and agarose digestion with agarase.
  • the DNA to be studied can be anchored or not anchored to the solid surface before stretching.
  • the DNA to be studied is modified so as to allow it to be immobilized on a solid surface (for example by exploiting the biotin-streptavidin system). Anchoring at one end may advantageously make it possible to obtain a particular distribution of the molecules on the solid surface.
  • the DNA molecules are combed "as is" from an unmodified DNA solution at one of its ends (it being understood that the DNA may be DNA modified at the one of its ends, but the modification is not carried out for anchoring on the surface).
  • the DNA is labeled by incorporation of nucleotide analogues during a polymerization reaction, according to techniques well known to those skilled in the art. These techniques use a DNA polymerase.
  • the skilled person has several techniques at his disposal to carry out this marking.
  • DNA polymerases are the Klenow fragment of Escherichia coli DNA polymerase I, Taq and Pfu heat-resistant polymerases and their commercial variants, Phi29 polymerase.
  • a sufficiently processive DNA polymerase is used to incorporate modified nucleotides into high molecular weight DNA.
  • the DNA polymerase used is a high fidelity polymerase.
  • the incorporation of modified nucleotides in double-stranded DNA, especially nucleotides coupled to a fluorophore is implemented using a DNA polymerase particularly tolerant to modified nucleotides.
  • the mutated form of the polB family polymerase extracted from the bacterium Pyrococcus furiousus (Pfu), designated E10 is capable of substituting up to 100% of cytosines by cytosines coupled to the Cy3 fluorophore, as described in Ramsay and collar.
  • This E10 Pfu polymerase can of course be used to incorporate other labeled nucleotides, especially nucleotides labeled with other fluorescent markers than Cy3, especially the other markers mentioned in the present application.
  • the incorporation of modified nucleotides in the double-stranded DNA molecules can thus be carried out according to one of the detailed protocols provided in Examples 1.
  • the in vitro synthesis is carried out by carrying out a single synthesis cycle, so as to obtain labeled DNA molecules on only one of their two strands.
  • Incorporation can be carried out from cytosol extracts of cells in culture, preferably human cells, containing the components of the replicative machinery. Typically, these components are extracted from cells (HeLa cell type) in culture, are supplemented with the modified nucleotides that it is desired to incorporate into the DNA and brought into contact with DNA, for example DNA genomics, which one wishes to mark. These techniques are known to those skilled in the art (eg Marheineke et al., 2009).
  • the DNA which one wishes to label is DNA located in the nucleus of cells in culture, in which fluorescent nucleotides are introduced by microinjection. The modified nucleotides are then incorporated into the DNA in vivo by the native replicative machinery of the cells. These techniques are known to those skilled in the art (Zink et al., 1998).
  • the polymerization reaction is carried out in the presence of the four bases of dATP DNA, dTTP, dGTP and dCTP.
  • one or more of the nucleotides may be replaced by an analogue.
  • the dUTP can replace the dTTP.
  • the labeling step may be carried out by incorporating at least one nucleotide analogue, said analogue being either a fluorescent analogue or an analogue capable of being modified to make it fluorescent.
  • the polymerization is carried out in the presence of the four bases of the DNA, supplemented with the analogue (s) to be incorporated in the DNA.
  • the analog (s) to be incorporated are used by completely replacing the corresponding unmodified base in the reaction mixture.
  • the method according to the invention comprises the labeling of the DNA with at least one fluorescent analogue of a nucleotide selected from dATP, dTTP (or dUTP), dGTP and dCTP.
  • a single fluorescent analogue is employed.
  • the fluorescent label used is identical or different for each of these analogs.
  • the fluorescent label is different for each of the analogs used.
  • Fluorescent nucleotide analogs are well known to those skilled in the art and are commercially available. Any fluorophore capable of being bound to a nucleotide either directly or via a spacer (e.g. (CH 2 ) n ) can be used in the present invention.
  • a spacer e.g. (CH 2 ) n
  • a marker of the ATTO family in particular ATT0647N, ATTO 550, ATT0565 available from Jena BioSciences coupled to nucleotides (or the like) according to different variants.
  • Different vendors market this type of fluorescent analogs, including Perkin Elmer, Amersham, etc.
  • the markers are photoactivatable molecules as a function of the oxido-reducing conditions of the reaction medium. This embodiment is particularly advantageous in the context of the implementation of the STORM technology described below.
  • the nucleotide analogue used may alternatively not itself be fluorescent, but may carry a group that can be modified to make it fluorescent.
  • the coupling of fluorophores can be covalent or transient (to overcome any steric limitations). In the case of transient coupling, fluorescent molecules having affinity for the nucleotide analog incorporated in the DNA are used.
  • Bromo-, iodo-, fluoro-nucleotides (especially bromo-, iodo-, fluoro-UTP, -ATP or -CTP), oxo-nucleotides (such as oxo-GTP), nucleotides containing, for example, an alkylene group (for example 5-ethynyl-dUTP, C8-Alkyne-dUTP, ⁇ -Propargyl-ATP) and nucleotides modified with a group containing an amino function, in particular an aminoallyl function such as aminoallyl-dUTP, and aminoallyl-dCTP .
  • an alkylene group for example 5-ethynyl-dUTP, C8-Alkyne-dUTP, ⁇ -Propargyl-ATP
  • nucleotides modified with a group containing an amino function in particular an aminoallyl function such as aminoallyl-dUTP, and aminoally
  • Coupling a fluorescent label to a modified nucleotide is well known to those skilled in the art.
  • the fluorescent labeling of a modified nucleotide carrying an amino function such as aminoallyl-dUTP or aminoallyl-dCTP may be carried out by reaction of the modified DNA with a fluorescent group carrying an N-function.
  • a fluorescent group carrying an N-function hydroxysuccinimide (NHS), sulfo-NHS or sulfotetrafluorophenyl (STP) which will allow coupling at the amino function.
  • the fluorescent label employed can thus be an NHS ester of a fluorescent molecule such as Cy3-NHS, Cy5-NHS, ATTO-NHS, Alexa-NHS, fluorescein-NHS, rhodamine-NHS or others.
  • Fluorescent labeling of a modified nucleotide carrying an alkyl function such as 5-ethynyl-dUTP can be achieved by the "Click Chemistry", a reaction of the modified DNA with a solution of copper bromide (CuBr), tris (benzyltriazolylmethyl) amine and a fluorescent molecule containing an azide group (such as fluoresceinazide, cyanine3-azide, cyanine-azide, etc.).
  • the coupling with a fluorescent marker may be carried out on a single-stranded DNA molecule comprising a nucleotide modified to increase the efficiency of this coupling.
  • the methods for obtaining a single-stranded DNA are well known to those skilled in the art. In particular, the addition of a concentration of concentrated urea to the double-stranded DNA solution may be mentioned. The fluorescent labeling is then carried out after purification of the single-stranded DNA.
  • the labeling is carried out by replication of a DNA molecule (template DNA) as described above with the Phi29 DNA polymerase, in the presence of dATP, dTTP (or alternatively dUTP), dCTP. and unmodified dGTPs and one or more fluorescent or fluorescent nucleotide analogues.
  • the nucleotide analogue completely replaces the corresponding unmodified base in the reaction medium.
  • the polymerization reaction is carried out at the temperature required for the operation of the enzyme according to the supplier's recommendations (30 ° C.
  • the labeling is carried out by hybridization of the DNA molecule with one or more labeled single-stranded oligonucleotides of size between 10 and 15 nucleotides.
  • the sequence of these oligonucleotides is chosen so that it is distributed approximately uniformly in the genome of interest, while allowing to obtain a specific labeling of a given DNA molecule. In the case of the human genome, these oligonucleotides are chosen according to the composition of the genome, and their distribution.
  • the sequence of the oligonucleotides may be of the form NNX1X2X3X4 5 6 7 8NN, wherein X1X2X3X4X5X6X7X8 is a defined sequence and N is a random base.
  • the oligonucleotides may in particular be labeled by incorporation of one or more fluorescent molecules at their end, according to procedures well known to those skilled in the art. According to a particular aspect of this second embodiment, the hybridization labeling is carried out after immobilization and stretching of the DNA molecule to be studied.
  • the labeling of the DNA molecule is carried out by contacting said DNA with an intercalating agent capable of binding to the double-stranded DNA and which emits a fluorescent signal when it is so bound.
  • an intercalating agent capable of binding to the double-stranded DNA and which emits a fluorescent signal when it is so bound.
  • Many intercalating agents are known to those skilled in the art.
  • the intercalating agent can be used to label the DNA molecule before or after immobilization on a solid support.
  • the labeling is carried out before immobilization of the DNA molecule, in particular using the molecule YOYO. Immobilization and stretching of DNA
  • Step b) of the method for obtaining a specific signature of a DNA molecule comprises immobilizing and stretching said DNA on a solid support.
  • the labeled DNA is immobilized and stretched by the molecular combing technique.
  • This technique is well known to those skilled in the art. A detailed description will be found in particular in application WO9521939, incorporated herein by reference.
  • this technique exploits the movement of a solvent meniscus that stretches and orients the DNA molecules in solution in the direction of motion, while locally applying a force that clumps the DNA molecules onto the solid surface. A stretch rate of 1 base / 0.5 nm can be obtained with this technique.
  • the surface on which the DNA molecules are immobilized is rigid (for example glass) or semi-rigid (for example a flexible polymer sheet).
  • the surface can in particular be composed or covered with an organic or inorganic polymer, a metal, metal oxide, semiconductor, or a combination of these materials.
  • the surface is covered, in whole or in part, with groups capable of reacting with one end of the DNA molecules in solution and thus of fixing it.
  • groups capable of reacting with one end of the DNA molecules in solution and thus of fixing it.
  • the different systems that can be used to fix a DNA molecule and will know in which cases the DNA molecule must be functionalized in parallel with the surface.
  • the DNA is not modified in view of its anchoring.
  • silanized glass slides are used (for example by soaking the glass slide in a bath of 80% trimethoxy (7-octen-1-yl) silane) which has not undergone additional treatment and the DNA molecule is then immobilized by application of the molecular combing technique.
  • the support may also be a support composed of or covered with a synthetic polymer, polyacrylamide, polycarbonates, etc.
  • the labeled DNA is immobilized in an individualized manner.
  • the labeled DNA is diluted to an adequate concentration to obtain, after immobilization, labeled DNA molecules separated from each other.
  • DNA fragments of 50 to 200 kb in length are used at a concentration of 0.2 to 1 ⁇ M.
  • the dilution may be carried out in 50 mM Tris buffer, pH 8 or 50 mM MES, pH 5.5, for example.
  • the molecular combing can be carried out in a suitable apparatus for moving the carrier at a constant speed out of a reservoir containing the labeled DNA to be fixed and combed.
  • the speed of movement of the support out of the tank can be adapted by those skilled in the art. By way of illustration, the examples below show the implementation of a movement at a constant speed of 300 ⁇ / s out of the tank.
  • the stretched DNA molecules are observed using an optical microscope to generate a fluorescent signal.
  • the microscope may include a Total Internal Reflection Fluorescence (TIRF) system to minimize noise around the DNA molecule to be studied.
  • the microscope is equipped with a magnifying objective chosen so as to optimize the observation of the labeled DNA molecule.
  • the objective may especially have a magnification of at least 40 ⁇ , preferably at least 50 ⁇ , at least 60 ⁇ or even at least 100 ⁇ .
  • the microscope is equipped with a high resolution CCD camera (for example 6.5 ⁇ ⁇ 6.5 ⁇ , or 65 nm per pixel for a 100 ⁇ objective) with high quantum efficiency (preferably greater than 65%). Under these conditions, one pixel of the camera covers a length of about 130 base pairs of DNA stretched and immobilized on the surface.
  • the microscope used comprises a TIRF system and is equipped with a magnification objective of at least 100 ⁇ and a high resolution CCD camera (for example 6.5 ⁇ ⁇ 6.5 ⁇ , or 65 nm per pixel) with high quantum efficiency (preferably greater than 65%).
  • Fluorescent molecules are excited by a laser of suitable wavelength, known to those skilled in the art.
  • the light emitted is captured by the camera attached to the microscope whose lens is equipped with a suitable optical filter. Suitable means for obtaining a fluorescence are therefore used.
  • appropriate excitation, dichroic and emission filters depending on the fluorophore used to label the DNA and the use of a laser excitation at a suitable wavelength.
  • the examples describe filters that can be used for the detection of the Cy3 marker or the use of a 633 nm wavelength laser to excite the Cy5 or 532 nm to excite the Cy3, the a person skilled in the art knowing the means necessary to obtain a fluorescence from other markers.
  • the microscopy implemented is a super-resolution fluorescence microscopy.
  • the super-resolution microscopy used implements a successive localization of individual fluorophores.
  • PALM photoactivated localization microscopy
  • STORM stochastic optical reconstruction microscopy
  • the microscope used comprises a TIRF system and a STORM or PALM system, preferably STORM.
  • the light signals collected in the form of images are then processed by a computerized process for the purpose of locating the relative position of the fluorophores (and thus the modified bases in the DNA) with respect to each other along the linear axis DNA molecules, and therefore their relative distance from each other.
  • the determination of the light profile of each molecule present on an image can be performed automatically by an algorithm implemented in a computer program.
  • the algorithm can in particular be carried out in two stages. The first includes identifying the peaks of maximum intensity on the foreground pixels along a ridge line.
  • a peak line is a high curvature surface (maximum curvature in at least one direction) produced by the image of the DNA molecule, defined by high absolute values of the smallest eigenvalues of the symmetric matrix of the partial derivatives of second order (Hessian matrix) of each pixel.
  • the second step comprises the determination of a spline curve by interpolation of the peak curvature peak points established in the first step.
  • the curve is sampled at equidistant points (for example at each pixel, or at each pixel). half-pixel) to approximate the value of the surface at these points.
  • the approximation can be done by directly taking into account the value of the pixel, by Taylor's approximation of the surface at the chosen point, or by a Richardson-Lucy deconvolution based on a "point spread function".
  • the successive list of these values constitutes the fluorescent profile of the DNA molecule (FIG. 3).
  • a Point Spread Function is a mathematical function describing the signal emitted by a fluorescent molecule. unique, will be adjusted on the light signal to break it down into as many PSFs as single emitting molecules. This operation makes it possible to point the center of each PSF and thus to position the emitting molecules relative to one another along the axis of the immobilized DNA molecule and stretched (preferably by molecular combing).
  • the pointing operation is carried out by means of algorithms well known to those skilled in the art (for example, Mortensen et al, 2010).
  • each PSF corresponding to the position of each fluorescent molecule, can thus be located with a precision depending on the number of photons acquired, and not on the diffraction limit of the emitted light.
  • the sequence of successive distances between the positions of the fluorescent molecules along the DNA molecules thus provides a specific signature of each of the molecules, expressed as a base pair of DNA.
  • the pointing of the individual molecules producing the light signal is not required, the linear light signal, expressed in units of arbitrary intensity per nanometer, directly representing the specific signature of each molecule of light.
  • a signal decomposition operation can be performed to increase the resolution of the signature. This operation can be performed by methods well known to those skilled in the art, such as wavelet-based methods (Donoho et al., 1995) or deconvolution (Bertero and Boccacci, 1998).
  • the method for obtaining a specific signature of a DNA molecule may then further comprise, after step c), a concatenation step where signature overlaps are identified between several fragments, indicating that the same region of the genome is observed. In this case, the two signatures are then merged to generate a longer signature.
  • the method described above makes it possible to obtain the signature of a DNA molecule.
  • This signature can advantageously be implemented to constitute reference libraries of DNA molecules.
  • the invention relates to a specific signature of a given DNA obtained according to the method detailed above.
  • the signatures of the reference DNA molecules can advantageously be used to identify unknown DNA molecules. Accordingly, another aspect of the invention relates to a method for identifying a DNA molecule comprising: i) obtaining the signature of said DNA molecule according to the method of obtaining described above ; and
  • step ii) comparing the signature obtained in step i) with predetermined signatures of reference DNA molecules;
  • the signature obtained in step i) is compared by a computer process based on statistical correlations.
  • the identification method may then further comprise, between steps i) and ii) a concatenation step where signature overlaps are identified between several fragments, indicating that the same region of the genome is observed. In this case, the two signatures are then merged to generate a longer signature.
  • the reference signatures may in particular correspond to the signatures of DNA molecules obtained from healthy subjects.
  • genomic DNA of a healthy subject or complementary DNA obtained from the transcriptome of a cell or tissue of a healthy subject.
  • reference signatures may be produced for each tissue / cell type.
  • healthy subject is meant according to the invention a subject for which no genomic alteration is suspected.
  • the DNA molecule signatures of healthy subjects are representative of the diversity of the populations considered, especially human.
  • the reference DNA molecules may correspond to the signature of chromosomes, for example to the signature of the 23 human chromosomes.
  • the complete signature of a chromosome will of course have been obtained by concatenation of the overlapping signals corresponding to this chromosome, according to the modalities described above.
  • the reference signatures may also correspond to DNA molecules of patients suffering from genetic diseases diagnosed or suffering from a documented cancer. These signatures can allow the identification of the pathologies concerned.
  • the applications of the method according to the invention are not limited to the study of the human genome.
  • the DNA studied can in particular be extracted from an animal, in particular a mammal (including man), but also from a plant, a fungus, a prokaryote, or a virus, for example a virus.
  • mammalian DNA genome in particular a human virus, or a bacteriophage with DNA genome.
  • the reference signatures may correspond to DNA molecules from each of these organisms.
  • the method according to the invention may therefore in particular be a method of identifying a DNA extracted from a plant that is to be identified.
  • the signature of the DNA studied will be compared with reference signatures from different plants or varieties of plants.
  • the reference signatures comprise all or part of DNA signatures of genetically modified plants.
  • the method according to the invention can also make it possible to determine whether a given plant is genetically modified.
  • the invention provides a method for identifying a genomic abnormality in a subject comprising:
  • genomic abnormality being detected if the signature of the genomic DNA of the subject differs from the signatures of the reference DNA molecules. These differences include deletions, inversions, duplications of chromosome segments.
  • the DNA obtained in step i) is compared with predetermined signatures of reference DNA molecules from diseased subjects whose disease is the result of an alteration in the genome of one or more cells of said patient, a genomic anomaly that may be suspected if the signature obtained in step i) corresponds to one of the reference signatures.
  • the invention therefore also relates to a method for identifying a genomic abnormality in a subject comprising:
  • step ii) comparing the signature obtained in step i) with the predetermined signatures of reference DNA molecules from diseased subjects, whose disease is the result of genetic alteration, in order to identify said DNA molecule genomics;
  • a genomic abnormality being detected if the signature of the genomic DNA of the test subject corresponds to at least one of the reference signatures.
  • the invention may advantageously be used to diagnose genetic damage in the context of amniocentesis.
  • This method allows for a finer identification of genetic alterations (inversion, deletions, duplications, translocations at one or more chromosomes), and cytogenetic karyotyping.
  • the method for identifying a genomic anomaly according to the invention can be implemented independently or in addition to such karyotyping.
  • the invention also relates to a method for sorting molecules. This process is applied to a mixture of different DNA molecules. According to this aspect, the invention therefore relates to a method of sorting different DNA molecules included in a mixture, the method comprising:
  • oligonucleotides by hybridization of one or more labeled oligonucleotides, said oligonucleotides being between 10 and 15 nucleotides in size; or
  • the sorting of molecules is of interest in the case where a DNA extract represents very small quantities of molecules (for example obtained at a crime scene, or on traces in a container having contained food potentially contaminated with a GMO , etc). If the amount of DNA is too small to consider existing DNA characterization techniques such as sequencing, but it is nevertheless desirable to recognize the presence of a particular redundant sequence in the mixture (eg to identify the presence of Human DNA through the repeated elements of the genome, or a multi-copy plasmid containing a transgene in a potentially genetically modified organism), the molecule sorting is a very interesting alternative. In this case the DNA molecules in the mixture typically have some redundancy due to the existence in the mixture of molecules having the same DNA sequence, in part or in part.
  • the molecules are said to be overlapping.
  • the mixture may comprise n subgroups of DNA molecules, each subgroup having one or more properties specific thereto (eg, a biological origin or a structural property).
  • the sorting method according to the invention can also be followed by a comparison step 2 to 2 of the different light profiles obtained, thus making it possible to assemble profiles on the basis of the overlap observed between two profiles.
  • the profiles of each molecule are cut into blocks to make the comparison. This approach has the advantage of avoiding any possible problem of discontinuity in the similarity of the profiles along the molecules, since the pairing of the molecules that share a common sequence part will be done locally (by means of the blocks). rather than global (through complete profiles).
  • the k nearest neighbors (k Nearest Neighbors, kNN) of a given block are those which are most similar to it because they are removed by a small Euclidean distance.
  • other strategies for calculating the similarity between two profiles or sub-segments of the profile of molecules include:
  • the similar blocks are then represented on a matrix.
  • the blocks belonging to m 2 which can be represented on a two-dimensional graph, whose axes are the positions of the respective blocks of m ⁇ and m 2 (see Figure 4 for illustrative purposes).
  • a correlation coefficient between two molecules can also be determined.
  • the Pearson correlation coefficient of the positions of the blocks represented in the matrix m 1,1112.
  • the Pearson correlation coefficient classifies all possible pairs of molecules (mi, m 2 ) from most similar to least similar. If necessary, the calculation of the Pearson coefficient can be replaced by the calculation of the Kendall coefficient.
  • This resolution can in particular be achieved by the use of TIRF technologies coupled to a STORJVI or PALM system described above, and analyzed by pointing PSFs as also described above.
  • the resolution of an optical microscope is commonly considered to be ⁇ / 2, about 250 nm.
  • the center of the image of a point (for example a single fluorophore) can be located with much greater accuracy.
  • the DNA studied can be a genomic DNA or a complementary DNA.
  • Figure 1 Example of image obtained after labeling a DNA with an extract of Xenopus egg cytoplasm, combing and acquisition of fluorescence
  • Figure 2 Light signal converted into arbitrary fluorescence units by image analysis software (ImageJ, pink curve (top curve)) while a representative sample of the surrounding background noise is represented by the blue curve (curve bottom).
  • Figure 3 Example of the comparison of the profile of two lambda phage molecules.
  • the molecule 1 on the abscissa has 208 blocks, and the molecule 2 on the y-axis has 147 blocks.
  • a blue dot is drawn at coordinates when a block i of molecule 1 has a block j of molecule 2 among its k best neighbors (kNN.
  • Figure 4 Histogram of the number of pairs recognized as being similar by the (ordered) method as a function of the minimum correlation coefficient threshold required to consider two pairs as being similar (abscissa).
  • the labeling technique is described in detail in Marheineke et al, 2009 and is based on a protocol originally described in Blow et al., 1986. Briefly, the protocol requires the extraction of cytosol from xenopal eggs. For this, eggs are collected on female xenopus and rinsed in deionized water for 5 minutes. The eggs are then dissociated with an appropriate solution ("thaw” solution) and activated with an appropriate solution (Barth solution) supplemented with 0.25 ⁇ g / ml calcium ionophore A23187.
  • the eggs are centrifuged at 2 ° C at a rate of 350 x g for 1 minute to allow removal of any trace of liquid solution and then at 20000 x g for 15 minutes to break them.
  • the central phase is the cytoplasmic extract, which is collected with a syringe and transferred to a tube placed on ice until use.
  • a mixture of 1/20 of cytosol extract, 1/20 of creatine phosphate solution, 1/50 of cycloheximide solution, 1/50 of dUTP-rhodamine solution is prepared. After completion of the reaction, it is stopped by the addition of ice cold PBS solution.
  • the DNA is centrifuged at 1000 ⁇ g for 7 minutes and resuspended in 50 ⁇ l of PBS.
  • the coverslips are carefully cleaned by treatment in a plasma oven to remove any traces of organic matter.
  • the coverslips are then sonicated in pure heptane for 10 minutes and then a silane layer is deposited by incubation for 16 hours in a solution of 100 ml of heptane supplemented with 100 ⁇ l of octenyltrichlorosilane.
  • the coverslips are then sonicated for 5 minutes each time in a succession of liquid: heptane, water, 50% methanol / water, water, chloroform, water, 50% methanol / water, water and then 2 minutes in chloroform.
  • the slats are finally air dried.
  • the DNA labeled in step 1 in a volume of 50 ⁇ l is incubated for 30 minutes at 65 ° C., cooled and then incubated for 30 minutes at room temperature.
  • the DNA is diluted in 1.2 ml of MES solution at pH 5.7-6.2.
  • the mixture is introduced into the tank of the combing apparatus.
  • a coverslip prepared in step 2 °) is fixed at the location provided in the apparatus to combing and immersed in the DNA solution for 5 minutes.
  • the coverslip is removed at a constant speed of 300 ⁇ / s, which causes the DNA to be combed on both sides of the coverslip. This is then dried in air and fixed on a glass slide.
  • the combing of the DNA is visualized with an optical microscope equipped with a 100X objective, an immersion in oil and a FITC filter.
  • the slats are placed under the objective 100X of an optical microscope equipped with a CCD camera (type CoolSnap HQ, Photometrics) having a grid of 512 x 512 photosensors of 6.5 ⁇ 2 .
  • An excitation light of 510 nm is applied by a laser light, and a matched filter is used to collect the signals.
  • 16-bit TIFF images are captured and transmitted for analysis to computer systems ( Figure 1).
  • FIG. 1 An example of an image obtained by this method is given in FIG. 1, and an example of an image analysis result is given in FIG. 2.
  • the luminous trace converted into fluorescence units represents the digital signature of this molecule. DNA.
  • the scattered light spots correspond to background noise.
  • a specific signature of a DNA molecule can be obtained by hybridization on these molecules of short DNA sequences (oligomers) labeled during their synthesis and thus covalently by a fluorescent molecule.
  • the process comprises four main steps:
  • a computer analysis of the images converts the sequence of the light signals generated by the oligomers, and the distance that separates them, into a specific signature of each molecule of combed DNA.
  • the use of different types of fluorophores, each associated with a specific oligonucleotide sequence, can provide a signal of increased complexity, which in turn increases the specificity of the signatures.
  • EXAMPLE 3 Marking of DNA with Amino-Allyl Nucleotides
  • modified nucleotides for example a circular plasmid, a circular bacterial chromosome or genomic or linearized plasmid DNA or other
  • a Phi29 DNA-dependent polymerase eg Fermentas # E0402, 10 U / ⁇ . Briefly, a solution of 25 ng / ⁇ of DNA is prepared in 10 ⁇ l of pure water supplemented with 0.5 ⁇ of cresol red. The DNA is denatured by the addition of 1 ⁇ l of 0.2 M KOH buffer and incubation for 3 minutes at room temperature.
  • the mixture is neutralized by the addition of 1 ⁇ l of Tris-Cl buffer.
  • the polymerization reaction is conducted by preparing the following mixture: 1 ⁇ ⁇ random oligomers of 6 bases, 3 ⁇ denatured DNA prepared above, 6 ⁇ of pure water, 1 ⁇ of pyrophosphatase (10 U / ⁇ ) , 2 ⁇ l of 10mM dCTP amino allyl, 1 ⁇ l of each dATP nucleotide, dTTP, 25mM dGTP, 2 ⁇ l of 2.5mM dCTP, 5 ⁇ l of reaction buffer provided with the commercial enzyme , 1 ⁇ of Phi29 enzyme, 26 ⁇ of pure water.
  • the mixture is incubated for 16 hours at 37 ° C. and then the DNA is denatured for 20 minutes at 70 ° C. the DNA is purified on a filtration column (for example Macherey-nagel Nucleospin Extractll).
  • the coupling between the modified nucleotides bearing amino-allyl groups is achieved by a chemical reaction known to those skilled in the art. Briefly a solution of 10 ⁇ l of 0.1 M carbonate buffer and pH 9.3 containing 200 mg of dissolved fluorescent group (for example Cy3-NHS or Cy5-NHS) is added with 1 ⁇ g of DNA containing the modified nucleotide and 80 ⁇ l of pure water. The mixture is incubated overnight at 25 ° C with gentle and constant agitation.
  • the uncoupled fluorophores are then removed by precipitation, for example by means of an acetate buffer or by a commercial purification kit (for example Promega ref # A7280 or Macherey-nagel Nucleospin Extractll).
  • the purified DNA is redissolved in pure water (for example 50 ⁇ l).
  • the labeling efficiency is achieved by spectrophotometric measurement known to those skilled in the art, by calculating the absorption ratio between the DNA (260 nm) and the fluorophore (at the specific wavelength of the fluorophore).
  • the DNA is denatured by methods known to those skilled in the art, for example by addition of concentrated urea. After purification the DNA is treated as described above to obtain fluorescent labeling.
  • Example 4 DNA labeling with ethynyl-dUTP nucleotides and "click chemistry"
  • Nucleotide 5-Ethynyl-dUTP can also be incorporated into double-stranded DNA by the same protocol as described in Example 3.
  • the coupling between the 5-EdUTPs and the fluorescent group follows a different protocol. as following. A solution of 5 ⁇ of DNA (2 mM) in pure water is added with 2 ⁇ of a solution of azide (50 mM), 3 ⁇ l of a solution of 0.1 M CuBr, 0, 1 M tris buffer (benzyltriazolylmethyl) amine. The mixture is incubated at 25 ° C for 3 hours. The DNA is purified by acetate precipitation by a protocol well known to those skilled in the art.
  • fluorophore-coupled nucleotides into double-stranded DNA is possible through the use of particularly modified nucleotide tolerant DNA polymerases.
  • the mutated form of the polB family polymerase extracted from the bacterium Pyrococcus furiousus (Pfu), designated E10 is capable of substituting up to 100% of cytosines by cytosines coupled to the Cy3 fluorophore, as described in Ramsay and collar. (J. AM CHEM SOC, 2010, 132, 5096-5104).
  • a glass microscope slide having a surface area of 22 ⁇ 22 mm and a thickness of 0.17 mm is washed twice successively in acetone, isopropanol and pure water, dried and placed immediately in a plasma furnace (eg Diener electronics Femto) for a treatment of 2 minutes at 80% intensity.
  • the slide is then immediately soaked in a bath composed of 100 ml of heptane and 150 ⁇ l of Trimethoxy (7-octen-1-yl) silane at 80% for a few seconds and then dried for 12 hours at room temperature.
  • the slide is finally sonicated successively in a bath of heptane, of pure water and finally of chloroform, for 5 minutes each time.
  • a DNA solution to be combed is prepared as follows: 150 ng of DNA suspended in water, 150 ⁇ of MES buffer (for example euromedex ref # EU0033), completion to 1.5 ml with water pure. The solution is placed in the tank of the device. A glass slide 22x 22 mm and 0.17 mm thick prepared as described in 2.1 is placed on the suitable support and incubated for 5 minutes in the DNA solution. The strip is then moved at a constant speed of 300 ⁇ / s out of the tank.
  • MES buffer for example euromedex ref # EU0033
  • Example 7 Image Acquisition by Light Microscopy 7.1. High resolution optical microscopy
  • 60X for example Plan Apo Vc, 60x / l, 40 OIL; ⁇ / 0, 17 WD 0, 13 of Nikon
  • 100X for example Plan APO Vc; 100x / 1, 40 OIL; ⁇ / 0, 17 Nikon WD DIC N2
  • immersion in oil
  • an excitation filter FF01-531 / 40-25, a dichroic filter FF562-Di02-25x36 and a transmission filter FF593 / 40-25 from SEMROCK Brightline will be used for the Cy3.
  • an excitation filter FF01-628 / 40-25, a dichroic filter FF660-D101-25x36 and a transmission filter FF01 -692 / 40-25 from SEMROCK Brightline will be used.
  • An alternative method to 7.1 is to use the Total Internal Reflection Microscopy (TIRF) technique.
  • the excitation is produced by a wavelength laser adapted to the chosen fluorophore, for example for Cy5 the excitation is produced at 633 nm (Vortran Laser technology (class IIIB)) or for Cy3 at 532 nm (Melles Griot 43 Laser ion series).
  • the laser beam excites the medium with an angle of incidence greater than the critical angle thanks to the "TIRF" mirror present in the microscope.
  • a ridge line is a high curvature surface (Maximum curvature in at least one direction) produced by the image of the DNA molecule, defined by high absolute values of the smallest eigenvalues of the symmetric matrix of the second order partial derivatives (Hessian matrix) of each pixel.
  • the second step includes determining a spline curve by interpolation of the maximum curvature points detected on the peak established in the first step.
  • the curve is sampled at equidistant points (for example at each pixel, or at each half-pixel) in order to approximate the value of the surface at these points.
  • the approximation can be done by directly taking into account the value of the pixel, by the Taylor approximation of the surface at the chosen point, or by a Richardson-Lucy deconvolution based on a "point spread function".
  • the successive list of these values constitutes the fluorescent profile of the DNA molecule.
  • the purpose of this application is to sort a group of molecules composed of n different types of molecules in n distinct subgroups, each type of molecule being able to be represented a large number of times.
  • the (real) example below is to show that it is possible to distinguish lambda phage molecules on the one hand, and molecules from the E genome. coli on the other hand.
  • the Euclidean distance between two blocks bl and b2 of size N is given by the following equation:
  • k 50, 100, 150, etc.
  • the k nearest neighbors (k Nearest Neighbors, kNN) of a given block are those which are most similar to it because they are removed by a small Euclidean distance.
  • the Pearson correlation coefficient of the positions of the blocks represented in the matrix (m 1 ⁇ m 2 ) is calculated.
  • the Pearson correlation coefficient classifies all possible pairs of molecules (m 1 ⁇ m 2 ) from most similar to least similar. If necessary, the calculation of the Pearson coefficient can be replaced by the calculation of the Kendall coefficient.
  • lambda phage molecules (30 to 40 kb) and 52 molecules of the E. coli (30 to 40 kb) were identified by the method described above (steps 9.1 to 9.4).
  • the molecules were labeled by substituting 17% of the native thymidines with an uracil coupled to a fluorescent molecule on either strand of DNA (amino-allyl labeling + Cy3-NHS).
  • the genome of the lambda phage is about 48 kb while the genome of E. coli is about 4.6 Mb, a hundred times more.
  • a DNA molecule image is generated as follows.
  • a Spread Function Point (PSF), a mathematical function describing the distribution of photons emitted by a single fluorescent molecule, is determined by approximating by a Gaussian function the points obtained empirically on individual fluorophores by the microscopic system described in Example 5.1. .
  • This PSF is assigned to a given percentage (percentage of labeled bases) of adenine and thymidine bases randomly selected on a DNA molecule of interest.
  • Each base of the DNA molecule is assigned to a pixel of size 0.5 nm (the size of a base when a DNA molecule is stretched) on a pixel line in the image.
  • a random number of these pixels corresponding to the marked base (for example adenine) is selected, depending on the percentage of desired labeling, and the maximum value of one pixel is set at the constant value of 100 photons.
  • a convolution in two dimensions is then carried out by integration of the PSF, then a noise of random Poisson is added (function of the intensity of the pixels) as well as a slight Gaussian noise (of average 0 and standard deviation 10).
  • the profile of each molecule is determined by the peak detection method as described in Example 8.1 above.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

L'invention concerne un procédé d'obtention d'une signature spécifique d'une molécule d'ADN. Ce procédé permet notamment l'obtention de signatures pour de longs fragments d'ADN. Il permet également l'analyse et la comparaison des différences génomiques entre différents individus.

Description

Procédé d'analyse génomique
L'invention concerne un procédé d'obtention d'une signature spécifique d'une molécule d'ADN. Ce procédé permet notamment l'obtention de signatures pour de longs fragments d'ADN. Il permet également l'analyse et la comparaison des différences génomiques entre différents individus.
Introduction:
A l'heure actuelle, dans le domaine du diagnostic médical lié aux altérations génétiques structurales (en anglais Copy Number Variants, CNV), les besoins sont principalement satisfaits par deux approches complémentaires: la technologie d'hybridation génomique comparative (ou "Comparative Genomic Hybridisation", (CGH)) ou la technologie de séquençage de génome individuel. La CGH sur chromosomes en métaphase est relativement peu coûteuse mais présente des limites. Le débit et la précision de cette technique sont faibles. Seules les modifications chromosomiques non équilibrées de plus de 1 millions de bases sont détectées. Des aberrations chromosomiques structurales telle que les translocations réciproques ou les inversions ne seront pas détectées. De plus, cette technique ne donne pas d'information concernant la ploïdie. Ainsi, des tétraploïdes ne présentant pas de réarrangements déséquilibrés apparaîtront normaux. Il existe également une technique de CGH sur fragments d'ADN fixés sur une puce (ou CGH array). Cette technologie est plus résolutive (jusqu'à 5 ou 10 kb) mais elle ne peut découvrir d'anomalie impliquant de l'ADN qui n'est pas présent sur la puce, et elle est insensible aux translocations et aux inversions.
Plus récemment, des technologies de séquençage à très haut débit ont permis dans des cas isolés, en recherche fondamentale, de séquencer l'ADN du génome de patients. Les fragments obtenus par séquençage sont très courts (de 35 à 300 pb) et doivent être alignés sur un génome de référence pour retrouver leurs positions respectives. Les anomalies de type CNV sont identifiées en comptant le nombre de fragments alignés à une position et en le comparant au nombre moyen de lecture alignés par base dans le génome entier. Si le nombre de fragments alignés sur une région correspond à 0% ou 50% de cette moyenne, on diagnostiquera une délétion complète (homozygote) ou partielle (hétérozygote) de la région. Si le nombre correspond à 150% ou plus, on conclura à une duplication. En pratique cette approche est limitée par la difficulté à tenir compte des biais de séquençage, qui biaisent localement le nombre de fragments obtenus. De plus, seulement 60% environ des régions du génome correspondant aux gènes et 45% des autres régions peuvent êtres "vues" par cette technologie. Finalement le coût du séquençage d'un génome humain reste encore prohibitif.
Des procédés basés sur l'utilisation d'enzymes reconnaissant des séquences spécifiques d'ADN ont également été proposés pour produire des signatures de molécules d'ADN. On peut notamment citer l'étude de Neely et al, 2010. Cet article concerne un procédé de cartographie de l'ADN du bactériophage λ par marquage fluorescent au niveau de séquences consensus reconnues par la méthyltransférase M. Hhal. L'ADN marqué est ensuite immobilisé et la fluorescence est observée au microscope pour établir une signature qualifiée de "fluorocode" par les auteurs de l'article. Cette technique ne permet pas d'obtenir une signature spécifique d'une molécule d'ADN, puisqu'un même fluorocode pourrait être obtenu pour différentes molécules d'ADN, par exemples des molécules d'ADN avec des séquences consensus dans des positions relatives équivalentes. Elle nécessite en outre plusieurs "lectures" de la molécule d'ADN marquée pour obtenir un fluorocode.
Il serait donc avantageux de disposer d'un procédé permettant l'obtention d'une signature spécifique d'un ADN donné. De préférence, un tel procédé permettrait l'étude de longues molécules d'ADN. Il serait également avantageux de disposer de techniques permettant le séquençage à l'échelle de la molécule unique.
Résumé de l'invention
La présente demande décrit un procédé d'obtention d'une signature spécifique d'une molécule d'ADN. Selon l'invention, deux molécules différentes auront des signatures différentes. A une séquence d'ADN correspond une signature spécifique unique. La signature obtenue par le procédé selon l'invention permet donc de reconnaître de manière spécifique et reproductible des molécules d'ADN identiques et de distinguer des molécules d'ADN différentes. Un premier objet de l'invention concerne donc un procédé d'obtention d'une signature spécifique d'une molécule d'ADN, comprenant:
a) le marquage d'une molécule d'ADN - par incorporation d'au moins un nucléotide modifié au cours d'une réaction de polymérisation d'ADN, le nucléotide modifié étant détectable, ou étant susceptible d'être modifié de manière à être détectable; ou
- par hybridation d'un ou plusieurs oligonucléotides marqués, lesdits oligonucléotides étant de taille comprise entre 10 et 15 nucléotides; ou
- par mise en contact de l'ADN avec une molécule intercalante fluorescente ;
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide ;
c) la détection du marquage le long de l'ADN au moyen d'un dispositif optique adapté;
moyennant quoi une signature spécifique de ladite séquence ADN est obtenue.
Un autre objet de l'invention concerne un procédé pour l'identification d'une molécule d'ADN, le procédé comprenant:
i) l'obtention de la signature de ladite molécule d'ADN selon le procédé décrit ci-dessus; et ii) la comparaison de la signature obtenue à l'étape i) à des signatures prédéterminées de molécules d'ADN de référence;
la comparaison permettant d'identifier la molécule d'ADN.
L'invention a également pour objet un procédé d'identification d'une anomalie génomique chez un sujet, ledit procédé comprenant:
i) l'obtention de la signature moléculaire d'une molécule d'ADN génomique d'un tissu ou d'une cellule d'un sujet, selon le procédé d'obtention décrit ci-dessus;
ii) la comparaison de la signature obtenue à l'étape i) aux signatures prédéterminées de molécules d'ADN de référence provenant d'un sujet sain afin d'identifier ladite molécule d'ADN génomique ;
une anomalie génomique étant détectée si la signature de la d'ADN génomique du sujet diffère des signatures des molécules d'ADN de référence.
Selon une première variante, le procédé d'identification d'une anomalie génomique mentionné ci-dessus comprend en outre:
- l'obtention à l'étape i) de la signature de plusieurs fragments d'ADN génomique et leur concaténation sur la base de chevauchement de signatures;
- le(s) concaténât étant ensuite comparé(s) aux séquences de références pour identifier le(s)dit(s) concaténât; une anomalie génomique étant détectée si un concaténât diffère de la molécule d'ADN de référence correspondante.
Selon une seconde variante, le procédé d'identification d'une anomalie génomique mentionné ci-dessus est utilisé pour identifier une molécule d'ADN complémentaire, la signature dudit ADN complémentaire étant comparée aux signatures d'un ensemble de molécule d'ADN complémentaire de référence.
En outre, l'invention a pour objet un procédé d'obtention de la séquence nucléotidique d'une molécule d'ADN comprenant:
a) le marquage d'une molécule d'ADN par incorporation d'au moins un nucléotide modifié au cours d'une ou plusieurs réactions indépendantes de polymérisation d'ADN, le(s) nucléotide(s) modifié(s) étant détectable(s), ou étant susceptible(s) d'être modifié(s) de manière à être détectable(s);
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide;
c) la détection du marquage au moyen d'un dispositif optique et d'un moyen de traitement adapté pour obtenir une information de résolution inférieure ou égale à 0,5 nm.
Selon un mode particulier de réalisation de cet objet, le moyen de détection utilisé est la technique TIRF couplée à un système STORM.
L'invention concerne par ailleurs un procédé de tri de molécules d'ADN différentes comprises dans un mélange, le procédé comprenant:
a) le marquage des molécules d'ADN
- par incorporation au cours d'une réaction de polymérisation d'au moins un nucléotide modifié détectable ou susceptible d'être modifié de manière à être détectable; ou
- par hybridation d'un ou plusieurs oligonucléotides marqués, lesdits oligonucléotides étant de taille comprise entre 10 et 15 nucléotides ; ou
- par mise en contact de l'ADN avec une molécule intercalante fluorescente;
b) l'immobilisation et l'étirement des molécules d'ADN marquées sur une surface solide;
c) la détection du marquage le long des molécules d'ADN au moyen d'un dispositif optique adapté; moyennant quoi un ensemble de profils lumineux correspondant aux différentes molécules d'ADN est obtenu, les différentes molécules d'ADN étant discriminées selon leur profil lumineux. Description détaillée de l'invention
Selon un premier aspect, l'invention concerne un procédé d'obtention d'une signature spécifique d'une molécule d'ADN. Ce procédé comprend:
a) le marquage d'une molécule d'ADN
- par incorporation au cours d'une réaction de polymérisation d'au moins un nucléotide modifié détectable ou susceptible d'être modifié de manière à être détectable; ou
- par hybridation d'un ou plusieurs oligonucléotides marqués, lesdits oligonucléotides étant de taille comprise entre 10 et 15 nucléotides ; ou
- par mise en contact de l'ADN avec une molécule intercalante fluorescente;
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide;
c) la détection du marquage le long de l'ADN au moyen d'un dispositif optique adapté;
moyennant quoi une signature spécifique de ladite séquence ADN est obtenue.
Selon les procédés de marquage et d'immobilisation utilisées, la séquence des étapes a) et b) peut être inversée. Ainsi, dans une variante, le marquage précède l'immobilisation et l'étirement de la molécule d'ADN. Dans une seconde variante, l'immobilisation et l'étirement de la molécule d'ADN précède le marquage de ladite molécule d'ADN, en particulier dans le cas d'un marquage de la molécule d'ADN par hybridation avec des oligonucléotides marqués.
Dans le cadre de la présente invention, le terme "signature d'un ADN" désigne le marquage spécifique obtenu le long dudit ADN après lecture optique du signal émis par le marqueur employé à l'étape a) du procédé selon l'invention. Comme nous le décrivons ci-dessous, la signature peut notamment correspondre:
- à la densité de marquage le long de la molécule d'ADN, convertie en unités de fluorescence, ou
- à la séquence de distances successives entre les positions des molécules fluorescentes le long des molécules d'ADN, déterminées par utilisation d'une fonction PSF.
Ladite signature obtenue selon l'invention est "spécifique" en ce sens que, dépendant de la séquence primaire de ladite molécule d'ADN, la probabilité que deux molécules d'ADN puissent avoir la même signature est faible, voire nulle, contrairement aux signatures obtenues par des techniques reposant sur la reconnaissance de séquences consensus.
Molécule d'ADN étudiée
La molécule d'ADN soumise au procédé selon l'invention peut être toute molécule d'ADN pour laquelle l'obtention d'une signature spécifique est souhaitable. Elle peut provenir d'une cellule d'un organisme unicellulaire ou pluricellulaire, et notamment être extraite d'un échantillon de cellules ou tissu d'un organisme pluricellulaire (par exemple échantillon de cheveu, de peau, de sang, etc.) La molécule d'ADN à étudier peut en particulier être une molécule de séquence inconnue.
L'ADN soumis au procédé selon l'invention peut être une molécule d'ADN, notamment une molécule d'ADN génomique, extraite d'une cellule eucaryote (par exemple une cellule de plante, de champignon, d'animal, notamment de mammifère, notamment une cellule humaine) ou procaryote, ou d'un virus, par exemple un virus de mammifère à génome ADN, notamment un virus humain, ou un bactériophage à génome ADN. Le procédé selon l'invention peut également être appliqué à une molécule d'ADN complémentaire. La molécule d'ADN à étudier peut également être une molécule d'ADN isolé ou contenue dans une banque d'ADN.
L'ADN génomique peut notamment provenir d'un patient susceptible d'être atteint d'une maladie impliquant une anomalie dans son génome, par exemple une maladie génétique ou un cancer. L'ADN génomique peut également provenir d'un sujet sain, notamment en vue d'une mise en oeuvre du procédé selon l'invention pour obtenir les signatures de molécules d'ADN "de référence" (cf. ci-dessous).
Le procédé selon l'invention peut notamment comprendre, dans un mode particulier de réalisation, l'extraction préalable de l'ADN à partir des cellules de l'organisme dont on souhaite analyser le génome. A titre illustratif, dans le cas de mammifères (par exemple l'homme ou un autre animal), l'ADN peut être extrait de lymphocytes contenus dans un échantillon de sang. Les techniques de prélèvement de tissus ou cellules (notamment par biopsie, frottis, prélèvement sanguin, ...) et d'extraction de l'ADN sont bien connues de l'homme du métier. L'ADN génomique peut notamment être extrait par lyse alcaline des cellules en prenant les précautions nécessaires lors de la manipulation pour minimiser la fragmentation des molécules d'ADN. En effet, selon un mode particulier de réalisation, les molécules d'ADN soumises au procédé selon l'invention sont des molécules de haut poids moléculaire, de préférence de taille supérieure à 50 kb, en particulier supérieure à 60 kb, en particulier supérieure à 100 kb, plus particulièrement supérieure à 200 kb. L'homme du métier pourra prendre en compte la densité du marquage obtenu pour déterminer la taille de fragment la plus adaptée. Ainsi, une signature spécifique peut notamment être obtenue pour un fragment de 60kb pour une densité de marquage de 50 % de l'une des quatre bases de l'ADN (A, T, C ou G), c'est-à-dire pour un marquage de 12,5 % de la molécule d'ADN en moyenne. L'homme du métier connaît les techniques permettant d'obtenir des molécules d'ADN de taille comprise adéquate. Par exemple, cette opération peut être réalisée en isolant les cellules dans des blocs d'agarose dans lesquels diffusent les solutions de lyse cellulaire et de digestion de l'ADN, suivi par une séparation des molécules d'ADN par électrophorèse, la découpe d'un bloc d'agarose correspondant à la taille souhaitée et la digestion de l'agarose par une agarase.
L'ADN à étudier peut être ancré ou non ancré à la surface solide avant étirement. Dans un mode particulier de réalisation, l'ADN à étudier est modifié de manière à permettre son immobilisation sur une surface solide (par exemple en exploitant le système biotine- streptavidine). L'ancrage par une extrémité peut avantageusement permettre d'obtenir une distribution particulière des molécules sur la surface solide.
Selon un autre mode de réalisation, les molécules d'ADN sont peignées « telles quelles » à partir d'une solution d'ADN non modifié à l'une de ses extrémités (étant entendu que l'ADN peut être un ADN modifié à l'une de ses extrémités, mais la modification n'étant pas réalisée en vue de son ancrage sur la surface).
Marquage de l'ADN
Selon un mode particulier de réalisation, l'ADN est marqué par incorporation d'analogues de nucléotides au cours d'une réaction de polymérisation, selon des techniques bien connues de l'homme du métier. Ces techniques mettent en oeuvre une ADN polymérase.
L'homme du métier a plusieurs techniques à sa disposition pour réaliser ce marquage. On peut ainsi notamment marquer l'ADN par synthèse in vitro en utilisant une ADN polymérase recombinante. Des exemples d'ADN polymérases utilisables sont le fragment Klenow de l'ADN polymérase I de Escherichia coli, les polymérases thermorésistantes Taq et Pfu et leur variantes commerciales, la polymérase Phi29. De préférence, on utilise une ADN polymérase suffisamment processive pour incorporer des nucléotides modifiés dans un ADN de haut poids moléculaire. De préférence, l'ADN polymérase utilisée est une polymérase à haute fidélité. L'ADN polymérase Phi29 disponible à la vente notamment chez New England Biolabs est un exemple de polymérase qui réunit ces propriétés et qui peut être utilisée dans le cadre de la présente invention. Selon un autre mode avantageux de réalisation, l'incorporation de nucléotides modifiés dans de l'ADN double brin, notamment de nucléotides couplés à un fluorophore, est mise en œuvre en utilisant une ADN polymérase particulièrement tolérante aux nucléotides modifiés. Par exemple la forme mutée de la polymérase de la famille des polB extraite de la bactérie Pyrococcus furiousus (Pfu), appelée E10, est susceptible de substituer jusqu'à 100% de cytosines par des cytosines couplées au fluorophore Cy3, comme décrit dans Ramsay et col. Cette Pfu polymérase E10 peut bien entendu être utilisée pour incorporer d'autres nucléotides marqués, notamment des nucléotides marqués par d'autres marqueurs fluorescents que le Cy3, notamment les autres marqueurs cités dans la présente demande. L'incorporation de nucléotides modifiés dans les molécules d'ADN double brin (par exemple un plasmide circulaire, chromosome bactérien circulaire, ADN génomique ou plasmidique linéarisé ou autre) peut ainsi notamment se faire selon l'un des protocoles détaillés fournis dans les exemples 1 à 5. Selon un mode particulier de réalisation, la synthèse in vitro est mise en œuvre en réalisant un seul cycle de synthèse, de manière à obtenir des molécules d'ADN marquées sur un seul de leurs deux brins.
L'incorporation peut être réalisée à partir d'extraits de cytosol de cellules en culture, de préférence de cellules humaines, contenant les composants de la machinerie réplicative. Typiquement, ces composants sont extraits à partir de cellules (type cellules HeLa) en culture, sont complétés avec les nucléotides modifiés que l'on souhaite incorporer dans l'ADN et mis en contact avec de l'ADN, par exemples de l'ADN génomique, que l'on souhaite marquer. Ces techniques sont connues de l'homme du métier (par exemple Marheineke et al, 2009). Selon un autre mode de réalisation de l'invention, l'ADN que l'on souhaite marquer est de l'ADN situé dans le noyau de cellules en culture, dans lesquels des nucléotides fluorescents sont introduits par micro-injection. Les nucléotides modifiés sont alors incorporés dans l'ADN in vivo par la machinerie réplicative native des cellules. Ces techniques sont connues de l'homme du métier (Zink et al., 1998).
La réaction de polymérisation est réalisée en présence des quatre bases de l'ADN dATP, dTTP, dGTP et dCTP. Selon un mode de réalisation, l'un ou plusieurs des nucléotides peuvent être remplacés par un analogue. Par exemple le dUTP peut remplacer le dTTP. Selon l'invention, l'étape de marquage peut être réalisée par incorporation d'au moins un analogue d'un nucléotide, ledit analogue étant soit un analogue fluorescent, soit un analogue susceptible d'être modifié pour le rendre fluorescent. Selon une variante, la polymérisation est réalisée en présence des quatre bases de l'ADN, complétées du ou des analogue(s) à incorporer dans l'ADN. Selon une autre variante, le ou les analogue(s) à incorporer sont utilisés en remplaçant totalement la base correspondante non modifiée dans le mélange réactionnel.
Ainsi, selon un mode particulier de réalisation, le procédé selon l'invention comprend le marquage de l'ADN avec au moins un analogue fluorescent d'un nucléotide choisi parmi dATP, dTTP (ou dUTP), dGTP et dCTP. Selon une variante spécifique de ce mode de réalisation, un seul analogue fluorescent est employé. Lorsque plusieurs analogues différents de différents nucléotides sont employés, le marqueur fluorescent utilisé est identique ou différent pour chacun de ces analogues. De préférence le marqueur fluorescent est différent pour chacun des analogues utilisés.
Les analogues fluorescents de nucléotides sont bien connus de l'homme du métier et sont disponibles dans le commerce. Tout fluorophore susceptible d'être lié à un nucléotide soit directement, soit par l'intermédiaire d'un espaceur (par exemple (CH2)n) peut être utilisé dans la présente invention. On peut citer notamment les analogues de nucléotides marqués à la diéthylaminocoumarine, la fluorescéine, une cyanine, notamment la cyanine 3 ou la cyanine 5, la tétraméthylrhodamine, la Lissamine®, au Texas Red®, à l'alexa ou encore à un marqueur de la famille ATTO (notamment ATT0647N, ATTO 550, ATT0565 disponibles chez Jena BioSciences couplés à des nucléotides (ou analogues) selon différentes variantes). Différents fournisseur commercialisent ce type d'analogues fluorescents, notamment Perkin Elmer, Amersham, etc.
Selon un mode particulier de réalisation, les marqueurs sont des molécules photoactivables en fonction des conditions oxydo-réductrices du milieu réactionnel. Ce mode de réalisation est particulièrement avantageux dans le cadre de la mise en oeuvre de la technologie STORM décrite ci-dessous.
L'analogue de nucléotide utilisé peut également alternativement ne pas être lui-même fluorescent, mais être porteur d'un groupement susceptible d'être modifié pour le rendre fluorescent. Le couplage des fluorophores peut être covalent ou transitoire (pour pallier d'éventuelles limitations stériques). Dans le cas d'un couplage transitoire, on utilise des molécules fluorescentes possédant une affinité pour l'analogue de nucléotide incorporé dans l'ADN. On peut notamment citer à titre illustratif les bromo-, iodo-, fluoro-nucléotides (notamment bromo-, iodo-, fluoro-UTP, -ATP ou -CTP), des oxo-nucléotides (tels que oxo- GTP) des nucléotides contenant un groupement alkyne (par exemple5-éthynyl-dUTP, C8- Alkyne-dUTP, γ-Propargyl-ATP) et des nucléotides modifiés par un groupement contenant une fonction aminé, notamment une fonction aminoallyle tels que aminoallyl-dUTP, et les aminoallyl-dCTP.
Le couplage d'un marqueur fluorescent sur un nucléotide modifié est bien connu de l'homme de l'art.
A titre illustratif, le marquage fluorescent d'un nucléotide modifié porteur d'une fonction aminé tel que l'aminoallyl-dUTP ou aminoallyle-dCTP peut être réalisé par réaction de l'ADN modifié avec un groupement fluorescent porteur d'une fonction N-hydroxysuccinimide (NHS), sulfo-NHS ou sulfotétrafluorophényl (STP) qui permettra le couplage au niveau de la fonction aminé. Le marqueur fluorescent employé peut ainsi être un ester NHS d'une molécule fluorescente telle que Cy3-NHS, Cy5-NHS, ATTO-NHS, Alexa-NHS, fluoresceine- NHS, rhodamine-NHS ou autres.
Le marquage fluorescent d'un nucléotide modifié porteur d'une fonction alkyne tel que 5- éthynyl-dUTP peut être réalisé par la "Click Chemistry", soit une réaction de l'ADN modifié avec une solution de bromure de cuivre (CuBr), de tris-(benzyltriazolylmethyl)amine et d'une molécule fluorescente contenant un groupement azide (comme par exemple la fluorescein- azide, la cyanine3 -azide, la cyanine5 -azide, etc.). Dans un mode particulier de réalisation, le couplage avec un marqueur fluorescent peut être réalisé sur une molécule d'ADN simple brin comprenant un nucléotide modifié pour augmenter l'efficacité de ce couplage. Les méthodes pour obtenir un ADN simple brin son bien connues de l'homme du métier. On peut notamment citer l'addition d'une concentration d'urée concentrée à la solution d'ADN double brin. Le marquage fluorescent est ensuite réalisé après purification de l'ADN simple brin.
Selon un mode particulier de réalisation, le marquage est réalisé par réplication d'une molécule d'ADN (ADN matrice) telle que décrite ci-dessus avec l'ADN polymérase Phi29, en présence de dATP, dTTP (ou alternativement dUTP), dCTP et dGTP non modifiés et d'un ou plusieurs analogues de nucléotides fluorescents ou susceptibles d'être rendus fluorescents. Selon une variante de ce mode de réalisation, l'analogue de nucléotide remplace complètement la base non modifiée correspondante dans le milieu réactionnel. La réaction de polymérisation est réalisée à la température requise pour le fonctionnement de l'enzyme selon les recommandations du fournisseur (30°C pour la Phi29) et pendant un temps suffisant pour permettre l'incorporation de nucléotides modifiés sur plusieurs dizaines de kilobases sur une partie au moins des molécules matrices. Selon un second mode de réalisation de l'invention, le marquage est réalisé par hybridation de la molécule d'ADN avec un ou plusieurs oligonucléotides simple brin marqués, de taille comprise entre 10 et 15 nucléotides. La séquence de ces oligonucléotides est choisie de sorte qu'elle soit répartie de manière à peu près uniforme dans le génome d'intérêt, tout en permettant l'obtention d'un marquage spécifique d'une molécule d'ADN donné. Dans le cas du génome humain, ces oligonucléotides sont choisis en fonction de la composition du génome, et de leur répartition. La séquence des oligonucléotides pourra être de la forme NNX1X2X3X4 5 6 7 8NN, dans laquelle X1X2X3X4X5X6X7X8 est une séquence déterminée et N est une base aléatoire. De cette façon la séquence déterminée de l'oligonucléotide sera suffisamment courte (par exemple 8 bases) pour avoir de nombreuses occurrences dans le génome, et suffisamment longue par addition de bases aléatoires (par exemple 8+4=12 bases ici) pour s'hybrider de manière stable. Les oligonucléotides peuvent notamment être marqués par incorporation d'une ou plusieurs molécules fluorescentes à leur extrémité, selon des procédures bien connues de l'homme du métier. Selon un aspect particulier de ce second mode de réalisation, le marquage par hybridation est réalisé après immobilisation et étirement de la molécule d'ADN à étudier.
Selon un troisième mode particulier de réalisation, le marquage de la molécule d'ADN est réalisé par mise en contact dudit ADN avec un agent intercalant capable de se lier à l'ADN double brin et qui émet un signal fluorescent lorsqu'il est ainsi lié. De nombreux agents intercalants sont connus de l'homme du métier. On peut citer à titre illustratif le bromure d'éthidium, l'iodure de propidium, le Sybr Green, le TOTO (1, 1 '-(4,4,7,7-tetramethyl-4,7- diazaundecamethylene)-bis-4-[3 -methyl-2,3-dihydro-(benzo- 1,3 -thiazole)-2- methylidene]- quinolinium tetraiodide) ou l'oxazole orange (YOYO).
L'agent intercalant peut être utilisé pour marquer la molécule d'ADN avant ou après immobilisation sur support solide. De préférence, le marquage est réalisé avant immobilisation de la molécule d'ADN, en particulier en utilisant la molécule YOYO. Immobilisation et étirement de l'ADN
L'étape b) du procédé d'obtention d'une signature spécifique d'une molécule d'ADN comprend l'immobilisation et l'étirement dudit ADN sur un support solide.
De préférence, l'ADN marqué est immobilisé et étiré par la technique du peignage moléculaire. Cette technique est bien connue de l'homme du métier. On en trouvera une description détaillée notamment dans la demande W09521939, incorporée ici par référence. En résumé, cette technique exploite le mouvement d'un ménisque de solvant qui étire et oriente les molécules d'ADN en solution dans la direction du mouvement, tout en appliquant localement une force qui plaque les molécules d'ADN sur la surface solide. Un taux d'étirement de 1 base/0,5 nm peut être obtenu avec cette technique.
La surface sur laquelle les molécules d'ADN sont immobilisées est rigide (par exemple du verre) ou semi-rigide (par exemple une feuille de polymère flexible). La surface peut notamment être composée ou recouverte d'un polymère organique ou inorganique, d'un métal, oxyde de métal, semi- conducteur, ou une combinaison de ces matières.
Selon un mode particulier de réalisation, la surface est recouverte, dans sa totalité ou en partie, de groupements susceptibles de réagir avec une extrémité des molécules d'ADN en solution et ainsi de la fixer. Bien entendu, l'homme du métier connaît les différents systèmes utilisables pour fixer une molécule d'ADN et saura dans quels cas la molécule d'ADN doit être fonctionnalisée en parallèle de la surface. On peut citer à titre d'exemple le système streptavidine-biotine, un système anticorps-antigène, etc.
Selon un autre mode particulier de réalisation, l'ADN n'est pas modifié en vu de son ancrage. On utilise alors par exemple des lames de verre silanisées (par exemple par trempage de la lame de verre dans un bain de trimethoxy(7-octen-l-yl)silane à 80 %) qui n'ont pas subi un traitement supplémentaire et la molécule d'ADN est alors immobilisée par application de la technique de peignage moléculaire. Selon une variante de ce mode de réalisation, le support peut également être un support composé ou recouvert d'un polymère synthétique, de polyacrylamide, de polycarbonates, etc.
Dans un mode particulier de réalisation, l'ADN marqué est immobilisé de manière individualisée. En d'autres termes, l'ADN marqué est dilué à une concentration adéquate pour obtenir, après immobilisation, des molécules d'ADN marqué séparées les unes des autres. A titre illustratif, des fragments d'ADN de 50 à 200 kb de longueur sont utilisés à une concentration de 0,2 à 1 pM. La dilution peut être réalisée dans un tampon Tris 50mM, pH 8 ou MES 50mM, pH 5.5 par exemple.
Le peignage moléculaire peut être réalisé dans un appareil adapté permettant de déplacer à vitesse constante le support hors d'un réservoir contenant l'ADN marqué à fixer et peigner. La vitesse de déplacement du support hors du réservoir peut être adaptée par l'homme du métier. A titre illustratif, les exemples ci-dessous présentent la mise en œuvre d'un déplacement à vitesse constante de 300 μιη/s hors du réservoir.
Observation
Après immobilisation, les molécules d'ADN étirées sont observées à l'aide d'un microscope optique afin de générer un signal fluorescent. Le microscope peut notamment comprendre un système TIRF (Total Internai Reflection Fluorescence) pour minimiser le bruit autour de la molécule d'ADN à étudier. Dans un mode particulier de réalisation, le microscope est équipé d'un objectif à grossissement choisi de manière à optimiser l'observation de la molécule d'ADN marquée. L'objectif peut notamment présenter un grossissement d'au moins 40X, de préférence d'au moins 50X, au moins 60X voire d'au moins 100X. Dans un autre mode particulier de réalisation, le microscope est équipé d'une caméra CCD à haute résolution (par exemple 6,5 μιη x 6,5 μπι, soit 65 nm par pixel pour un objectif 100X) à efficacité quantique élevée (de préférence supérieure à 65%). Dans ces conditions, un pixel de la caméra couvre une longueur d'environ 130 paires de base d'ADN étiré et immobilisé sur la surface.
Selon un mode préféré de réalisation, le microscope utilisé comprend un système TIRF et est équipé d'un objectif à grossissement d'au moins 100X et d'une caméra CCD à haute résolution (par exemple 6,5 μπι x 6,5 μπι, soit 65 nm par pixel) à efficacité quantique élevée (de préférence supérieure à 65%).
Les molécules fluorescentes sont excitées par un laser de longueur d'onde adaptée, connue de l'homme du métier. La lumière émise est capturée par la caméra fixée au microscope dont l'objectif est équipé d'un filtre optique adapté. Des moyens adaptés pour l'obtention d'une fluorescence sont donc employés. On pourra notamment citer l'emploi de filtres d'excitation, dichroïques et d'émission appropriés en fonction du fluorophore utilisé pour marquer l'ADN et l'emploi d'une excitation par un laser à une longueur d'onde adaptée. A titre illustratif, les exemples décrivent des filtres qui peuvent être utilisés pour la détection du marqueur Cy3 ou encore l'emploi d'un laser de longueur d'onde de 633 nm pour exciter le Cy5 ou 532 nm pour exciter le Cy3, l'homme du métier connaissant les moyens nécessaires à l'obtention d'une fluorescence à partir d'autres marqueurs.
Bien entendu, l'homme du métier pourra adapter l'équipement pour obtenir la meilleure résolution possible. Selon un mode préféré de réalisation, la microscopie mise en œuvre est une microscopie à fluorescence de super-résolution. Selon un aspect préféré, la microscopie de super-résolution utilisée met en œuvre une localisation successive de fluorophores individuels. Parmi les technologies disponibles, on peut citer le PALM (photoactivated localization microscopy) et le STORM (stochastic optical reconstruction microscopy) qui permettent de s'affranchir de la limite de résolution imposée par la diffraction. Ces techniques sont décrites dans les articles de Betzig et al, 2006 et Rust et al., 2006, qui sont incorporés ici par référence. Ces techniques implémentent une photoactivation des fluorophores incorporés dans l'ADN par des flashs de lumière qui excitent aléatoirement un petit nombre de molécules fluorescentes, plutôt que de les exciter en continu. Ces molécules fluorescentes sont alors imagées jusqu'à ce que le fluorophore soit détruit ou repasse dans un état inactif.
Selon un mode particulier de réalisation, le microscope utilisé comprend un système TIRF et un système STORM ou PALM, de préférence STORM.
Les signaux lumineux collectés sous forme d'images sont ensuite traités par un processus informatisé dans le but de localiser la position relative des fluorophores (et donc des bases modifiées dans l'ADN) les uns par rapport aux autres le long de l'axe linéaire des molécules d'ADN, et donc leur distance relative les uns par rapport aux autres.
La détermination du profil lumineux de chaque molécule présente sur une image peut être réalisée automatiquement par un algorithme implémenté dans un programme informatique. Selon un aspect particulier, l'algorithme peut notamment se dérouler en deux étapes. La première comprend l'identification des pics d'intensité maximale sur les pixels de premier plan le long d'une ligne de crête. Une ligne de crête est une surface de courbure élevée (courbure maximale dans au moins une direction) produite par l'image de la molécule d'ADN, définie par des valeurs absolues élevée des plus petites valeurs propres de la matrice symétrique des dérivées partielles de second ordre (matrice Hessienne) de chaque pixel. Selon un mode particulier de réalisation, un flou Gaussien (sigma = 1 pixel) peut être appliqué afin de réduire l'influence du bruit. La deuxième étape comprend la détermination d'une courbe spline par interpolation des points de courbure maximale détectés sur la crête, établis lors de la première étape.. La courbe est échantillonnée à des points équi distants (par exemple à chaque pixel, ou à chaque demi-pixel) afin d'approximer la valeur de la surface à ces points. L'approximation peut se faire par la prise en compte directe de la valeur du pixel, par l'approximation de Taylor de la surface au point choisi, ou par une déconvolution de Richardson-Lucy basée sur une « point spread fonction ». La liste successive de ces valeurs constitue le profil fluorescent de la molécule d'ADN (Figure 3). Dans un mode de réalisation de l'invention s'appuyant sur la technologie STORM ou PALM, une fonction d'étalement du point (ou Point Spread Function (PSF) en anglais), soit une fonction mathématique décrivant le signal émis par une molécule fluorescente unique, sera ajustée sur le signal lumineux afin de décomposer celui-ci en autant de PSFs que de molécules émettrices uniques. Cette opération permet de pointer le centre de chaque PSF et ainsi de positionner les molécules émettrices les unes par rapport aux autres le long de l'axe de la molécule d'ADN immobilisée et étirée (de préférence par peignage moléculaire). L'opération de pointage est réalisée grâce à des algorithmes bien connus de l'homme du métier (par exemple, Mortensen et al, 2010). Le centre de chaque PSF, correspondant à la position de chaque molécule fluorescente, pourra ainsi être localisé avec une précision dépendant du nombre de photons acquis, et non pas de la limite de diffraction de la lumière émise. La séquence de distances successives entre les positions des molécules fluorescentes le long des molécules d'ADN fournit ainsi une signature spécifique de chacune des molécules, exprimée en paire de base d'ADN. Dans un autre mode de réalisation de l'invention, le pointage des molécules individuelles produisant le signal lumineux n'est pas requis, le signal lumineux linéaire, exprimé en unités d'intensité arbitraire par nanomètre, représentant directement la signature spécifique de chaque molécule d'ADN. Dans ce cas une opération de décomposition du signal peut être réalisée afin d'accroître la résolution de la signature. Cette opération peut être réalisée par des méthodes bien connues de l'homme du métier, comme les méthodes basées sur les ondelettes (Donoho et al., 1995) ou sur la déconvolution (Bertero et Boccacci, 1998).
Il est possible que des fragments différents représentant différentes copies d'une même séquence d'ADN soient immobilisés sur la surface dans le procédé selon l'invention. Le procédé d'obtention d'une signature spécifique d'une molécule d'ADN peut alors comprendre en outre, après l'étape c) une étape de concaténation où des chevauchements de signature sont identifiés entre plusieurs fragments, indiquant que la même région du génome est observée. Dans ce cas, les deux signatures sont alors fusionnées pour générer une signature plus longue. Autres objets de l'invention
Le procédé décrit ci-dessus permet d'obtenir la signature d'une molécule d'ADN. Cette signature peut avantageusement être mise en œuvre pour constituer des banques de signatures de molécules d'ADN de référence.
Ainsi, selon l'un de ses aspects, l'invention concerne une signature spécifique d'un ADN donné obtenue selon le procédé détaillé ci-dessus.
Les signatures des molécules d'ADN de référence peuvent avantageusement être utilisées pour identifier des molécules d'ADN inconnues. En conséquence, un autre aspect de l'invention concerne un procédé pour l'identification d'une molécule d'ADN comprenant: i) l'obtention de la signature de ladite molécule d'ADN selon le procédé d'obtention décrit ci- dessus; et
ii) la comparaison de la signature obtenue à l'étape i) à des signatures prédéterminées de molécules d'ADN de référence;
ladite comparaison permettant d'identifier la molécule d'ADN.
La signature obtenue à l'étape i) est comparée par un procédé informatique basé sur des corrélations statistiques.
Il est possible que des fragments différents issus d'une même molécule d'ADN soient immobilisés sur la surface dans le procédé selon l'invention. Comme mentionné ci-dessus, le procédé d'identification peut alors comprendre en outre, entre les étapes i) et ii) une étape de concaténation où des chevauchements de signature sont identifiés entre plusieurs fragments, indiquant que la même région du génome est observée. Dans ce cas, les deux signatures sont alors fusionnées pour générer une signature plus longue.
Les signatures de référence peuvent notamment correspondre aux signatures de molécules d'ADN obtenues à partir de sujets sains. On peut notamment citer de l'ADN génomique d'un sujet sain, ou de l'ADN complémentaire obtenu à partir du transcriptome d'une cellule ou d'un tissu d'un sujet sain. Dans le cas d'ADN complémentaire, des signatures de référence pourront être produite pour chaque tissu/type cellulaire. Par "sujet sain", on désigne selon l'invention un sujet pour lequel on ne suspecte aucune altération génomique. Préférentiellement, les signatures de molécule d'ADN de sujet sain sont représentatives de la diversité des populations considérées, notamment humaines. Les molécules d'ADN de référence peuvent correspondre à la signature de chromosomes, par exemple à la signature des 23 chromosomes humains. La signature complète d'un chromosome aura bien entendu été obtenue par concaténation des signaux chevauchant correspondant à ce chromosome, selon les modalités exposées ci-dessus. Les signatures de référence peuvent également correspondre à des molécules d'ADN de patients souffrant de maladies génétiques diagnostiquées, ou souffrant d'un cancer documenté. Ces signatures peuvent permettre l'identification des pathologies concernées.
Bien entendu, comme cela a été mentionné ci-dessus, les applications du procédé selon l'invention ne se limitent pas à l'étude du génome humain. L'ADN étudié peut notamment être extrait d'un animal, notamment un mammifère (dont l'homme), mais également d'une plante, d'un champignon, d'un procaryote, ou d'un virus, par exemple un virus de mammifère à génome ADN, notamment un virus humain, ou un bactériophage à génome ADN. En particulier, les signatures de référence peuvent correspondre à des molécules d'ADN provenant de chacun de ces organismes.
Le procédé selon l'invention peut donc notamment être un procédé d'identification d'un ADN extrait d'une plante que l'on cherche à identifier. Dans ce cadre, la signature de l'ADN étudié sera comparée à des signatures de référence provenant de différentes plantes ou variétés de plantes. Selon un mode particulier de réalisation, les signatures de référence comprennent en tout ou partie des signatures d'ADN de plantes génétiquement modifiées. Ainsi, le procédé selon l'invention peut également permettre de déterminer si une plante donnée est génétiquement modifiée. Selon un autre aspect, l'invention concerne un procédé pour l'identification d'une anomalie génomique chez un sujet comprenant:
i) l'obtention de la signature moléculaire d'une molécule d'ADN génomique d'un tissu ou d'une cellule d'un sujet; ii) la comparaison de la signature obtenue à l'étape i) aux signatures prédéterminées de molécules d'ADN de référence provenant d'un sujet sain afin d'identifier ladite molécule d'ADN génomique ;
une anomalie génomique étant détectée si la signature de l'ADN génomique du sujet diffère des signatures des molécules d'ADN de référence. Ces différences comprennent notamment des délétions, des inversions, des duplications de segments de chromosomes.
Selon un autre mode de réalisation, l'ADN obtenu à l'étape i) est comparé à des signatures prédéterminées de molécules d'ADN de référence provenant de sujets malades, dont la maladie est le résultat d'une altération dans le génome d'une ou plusieurs cellules dudit patient, une anomalie génomique pouvant être suspectée si la signature obtenue à l'étape i) correspond à l'une des signatures de référence. L'invention concerne donc également un procédé pour l'identification d'une anomalie génomique chez un sujet comprenant:
i) l'obtention de la signature moléculaire d'une molécule d'ADN génomique d'un tissu ou d'une cellule d'un sujet;
ii) la comparaison de la signature obtenue à l'étape i) aux signatures prédéterminées de molécules d'ADN de référence provenant de sujets malades, dont la maladie est le résultat d'une altération génétique, afin d'identifier ladite molécule d'ADN génomique ;
une anomalie génomique étant détectée si la signature de l'ADN génomique du sujet testé correspond à au moins l'une des signatures de référence.
Par ailleurs, l'invention peut notamment avantageusement être utilisée pour diagnostiquer une altération génétique dans le cadre d'une amniocentèse. Ce procédé permet une identification plus fine d'altérations génétiques (inversion, délétions, duplications, translocations au niveau d'un ou plusieurs chromosomes) que le caryotypage par cytogénétique. Le procédé pour l'identification d'une anomalie génomique selon l'invention peut être mis en oeuvre indépendamment ou en complément d'un tel caryotypage.
L'invention concerne également un procédé de tri de molécules. Ce procédé est appliqué à un mélange de molécules d'ADN différentes. Selon cet aspect, l'invention concerne donc un procédé de tri de molécules d'ADN différentes comprises dans un mélange, le procédé comprenant:
a) le marquage des molécules d'ADN - par incorporation au cours d'une réaction de polymérisation d'au moins un nucléotide modifié détectable ou susceptible d'être modifié de manière à être détectable; ou
- par hybridation d'un ou plusieurs oligonucléotides marqués, lesdits oligonucléotides étant de taille comprise entre 10 et 15 nucléotides ; ou
- par mise en contact de l'ADN avec une molécule intercalante fluorescente;
b) l'immobilisation et l'étirement des molécules d'ADN marquées sur une surface solide;
c) la détection du marquage le long des molécules d'ADN au moyen d'un dispositif optique adapté;
moyennant quoi un ensemble de profils lumineux correspondant aux différentes molécules d'ADN est obtenu, les différentes molécules d'ADN étant triées selon leur profil lumineux.
Le tri de molécules présente un intérêt dans le cas où un extrait d'ADN représente de très petites quantités de molécules (par exemple obtenues sur une scène de crime, ou sur des traces dans un récipient ayant contenu de la nourriture potentiellement contaminée par un OGM, etc). Si la quantité d'ADN est trop faible pour envisager des techniques de caractérisation de l'ADN existantes comme le séquençage, mais que l'on souhaite néanmoins reconnaître la présence d'une séquence particulière redondante dans le mélange (par exemple identifier la présence d'ADN humain à travers les éléments répétés du génome, ou un plasmide multi- copies contenant un transgène dans un organisme potentiellement modifié génétiquement), le tri de molécule est une alternative très intéressante. Dans ce cas les molécules d'ADN dans le mélange présentent typiquement une certaine redondance due à l'existence dans le mélange de molécules possédant la même séquence d'ADN, exactement ou en partie. Dans ce dernier cas, les molécules sont dites chevauchantes. Ainsi, le mélange peut comprendre n sous-groupes de molécules d'ADN, chaque sous-groupe possédant une ou plusieurs propriétés qui lui sont spécifique (par exemple une origine biologique ou une propriété structurale). Dans ce cas, le procédé de tri selon l'invention peut également être suivi d'une étape de comparaison 2 à 2 des différents profils lumineux obtenus, permettant ainsi de procéder à un assemblage de profils sur la base du chevauchement observé entre deux profils. Selon un mode spécifique de réalisation, les profils de chaque molécule sont découpés en blocs pour procéder à la comparaison. Cette approche présente l'avantage de s'affranchir de tout problème éventuel de discontinuité dans la similarité des profils le long des molécules, puisque l'appariement des molécules qui partagent une partie de séquence commune se fera de manière locale (par le biais des blocs) plutôt que globale (par le biais des profils complets). Ainsi, il est possible de découper les profils lumineux obtenus en blocs de taille t se chevauchants de p pixels, avec p < t. Une mesure de similarité (par exemple une distance Euclidienne) est calculée entre toutes les paires possibles de blocs. On recherche alors les situations où une succession de blocs appartenant à une molécule donnée montrent une forte similarité à une succession de blocs d'une autre molécule. Cette situation est caractéristique de deux molécules partageant une région de même séquence d'ADN.
Par exemple, il est possible de déterminer la distance euclidienne entre deux blocs bl et b2 de taille N, donnée par l'équation suivan
Figure imgf000022_0001
On définit pour chaque bloc de chaque molécule, ses k meilleurs voisins (par exemple avec k= 50, 100, 150, etc) parmi tous les blocs de toutes les autres molécules. Les k meilleurs voisins (k Nearest Neighbors, kNN) d'un bloc donné sont ceux qui lui sont le plus similaires car ils en sont éloignés par une petite distance euclidienne. Selon un mode alternatif de réalisation, d'autres stratégies pour calculer la similarité entre deux profils ou sous-segments de profil de molécules incluent :
- des corrélations croisées normalisées
- des corrélations croisées normalisées avec chevauchement partiel
- la distance euclidienne sur des transformées de Fourier à terme
- la distance de Hellinger
- la Minimum Variance Matching (MVM) selon Keogh
- la distance euclidienne sur des coefficients d'ondelettes seuillés
- l'écart de Weyl Selon un mode particulier de réalisation, les blocs similaires sont ensuite représentés sur une matrice. Par exemple, pour toutes les paires possibles de molécules {m1} m2), on sélectionne parmi les kNN de chaque bloc de m} les blocs appartenant à m2, et qui peuvent être représentés sur un graphe à deux dimensions, dont les axes sont les positions des blocs respectifs de m} et m2 (voir à titre illustratif la figure 4).
Un coefficient de corrélation entre deux molécules peut également être déterminé. En particulier, afin de quantifier la comparaison des molécules mi et m2, on peut calculer le coefficient de corrélation de Pearson des positions des blocs représentés dans la matrice (m 1,1112) . Le coefficient de corrélation de Pearson permet de classer toutes les paires possibles de molécules (mi,m2) de la plus similaire à la moins similaire. Si nécessaire, le calcul du coefficient de Pearson peut être remplacé par le calcul du coefficient de Kendall.
Bien entendu, ces méthodes de calcul peuvent également être appliquées aux autres procédés selon l'invention nécessitant une comparaison de profils.
Après assemblage des différents profils lumineux identifiés sur le support, il est possible d'obtenir une signature spécifique (qui correspond à la succession de profils obtenue grâce à l'assemblage) pour chaque molécule d'ADN différente présente dans le mélange initial. Ces profils spécifiques peuvent alors être utilisés pour identifier les molécules d'ADN présentes dans le mélange, selon les procédures développées ci-dessus.
Compte tenu des résolutions obtenues grâce aux techniques de microscopie de superrésolution, il est également décrit un procédé d'obtention de la séquence nucléotidique d'une molécule d'ADN, comprenant:
a) le marquage d'une molécule d'ADN par incorporation d'au moins un nucléotide modifié au cours d'une ou plusieurs réactions indépendantes de polymérisation d'ADN, le(s) nucléotide(s) modifié(s) étant détectable(s), ou étant susceptible(s) d'être modifié(s) de manière à être détectable(s);
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide;
c) la détection du marquage au moyen d'un dispositif optique et d'un moyen de traitement adapté pour obtenir une information de résolution inférieure ou égale à 0,5 nm.
Cette résolution peut notamment être atteinte par l'utilisation des technologies TIRF couplées à un système STORJVI ou PALM décrits ci-dessus, et analysé par pointage des PSF comme également décrit ci-dessus. La résolution d'un microscope optique est communément considérée comme étant λ/2, soit environ 250 nm. Cependant le centre de l'image d'un point (par exemple un fluorophore unique) peut être localisé avec une précision largement supérieure. En effet, si l'observation est réalisée par un microscope équipé d'une caméra CCD dont les pixels mesure a nm de côté, et dont la valeur efficace du bruit de chaque pixel est b (en nombre de photons comptés), alors l'incertitude σ sur la position de l'émetteur de photons (Thompson, R.E., Larson, D.R., Webb, W.W. Précise nanometer localization analysis for individual fluorescent probes. Biophys. J. (2002) 82 :2775-2783) est donnée par s2 + a2 l\2 8TTS4 b2
σ = 1 ~
N a2 N
avec s (en nm) la déviation standard de la PSF et N le nombre total de photons collectés. On constate que cette incertitude est en théorie limitée uniquement par le nombre N de photon (les autres paramètres étant des constantes), et permet donc d'atteindre une précision inférieure au nanomètre. Avec des méthodes de correction du mouvement de la dérive du microscope bien connues de l'homme de l'art, et après calibrage de la réponse quantique de chaque pixel, de telle résolution ont été atteintes en pratique (Pertsinidis, A., Zhang, Y., Chu, S. (2010) Subnanometre single-molecule localization, registration and distance measurements, Nature 466:647-51). Selon le procédé d'obtention de la séquence nucléotidique d'une molécule d'ADN selon l'invention, l'ADN étudié peut être un ADN génomique ou un ADN complémentaire.
Légendes des figures
Figure 1: exemple d'image obtenue après marquage d'un ADN avec un extrait de cytoplasme d'œuf de xénope, peignage et acquisition de la fluorescence
Figure 2: signal lumineux converti en unités de fluorescence arbitraires par un logiciel d'analyse d'image (ImageJ; courbe rose (courbe du haut)) tandis qu'un échantillon représentatif du bruit de fond environnant est représenté par la courbe bleue (courbe du bas).
Figure 3. Exemple de la comparaison du profil de deux molécules de phage lambda. La molécule 1 en abscisse possède 208 blocs, et la molécule 2 en ordonnée possède 147 blocs.
Un point bleu est dessiné aux coordonnées lorsqu'un bloc i de la molécule 1 possède un bloc j de la molécule 2 parmi ses k meilleurs voisins (kNN .
Figure 4. Histogramme du nombre de paires reconnues comme étant similaires par le procédé (ordonnées) en fonction du seuil de coefficient de corrélation minimal requis pour considérer deux paires comme étant similaires (abscisses).
Figure 5. Distribution des coefficients de corrélation obtenus en comparant les profils de deux molécules de phage lambda (courbe trait plein) et les profils d'une molécule de phage lambda et d'une molécule d'ADN de souris (courbe trait pointillé). Exemples
Exemple 1. Marquage par des extraits de système réplicatif d'œufs de Xenopus laevis
1°) Marquage de l 'ADN
La technique de marquage est décrite en détail dans Marheineke et al, 2009 et est basée sur un protocole initialement décrit dans Blow et al., 1986. Brièvement, le protocole requiert l'extraction de cytosol d'œufs de xénopes. Pour cela des œufs sont récoltés sur des femelles de xénopes et rincés dans de l'eau déionisée pendant 5 minutes. Les œufs sont ensuite dissociés par une solution appropriée (solution « dégelante ») et activés par une solution appropriée (solution de Barth) additionnée de 0,25 μg/ml de calcium ionophore A23187. Après rinçage, les œufs sont centrifugés à 2°C à une vitesse de 350 x g pendant 1 minute pour permettre l'élimination de toute trace de solution liquide puis à 20000 x g pendant 15 minutes pour les casser. Parmi les trois phases liquides qui résultent, la phase centrale correspond à l'extrait de cytoplasme, qui est récolté à l'aide d'une seringue, puis transféré dans un tube placé sur la glace jusqu'à utilisation. Pour le marquage, on réalise un mélange de 1/20 d'extrait de cytosol, 1/20 de solution de créatine phosphate, 1/50 de solution de cycloheximide, 1/50 de solution de dUTP-rhodamine. Après complétion de la réaction, celle- ci est arrêtée par l'addition de solution de PBS glacé. L'ADN est centrifugé à 1000 x g pendant 7 minutes et resuspendu dans 50 μΐ de PBS.
2°) Préparation des lamelles de verre pour le peignage moléculaire
La préparation des lames pour le peignage est décrite en détail dans Marheineke et al. Premièrement les lamelles sont soigneusement nettoyées par traitement dans un four à plasma afin de les débarrasser de toute trace de matière organique. Les lamelles sont ensuite soniquées dans de l'heptane pur pendant 10 minutes puis une couche de silane est déposée par incubation pendant 16 heures dans une solution de 100 ml d'heptane additionnée de 100 μΐ de octenyltrichlorosilane. Les lamelles sont ensuite soniquées 5 minutes chaque fois dans une succession de liquide : heptane, eau, 50% méthanol/eau, eau, chloroforme, eau, 50% méthanol/eau, eau puis 2 minutes dans du chloroforme. Les lamelles sont finalement séchées à l'air.
3°) Peignage moléculaire
L'ADN marqué à l'étape 1 dans un volume de 50 μΐ est incubé pendant 30 minutes à 65°C, refroidi, puis incubé 30 minutes à température ambiante. L'ADN est dilué dans 1,2 ml de solution MES à pH 5,7-6,2. Le mélange est introduit dans le réservoir de l'appareil à peignage. Une lamelle préparée à l'étape 2°) est fixée à l'emplacement prévu dans l'appareil à peignage et immergée dans la solution d'ADN pendant 5 minutes. La lamelle est retirée à vitesse constante de 300 μιη / s, ce qui provoque le peignage de l'ADN sur les deux faces de la lamelle. Celle-ci est ensuite séchée à l'air et fixée sur une lame de verre. Le peignage de l'ADN est visualisé au microscope optique équipé d'un objectif 100X, une immersion à l'huile et un filtre FITC.
4°) Acquisition des images
Les lamelles sont placées sous l'objectif 100X d'un microscope optique équipé d'une caméra CCD (type CoolSnap HQ, Photometrics) possédant une grille de 512 x 512 photocapteurs de 6,5 μπι2. Une lumière excitatrice de 510 nm est appliquée par une lumière laser, et un filtre adapté est utilisé pour collecter les signaux. Des images 16-bit TIFF sont capturées et transmises pour analyse aux systèmes informatiques (figure 1).
5°) Analyse d'image
Un exemple d'image obtenue par cette méthode est donné en figure 1, et un exemple de résultat d'analyse de l'image est donné en figure 2. La trace lumineuse convertie en unités de fluorescence représente la signature numérique de cette molécule d'ADN.
On observe une trace rectiligne verticale correspondant à une molécule individuelle d'un fragment d'ADN d'environ 30000 bases, marqué par des molécules de rhodamine fluorescentes fixées de manière covalentes sur des bases dUTP, un analogie de la thymidine (figure 1). Les points lumineux épars correspondent à du bruit de fond.
Sur la figure 2, le signal lumineux a été converti en unités arbitraires de fluorescence par un logiciel d'analyse d'image (ImageJ; courbe rose - courbe du haut) tandis qu'un échantillon représentatif du bruit de fond environnant est représenté par la courbe bleue (courbe du bas). Exemple 2. marquage par hybridation d'oligonucléotides fluorescents
Une signature spécifique de molécule d'ADN peut être obtenue par hybridation sur ces molécules de courtes séquences d'ADN (oligomères) marquées lors de leur synthèse et donc de manière covalente par une molécule fluorescente. Le procédé comprend quatre étapes principales :
1) le peignage de l'ADN de haut poids moléculaire (par exemple : ADN génomique) sur des lames de verre comme décrit ci-dessus (cet ADN n'est pas marqué par des molécules fluorescentes.
2) l'hybridation de cet ADN par des oligomères simple brin de 10 à 15 bases, associant des séquences connues et aléatoires comme décrit ci-dessus, et connues pour être répartie à peu près uniformément dans le génome d'intérêt. Ces oligomères comportent à l'une de leurs extrémités une ou plusieurs molécules fluorescentes. L'hybridation résulte en l'attachement, par complémentarité de bases, des oligomères sur les molécules d'ADN peignées, à des positions dépendantes de la séquence de celles-ci.
3) Des images des molécules d'ADN peignées sont réalisées en hyper résolution (Système TIRF et STORM).
4) une analyse informatique des images convertit la séquence des signaux lumineux générés par les oligomères, et la distance qui les sépare, en signature spécifique de chaque molécule d'ADN peigné. L'utilisation de différents types de fluorophores, chacun associé à une séquence d'oligonucléotide spécifique, peut permettre d'obtenir un signal d'une complexité accrue, qui à son tour augmente la spécificité des signatures.
Exemple 3: Marquage de l'ADN par des nucléotides amino-allyle L'incorporation de nucléotides modifiés dans des molécules d'ADN double brin (par exemple un plasmide circulaire, chromosome bactérien circulaire, ADN génomique ou plasmidique linéarisé ou autre) se fait par synthèse in vitro à l'aide d'une polymérase ADN-dépendante Phi29 (par exemple Fermentas #E0402, 10 U/μΙ). Brièvement, une solution de 25 ng/μΐ d'ADN est préparée dans 10 μΐ d'eau pure additionnée de 0,5 μΐ de rouge de crésol. L'ADN est dénaturé par l'addition de 1 μΐ de tampon KOH à 0.2 M et une incubation de 3 minutes à température ambiante. Le mélange est neutralisé par l'addition de 1 μΐ de tampon Tris-Cl. La réaction de polymérisation est réalisée par la préparation du mélange suivant : 1 μΐ^ d'oligomères aléatoires de 6 bases, 3 μΐ d'ADN dénaturé préparé précédemment, 6 μΐ d'eau pure, 1 μΐ de pyrophosphatase (10 U/μΙ), 2 μΐ d'amino-allyle dCTP à 10 mM, 1 μΐ de chacun des nucléotides dATP, dTTP, dGTP à 25 mM, 2 μΐ de dCTP à 2,5 mM, 5 μΐ de tampon de réaction fourni avec l'enzyme commerciale, 1 μΐ d'enzyme Phi29, 26 μΐ d'eau pure. Le mélange est incubé 16 heures à 37°C puis l'ADN est dénaturé pendant 20 minutes à 70 °C. l'ADN est purifié sur une colonne de filtration (par exemple Macherey-nagel Nucleospin Extractll).
Le couplage entre les nucléotides modifiés porteurs de groupements amino-allyles (par exemple dUMP-aa ou dCMP-aa) est réalisé par une réaction chimique connue de l'homme de l'art. Brièvement une solution de 10 μΐ de tampon carbonate à 0, 1 M et à pH 9,3 contenant 200 mg de groupement fluorescent (par exemple Cy3-NHS ou Cy5-NHS) dissous est additionnée de 1 μg d'ADN comportant le nucléotide modifié et de 80 μΐ d'eau pure. Le mélange est incubé sur la nuit à 25°C avec une agitation douce et constante. Les fluorophores non couplés sont ensuite éliminés par précipitation, par exemple grâce à un tampon acétate ou par un kit de purification commercial (par exemple Promega ref #A7280 ou Macherey-nagel Nucleospin Extractll). L'ADN purifié est remis en solution dans l'eau pure (par exemple 50 μΐ). L'efficacité du marquage est réalisée par mesure spectrophotométrique connue de l'homme de l'art, en calculant le rapport d'absorption entre l'ADN (260 nm) et le fluorophore (à la longueur d'onde spécifique du fluorophore).
Si nécessaire, un couplage plus efficace peut-être réalisé sur de l'ADN simple brin contenant les nucléotides modifiés. Après l'étape de polymérisation en présence de nucléotides modifiés portant un groupement amino-allyle, l'ADN est dénaturé par des méthodes connues de l'homme de l'art, par exemple par addition d'urée concentrée. Après purification l'ADN est traité comme décrit ci-dessus par obtenir un marquage fluorescent.
Exemple 4: Marquage de l'ADN par des nucléotides ethynyl-dUTP et "click chemistry"
On peut également incorporer dans de l'ADN double brin des nucléotides 5 -Ethynyl-dUTP (5-EdUTP) par le même protocole que décrit dans l'exemple 3. Le couplage entre les 5- EdUTP et le groupe fluorescent suit un protocole différent comme suit. Une solution de 5 μΐ d'ADN (2 mM) dans l'eau pure est additionnée de 2 μΐ d'une solution d'azide (50 mM), 3 μΐ d'une solution de 0, 1 M CuBr, 0, 1 M de tampon tris-(benzyltriazolylmethyl)amine. Le mélange est incubé à 25°C pendant 3 heures. L'ADN est purifié par précipitation à l'acétate par un protocole bien connu de l'homme de l'art.
Si nécessaire, un couplage plus efficace peut-être réalisé sur de l'ADN simple brin contenant les nucléotides modifiés. Après l'étape de polymérisation en présence de nucléotides modifiés portant un groupement ethynyl, l'ADN est dénaturé par des méthodes connues de l'homme de l'art, par exemple par addition d'urée concentrée. Après purification l'ADN est traité comme décrit dans le paragraphe précédent pour procéder au marquage fluorescent. Exemple 5: incorporation de nucléotides fluorescents avec le mutant E10 de la polymérase pfu
L'incorporation directe de nucléotides couplés à un fluorophore dans de l'ADN double brin est possible grâce à l'utilisation de polymérases à ADN particulièrement tolérantes aux nucléotides modifiés. Par exemple la forme mutée de la polymérase de la famille des polB extraite de la bactérie Pyrococcus furiousus (Pfu), appelée E10, est susceptible de substituer jusqu'à 100% de cytosines par des cytosines couplées au fluorophore Cy3, comme décrit dans Ramsay et col. (J. AM. CHEM. SOC. 2010, 132, 5096-5104).
Exemple 6: Peignage moléculaire
Préparation du support
Une lamelle de microscope en verre de 22 x 22 mm de surface et de 0, 17 mm d'épaisseur est lavée deux fois successivement dans de l'acétone, de l'isopropanol et de l'eau pure, séchée et placée immédiatement dans un four à plasma (par exemple Diener electronics Femto) pour un traitement de 2 minutes à 80% d'intensité. La lame est ensuite immédiatement trempée dans un bain composé de 100 ml d'heptane et 150 μΐ de Trimethoxy(7-octen-l-yl)silane à 80% pendant quelques secondes puis séchée pendant 12 heures à température ambiante. La lame est finalement soniquée successivement dans un bain d'heptane, d'eau pure et enfin de chloroforme, pendant 5 minutes chaque fois.
Peignage
Le peignage moléculaire est réalisé dans un appareil ad hoc, permettant de déplacer à vitesse constante une lamelle de verre hors d'un réservoir. Une solution d'ADN à peigner est préparée comme suit : 150 ng d'ADN en suspension dans de l'eau, 150 μΐ de tampon MES (par exemple euromedex ref#EU0033), complétion à 1,5 ml par de l'eau pure. La solution est placée dans le réservoir de l'appareil. Une lamelle de verre de 22x 22 mm et de 0, 17 mm d'épaisseur préparée comme décrit en 2.1 est placée sur le support adapté et incubée 5 minutes dans la solution d'ADN. La lamelle est ensuite déplacée à vitesse constante de 300 μιη/s hors du réservoir.
Exemple 7: Acquisition d'image par microscopie optique 7.1. Microscopie optique haute résolution
Une lame de microscope sur laquelle sont immobilisées les molécules d'ADN est montée sur un microscope optique (par exemple Nikon Eclipse Ti) équipé d'une caméra haute résolution (par exemple Coolsnap HQ2 de Roper Scientific Photometrics ou Ixon 897 de ANDOR Technology). Du liquide de montage anti-blanchiment est utilisé (Spector lab). Les images sont acquises à travers un objectif de 60X (par exemple Plan Apo Vc; 60x/l,40 OIL;∞/0, 17 WD 0, 13 de Nikon) ou de 100X (par exemple Plan APO Vc; 100x/1,40 OIL;∞/0, 17 WD DIC N2 de Nikon) par immersion sous huile (par exemple type F; Ne=l,518 ue=41 23 °C de Olympus). Des filtres d'excitation, dichroïques et d'émission appropriés sont utilisés en fonction du fluorophore utilisé pour marquer l'ADN. Par exemple on utilisera pour le Cy3 un filtre d'excitation FF01-531/40-25, un filtre dichroïque FF562-Di02-25x36 et un filtre d'émission FF593/40-25 de SEMROCK Brightline. Pour le Cy5 on utilisera un filtre d'excitation FF01-628/40-25, un filtre dichroïque FF660-DÏ01-25x36 et un filtre d'émission FF01 -692/40-25 de SEMROCK Brightline.
7.2. Mise en œuyre du système TIRF
Une méthode alternative à 7.1 consiste à utiliser la technique Total Internai Reflection Microscopy (TIRF). Les modifications sont les suivantes : un objectif possédant une grande ouverture numérique Nikon APO TIRF; 100x/l,49 OIL;∞/0, 13 - 0,20 DIC N2) et l'huile de montage préférée est par exemple Nikon Immersion oil type F; Nd=l,515 - vd (dispersion)=43 à 23°C - viscosité = 800cSt. L'excitation est produite par un laser de longueur d'onde adaptée au fluorophore choisi, par exemple pour le Cy5 l'excitation est produite à 633 nm (Vortran Laser technology (class IIIB)) ou pour du Cy3 à 532 nm (Melles Griot 43 Séries ion laser). Le faisceau laser excite le milieu avec un angle d'incidence supérieur à l'angle critique grâce au miroir « TIRF » présent dans le microscope.
Exemple 8: obtention d'un profil d'intensité lumineuse sur des molécules individuelles d'ADN
Obtention d'un profil par détection de crêtes
La détermination du profil lumineux de chaque molécule présente sur une image est réalisée automatiquement par un algorithme implémenté dans un programme informatique. L'algorithme se déroule en deux étapes. Une ligne de crête est une surface de courbure élevée (courbure maximale dans au moins une direction) produite par l'image de la molécule d'ADN, définie par des valeurs absolues élevée des plus petites valeurs propres de la matrice symétrique des dérivées partielles de second ordre (matrice Hessienne) de chaque pixel. Selon un mode particulier de réalisation, un flou Gaussien (sigma = 1 pixel) peut être appliqué afin de réduire l'influence du bruit. La deuxième étape comprend la détermination d'une courbe spline par interpolation des points de courbure maximale détectés sur la crête, établis lors de la première étape. La courbe est échantillonnée à des points équidistants (par exemple à chaque pixel, ou à chaque demi-pixel) afin d'approximer la valeur de la surface à ces points. L'approximation peut se faire par la prise en compte directe de la valeur du pixel, par l'approximation de Taylor de la surface au point choisi, ou par une déconvolution de Richardson-Lucy basée sur une « point spread function ». La liste successive de ces valeurs constitue le profil fluorescent de la molécule d'ADN.
Exemple 9: tri de molécules sur la base de leurs profils lumineux
L'objectif de cette application est de trier un groupe de molécules composé de n types de molécules différentes en n sous-groupes distincts, chaque type de molécule pouvant être représenté un grand nombre de fois. L'exemple (réel) ci-dessous consiste à montrer qu'il est possible de distinguer des molécules de phage lambda d'une part, et des molécules issues du génome d'E. coli d'autre part.
9.1. Découpage des profils en blocs
Les profils de chaque molécule sont découpés en blocs de taille t se chevauchants de p pixels, avec p < t. Une distance Euclidienne est calculée entre toutes les paires possibles de blocs. On recherche alors les situations où une succession de blocs appartenant à une molécule donnée montrent une petite distance d'une succession de blocs d'une autre molécule. Cette situation est caractéristique de deux molécules partageant une région de même séquence d'ADN.
9.2. Calcul de la distance euclidienne entre chaque bloc
La distance euclidienne entre deux blocs bl et b2 de taille N est donnée par l'équation suivante :
Figure imgf000031_0001
On définit pour chaque bloc de chaque molécule, ses k meilleurs voisins (par exemple avec k= 50, 100, 150, etc) parmi tous les blocs de toutes les autres molécules. Les k meilleurs voisins (k Nearest Neighbors, kNN) d'un bloc donné sont ceux qui lui sont le plus similaires car ils en sont éloignés par une petite distance euclidienne.
D'autres stratégies sont également possibles pour calculer la distance entre deux profils ou sous-segments de profil de molécules :
- Corrélations croisées normalisées
- Corrélations croisées normalisées avec chevauchement partiel
- Distance euclidienne sur des transformées de Fourier à terme
- Distance de Hellinger
- Minimum Variance Matching (MVM) selon Keogh
- Distance euclidienne sur des coefficients d'ondelettes seuillés
- Ecart de Weyl
9.3. Représentation matricielle des blocs similaires
Pour toutes les paires possibles de molécules {m1} m2), on sélectionne parmi les kNN de chaque bloc de m} les blocs appartenant à m2, et on les représente sur un graphe à deux dimensions, dont les axes sont les positions des blocs respectifs de m} et m2 (Figure 3).
9.4. Calcul d'un coefficient de corrélation entre deux molécules
Afin de quantifier la comparaison des molécules mi et m2, on calcule le coefficient de corrélation de Pearson des positions des blocs représentés dans la matrice (m1}m2). Le coefficient de corrélation de Pearson permet de classer toutes les paires possibles de molécules (m1}m2) de la plus similaire à la moins similaire. Si nécessaire, le calcul du coefficient de Pearson peut être remplacé par le calcul du coefficient de Kendall.
9.5. Exemple de résultat sur 52 molécules de lambda et 52 molécules de E. coli
Dans cet exemple, 52 molécules de phage lambda (30 à 40 kb) et 52 molécules du génome d'E. coli (30 à 40 kb) ont été identifiées par le procédé décrit ci-dessus (étapes 9.1 à 9.4). Les molécules ont été marquées en substituant 17% des thymidines natives par une uracile couplée à une molécule fluorescente sur l'un ou l'autre brin d'ADN (marquage amino-allyle + Cy3-NHS). Le génome du phage lambda mesure environ 48 kb tandis que le génome d'E. coli mesure environ 4.6 Mb, soit cent fois plus. Ainsi l'hypothèse de départ postule qu'il est probable que beaucoup de molécules de lambda partagent des segments de séquences entre elles, tandis qu'en raison de sa très grande taille relative au phage lambda, il est très peu probable que deux molécules d'E. coli partagent un segment de séquence. La comparaison des profils par la méthode décrite ci-dessus doit donc permettre de distinguer les molécules de lambda, qui auront un profil similaire entre elles, des molécules d'E. coli qui auront un profil différent de tous les autres. La figure 4 illustre une comparaison de deux profils de molécules de lambda différentes par la méthode décrite ci-dessus. Dans cette comparaison le coefficient de corrélation de Pearson est égal à 0.99. Les résultats montrent que le procédé est clairement en mesure de trier les paires de molécules lambda en net excès par rapport aux paires de molécules E. coli ou par rapport aux paires de molécules E. coli - lambda (Figure 4). On constate en effet que plus le seuil de coefficient de corrélation augmente - c'est à dire plus la spécificité augmente - mieux le procédé peut distinguer les paires de molécules lambda, au point d'éliminer totalement les paires artéfactuelles lambda - E. coli.
Exemple 10: identification de signatures spécifiques de molécules
Nous montrons ci-dessous que deux profils de molécules d'ADN lambda marquées à 20% génèrent chacun une signature spécifique car leur coefficient de corrélation maximal est obtenu uniquement lorsque les deux séquences sont parfaitement alignées. De plus ce coefficient maximal est largement supérieur à ceux produits en alignant un profil d'une molécule de lambda à celui d'une molécule d'E. coli, dans toutes les combinaisons possibles. 10.1. Obtention d'images de profils d'intensités de séquences d'ADN.
Une image de molécule d'ADN est générée comme suit. Une Point Spread Function (PSF), soit une fonction mathématique décrivant la distribution des photons émis par une molécule fluorescente unique, est déterminée en approximant par une fonction Gaussienne les points obtenus empiriquement sur des fluorophores individuels par le système microscopique décrit dans l'exemple 5.1. Cette PSF est attribuée à un pourcentage donné (pourcentage de bases marquées) des bases adénine et thymidine choisies de manière aléatoire sur une molécule d'ADN d'intérêt. Chaque base de la molécule d'ADN est assignée à un pixel de taille 0.5 nm (soit la taille d'une base lorsqu'une molécule d'ADN est étirée) sur une ligne de pixel dans l'image. Un nombre aléatoire de ces pixels correspondant à la base marquée (par exemple adénine) est sélectionné, en fonction du pourcentage de marquage souhaité, et la valeur maximale d'un pixel est fixée à la valeur constante de 100 photons. Une convolution en deux dimensions est ensuite réalisée par intégration de la PSF, puis un bruit de Poisson aléatoire est rajouté (fonction de l'intensité des pixels) ainsi qu'une léger bruit Gaussien (de moyenne 0 et de déviation standard 10).
10.2. Calcul du profil d'intensité
Le profil de chaque molécule est déterminé par la méthode de détection de crêtes telle que décrite dans l'exemple 8.1 ci-dessus.
10.3. Calcul de la similarité entre différents profils d'intensité par coefficient de corrélation Comparaison de deux molécules de lambda par glissement
Le profil de chaque molécule de lambda (complète et fragment) dérivé des images représentées en Figure 6 est comparé en glissant les deux profils l'un par rapport à l'autre, pixel par pixel, et en calculant un coefficient de corrélation de Pearson à chaque position. Cette expérience montre que le coefficient maximal de 0.669 se démarque remarquablement bien des autres valeurs obtenues et est obtenu précisément à la position correspondant à l'alignement des deux séquences (Figure 5, courbe trait plein). L'allure globale de la courbe témoigne également du caractère spécifique de la signature, par l'augmentation progressive et symétrique des coefficients de corrélation de part et d'autre de la position correspondant à l'alignement exact.
Comparaison d'une molécule de lambda et d'une molécule d'ADN de souris
Le contrôle négatif suivant renforce la notion de signature spécifique. Une molécule issue du génome de souris mesurant 212 kb a également servi de base pour produire une image comme décrit en 10.1 (marquage aléatoire à 80%), puis un profil comme décrit en 8.1. Ce profil a été comparé à celui du phage lambda, par glissement progressif et calcul d'un coefficient de corrélation à chaque position (Figure 5, courbe pointillée). On constate sans équivoques que les coefficients issus de cette comparaison de deux molécules différentes montrent un maximum à 0.27, soit très largement inférieur au coefficient maximal obtenu lors de la comparaison de deux molécules identiques comme décrit ci-dessus.
Références Bertero et P. Boccacci, 1998, "Introduction to Inverse Problems in Imaging" (IOP Publishing, Bristol)
Betzig et al, "Imaging Intracellular Fluorescent Proteins at Nanometer Resolution" , Science, 2006, 1642-1645
Blow et al, "Initiation ofDNA replication in nuclei and purified DNA by a cell-free extract of Xenopus eggs", Cell, 1986, 47, 577 - 587
Donoho et al, "Nonlinear Solution of Linear Inverse Problem by Wavelet-Vaguelette Décomposition" , Appl. Comput. Harmon. Anal., 2 (1995), 101-126
Marheineke, et al, "Use of DNA combing to study DNA replication in Xenopus and human cell-free Systems", Methods in Molecular Biology, DNA replication: Methods and Protocols, 2009, 521, 575-60
Mortensen et al, "Optimized localization analysis for single-molecule tracking and super- resolution microscopy" , Nature Methods 7, 2010, 377 - 381
Neely et al, "DNA fluor ocode: a single molécule, optical map of DNA with nanometre resolution", Chem. Sci., 2010, 1, 453-460
Pertsinis et al. "Subnanometre single-molecule localization, registration and distance measurement" s, Nature 2010, 466:647-51
Ramsay et al. CyDNA: Synthesis and Replication of Highly Cy-Dye Substituted DNA by an Evolved Polymerase" J. Am. Chem. Soc. 2010, 132, 5096-5104)
Rust et al., "Sub-diffraction-limit imaging by stochastic optical reconstruction microscopy (STORM)", Nat Methods, 2006, 793-795
Thompson, R.E., Larson, D.R., Webb, W.W. Précise nanometer localization analysis for individual fluorescent probes. Biophys. J. (2002) 82 :2775-2783
Zink et al., "Structure and dynamics of human interphase chromosome territories in vivo"; Hum Genêt; 1998 Feb; 102(2):241-51

Claims

REVENDICATIONS
1. Procédé d'obtention d'une signature spécifique d'une molécule d'ADN, comprenant:
a) le marquage d'une molécule d'ADN par incorporation d'au moins un nucléotide modifié au cours d'une réaction de polymérisation d'ADN, le nucléotide modifié étant détectable, ou étant susceptible d'être modifié de manière à être détectable;
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide ;
c) la détection du marquage le long de l'ADN au moyen d'un dispositif optique adapté, moyennant quoi une signature spécifique de ladite séquence ADN est obtenue.
2. Procédé selon la revendication 1, dans lequel la molécule d'ADN a une taille supérieure à 50 kb, de préférence supérieure à 60 kb, de manière plus préférée supérieure à 100 kb, de manière encore plus préférée supérieure à 200 kb.
3. Procédé selon la revendication 1 ou 2, l'étape a) de marquage comprenant l'incorporation d'au moins un nucléotide modifié au cours d'une réaction de polymérisation d'ADN in vitro avec la polymérase Phi29.
4. Procédé selon l'une quelconque des revendications 1 à 3, la détection à l'étape c) mettant en oeuvre un système TIRF.
5. Procédé selon l'une quelconque des revendications 1 à 4, la détection à l'étape c) mettant en oeuvre un système STORJVI.
6. Procédé selon l'une quelconque des revendications 1 à 5, dans laquelle l'étape d'immobilisation et d'étirement b) précède l'étape de marquage a).
7. Procédé pour l'identification d'une molécule d'ADN comprenant:
i) l'obtention de la signature de ladite molécule d'ADN selon le procédé de l'une quelconque des revendications 1 à 6; et
ii) la comparaison de la signature obtenue à l'étape i) à des signatures prédéterminées de molécules d'ADN de référence;
la comparaison permettant d'identifier la molécule d'ADN.
8. Procédé pour l'identification d'une anomalie génomique chez un sujet comprenant:
i) l'obtention de la signature moléculaire d'une molécule d'ADN génomique d'un tissu ou d'une cellule d'un sujet, selon le procédé de l'une quelconque des revendications 1 à
6;
ii) la comparaison de la signature obtenue à l'étape i) aux signatures prédéterminées de molécules d'ADN de référence provenant
-d'un sujet sain et/ou
- d'un sujets malades, leur maladie résultant d'une altération du génome d'une ou plusieurs de leurs cellules;
afin d'identifier ladite molécule d'ADN génomique ;
une anomalie génomique étant détectée
- si la signature de l'ADN génomique du sujet diffère des signatures des molécules d'ADN de référence dans le cas de molécules d'ADN de référence provenant de sujet sain, ou
- si la signature de l'ADN génomique testé correspond à au moins l'une des signatures de référence provenant d'un sujet malade.
9. Procédé selon la revendication 8, comprenant en outre
- l'obtention à l'étape i) de la signature de plusieurs fragments d'ADN génomique et leur concaténation sur la base de chevauchement de signatures;
- le(s) concaténât étant ensuite comparé(s) aux séquences de références pour identifier le(s)dit(s) concaténât;
une anomalie génomique étant détectée si un concaténât diffère de la molécule d'ADN de référence ayant permis de l'identifier.
10. Procédé selon la revendication 8, pour l'identification d'une molécule d'ADN complémentaire, la signature dudit ADN complémentaire étant comparée aux signatures d'un ensemble de molécule d'ADN complémentaire de référence.
11. Procédé d'obtention de la séquence nucléotidique d'une molécule d'ADN comprenant: a) le marquage d'une molécule d'ADN par incorporation d'au moins un nucléotide modifié au cours d'une ou plusieurs réactions indépendantes de polymérisation d'ADN, le(s) nucléotide(s) modifié(s) étant détectable(s), ou étant susceptible(s) d'être modifié(s) de manière à être détectable(s);
b) l'immobilisation et l'étirement de l'ADN marqué sur une surface solide; c) la détection du marquage au moyen d'un dispositif optique et d'un moyen de traitement adapté pour obtenir une information de résolution inférieure ou égale à 0,5 nm.
12. Procédé selon la revendication 11, dans lequel la molécule d'ADN est un ADN génomique ou un ADN complémentaire.
13. Procédé selon l'une quelconque des revendications 1 à 12, dans lequel l'étape
d'immobilisation et d'étirement est réalisé en utilisant la technique de peignage moléculaire.
14. Procédé de tri de molécules d'ADN différentes comprises dans un mélange, le procédé comprenant:
a) le marquage des molécules d'ADN par incorporation au cours d'une réaction de polymérisation d'au moins un nucléotide modifié détectable ou susceptible d'être modifié de manière à être détectable;
b) l'immobilisation et l'étirement des molécules d'ADN marquées sur une surface solide; c) la détection du marquage le long des molécules d'ADN au moyen d'un dispositif optique adapté;
moyennant quoi un ensemble de profils lumineux correspondant aux différentes molécules d'ADN est obtenu, les différentes molécules d'ADN étant discriminées selon leur profil lumineux.
PCT/EP2011/069374 2010-11-03 2011-11-03 Procede d'analyse genomique Ceased WO2012059563A1 (fr)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
FR1059062 2010-11-03
FR1059062A FR2966844A1 (fr) 2010-11-03 2010-11-03 Procede d'analyse genomique
US201161450667P 2011-03-09 2011-03-09
US61/450,667 2011-03-09

Publications (1)

Publication Number Publication Date
WO2012059563A1 true WO2012059563A1 (fr) 2012-05-10

Family

ID=43900966

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2011/069374 Ceased WO2012059563A1 (fr) 2010-11-03 2011-11-03 Procede d'analyse genomique

Country Status (2)

Country Link
FR (1) FR2966844A1 (fr)
WO (1) WO2012059563A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018148903A1 (fr) * 2017-02-16 2018-08-23 上海亿康医学检验所有限公司 Procédé de diagnostic auxiliaire pour des tumeurs du système urinaire

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995021939A1 (fr) 1994-02-11 1995-08-17 Institut Pasteur Procede d'alignement de macromolecules par passage d'un menisque et applications
US20020061523A1 (en) * 1998-10-20 2002-05-23 Schwartz David C. Method for analyzing nucleic acid reactions
US20090111115A1 (en) * 2007-10-15 2009-04-30 Complete Genomics, Inc. Sequence analysis using decorated nucleic acids
US20090155780A1 (en) * 2007-12-14 2009-06-18 Board Of Trustees Of The University Of Illinois Methods for determining genetic haplotypes and DNA mapping
WO2010059731A2 (fr) * 2008-11-18 2010-05-27 Bionanomatrix, Inc. Cartographie et séquences de polynucléotide

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995021939A1 (fr) 1994-02-11 1995-08-17 Institut Pasteur Procede d'alignement de macromolecules par passage d'un menisque et applications
US20020061523A1 (en) * 1998-10-20 2002-05-23 Schwartz David C. Method for analyzing nucleic acid reactions
US20090111115A1 (en) * 2007-10-15 2009-04-30 Complete Genomics, Inc. Sequence analysis using decorated nucleic acids
US20090155780A1 (en) * 2007-12-14 2009-06-18 Board Of Trustees Of The University Of Illinois Methods for determining genetic haplotypes and DNA mapping
WO2010059731A2 (fr) * 2008-11-18 2010-05-27 Bionanomatrix, Inc. Cartographie et séquences de polynucléotide

Non-Patent Citations (20)

* Cited by examiner, † Cited by third party
Title
ANONYMOUS: "Super resolution microscope N-STORM", July 2010 (2010-07-01), XP002635460, Retrieved from the Internet <URL:http://www.nikoninstruments.com/Products/Microscope-Systems/Super-Resolution/N-STORM-Super-Resolution/%28brochure%29> [retrieved on 20110505] *
BERTERO, P. BOCCACCI: "Introduction to Inverse Problems in Imaging", 1998, IOP PUBLISHING, BRISTOL
BETZIG ET AL.: "Imaging Intracellular Fluorescent Proteins at Nanometer Resolution", SCIENCE, 2006, pages 1642 - 1645, XP002540128, DOI: doi:10.1126/SCIENCE.1127344
BLOW ET AL.: "Initiation of DNA replication in nuclei and purified DNA by a cell-free extract of Xenopus eggs", CELL, vol. 47, 1986, pages 577 - 587, XP024244150, DOI: doi:10.1016/0092-8674(86)90622-7
DONOHO ET AL.: "Nonlinear Solution of Linear Inverse Problem by Wavelet-Vaguelette Decomposition", APPL. COMPUT. HARMON. ANAL., vol. 2, 1995, pages 101 - 126
MARHEINEKE ET AL.: "Use of DNA combing to study DNA replication in Xenopus and human cell-free systems", METHODS IN MOLECULAR BIOLOGY, DNA REPLICATION: METHODS AND PROTOCOLS, vol. 521, 2009, pages 575 - 60
MARHEINEKE KATHRIN ET AL: "Use of DNA combing to study DNA replication in Xenopus and human cell-free systems", METHODS IN MOLECULAR BIOLOGY, HUMANA PRESS INC, NJ, US, vol. 521, 1 January 2009 (2009-01-01), pages 575 - 603, XP009147752, ISSN: 1064-3745 *
MORTENSEN ET AL.: "Optimized localization analysis for single-molecule tracking and super- resolution microscopy", NATURE METHODS, vol. 7, 2010, pages 377 - 381, XP055274989, DOI: doi:10.1038/nmeth.1447
NEELY ET AL.: "DNA fluorocode: a single molecule, optical map of DNA with nanometre resolution", CHEM. SCI., vol. 1, 2010, pages 453 - 460, XP002635461, DOI: doi:10.1039/c0sc00277a
NEELY RK ET AL: "DNA fluorocode: A single molecule, optical map of DNA with nanometre resolution", CHEMICAL SCIENCE, vol. 1, 1 October 2010 (2010-10-01), pages 453 - 460, XP002635461 *
PERTSINIDIS, A., ZHANG, Y., CHU, S.: "Subnanometre single-molecule localization, registration and distance measurements", NATURE, vol. 466, 2010, pages 647 - 51
PERTSINIS ET AL.: "ubnanometre single-molecule localization, registration and distance measurement", NATURE, vol. 466, 2010, pages 647 - 51
PULCINI F ET AL: "Fibre-fluorescence in situ hybridization directly performed from fresh biological samples: Novel perspectives for genetic diagnosis", CHROMOSOME RESEARCH, vol. 6, no. 6, September 1998 (1998-09-01), pages 501 - 503, XP002635458, ISSN: 0967-3849 *
QU XIAOHUI ET AL: "Nanometer-localized multiple single-molecule fluorescence microscopy", PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA, vol. 101, no. 31, 3 August 2004 (2004-08-03), pages 11298 - 11303, XP002635457, ISSN: 0027-8424 *
RAMSAY ET AL.: "CyDNA: Synthesis and Replication of Highly Cy-Dye Substituted DNA by an EvolvedPolymerase", J. AM. CHEM. SOC., vol. 132, 2010, pages 5096 - 5104, XP055009417, DOI: doi:10.1021/ja909180c
RAMSAY, J. AM. CHEM. SOC., vol. 132, 2010, pages 5096 - 5104
RUST ET AL.: "Sub-diffraction-limit imaging by stochastic optical reconstruction microscopy (STORM", NAT METHODS, 2006, pages 793 - 795, XP002492582, DOI: doi:10.1038/nmeth929
STEINHAUER CHRISTIAN ET AL: "DNA origami as a nanoscopic ruler for super-resolution microscopy.", ANGEWANDTE CHEMIE (INTERNATIONAL ED. IN ENGLISH) 2009 LNKD- PUBMED:19830751, vol. 48, no. 47, 2009, pages 8870 - 8873, XP002635459, ISSN: 1521-3773 *
THOMPSON, R.E., LARSON, D.R., WEBB, W.W.: "Precise nanometer localization analysis for individual fluorescent probes", BIOPHYS. J., vol. 82, 2002, pages 2775 - 2783, XP002309230
ZINK ET AL.: "Structure and dynamics of human interphase chromosome territories in vivo", HUM GENET., vol. 102, no. 2, February 1998 (1998-02-01), pages 241 - 51

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018148903A1 (fr) * 2017-02-16 2018-08-23 上海亿康医学检验所有限公司 Procédé de diagnostic auxiliaire pour des tumeurs du système urinaire

Also Published As

Publication number Publication date
FR2966844A1 (fr) 2012-05-04

Similar Documents

Publication Publication Date Title
Xiao et al. Rapid DNA mapping by fluorescent single molecule detection
CH647870A5 (fr) Procede d&#39;analyse d&#39;une sequence ou fragment determine d&#39;acide nucleique et moyens de mise en oeuvre du procede.
US20130256118A1 (en) Use of Nanopore Arrays For Multiplex Sequencing of Nucleic Acids
EP1601798A2 (fr) Biopuces a sondes et leurs methodes d&#39;utilisation
WO2017028760A1 (fr) Procédé de séquençage à molécule unique, dispositif, système, et application
US20220106629A1 (en) Method of translocating nucleic acids through nanopores
FR2849196A1 (fr) Lecteur de puces de type biopuces, et procedes associes
EP3500684A1 (fr) Séquençage par nanopores à base optique à l&#39;aide d&#39;agents d&#39;extinction
EP1179091B1 (fr) Procede d&#39;analyse de la predisposition genetique d&#39;un patient a au moins une maladie et amplification adaptee a un tel procede
WO2012059563A1 (fr) Procede d&#39;analyse genomique
FR2769323A1 (fr) Moyens pour l&#39;analyse qualitative et quantitative des populations microbiennes eventuellement presentes dans un echantillon
CN120188193A (zh) 流动池图像的颜色校正
EP1216411B1 (fr) Procede de detection d&#39;une reaction de reconnaissance moleculaire
FR2784683A1 (fr) Sondes fluorescentes de peinture chromosomique
US7829278B2 (en) Polynucleotide barcoding
EP1334211B1 (fr) Procede d&#39;analyse de la predisposition genetique d&#39;un patient au diabete insulino-dependant, dispositif et jeu d&#39;amorces
WO2014170614A1 (fr) Méthode de caractérisation des mutations chromosomiques des gènes codant les topoisomérases bactériennes
EP0843737A1 (fr) Test co-dominant de diagnostic genetique
FR2733755A1 (fr) Fragment nucleotidique de l&#39;arn ribosomique 16s de corynebacteries, sondes et amorces derivees, reactif et procede de detection
BE1026457B1 (fr) Procédé et dispositif pour la détection et différenciation de mutations ponctuelles chez des microorganismes par oligochromatographie
EP1254253B1 (fr) Oligonucleotides monocatenaires, sondes, amorces et procede de detection des spirochetes
FR2818382A1 (fr) Support pour determiner un analyte tel qu&#39;une cible adn ou arn, comportant un filtre spectral selectif
EP2321432A1 (fr) Procede de detection d&#39;anomalies chromosomiques
EP0725836B1 (fr) Sonde et procede de detection des levures de l&#39;espece candida krusei
EP2491136B1 (fr) Test de détection de xanthomonas axonopodis pv. allii

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11778888

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11778888

Country of ref document: EP

Kind code of ref document: A1