WO2024024583A1 - 次世代シーケンサー解析等のための断片化及びタグメント化方法 - Google Patents
次世代シーケンサー解析等のための断片化及びタグメント化方法 Download PDFInfo
- Publication number
- WO2024024583A1 WO2024024583A1 PCT/JP2023/026339 JP2023026339W WO2024024583A1 WO 2024024583 A1 WO2024024583 A1 WO 2024024583A1 JP 2023026339 W JP2023026339 W JP 2023026339W WO 2024024583 A1 WO2024024583 A1 WO 2024024583A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- adapter
- sequence
- double
- stranded dna
- tagment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2523/00—Reactions characterised by treatment of reaction samples
- C12Q2523/10—Characterised by chemical treatment
- C12Q2523/125—Bisulfite(s)
Definitions
- the present invention relates to a method for generating a double-stranded DNA library, etc.
- next-generation sequencer NGS
- various preprocessing techniques such as fragmentation of double-stranded DNA and tagment addition for this analysis have been developed.
- two types of transposomes are formed by adding a first tagment sequence or a second tagment sequence to a recombinant enzyme such as transposase, and these two types of transposomes randomly fragment the target double-stranded DNA.
- tags and tagments There are known methods for creating tags and tagments.
- two types of transposomes randomly bind to the ends of the target double-stranded DNA, which reduces the theoretical yield by half, and also makes it difficult to retain strand information, making it difficult for bisulfite sequence analysis. There are problems such as unavailability.
- RNA sequence analysis methods that retain strand information, that is, from which strand of genomic DNA forming a double strand RNA is transcribed.
- strand information By using strand information, it becomes possible not only to analyze non-coding genes such as antisense RNA, but also to more accurately quantify the expression of overlapping genes. Therefore, methods of fragmentation and tagment addition for retaining strand information are being developed. For example, after fragmentation, a method of adding a Y-shaped adapter (Patent Document 1), fragmentation with transposase, tagmentation of only the 5' end with the first tagment sequence, and then heat treatment of the adapter on the 3' end, etc. Methods have been reported so far, such as removing the tag and replacing the second tagment sequence (Patent Document 2 and Non-Patent Document 1).
- An object of the present invention is to provide a method for efficiently fragmenting and tagmenting double-stranded DNA using simple procedures.
- a method for generating a double-stranded DNA library having different tagment sequences on the 5' end and 3' end comprising the following steps (i) to (iii): (i) (a) a first adapter comprising a first tagment sequence and a first transposon terminal sequence; (b) a second adapter comprising a second transposon terminal sequence having a complementary base sequence to at least a portion of the first transposon terminal sequence; (c) Fragmenting the double-stranded DNA with a transposome containing transposase and transferring either one of the first adapter and the second adapter to the 5' end or 3' end of the double-stranded DNA.
- step (ii) a step of linking as a chain; (ii) a step of linking an additional oligo containing a second tagment sequence to the second adapter, and (iii) a non-transferred portion of the first adapter and the second adapter that is not linked to the double-stranded DNA. ligating a strand adapter to the 5' end and 3' end of the double-stranded DNA to which the transferred strand adapter was not linked in step (i); wherein said step (ii) is performed before, after, or simultaneously with said step (iii).
- the first adapter includes a first tagment sequence on the 5' end side of the first transposon terminal sequence, and becomes a transferred strand that is linked to the 5' end of the double-stranded DNA by transposase. , the method described in Section 1.
- the additional oligo includes a base sequence complementary to a part of the base sequence of the first adapter.
- the transposase is a highly active Tn5 transposase
- the first and second transposon terminal sequences are Tn5-type transposon terminal sequences.
- step (iii) The method according to any one of Items 1 to 4, wherein in step (ii), the additional oligo is ligated to the second adapter using DNA ligase.
- step (iii) Any one of Items 1 to 5, wherein in step (iii), an adapter of a non-transferred strand that is not connected to the double-stranded DNA is ligated to the double-stranded DNA using a DNA polymerase and a DNA ligase. The method described in.
- the adapter of the non-transferred strand that is not linked to the double-stranded DNA is a second adapter whose 5' end side is phosphorylated, and the second adapter is connected to the two adapters.
- step (i) a first adapter is linked as a transferred strand to the 5' end of the double-stranded DNA, and in step (ii), an additional oligo whose 5' end is phosphorylated is added. 8. The method according to any one of Items 1 to 7, wherein ligates to the 3' end of the second adapter.
- step (i) a first adapter is linked as a transferred strand to the 5' end of the double-stranded DNA, and in step (ii), the OH group on the 3' end side is modified.
- double-stranded DNA can be efficiently fragmented using a simpler procedure than conventional methods, and tags with different sequences can be added to the 5' and 3' ends.
- tags with different sequences can be added to the 5' and 3' ends.
- the method of the present invention there is no need to prepare two different types of transposomes.
- FIG. 1 is a schematic diagram of one embodiment of the invention. After adding a first adapter having a first tagment sequence and a first transposon terminal sequence and a second adapter having a second transposon terminal sequence to the double-stranded DNA by a tagmentase such as transposase, a second adapter is added to the double-stranded DNA. Linking an additional oligo having a tagment sequence to a second adapter, and linking an adapter that is not linked (covalently bonded) to the double-stranded DNA (non-transferred strand, the second adapter in this figure) to the double-stranded DNA.
- a tagmentase such as transposase
- FIG. 2 shows one embodiment of the present invention, a first adapter consisting of the base sequence shown in SEQ ID NO: 3, a second adapter consisting of the base sequence shown in SEQ ID NO: 4, and a base sequence shown in SEQ ID NO: 5.
- SEQ ID NO: 3 a first adapter consisting of the base sequence shown in SEQ ID NO: 3
- SEQ ID NO: 4 a second adapter consisting of the base sequence shown in SEQ ID NO: 4
- SEQ ID NO: 5 shows a base sequence shown in SEQ ID NO: 5.
- FIG. 3 shows one embodiment of the present invention, which includes a first adapter consisting of the base sequence shown in SEQ ID NO: 6, a second adapter consisting of the base sequence shown in SEQ ID NO: 7, and a base sequence shown in SEQ ID NO: 8.
- FIG. 2 is a schematic diagram of the case in which the base sequence length of the first adapter and the second adapter is shorter than that of the example in FIG. 2.
- FIG. 4 shows one embodiment of the present invention, which includes a first adapter consisting of the base sequence shown in SEQ ID NO: 9, a second adapter consisting of the base sequence shown in SEQ ID NO: 10, and a base sequence shown in SEQ ID NO: 11.
- the first tagment sequence in the first adapter and the second tagment sequence in the additional oligo are not arranged at the ends, and the first and second tagment sequences are is an example of forming a cyclic structure).
- FIG. 5 is a diagram showing the results of electrophoresis of the library product (adapter 2) in Example 1.
- the pattern of the library product was confirmed using MultiNA, a microchip electrophoresis device for DNA/RNA analysis manufactured by SHIMADZU.
- FIG. 6 is a diagram showing the results of electrophoresis of the library product (adapter 3) in Example 2.
- the pattern of the library product was confirmed using MultiNA, a microchip electrophoresis device for DNA/RNA analysis manufactured by SHIMADZU.
- the present invention provides a method for generating a double-stranded DNA library having different tagment sequences at the 5' end and 3' end using a simpler procedure than conventional methods.
- double-stranded DNA is fragmented by a first adapter containing a first tagment sequence, a second adapter, and a transposome containing transposase, and then the second adapter contains a second tagment sequence.
- the method of the present invention enables fragmentation and addition of tagment sequences, which are necessary in sequence analysis including NGS. Furthermore, in the tagmentation of the present invention, different tagment sequences are added to the 5' end and 3' end, making it possible, for example, to prepare a double-stranded DNA library while preserving strand information. can.
- Generate a double-stranded DNA library (i) (a) a first adapter comprising a first tagment sequence and a first transposon terminal sequence; (b) a second adapter comprising a second transposon terminal sequence having a complementary base sequence to at least a portion of the first transposon terminal sequence; (c) Fragment the double-stranded DNA with a transposome containing transposase, and place either one of the first adapter and the second adapter as a transferred strand at the 5' end or 3' end of the double-stranded DNA.
- step (ii) a step of linking an additional oligo containing the second tagment sequence to the second adapter; and (iii) a step of linking an additional oligo containing the second tagment sequence to the second adapter;
- step (ii) a step of linking an additional oligo containing the second tagment sequence to the second adapter;
- step (iii) a step of linking an additional oligo containing the second tagment sequence to the second adapter;
- step (iii) is not limited, and step (ii) may be performed before step (iii), or step (ii) may be performed before step (ii).
- iii) may be performed, or step (ii) and step (iii) may be performed simultaneously.
- double-stranded DNA is fragmented by a transposome containing the above-mentioned (a), (b), and (c), and the 5' end or 3' end of the double-stranded DNA is fragmented.
- a first adapter or a second adapter is connected to the end as a transferred strand.
- the end to which the transferred strand is linked may be either the 5' end or the 3' end, but in one embodiment, the first adapter or the second adapter is linked to the 5' end as the transferred strand. is preferable, and it is preferable to link the first adapter as a transferred strand to the 5' end.
- a transposome containing (a) a first adapter and (b) a second adapter is used along with (c) a transposase.
- the first adapter (a) constituting the transposome of the present invention is a polynucleotide that includes at least a first tagment sequence and a first transposon terminal sequence.
- the first adapter may have one or more arbitrary lengths (for example, a length of about 5 to 30 bp, preferably a length of about 7 to 25 bp, more preferably a length of about 7 to 25 bp).
- first adapter may include a base sequence (with a length of approximately 15 to 20 bp) (herein also referred to as "arbitrary sequence of the first adapter", etc.).
- This optional sequence of the first adapter may be present between the first tagment sequence and the first transposon terminal sequence, and/or adjacent to the first tagment sequence and different from the first transposon terminal sequence. It may be present on the opposite side (for example, when the first adapter is linked to the 5' end as a transferred strand, on the 5' end side of the first tagment sequence).
- the arbitrary sequence of the first adapter is designed to bind complementary to a part (other than the second tagment sequence) of the additional oligo described below (preferably, the arbitrary sequence of the first adapter is (designed to complementarily bind with a part of the first transposon terminal sequence and with a part of the additional oligo (other than the second tagment sequence) described below), and the additional oligo and the second adapter It functions to make it easier to connect.
- the arbitrary sequence of the first adapter is also referred to as a "sequence complementary to the additional oligo."
- the first tagment sequence region and the first transposon terminal sequence region do not necessarily need to be clearly distinguished; Some of the sequences may overlap.
- the second adapter (b) constituting the transposome of the present invention is a polynucleotide that includes at least the second transposon terminal sequence, and preferably consists of the second transposon terminal sequence.
- the second transposon terminal sequence preferably has a base sequence that is complementary to at least a portion of the first transposon terminal sequence.
- the first transposon terminal sequence contained in the first adapter and the second transposon terminal sequence contained in the second adapter contain mutually complementary base sequences, so that the first adapter and the second adapter Fragmented double strands that form a double strand in at least a part of the region (preferably the end region that is ultimately transferred to the fragmented double stranded DNA) through complementary base sequences. It can be easily added to the ends of DNA.
- the first tagment sequence contained in the first adapter and the second tagment sequence linked to the second adapter are not particularly limited, but it is preferable that the two tagment sequences, the first and second, are not complementary.
- the identity between the base sequence that is the reverse complement of the first tagment sequence and the base sequence of the second tagment sequence is preferably 70% or less, more preferably 60% or less. , more preferably 50% or less.
- the lower limit of the identity between the base sequence that is the reverse complementary strand of the first tagment sequence and the base sequence of the second tagment sequence is not particularly limited, but preferably exceeds 0%, and is preferably 1% or more. It is preferable that Sequence identity can be determined using programs such as Blast, Clustal W, etc.
- both ends of the double-stranded DNA are The first and second tagment sequences attached to each can be more clearly identified, and the 5' end and 3' end of the double-stranded DNA to which the first or second tagment sequences have been added can be easily distinguished. Become.
- the first adapter particularly a region other than the first tagment sequence, preferably an arbitrary sequence region of the first adapter and/or a partial region of the first transposon terminal sequence
- Several bases complementary to the base sequence of the additional oligo especially other than the second tagment sequence (for example, 7 bp or more, preferably 10 bp or more, more preferably 12 bp or more, still more preferably 15 bp or more, and the upper limit is particularly limited)
- the additional oligo is not linked to the end of the first adapter in step (ii), but It becomes easier to bind complementary to the first adapter.
- the additional oligo is aligned in close proximity to the second adapter that is complementary to the first adapter, and as a result, the additional oligo is easily linked to the end of the second adapter.
- the 5' end of the adapter that is not the transferred strand also referred to as the non-transferred strand adapter
- step (iii) for example, DNA ligase, etc.
- DNA ligase for example, DNA ligase, etc.
- the first adapter includes a first tagment sequence on the 5' end side of the first transposon terminal sequence, and becomes a transferred strand that is linked to the 5' end of the double-stranded DNA by transposase.
- the second adapter preferably has its 5' end modified by phosphorylation or the like, and becomes a non-transferred strand that can be ligated to the 3' end of the double-stranded DNA using DNA ligase or the like.
- the oligo DNA (referred to as additional oligo) for ligation to the second adapter includes a second tagment sequence.
- the additional oligo is complementary to the base sequence of the first adapter (particularly a region other than the first tagment sequence, preferably an arbitrary sequence region of the first adapter and/or a partial region of the first transposon terminal sequence). It is preferable to have a continuous base sequence of several bases (for example, 7 bp or more, preferably 10 bp or more, more preferably 12 bp or more, even more preferably 15 bp or more, and the upper limit is not particularly limited, but for example, 30 bp or less).
- the region of the second tagment sequence and the nucleotide sequence of the first adapter (in particular, a region other than the first tagment sequence, preferably an arbitrary sequence region of the first adapter and/or a part of the first transposon terminal sequence)
- the region of the base sequence complementary to the nucleotide sequence does not necessarily have to be clearly distinguished, and some of the sequences may overlap.
- the additional oligo thus contains the nucleotide sequence of the first adapter (particularly a region other than the first tagment sequence, preferably an arbitrary sequence region of the first adapter and/or a partial region of the first transposon terminal sequence).
- the additional oligo By containing a complementary base sequence to the first adapter, in step (ii), the additional oligo tends to be complementary to the first adapter rather than being linked to the end of the first adapter, and as a result, the first adapter It is arranged in close proximity to the second adapter which is complementary to the oligo, and the additional oligo is easily ligated to the end of the second adapter.
- the additional oligo may include a nucleic acid analog such as a Locked Nucleic Acid (LNA) or a Bridged Nucleic Acid (BNA).
- the bases constituting the additional oligo contain such nucleic acid analogs such as LNA and BNA, it is possible to improve the annealing temperature between the first adapter and the additional oligo, thereby making it possible to improve the annealing temperature of the first adapter and the additional oligo.
- This has the advantage that oligos are more likely to bind in a complementary manner.
- the additional oligo used in the present invention further has one or more arbitrary lengths (for example, a length of about 5 to 30 bp, preferably about 5 to 30 bp, in addition to the base sequences complementary to the second tagment sequence and the first adapter base sequence).
- This optional sequence of the additional oligo may be present at either the 5' end or the 3' end of the second tagment sequence.
- the 5' end be adjacent to the second tagment sequence and opposite to the end to which the second adapter is ligated (for example, the 5' end with the first adapter as a transferred strand).
- it is preferably present at the 3' end of the second tagment sequence.
- transposase and transposon terminal sequence The transposase used in the present invention is not particularly limited, and any transposase or variant thereof known in the art can be used.
- Tn5 transposase a variant having an amino acid sequence in which 1 to 10, preferably 1 to 5, more preferably 1 to 3 amino acids are substituted, deleted, inserted, or added.
- hyperactive mutants of Tn5 transposase, MuA transposase, Sleeping Beauty transposase, piggyBac transposase, Himar1 transposase, Mos1 transposase, or mutants thereof for example, Picelli et al., Genome Res .24(12):2033-40, 2014, M. Zhou, and WS Reznikoff, J. Mol. Biol., 271, 362-373, 1997, TW Wiegand, and WS Reznikoff, J.
- Tn5 transposase or its mutant Tn5-type transposase is more preferred, and Tn5 transposase mutant (highly active Tn5 transposase) is particularly preferred.
- the transposon end sequence (a unique double-stranded sequence recognized by the transposase) used in combination with the transposase will be used. Usually, one strand will be the transferred strand and the other strand will be the non-transferred strand. ) are different.
- the transposon terminal sequence used in the present invention does not need to be a full-length sequence, and may be a part of a base sequence known as a transposon terminal sequence as long as the effect of the present invention is achieved.
- a transposon terminal sequence serving as a non-transferred strand can be used in the present invention if it has a length of at least 10 bp (preferably at least 11 bp, more preferably at least 12 bp).
- a transposon end sequence with a base length of at least 10 bp is obtained by deleting the 3' end of the base sequence of the transposon end sequence that is known to be a non-transferred strand.
- transposon terminal sequences that become non-transferred strands.
- transposon terminal sequence used when the transposase exhibits transposition activity on double-stranded DNA is not the same as shown here; Any terminal sequence can be used in the present invention.
- a sequence complementary to the first tagment sequence and the additional oligo is added to the 5' end of the first transposon terminal sequence.
- 5'- TCGTCGGCAGCGTCCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 3) is used as the first adapter which becomes the transferred strand
- 5'-CTGTCTCTTATACACATCT-3' (SEQ ID NO: 4) was used as a second adapter for the non-transferred strand
- 5'-TCAAGTAGCACACGAGCCGAGCCCACGAGAC-3' can be used as an additional oligo.
- the 5' ends of the second adapter and additional oligo may be phosphorylated.
- the 3' terminal side of the additional oligo may be modified with an OH group (for example, modified with a phosphate group or inverted dT).
- the non-transferred strand can also be shorter.
- the total length of the non-transferred strand (or the second adapter that can become the non-transferred strand) can be shortened to about 10 bp to 19 bp, preferably about 11 bp to 19 bp, more preferably about 12 bp to 19 bp, even more preferably 14 bp to 19 bp.
- a non-transferred strand of about 19 bp can be used.
- 5'-TCGTCGGCAGCGTCAGCTAGCTAGCAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 6) is used as the first adapter which becomes the transferred strand
- 5'-CTGTCTCTTATACAC-3' (SEQ ID NO: 7) was used as a second adapter for the non-transferred strand
- 5'-ATCTGCTAGCTAGCTCCGAGCCCACGAGAC-3' (SEQ ID NO: 8) can be used as an additional oligo.
- the 5' ends of the second adapter and additional oligo may be phosphorylated.
- the 3' terminal side of the additional oligo may be modified with an OH group (for example, modified with a phosphate group or inverted dT).
- an OH group for example, modified with a phosphate group or inverted dT.
- the first tagment sequence may be incorporated into a sequence complementary to the additional oligo in the first adapter.
- sequences complementary to the additional oligo may be present at the 5' end and 3' end of the first tagment sequence.
- 5'-CTCGTGTGCTACTTGATCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 9) is used as the first adapter which becomes the transferred strand
- 5'-CTGTCTCTTATA-3' (SEQ ID NO: 10) was used as a second adapter for the non-transferred strand
- 5'-CACATCTCCGAGCCCACGAGACTCAAGTAGCACACGAG-3' (SEQ ID NO: 11) can be used as an additional oligo.
- the 5' ends of the second adapter and additional oligo may be phosphorylated.
- the 3' terminal side of the additional oligo may be modified with an OH group (for example, modified with a phosphate group or inverted dT).
- the first tagment sequence and the second tagment sequence form a circular structure sandwiched between double-stranded regions, but in the present invention, Such a tagment sequence may be added to double-stranded DNA.
- the first and second tagment sequences are present at positions closer to the ends of the double-stranded DNA. There is an advantage that the reaction can proceed more efficiently when performing PCR or the like using primers.
- transposome used in the present invention is characterized by containing at least the above-mentioned (a) first adapter, (b) second adapter, and (c) transposase.
- the method of adding the first and second adapters to transposase is not particularly limited, but for example, in addition to Non-Patent Document 1, methods described in Picelli et al., Genome Res.24(12):2033-40, 2014, etc. There are several methods that can be used.
- the reaction temperature and time of the transposase treatment ((i) step of reacting the transposome with the double-stranded DNA)
- the temperature at which the transposome and the double-stranded DNA are reacted depends on the transposase used, the sequence and length of the first adapter, and the It can be set as appropriate depending on the sequences and lengths of the two adapters, their combinations, etc.
- the reaction temperature is preferably 30°C or higher and 65°C or lower, more preferably 37°C or higher and 60°C or lower, and even more preferably 50°C or higher and 60°C or lower.
- the reaction time is preferably 1 minute or more, more preferably 3 minutes or more, even more preferably 5 minutes or more.
- the upper limit of the reaction time is not particularly limited, but may be, for example, 24 hours or less, preferably 12 hours or less, more preferably 6 hours or less, even more preferably 3 hours or less.
- the concentration of transposase in the reaction solution for reacting transposomes with double-stranded DNA is not particularly limited as long as it exhibits transposase activity, but it is preferably 10 pg/ ⁇ L or more.
- the reaction solution used for the transposase treatment is not particularly limited as long as it exhibits transposase activity, and may contain other additives.
- N,N-dimethylformamide or polyethylene glycol increases the efficiency of NGS library preparation using transposon reactions, and can be preferably used (Picelli et al., Genome Res. 24 (12):2033-40, 2014).
- buffers, salts, organic solvents, polymers, surfactants, chelating agents, proteins, combinations of two or more of these, and the like may be used as additives.
- buffers examples include Tris, Bis-Tris, Tricine, Bis-Tricine, Hepes, Mops, Tes, and Taps. (Taps), Pipes, Caps, phosphoric acid, acetic acid, and combinations of two or more of these. Buffers are usually dissolved in water (preferably nuclease-free water) and used in the form of an aqueous solution.
- salts include chlorides (e.g., lithium chloride, sodium chloride, potassium chloride, magnesium chloride, manganese chloride, ammonium chloride), acetates (e.g., lithium acetate, sodium acetate, potassium acetate, magnesium acetate, manganese acetate, (ammonium acetate), sulfates (eg, potassium sulfate, magnesium sulfate, manganese sulfate, ammonium sulfate), and combinations of two or more of these.
- chlorides e.g., lithium chloride, sodium chloride, potassium chloride, magnesium chloride, manganese chloride, ammonium chloride
- acetates e.g., lithium acetate, sodium acetate, potassium acetate, magnesium acetate, manganese acetate, (ammonium acetate)
- sulfates eg, potassium sulfate, magnesium sulfate, manganese sulfate, ammoni
- organic solvent examples include alcohols (eg, ethanol, methanol, polyethylene glycol), aprotic solvents such as N,N-dimethylformamide and dimethyl sulfoxide, and combinations of two or more of these.
- alcohols eg, ethanol, methanol, polyethylene glycol
- aprotic solvents such as N,N-dimethylformamide and dimethyl sulfoxide
- Surfactants include anionic surfactants (e.g., sodium dodecyl sulfate, sodium cholate, sodium deoxycholate), cationic surfactants (e.g., cetyltrimethylammonium bromide), nonionic surfactants (e.g., cetyltrimethylammonium bromide), For example, octylphenol ethoxylate, polyoxyethylene lauryl ether, polyoxyethylene oleyl ether, polyoxyethylene stearyl ether, polyoxyethylene sorbitan monolaurate), and amphoteric surfactants (such as 3-[(3-col (amidopropyl)dimethylammonio]-1-propanesulfonic acid) and the like, but are not limited to these.
- anionic surfactants e.g., sodium dodecyl sulfate, sodium cholate, sodium deoxycholate
- cationic surfactants e.g., cetyltrimethylammonium bro
- Chelating agents include ethylenediaminetetraacetic acid (EDTA), glycol etherdiaminetetraacetic acid (EGTA), nitrilotriacetic acid (NTA), phenanthroline, maleic acid, citric acid, tricine, trans-1,2-diaminocyclohexane-N,N , N',N'-tetraacetic acid (CDTA), tartaric acid, nicotinamide, hydroxyethyliminodiacetic acid (HIDA), phytic acid, and the like, but are not limited to these.
- EDTA ethylenediaminetetraacetic acid
- EGTA glycol etherdiaminetetraacetic acid
- NTA nitrilotriacetic acid
- CDTA trans-1,2-diaminocyclohexane-N,N , N',N'-tetraacetic acid
- HIDA hydroxyethyliminodiacetic acid
- proteins include, but are not limited to, fetal bovine serum albumin (BSA).
- BSA fetal bovine serum albumin
- the method for linking the additional oligo to the second adapter is not particularly limited, but it is preferably carried out by an enzymatic reaction, more preferably by using polynucleotide ligase, and by DNA ligase. It is particularly preferable that there be.
- polynucleotide ligase the origin of the enzyme is not particularly limited, but DNA ligase derived from T4 phage, DNA ligase derived from T3 phage, DNA ligase derived from T7 phage, DNA ligase derived from Escherichia coli or its mutant, or Lucigen.
- a DNA ligase is used, such as Ampligase® Thermostable DNA ligase, sold by Ampligase®.
- the gap can be filled by an enzyme reaction such as DNA polymerase (gap repair). This gap repair may be performed simultaneously with the ligation using polynucleotide ligase, or may be performed separately.
- the enzyme used for gap repair and ligation is not particularly limited, but it is preferable to use DNA polymerase and polynucleotide ligase.
- DNA polymerase is not particularly limited, it is preferable to use DNA polymerase derived from T4 phage, DNA polymerase I derived from Escherichia coli, or Klenow fragment, which is a fragment of DNA polymerase I derived from Escherichia coli. It is more preferable to use an enzyme that hardly exhibits DNA strand displacement activity.
- the origin of the enzyme for polynucleotide ligase is not particularly limited, but heat-stable DNA ligase such as Ampligase (registered trademark) Thermostable DNA ligase sold by Lucigen, DNA ligase derived from T4 phage, and DNA ligase derived from Escherichia coli may be used. Preferably, DNA ligase is used.
- the concentration of these enzymes is not particularly limited as long as they exhibit activity, but the concentration of polynucleotide ligase is 0.01 U/ ⁇ L. As mentioned above, it is preferable that the concentration of DNA polymerase is 0.005 U/ ⁇ L or more. Further, the reaction solution used for the linking process in this enzyme reaction is not particularly limited as long as it exhibits enzyme activity, and may contain other additives.
- polynucleotide ligases such as DNA ligase derived from T4 phage require adenosine triphosphate (ATP) to exert their activity; It is known that polynucleotide ligases such as DNA ligase derived from E. coli require nicotinamide adenine dinucleotide (NAD) to exert their activity. Furthermore, DNA polymerases usually require deoxyribonucleotides to exert their activity. In addition, for example, buffers, salts, organic solvents, polymers, surfactants, chelating agents, proteins, combinations of two or more of these, and the like may be used as additives.
- ATP adenosine triphosphate
- NAD nicotinamide adenine dinucleotide
- DNA polymerases usually require deoxyribonucleotides to exert their activity.
- buffers examples include Tris, Bis-Tris, Tricine, Bis-Tricine, Hepes, Mops, Tes, and Taps. (Taps), Pipes, Caps, phosphoric acid, acetic acid, and combinations of two or more of these. Buffers are usually dissolved in water (preferably nuclease-free water) and used in the form of an aqueous solution.
- salts include chlorides (e.g., lithium chloride, sodium chloride, potassium chloride, magnesium chloride, manganese chloride, ammonium chloride), acetates (e.g., lithium acetate, sodium acetate, potassium acetate, magnesium acetate, manganese acetate, (ammonium acetate), sulfates (eg, potassium sulfate, magnesium sulfate, manganese sulfate, ammonium sulfate), and combinations of two or more of these.
- chlorides e.g., lithium chloride, sodium chloride, potassium chloride, magnesium chloride, manganese chloride, ammonium chloride
- acetates e.g., lithium acetate, sodium acetate, potassium acetate, magnesium acetate, manganese acetate, (ammonium acetate)
- sulfates eg, potassium sulfate, magnesium sulfate, manganese sulfate, ammoni
- organic solvent examples include alcohols (eg, ethanol, methanol, polyethylene glycol), aprotic solvents such as N,N-dimethylformamide and dimethyl sulfoxide, and combinations of two or more of these.
- alcohols eg, ethanol, methanol, polyethylene glycol
- aprotic solvents such as N,N-dimethylformamide and dimethyl sulfoxide
- Surfactants include anionic surfactants (e.g., sodium dodecyl sulfate, sodium cholate, sodium deoxycholate), cationic surfactants (e.g., cetyltrimethylammonium bromide), nonionic surfactants (e.g., cetyltrimethylammonium bromide), For example, octylphenol ethoxylate, polyoxyethylene lauryl ether, polyoxyethylene oleyl ether, polyoxyethylene stearyl ether, polyoxyethylene sorbitan monolaurate), and amphoteric surfactants (e.g., 3-[(3-col) (amidopropyl)dimethylammonio]-1-propanesulfonic acid) and the like, but are not limited to these.
- anionic surfactants e.g., sodium dodecyl sulfate, sodium cholate, sodium deoxycholate
- cationic surfactants e.g., cetyltrimethyl
- Chelating agents include ethylenediaminetetraacetic acid (EDTA), glycol etherdiaminetetraacetic acid (EGTA), nitrilotriacetic acid (NTA), phenanthroline, maleic acid, citric acid, tricine, trans-1,2-diaminocyclohexane-N,N , N',N'-tetraacetic acid (CDTA), tartaric acid, nicotinamide, hydroxyethyliminodiacetic acid (HIDA), phytic acid, and the like, but are not limited to these.
- EDTA ethylenediaminetetraacetic acid
- EGTA glycol etherdiaminetetraacetic acid
- NTA nitrilotriacetic acid
- CDTA trans-1,2-diaminocyclohexane-N,N , N',N'-tetraacetic acid
- HIDA hydroxyethyliminodiacetic acid
- proteins include, but are not limited to, fetal bovine serum albumin (BSA).
- BSA fetal bovine serum albumin
- reaction solution used in step (i) can be used as it is, and the enzyme described above can be added thereto to perform step (ii) (linking of the additional oligo to the second adapter). Good too.
- the method for linking the non-transferred strand (for example, second adapter) to double-stranded DNA is not particularly limited, but it is preferably carried out by an enzymatic reaction.
- an enzymatic reaction When linking a non-transferred strand to an adapter double-stranded DNA by an enzymatic reaction, it is preferable to phosphorylate the 5' end of the non-transferred strand. In some embodiments, it is preferable to perform gap repair because there may be a distance of several bases between the non-transferred strand by transposase and the double-stranded DNA.
- Gap repair between the adapter of the non-transferred strand and the double-stranded DNA may be performed simultaneously with the ligation of the additional oligo to the second adapter in (ii) above, or may be performed separately.
- the same enzyme is commonly used as (ii) the enzyme that connects the additional oligo to the second adapter and (iii) the enzyme that connects the non-transferred strand adapter to the double-stranded DNA.
- separate enzymes may be used.
- the enzyme used for gap repair and ligation is not particularly limited, but it is preferable to use DNA polymerase and polynucleotide ligase.
- DNA polymerase is not particularly limited, it is more preferable to use DNA polymerase derived from T4 phage, DNA polymerase I derived from Escherichia coli, or Klenow fragment, which is a fragment of DNA polymerase I derived from Escherichia coli, and DNA polymerase derived from T4 phage. It is more preferable to use an enzyme that hardly exhibits DNA strand displacement activity such as.
- the origin of the enzyme for polynucleotide ligase is not particularly limited, but heat-stable DNA ligase such as Ampligase (registered trademark) Thermostable DNA ligase sold by Lucigen, DNA ligase derived from T4 phage, or Escherichia coli-derived DNA ligase may be used. Preferably, DNA ligase is used.
- the concentration of these enzymes is not particularly limited as long as they exhibit activity, but the concentration of polynucleotide ligase is 0.
- the concentration of DNA polymerase is preferably 0.005 U/ ⁇ L or more.
- the reaction solution used for the linking process in this enzyme reaction is not particularly limited as long as it exhibits enzyme activity, and may contain other additives. As other additives, for example, those similar to those described as other additives that can be suitably used in the enzyme reaction in (ii) above for linking the additional oligo to the second adapter can be used.
- reaction temperature and time for the ligation of (ii) and (iii) Reactions during the above (ii) ligation of the additional oligo to the second adapter and the above (iii) ligation of the non-transferred strand adapter to the double-stranded DNA The conditions are not particularly limited, and the reaction conditions in both steps may be the same or different. For example, when both steps are performed under the same reaction conditions, the upper limit of the reaction temperature is not particularly limited.
- the Tm value of the complementary sequence portion of the second transposon terminal sequence is +15°C or less, and the complementary sequence portion of the first adapter and the additional oligo (particularly the region other than the first tagment sequence (preferably the The Tm value of the complementary sequence region between the arbitrary sequence region of one adapter and/or a partial region of the first transposon terminal sequence) and the additional oligo (region other than the second tagment sequence) +15°C or less
- the Tm value of the complementary sequence portion of the first adapter and the second adapter is preferably +10°C or less, and the Tm value of the complementary sequence portion of the first adapter and the additional oligo is +10°C or less. is more preferable.
- the temperature is preferably 45°C or lower, more preferably 37°C or lower.
- the lower limit of the reaction temperature in this case is not particularly limited, but in order to reduce non-specific linkage while maintaining enzyme activity, it is preferably 4°C or higher, more preferably 10°C or higher. , more preferably 15°C or higher.
- the temperature range is preferably such that the polynucleotide ligase activity can be maintained at 10% or more and the DNA polymerase activity can be maintained at 10% or more, in order to avoid a decrease in enzyme activity due to low temperature or heat.
- the reaction time is not particularly limited, but is preferably 5 minutes or longer, more preferably 10 minutes or longer.
- the upper limit of the reaction time is not particularly limited, it can be, for example, 1 hour or less.
- DNA purification is performed after any one or more of steps (i), (ii), and (iii), or after all of these steps. may or may not be performed. Furthermore, when performing the PCR reaction described below, the DNA may or may not be purified before the PCR. Furthermore, when performing NGS analysis using the double-stranded DNA library generated according to the present invention, DNA purification may or may not be performed before the NGS analysis. Purification of DNA can be performed by any method known in the art, such as a method using AMPure XP (Beckman Coulter) or similar adsorption beads, or a method using insolubilization using ethanol or polyethylene glycol. However, there are no particular limitations.
- PCR Polymerase chain reaction
- Tagment sequences added in nucleic acid amplification methods such as PCR include, for example, index sequences used in NGS instruments such as Illumina (e.g., NextSeq TM , MiSeq TM series, etc.), sequences for hybridization on flow cells (e.g., Illumina).
- NGS instruments such as Illumina (e.g., NextSeq TM , MiSeq TM series, etc.)
- sequences for hybridization on flow cells e.g., Illumina
- P5 sequence, P7 sequence manufactured by Oxford Nanopore Technologies, and sequences required for recognition of target DNA using long read sequencers (eg, MinION, GridION, PromethION) manufactured by Oxford Nanopore Technologies, etc., but are not particularly limited.
- the method of nucleic acid amplification such as PCR is not particularly limited.
- strand information may or may not be stored in the prepared library.
- the target double-stranded DNA for storing strand information is not particularly limited.
- double-stranded DNA containing uracil only on one strand is prepared by synthesizing DNA complementary to the cDNA in a reaction solution containing dUTP,
- the DNA strand containing uracil is amplified by treatment with UNG (uracil DNA glycosylase) and/or by performing PCR using a DNA polymerase that cannot use uracil as a template (e.g., family B DNA polymerase). You can make it impossible.
- UNG uracil DNA glycosylase
- each DNA strand can be analyzed while preserving strand information.
- bisulfite sequence analysis can be easily performed. For example, after methylating cytosine bases in the first tagment sequence region of the first adapter and cytosine bases in the second tagment sequence region of the additional oligo, a library is generated from double-stranded DNA, and bisulfite (sulfite The methylation state of cytosine in double-stranded DNA can be detected by treatment with hydrogen salts) or the like.
- T-WGBS Tagmentation-based whole-genome bisulfite sequence
- the present invention uses the first adapter in which the cytosine base in the first tagment sequence is methylated and the additional oligo in which the cytosine base in the second tagment sequence is methylated.
- it may also be a method of generating a double-stranded DNA library used for bisulfite analysis, and by this method, it is possible to perform methylation analysis of double-stranded DNA in which at least one strand is methylated. can.
- the target double-stranded DNA (also referred to as target double-stranded DNA) is not particularly limited, but may include genomic DNA extracted from cells, double-stranded DNA amplified by a method such as PCR, or RNA. Examples include synthesized double-stranded DNA.
- double-stranded DNA is not only double-stranded DNA derived from one cell, tissue, organ, or organism (e.g., animals, plants, fungi, bacteria, viruses, etc.), but also double-stranded DNA derived from multiple cells, tissues, organs, or organisms. It may be double-stranded DNA derived from The amount of double-stranded DNA used in the present invention is not particularly limited.
- Double-stranded DNA library generation kit The present invention may also be an embodiment of a kit for generating a double-stranded DNA library having different tagment sequences at the 5' end and 3' end.
- the kit includes (a) a first adapter comprising a first tagment sequence and a first transposon terminal sequence; and (b) a second adapter having a base sequence complementary to at least a portion of the first transposon terminal sequence.
- a transposome comprising a second adapter comprising a transposon terminal sequence; and (c) a transposase.
- the kit preferably also contains enzymes such as polynucleotide ligase and DNA polymerase.
- This purified Hyperactive Tn5 was dialyzed in 50 mM HEPES-KOH (pH 7.5), 100 mM NaCl, 1 mM dithiothreitol (DTT), and 50% glycerol, the buffer was replaced, and the protein concentration was adjusted to 100 ⁇ g/mL in the dialysis buffer.
- the diluted solution was prepared as a "purified Tn5 solution".
- three sets of adapters shown in Table 1 below were first prepared.
- a solution was prepared such that the concentration of the first adapter and the second adapter was 5 ⁇ M in a solution of 50 mM HEPES-KOH (pH 7.5) and 100 mM NaCl, and the solution was heated to 100°C.
- the adapter was then annealed by cooling to 25°C at a rate of ⁇ -1°C/min. After annealing, equal amounts of 100% glycerol were mixed to prepare each "adapter solution (1, 2, 3)" which was adjusted to 50% glycerol.
- each adapter solution (1, 2, 3) was added to 24 ⁇ L of the purified Tn5 solution and left to stand at 25°C for 60 minutes to provide each adapter, followed by dialysis buffer.
- the mixture was diluted 100 times to prepare "Tn5 (Adapter 1),”"Tn5 (Adapter 2),” and "Tn5 (Adapter 3).”
- Tn5 Adapter 1
- Tn5 Adapter 2
- Tn5 Adapter 3
- the 5' side of the second adapter (non-transferred strand) shown in Table 2 below is not phosphorylated, and three adapter sets that cannot bind to the target double-stranded DNA in an additional reaction using DNA ligase, etc.
- the underline indicates the first tagment sequence
- the underline indicates the first transposon terminal sequence
- reaction buffer Preparation of reaction buffer
- Tn5 reaction buffer (20 mM Tris-HCl (pH 7.5), 15% dimethylformamide, 10 mM MgCl 2
- additional reaction buffer 300 mM Tris-HCl (pH 8.0), 40 mM MgCl 2 , 100 mM (NH 4 ) 2 SO 4 , 12 mM EDTA (pH 8.0), 1 mM NAD, 0.05% BSA
- Example 1 Preparation of library for NGS using the present invention
- a target double-stranded DNA was fragmented according to the present invention, and a tagment that added different sequences to the 5' end and 3' end was prepared.
- the following experiment was conducted to examine whether the conversion could be performed efficiently and the library for NGS could be prepared.
- Tn5 adapter
- genomic DNA (1 ng) purified from HeLa S3 cells as the target double-stranded DNA
- a Tn5 reaction solution was first prepared with the composition shown in Table 4.
- the prepared reaction solution was reacted at 55°C for 5 minutes (Adapters 1, 2, 1NC, and 2NC) or at 50°C for 20 minutes (Adapters 3 and 3NC) to perform fragmentation and addition of the first tagment sequence. . After stopping the reaction by adding 2.5 ⁇ L of 0.15% sodium dotecyl sulfate solution, the entire amount of the additional reaction solution prepared with the composition shown in Table 5 was added.
- a PCR reaction was performed as follows. A PCR reaction solution was prepared with the composition shown in Table 6, PCR was carried out according to the reaction cycle shown in Table 7, and an index sequence and P5 and P7 sequences for Illumina's NGS were added.
- the nucleic acid of the PCR product after the reaction was purified using 24 ⁇ L of AMPure XP beads (Beckman Coulter) according to the manual, and eluted into 30 ⁇ L of TE buffer (Nacalai Tesque) (purified PCR nucleic acid solution). Then, using 3 ⁇ L of the purified PCR nucleic acid solution, electrophoresis was performed using MultiNA, a microchip electrophoresis device for DNA/RNA analysis manufactured by SHIMADZU, according to the manual, and the pattern of the library product was confirmed (FIG. 5).
- Example 2 Preparation of NGS library retaining strand information using the present invention
- fragmentation and tagmentation targeting RNA-derived double-stranded cDNA were efficiently performed using the present invention.
- cDNA was synthesized from 1 ng of RNA purified from HeLa S3 cells using the RNeasy Plus Mini Kit (QIAGEN), and the 2nd strand synthesis solution shown in Table 8 was added to 9 ⁇ L of this cDNA solution. The reaction was carried out in different cycles to obtain RNA-derived double-stranded DNA.
- RNA-derived double-stranded DNA was purified using 27 ⁇ L of AMPure XP beads (Beckman Coulter) according to the manual, and the DNA was purified with a mixture of 2.5 ⁇ L of Tn5 reaction buffer and 1.25 ⁇ L of sterile water. Eluted (purified double-stranded DNA (derived from RNA)). Thereafter, in the same manner as in Example 1, a Tn5 reaction solution was prepared with the composition shown in Table 10 using the obtained (RNA-derived) purified double-stranded DNA as the target double-stranded DNA.
- the prepared reaction solution was reacted at 55°C for 5 minutes (Adapters 1 and 2) or at 50°C for 20 minutes (Adapter 3) to perform fragmentation and addition of the first tagment sequence. After stopping the reaction by adding 2.5 ⁇ L of 0.15% sodium dotecyl sulfate solution, the entire amount of the additional reaction solution prepared with the composition shown in Table 5 was added.
- PCR reaction was performed as follows.
- a PCR reaction solution was prepared with the composition shown in Table 6, PCR was carried out according to the reaction cycle shown in Table 7, and an index sequence and P5 and P7 sequences for Illumina's NGS were added.
- DNA polymerase derived from KOD Thermococcus kodakarensis
- the PCR product was purified using 24 ⁇ L of AMPure XP beads (Beckman Coulter) according to the manual, and eluted into 30 ⁇ L of TE buffer (Nacalai Tesque) (purified PCR nucleic acid solution). Then, using 3 ⁇ L of the purified PCR nucleic acid solution, electrophoresis was performed using MultiNA, a microchip electrophoresis device for DNA/RNA analysis manufactured by SHIMADZU, according to the manual, and the pattern of the library product was confirmed (Figure 6).
- Tn5 adapter 1
- Tn5 adapter 2
- Tn5 Adapter 3
- the present invention allows efficient fragmentation and tagmentation even from RNA-derived cDNA, making it possible to prepare a library for Illumina NGS. Furthermore, under conditions containing dUTP, about half the yield was obtained, suggesting that amplification from the 2nd strand was not possible due to the use of a polymerase that cannot amplify using uracil as a template. From this result, it can be seen that the double-stranded DNA library obtained by the method of this example is composed of the one amplified from the 1st strand and is able to retain strand information.
- Example 3 NGS analysis of libraries prepared using the present invention Among the double-stranded DNA libraries obtained in Examples 1 and 2, genomic DNA or RNA-derived double-stranded DNA (without dUTP or NGS analysis was performed using Miseq Reagent Kit v3 and Miseq using a library prepared by treating Tn5 (adapter 1), Tn5 (adapter 2), and Tn5 (adapter 3).
- Tn5 adapter 1
- Tn5 adapter 2
- Tn5 adapter 3
- the following custom primers were added to the predetermined sequence primer solution as sequence primers.
- the Read1 primer, Read2 primer, and Index1 Read primer attached to Miseq Reagent Kit v3 were used.
- Read1 primer for adapter 1 5'-GCGTCCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 12)
- Read2 primer for adapter 1 5'-CTCGGCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 13)
- Index1 Read primer for adapter 1 5'-TCAAGTAGCACACGAGCCGAGCCCAGAGAC-3' (SEQ ID NO: 14)
- Read1 primer for adapter 2 5'-GGCAGCGTCAGCTAGCTAGCAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 15)
- Read2 primer for adapter 2 5'-GTGGGCTCGGAGCTAGCTAGCAGATGTGTATAAGAGACAG-3' (SEQ ID NO: 16)
- Index1 Read primer for adapter 2 5'-ACATCTGCTAGCTAGCTCCGAGCCCACGAGAC-3' (SEQ ID NO: 17)
- the double-stranded DNA library generation method of the present invention can efficiently generate a double-stranded DNA library that can be used for sequence analysis such as NGS with a simple procedure.
- the present invention makes it possible to easily and quickly prepare a library for genetic analysis such as next-generation sequencer (NGS) analysis.
- NGS next-generation sequencer
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
[項1] 5’末端側と3’末端側とに異なるタグメント配列を有する二本鎖DNAライブラリーを生成する方法であって、以下の工程(i)~(iii):
(i)(a)第一のタグメント配列及び第一のトランスポゾン末端配列を含む第一アダプターと、
(b)前記第一のトランスポゾン末端配列の少なくとも一部と相補的な塩基配列を有する第二のトランスポゾン末端配列を含む第二アダプターと、
(c)トランスポゼースと
を含むトランスポソームによって二本鎖DNAを断片化し、該二本鎖DNAの5’末端又は3’末端に、前記第一アダプター及び前記第二アダプターのいずれか一方のアダプターを転移鎖として連結させる工程、
(ii)第二のタグメント配列を含むアディショナルオリゴを前記第二アダプターに連結させる工程、及び
(iii)前記第一アダプター及び前記第二アダプターのうち、前記二本鎖DNAに連結していない非転移鎖のアダプターを、該二本鎖DNAの5’末端及び3’末端のうち前記工程(i)において転移鎖のアダプターを連結させていない末端に連結させる工程、
を含み、ここで前記工程(ii)は、前記工程(iii)の前、後、又は同時に実施される、方法。
[項2] 前記第一アダプターが、前記第一のトランスポゾン末端配列よりも5’末端側に第一のタグメント配列を含み、トランスポゼースによって前記二本鎖DNAの5’末端に連結する転移鎖となる、項1に記載の方法。
[項3] 前記アディショナルオリゴが、前記第一アダプターの塩基配列の一部に相補的な塩基配列を含む、項1又は2に記載の方法。
[項4] 前記トランスポゼースが、高活性Tn5トランスポゼースであり、前記第一及び第二のトランスポゾン末端配列がTn5型のトランスポゾン末端配列である、項1~3のいずれかに記載の方法。
[項5] 前記工程(ii)において、DNAリガーゼにより、アディショナルオリゴを第二アダプターに連結させる、項1~4のいずれかに記載の方法。
[項6] 前記工程(iii)において、DNAポリメラーゼ及びDNAリガーゼにより、前記二本鎖DNAに連結していない非転移鎖のアダプターを前記二本鎖DNAに連結させる、項1~5のいずれかに記載の方法。
[項7] 前記工程(iii)において、二本鎖DNAに連結していない非転移鎖のアダプターが5’末端側がリン酸化修飾されている第二アダプターであり、前記第二アダプターを前記二本鎖DNAの3’末端に連結させる、項1~6のいずれかに記載の方法。
[項8] 前記工程(i)において、前記二本鎖DNAの5’末端に第一アダプターを転移鎖として連結させ、前記工程(ii)において、5’末端側がリン酸化修飾されているアディショナルオリゴを第二アダプターの3’末端に連結させる、項1~7のいずれかに記載の方法。
[項9] 前記工程(i)において、前記二本鎖DNAの5’末端に第一アダプターを転移鎖として連結させ、前記工程(ii)において、3’末端側のOH基が修飾されているアディショナルオリゴを第二アダプターの3’末端に連結させる、項1~8のいずれかに記載の方法。
[項10] 前記OH基の修飾が、リン酸基又はinverted dTによる修飾である、項9に記載の方法。
[項11] ストランド情報を保持している二本鎖DNAライブラリーを生成する、項1~10のいずれかに記載の方法。
[項12] 前記二本鎖DNAの少なくとも一方の鎖が修飾されている、項1~11のいずれかに記載の方法。
[項13] 前記修飾がメチル化修飾である、項12に記載の方法。
[項14] 前記第一のタグメント配列におけるシトシン塩基がメチル化されている前記第一アダプター及び前記第二タグメント配列におけるシトシン塩基がメチル化されている前記アディショナルオリゴを使用し、バイサルファイト解析に用いられる二本鎖DNAライブラリーを生成する、項12に記載の方法。
以下、本発明の実施形態を示しつつ、本発明について更に詳説する。
<二本鎖DNAライブラリーを生成する方法>
本発明では、従来の方法よりも単純な手順で、5’末端側と3’末端側とに異なるタグメント配列を有する二本鎖DNAライブラリーを生成する方法を提供する。本発明では、第一のタグメント配列を含む第一のアダプター、第二のアダプター、及びトランスポゼースを含むトランスポソームによって二本鎖DNAを断片化した後、第二のアダプターに第二のタグメント配列を含むアディショナルオリゴをリガーゼなどによって連結することで、単純かつ効率的に二本鎖DNAの断片化と、第一のタグメント配列及び第二のタグメント配列の付加を行うことができる。本発明の方法により、NGSをはじめとするシーケンス解析において必要となる、断片化及びタグメント配列の付加が可能となる。さらに、本発明のタグメント化においては、5’末端側と3’末端側とに異なるタグメント配列が付加されるため、例えば、ストランド情報を保存した状態で二本鎖DNAライブラリーを調製することができる。
本発明では、少なくとも以下の工程(i)~(iii)を含む方法によって、5’末端側と3’末端側とに異なるタグメント配列を有する二本鎖DNAライブラリーを生成する:
(i)(a)第一のタグメント配列及び第一のトランスポゾン末端配列を含む第一アダプターと、
(b)前記第一のトランスポゾン末端配列の少なくとも一部と相補的な塩基配列を有する第二のトランスポゾン末端配列を含む第二アダプターと、
(c)トランスポゼースと
を含むトランスポソームによって二本鎖DNAを断片化し、該二本鎖DNAの5’末端又は3’末端に、第一アダプター及び第二アダプターのいずれか一方のアダプターを転移鎖として連結させる工程
(ii)第二のタグメント配列を含むアディショナルオリゴを第二アダプターに連結させる工程、及び
(iii)第一アダプター及び第二アダプターのうち、前記二本鎖DNAに連結していない非転移鎖のアダプターを、該二本鎖DNAの5’末端又は3’末端のうち前記工程(i)において転移鎖のアダプターを連結させていない末端に連結させる工程。
尚、これらの工程のうち工程(ii)及び工程(iii)は順序を制限されず、工程(iii)の前に工程(ii)を行ってもよいし、工程(ii)の前に工程(iii)を行ってもよいし、工程(ii)及び工程(iii)を同時に行うこともできる。
本発明では、(c)トランスポゼースと共に、(a)第一アダプター及び(b)第二アダプターを含むトランスポソームを用いる。本発明のトランスポソームを構成する(a)第一アダプターは、第一のタグメント配列及び第一のトランスポゾン末端配列を少なくとも含むポリヌクレオチドである。第一アダプターは、第一のタグメント配列及び第一のトランスポゾン末端配列以外に1又は複数の任意の長さ(例えば、5~30bp程度の長さ、好ましくは7~25bp程度の長さ、より好ましくは15~20bp程度の長さ)の塩基配列(本明細書では、「第一アダプターの任意配列」等ともいう)を含んでいてもよい。この第一アダプターの任意配列は、第一のタグメント配列と第一のトランスポゾン末端配列との間に存在してもよく、及び/又は第一のタグメント配列に隣接し第一のトランスポゾン末端配列とは反対側(例えば、第一アダプターを転移鎖として5’末端に連結させる場合、第一のタグメント配列の5’末端側)に存在してもよい。特定の実施形態において、第一アダプターの任意配列は、後述するアディショナルオリゴの一部(第二のタグメント配列以外)と相補的に結合するように設計され(好ましくは、第一アダプターの任意配列は第一のトランスポゾン末端配列の一部と一緒になって、後述するアディショナルオリゴの一部(第二のタグメント配列以外)と相補的に結合するように設計され)、当該アディショナルオリゴと第二アダプターとを連結させ易くするように機能する。この場合、第一アダプターの任意配列は、「アディショナルオリゴと相補的な配列」ともいう。なお、第一のタグメント配列領域と第一のトランスポゾン末端配列領域(及び、必要に応じて含まれる第一アダプターの任意配列の領域)は、必ずしもその領域が明確に区別されている必要はなく、それらの一部の配列が重複するものであってもよい。
本発明のトランスポソームを構成する(b)第二アダプターは、第二のトランスポゾン末端配列を少なくとも含み、好ましくは第二のトランスポゾン末端配列からなる、ポリヌクレオチドである。前記第二のトランスポゾン末端配列は、前記第一のトランスポゾン末端配列の少なくとも一部と相補的な塩基配列を有することが好ましい。このように第一アダプターに含まれる第一のトランスポゾン末端配列と、第二アダプターに含まれる第二のトランスポゾン末端配列とが互いに相補的な塩基配列を含むことにより、第一アダプター及び第二アダプターは相補的な塩基配列を介して少なくとも一部の領域(好ましくは、断片化二本鎖DNAに最終的に転移させる方の末端側の領域)で二本鎖を形成し、断片化した二本鎖DNAの末端に付加され易くすることができる。
本発明において、第二アダプターに連結させるためのオリゴDNA(アディショナルオリゴと称する)は第二のタグメント配列を含む。アディショナルオリゴは、第一アダプターの塩基配列(特に、第一のタグメント配列以外の領域、好ましくは第一アダプターの任意配列の領域及び/又は第一のトランスポゾン末端配列の一部の領域)と相補的な数塩基(例えば、7bp以上、好ましくは10bp以上、より好ましくは12bp以上、さらに好ましくは15bp以上であり、上限は特に限定されないが、例えば30bp以下)の連続する塩基配列を有することが好ましい。なお、第二のタグメント配列の領域と、第一アダプターの塩基配列(特に、第一のタグメント配列以外の領域、好ましくは第一アダプターの任意配列の領域及び/又は第一のトランスポゾン末端配列の一部の領域)と相補的な塩基配列の領域は、必ずしもその領域が明確に区別されている必要はなく、それらの一部の配列が重複するものであってもよい。アディショナルオリゴが、このように第一アダプターの塩基配列(特に、第一のタグメント配列以外の領域、好ましくは第一アダプターの任意配列の領域及び/又は第一のトランスポゾン末端配列の一部の領域)と相補的な塩基配列を含むことにより、工程(ii)においてアディショナルオリゴは、第一アダプターの末端に連結されるのではなく第一アダプターに相補的に結合し易くなり、結果として、第一アダプターに相補的に結合している第二アダプターと近接して並び、第二アダプターの末端にアディショナルオリゴが連結し易くなる。
一つの実施形態において、アディショナルオリゴは、ロック核酸(LNA、Locked Nucleic Acid)又は架橋型核酸(BNA、Bridged Nucleic Acid)等の核酸アナログを含んでいてもよい。アディショナルオリゴを構成する塩基がこのようなLNA、BNA等の核酸アナログを含むことにより、第一アダプターとアディショナルオリゴのアニーリング温度を向上させることができ、それにより第一アダプターの塩基配列に対してアディショナルオリゴが相補的に結合し易くなるという利点がある。
本発明において使用されるトランスポゼースは特に制限されず、当該分野で公知の任意のトランスポゼース又はその変異体を使用することができる。例えば、Tn3トランスポゼース、Tn5トランスポゼース、Tn7トランスポゼース、Tn10トランスポゼース、MuAトランスポゼース、Sleeping Beautyトランスポゼース、piggyBacトランスポゼース、Himar1トランスポゼース、Mos1トランスポゼース、又はこれらの変異体(例えば、これらの野生型のアミノ酸配列において1又は数個(例えば、1~10個、好ましくは1~5個、より好ましくは1~3個程度)のアミノ酸が置換、欠失、挿入又は付加したアミノ酸配列を有する変異体)等が挙げられるがこれらに限定されない。なかでも、過剰活性型(hyperactive)変異体が知られているTn5トランスポゼース、MuAトランスポゼース、Sleeping Beautyトランスポゼース、piggyBacトランスポゼース、Himar1トランスポゼース、Mos1トランスポゼース、又はこれらの変異体(例えば、Picelli et al., Genome Res.24(12):2033-40, 2014、M. Zhou, and W.S. Reznikoff, J. Mol. Biol., 271, 362-373, 1997、T.W. Wiegand, and W.S. Reznikoff, J. Bacteriol., 174, 1229-1239, 1992、M.D. Weinreich, A. Gasch, and W.S. Reznikoff, Genes Dev., 8, 2363-2374, 1994、T.A. Naumann, and W.S. Reznikoff, Proc. Natl. Acad. Sci. U. S. A. 97, 8944-8949, 2000、I.Y. Goryshin, and W.S. Reznikoff, J. Biol. Chem. 273, 7367-7374, 1998に記載されているTn5トランスポゼース変異体、F. Voigt et al., Nat. Commun., Vol.7, No.11126, 2016に記載されているSleeping Beautyトランスポゼース変異体、K. Yusa et al., Proc. Natl. Acad. Sci. U. S. A., Vol.108 No.4 1531-1536, 2010に記載されているPiggyBacトランスポゼース変異体、D.J. Lampe et al., Proc. Natl. Acad. Sci. U. S. A., Vol.96, No.20, 11428-11433, 1999に記載されているHimar1トランスポゼース変異体、S. Germon et al., Genetica, Vol.137, No.265, 265-276, 2009に記載されているMos1トランスポゼース変異体、T.S. Rasila et al., Nucleic Acids Res. Vol.46, Issue 9, 4649-4661, 2018に記載されているMuAトランスポゼース変異体等)が好ましく、Tn5トランスポゼース又はこの変異体であるTn5型トランスポゼースがより好ましく、Tn5トランスポゼース変異体(高活性Tn5トランスポゼース)が特に好ましい。
また、本発明に用いるトランスポゾン末端配列は全長配列でなくてもよく、本発明の効果を奏する限り、トランスポゾン末端配列として公知の塩基配列の一部であってもよい。例えば、非転移鎖となるトランスポゾン末端配列は、少なくとも10bp(好ましくは少なくとも11bp、より好ましくは少なくとも12bp)の長さがあれば、本発明に使用できることが確認されている。例えば、非転移鎖となることが公知のトランスポゾン末端配列の塩基配列において3’末端側を欠失させた、少なくとも10bp(好ましくは少なくとも11bp、より好ましくは少なくとも12bp)の塩基長のトランスポゾン末端配列の一部を、本発明において好適に使用することができる。
5’-AGATGTGTATAAGAGACAG-3’(配列番号1)
などの配列が転移鎖となるトランスポゾン末端配列として使用され、またその相補鎖である
5’-CTGTCTCTTATACACATCT-3’(配列番号2)
などの配列が非転移鎖となるトランスポゾン末端配列として使用される。
尚、特許文献2に示されるように、トランスポゼースが二本鎖DNAに対して転移活性を示す際に使用するトランスポゾン末端配列はここに示した1通りではなく、使用するトランスポゼースが転移活性を示すトランスポゾン末端配列であれば、本発明において使用できる。
5’- TCGTCGGCAGCGTCCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3’(配列番号3)
を転移鎖となる第一アダプターとして使用し、
5’-CTGTCTCTTATACACATCT-3’(配列番号4)
を非転移鎖の第二アダプターとして使用した上で、
5’-TCAAGTAGCACACGAGCCGAGCCCACGAGAC-3’(配列番号5)をアディショナルオリゴとして使用することができる。尚、第二アダプター及びアディショナルオリゴの5’末端側はリン酸化修飾してもよい。また、アディショナルオリゴの3’末端側はOH基を修飾(例えば、リン酸基又はinverted dTで修飾)してもよい。
例えば、図3に示すように、
5’-TCGTCGGCAGCGTCAGCTAGCTAGCAGATGTGTATAAGAGACAG-3’(配列番号6)
を転移鎖となる第一アダプターとして使用し、
5’-CTGTCTCTTATACAC-3’(配列番号7)
を非転移鎖の第二アダプターとして使用した上で、
5’-ATCTGCTAGCTAGCTCCGAGCCCACGAGAC-3’(配列番号8)
をアディショナルオリゴとして使用することができる。尚、第二アダプター及びアディショナルオリゴの5’末端側はリン酸化修飾してもよい。また、アディショナルオリゴの3’末端側はOH基を修飾(例えば、リン酸基又はinverted dTで修飾)してもよい。
このように非転移鎖のアダプターが短い場合であっても、アディショナルオリゴと一緒になって安定したタグメント配列を形成し、転移鎖のアダプターと共に二本鎖DNAに付加することができる。
例えば、図4に示すように、
5’-CTCGTGTGCTACTTGATCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(配列番号9)
を転移鎖となる第一アダプターとして使用し、
5’-CTGTCTCTTATA-3’(配列番号10)
を非転移鎖の第二アダプターとして使用した上で、
5’-CACATCTCCGAGCCCACGAGACTCAAGTAGCACACGAG-3’(配列番号11)
をアディショナルオリゴとして使用することができる。尚、第二アダプター及びアディショナルオリゴの5’末端側はリン酸化修飾してもよい。また、アディショナルオリゴの3’末端側はOH基を修飾(例えば、リン酸基又はinverted dTで修飾)してもよい。
このような第一アダプター、第二アダプター、及びアディショナルオリゴを使用すると第一のタグメント配列と第二のタグメント配列が二本鎖領域に挟まれた環状構造を形成することになるが、本発明ではこのようなタグメント配列を二本鎖DNAに付加する態様であってもよい。このような環状構造とすることによって、二本鎖DNAの末端により近い位置に第一及び第二のタグメント配列が存在することになり、例えば、第一及び第二のタグメント配列からそれぞれに対応するプライマーを用いてPCR等を行う際により効率よく反応を進めることができるという利点がある。
本発明に用いるトランスポソームは、前記の(a)第一アダプター、(b)第二アダプター、及び(c)トランスポゼースを少なくとも含むことを特徴としている。トランスポゼースに第一及び第二のアダプターを付与する方法としては特に制限されないが、例えば非特許文献1の他、Picelli et al., Genome Res.24(12):2033-40, 2014などに記載されているような方法が挙げられる。
トランスポソームと二本鎖DNAを反応させる温度は、使用するトランスポゼース、第一アダプターの配列及び長さ、第二アダプターの配列及び長さ、並びにこれらの組み合わせ等に応じて適宜設定され得る。例えば、反応温度としては、30℃以上、65℃以下であることが好ましく、37℃以上、60℃以下であることがより好ましく、50℃以上、60℃以下であることがさらに好ましい。反応時間としては1分以上であることが好ましく、より好ましくは3分以上であることがより好ましく、5分以上であることがさらに好ましい。反応時間の上限は、特に限定されないが、例えば24時間以下、好ましくは12時間以下、より好ましくは6時間以下、更に好ましくは3時間以下であり得る。
アディショナルオリゴの第二アダプターへの連結方法は特に制限されないが、酵素反応によって行われることが好ましく、ポリヌクレオチドリガーゼを用いることがより好ましく、DNAリガーゼであることが特に好ましい。ポリヌクレオチドリガーゼを用いる場合、酵素の由来は特に制限されないが、T4ファージ由来のDNAリガーゼ、T3ファージ由来のDNAリガーゼ、T7ファージ由来のDNAリガーゼ、大腸菌由来のDNAリガーゼ又はその変異体、又はLucigen社が販売しているAmpligase(登録商標)Thermostable DNA ligaseのようなDNAリガーゼを使用することが好ましい。
またアディショナルオリゴと第二アダプターの間が1塩基以上離れている場合、DNAポリメラーゼなどの酵素反応によって間を埋めることができる(ギャップリペアー)。このギャップリペアーはポリヌクレオチドリガーゼによる連結と同時に行ってもよいし、別々に行ってもよい。ギャップリペアーして連結させる場合に用いられる酵素としては特に制限されないが、DNAポリメラーゼ及びポリヌクレオチドリガーゼを用いることが好ましい。DNAポリメラーゼとしては特に制限されないが、T4ファージ由来のDNAポリメラーゼ、大腸菌由来のDNAポリメラーゼI、又は大腸菌由来のDNAポリメラーゼIの断片であるクレノウ断片を用いることが好ましく、T4ファージ由来のDNAポリメラーゼなどのDNA鎖置換活性をほとんど示すことのない酵素を用いることがより好ましい。ポリヌクレオチドリガーゼとしては、酵素の由来は特に制限されないが、Lucigen社が販売しているAmpligase(登録商標)Thermostable DNA ligaseのような耐熱性のDNAリガーゼや、T4ファージ由来のDNAリガーゼ、大腸菌由来のDNAリガーゼを使用することが好ましい。
非転移鎖(例えば、第二アダプター)の二本鎖DNAへの連結方法は特に制限されないが、酵素反応によって行われることが好ましい。酵素反応によって非転移鎖のアダプターの二本鎖DNAへの連結を行う場合には、非転移鎖の5’末端をリン酸化することが好ましい。いくつかの実施形態では、トランスポゼースによる非転移鎖と二本鎖DNAの間は数塩基離れている場合があるため、ギャップリペアーを行うことが好ましい。
非転移鎖のアダプターと二本鎖DNAの間のギャップリペアーは、上記(ii)のアディショナルオリゴの第二アダプターへの連結と同時に行ってもよいし、別々に行ってもよい。また、上記(ii)アディショナルオリゴの第二アダプターへの連結を行う酵素と、(iii)非転移鎖のアダプターの二本鎖DNAへの連結を行う酵素は、同じ酵素を共通して使用してもよいし、別々の酵素を用いてもよい。ギャップリペアーして連結させる場合に用いられる酵素としては特に制限されないが、DNAポリメラーゼ及びポリヌクレオチドリガーゼを用いることが好ましい。DNAポリメラーゼとしては特に制限されないが、T4ファージ由来のDNAポリメラーゼ、大腸菌由来のDNAポリメラーゼI、又は大腸菌由来のDNAポリメラーゼIの断片であるクレノウ断片を用いることがさらに好ましく、またT4ファージ由来のDNAポリメラーゼなどのDNA鎖置換活性をほとんど示すことのない酵素を用いることがより好ましい。ポリヌクレオチドリガーゼとしては、酵素の由来は特に制限されないが、Lucigen社が販売しているAmpligase(登録商標)Thermostable DNA ligaseのような耐熱性のDNAリガーゼ、T4ファージ由来のDNAリガーゼ、又は大腸菌由来のDNAリガーゼを使用することが好ましい。
上記(ii)アディショナルオリゴの第二アダプターへの連結及び上記(iii)非転移鎖のアダプターの二本鎖DNAへの連結を行う際の反応条件は特に限定されず、両工程の反応条件は同じであっても、異なっていてもよい。例えば、両工程を同じ反応条件で行う場合、反応温度の上限は特に制限されないが、一例として、第一アダプターと第二アダプターとの相補的な配列部分(特に、第一のトランスポゾン末端配列と第二のトランスポゾン末端配列との相補的な配列部分)のTm値+15℃以下であり、かつ第一アダプターとアディショナルオリゴの相補的な配列部分(特に、第一のタグメント配列以外の領域(好ましくは第一アダプターの任意配列の領域及び/又は第一のトランスポゾン末端配列の一部の領域))とアディショナルオリゴ(第二のタグメント配列以外の領域)との相補的な配列部分)のTm値+15℃以下であることが好ましく、第一アダプターと第二アダプターの相補的な配列部分のTm値+10℃以下であり、かつ第一アダプターとアディショナルオリゴの相補的な配列部分のTm値+10℃以下であることがより好ましい。一実施形態では、45℃以下であることが好ましく、37℃以下であることがより好ましい。また、この場合の反応温度の下限は特に制限されないが、酵素の活性を保持しつつ、非特異的な連結を減らすため、4℃以上であることが好ましく、10℃以上であることがより好ましく、15℃以上であることがさらに好ましい。また酵素反応によって連結を行う場合、低温や熱による酵素活性の低下を免れるため、ポリヌクレオチドリガーゼ活性を10%以上、DNAポリメラーゼ活性を10%以上に保持できる温度範囲であることが好ましい。
反応時間は特に制限されないが、例えば、5分以上が好ましく、10分以上がより好ましい。反応時間の上限は特に限定されないが、例えば、1時間以下とすることができる。
本発明によってタグメント配列を付加した後(工程(i)、(ii)、及び(iii)の終了後)、各種用途に利用することができる。本発明では、Y字アダプターを付加する場合のように、アダプターダイマー等の不純物も生成しないため、精製することなく、そのまま各種用途に利用することができる。例えば、5’末端側と3’末端側にそれぞれ付加された異なるタグメント配列にそれぞれ結合するように設計されたプライマー対を利用して、PCR等の任意の核酸増幅法によってタグメント化された二本鎖DNAを増幅してもよい。またPCR等の核酸増幅法によって新たなタグメント配列を付加してもよい。PCR等の核酸増幅法で付加するタグメント配列としては、例えばillumina社などのNGS機器(例えばNextSeqTM、MiSeqTMシリーズなど)において使用するインデックス配列や、フローセル上にハイブリダイズさせるための配列(例えばillumina社のP5配列、P7配列)や、Oxford Nanopore Technologies社のロングリードシーケンサー(例えばMinION、GridION、PromethION)などで標的DNAの認識に必要となる配列などが挙げられるが、特に制限されない。PCR等の核酸増幅の方法は特に制限されない。
本発明では、調製されるライブラリーにストランド情報を保存してもよいし、保存しなくてもよい。ストランド情報を保存する場合の標的二本鎖DNAとしては、特に制限されない。例えばRNAからcDNAを合成した後、当該cDNAに相補的なDNAを合成する際にdUTPを含む反応液中で合成することで、片側の鎖にのみウラシルを含んだ二本鎖DNAを調製し、後の工程において、UNG(ウラシルDNAグリコシラーゼ)によって処理する、及び/又はウラシルを鋳型にできないDNAポリメラーゼ(例えば、ファミリーBのDNAポリメラーゼ)を用いてPCRを行う、などによってウラシルを含むDNA鎖を増幅できないようにすることができる。これによって、例えば、後に続くシーケンシング解析において、ストランド情報を保存しつつ、それぞれのDNA鎖を解析することができる。
本発明によれば、簡便にバイサルファイトシーケンス解析、特にT-WGBS(Tagmentation-based whole-genome bisulfite sequencin)解析を実施することもできる。例えば、第一アダプターの第一のタグメント配列領域におけるシトシン塩基と、アディショナルオリゴの第二のタグメント配列領域のシトシンをメチル化した上で、二本鎖DNAからライブラリーを生成し、バイサルファイト(亜硫酸水素塩)などで処理することで、二本鎖DNAにおけるシトシンのメチル化状態を検出することができる。このようなバイサルファイトシーケンス解析としては、例えば、Adey A. et al., Genome Res. 22,1139-1143,2012に記載の方法等を参照することにより実施できる。
従って、一つの実施形態において、本発明は、前記第一タグメント配列におけるシトシン塩基がメチル化されている前記第一アダプター及び前記第二タグメント配列におけるシトシン塩基がメチル化されている前記アディショナルオリゴを使用し、バイサルファイト解析に用いられる二本鎖DNAライブラリーを生成する方法であってもよく、この方法により少なくとも一方の鎖がメチル化修飾されている二本鎖DNAのメチル化解析を行うことができる。
本発明において、対象となる二本鎖DNA(標的二本鎖DNAなどとも呼ばれる)は特に制限されないが、細胞より抽出されたゲノムDNA、PCRなどの方法によって増幅された二本鎖DNA、RNAより合成された二本鎖DNAなどが挙げられる。また、二本鎖DNAは、一つの細胞、組織、器官、生物(例えば、動植物、真菌、細菌、ウイルス等)に由来する二本鎖DNAだけでなく、複数の細胞、組織、器官、生物に由来する二本鎖DNAであってもよい。本発明に使用される二本鎖DNAの量としては特に制限されない。
本発明は、5’末端側と3’末端側とに異なるタグメント配列を有する二本鎖DNAライブラリーを生成するためのキットの態様でもあり得る。当該キットは、(a)第一のタグメント配列及び第一のトランスポゾン末端配列を含む第一アダプターと、(b)前記第一のトランスポゾン末端配列の少なくとも一部と相補的な塩基配列を有する第二のトランスポゾン末端配列を含む第二アダプターと、(c)トランスポゼースとを含むトランスポソームを少なくとも含む。また、当該キットは、ポリヌクレオチドリガーゼ、DNAポリメラーゼなどの酵素も含んでいることが好ましい。これらの(a)~(c)成分、酵素、及び任意に含み得る他の添加剤は、各成分が任意に混合された混合物の形態であってもよく、各成分を別々に備えたキットの形態であってもよい。
まず実施例に先立って、トランスポゼースの準備として、Hyperactive Tn5(Picelli et al., Genome Res.24(12):2033-40, 2014に記載されているTn5トランスポゼース変異体(E54K/L372P変異体))のC末端をヒスチジンタグにより修飾したタンパク質をコードする遺伝子を発現プラスミド中に挿入し、大腸菌DH5α株に形質転換した。この大腸菌株を30℃にて培養後、50 mM HEPES-KOH(pH 8.0)、100 mM NaCl中に懸濁し、超音波処理を行い破砕した。そしてこの破砕液をTALON(商標) Affinity Resin(ClonTech社)用いてアフィニティークロマトグラフィーに供し、結合させた後、50 mM HEPES-KOH(pH 8.0)、100 mM NaCl、10 mM imidazoleで洗浄し、50 mM HEPES-KOH(pH 8.0)、100 mM NaCl、150 mM imidazoleで溶出することで精製したHyperactive Tn5を得た。 この精製したHyperactive Tn5を50 mM HEPES-KOH(pH 7.5)、100 mM NaCl、1 mM ジチオトレイトール(DTT)、50%グリセロール中で透析し、バッファー置換し、タンパク濃度を100μg/mLに透析バッファーで希釈したものを「精製Tn5溶液」として調製した。 またトランスポゼースに供与するアダプターを調製するため、まず以下の表1に示す3組のアダプターを用意した。
そして精製Tn5溶液24μLに対し、各アダプター溶液(1、2、3)のいずれか1種を6μL添加し、25℃で60分間静置することで、それぞれのアダプターを供与した後、透析バッファーで100倍希釈し、「Tn5(アダプター1)」、「Tn5(アダプター2)」、「Tn5(アダプター3)」を調製した。
またネガティブコントロールとして、下記表2に示す第二アダプター(非転移鎖)の5’側がリン酸化されておらず、DNAリガーゼなどによるアディショナル反応において標的二本鎖DNAに結合できない3組のアダプターセットにおいても同様の作業を行い、「Tn5(アダプター1NC)」、「Tn5(アダプター2NC)」、「Tn5(アダプター3NC)」を調製した。
尚、調製した「Tn5(アダプター1)」、「Tn5(アダプター2)」、「Tn5(アダプター3)」、「Tn5(アダプター1NC)」、「Tn5(アダプター2NC)」、「Tn5(アダプター3NC)」を用いてヒトゲノムDNAの分解を評価することによる活性測定を行い、いずれも活性を示すことを確認した。またアダプターの5’側リン酸化の有無は、トランスポソームの転移活性に影響を及ぼさなかった。
さらに、これらのアダプターセットとともに使用する表3に示したアディショナルオリゴを10μMとなるように調製した。
また反応用バッファーとして、Tn5反応用バッファー(20 mM Tris-HCl (pH 7.5)、15% ジメチルホルムアミド、10 mM MgCl2)、アディショナル反応用バッファー(300 mM Tris-HCl(pH8.0)、40 mM MgCl2、100 mM (NH4)2SO4、12 mM EDTA(pH8.0)、1 mM NAD、0.05% BSA)を調製した。
本実施例では、本発明によって標的二本鎖DNAの断片化、及び5’末端側と3’末端側とに異なる配列を付加するタグメント化が効率的に行われ、NGS用ライブラリーの調製が可能であるか検討するため、以下の実験を行った。
上記の調製法で得られたTn5(アダプター)を用い、HeLa S3細胞より精製したゲノムDNA(1 ng)を標的二本鎖DNAとして、まず表4の組成でTn5反応液を調製した。
表6の組成でPCR反応液を調製し、表7の反応サイクルでPCRを行い、インデックス配列及びillumina社NGS用のP5、P7配列の付加を行った。
これらの結果から、本発明によって効率的に断片化、タグメント化が行われており、イルミナ社NGS用のライブラリーの調製が可能となったことがわかる。またネガティブコントロールではほとんど収量が得られていないことから、アディショナルオリゴは非転移鎖である第二アダプターに連結され、第二アダプターは標的二本鎖DNAに連結されることで反応が起こることが示された。
本実施例では、本発明によってRNA由来の二本鎖cDNAを標的とした断片化、タグメント化が効率的に行われ、NGS用ライブラリーの調製が可能であるか検討し、さらにストランド情報の保持が可能となるか検討するため、以下の実験を行った。
まずHeLa S3細胞よりRNeasy Plus Mini Kit(QIAGEN社)を用いて精製したRNA 1 ngからcDNAを合成し、このcDNA溶液9 μLに表8に示した2ndストランド合成液を添加し、表9に示したサイクルで反応させ、RNA由来二本鎖DNAを得た。
表6の組成でPCR反応液を調製し、表7の反応サイクルでPCRを行い、インデックス配列及びillumina社NGS用のP5、P7配列の付加を行った。なお、このPCR反応液では、ウラシルを含む塩基配列を増幅できないファミリーBに属するKOD(Thermococcus kodakarensis)由来のDNAポリメラーゼを使用した。
実施例1、実施例2において得られた二本鎖DNAライブラリーのうち、ゲノムDNA又はRNA由来二本鎖DNA(dUTPなし、又はあり)をTn5(アダプター1)、Tn5(アダプター2)、Tn5(アダプター3)で処理して調製したライブラリーを使用して、Miseq Reagent Kit v3及びMiseqを用いてNGS解析を行った。尚、アダプター1及びアダプター2を解析する場合には、シーケンスプライマーとして以下のカスタムプライマーを既定のシーケンスプライマー液に添加した。アダプター3の解析は、Miseq Reagent Kit v3に添付されているRead1プライマー、Read2プライマー、Index1 Readプライマーを使用した。
アダプター1のためのRead1プライマー:
5’-GCGTCCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3’(配列番号12)
アダプター1のためのRead2プライマー:
5’-CTCGGCTCGTGTGCTACTTGAAGATGTGTATAAGAGACAG-3’(配列番号13)
アダプター1のためのIndex1 Readプライマー:
5’-TCAAGTAGCACACGAGCCGAGCCCACGAGAC-3’(配列番号14)
アダプター2のためのRead1プライマー:
5’-GGCAGCGTCAGCTAGCTAGCAGATGTGTATAAGAGACAG-3’(配列番号15)
アダプター2のためのRead2プライマー:
5’-GTGGGCTCGGAGCTAGCTAGCAGATGTGTATAAGAGACAG-3’(配列番号16)
アダプター2のためのIndex1 Readプライマー:
5’-ACATCTGCTAGCTAGCTCCGAGCCCACGAGAC-3’(配列番号17)
CLC Genomics workbenchを用いて、解析されたNGSデータについてヒトゲノムへのマッピング率及びストランド率を解析した。その結果を表11に示す。
Claims (14)
- 5’末端側と3’末端側とに異なるタグメント配列を有する二本鎖DNAライブラリーを生成する方法であって、以下の工程(i)~(iii):
(i)(a)第一のタグメント配列及び第一のトランスポゾン末端配列を含む第一アダプターと、
(b)前記第一のトランスポゾン末端配列の少なくとも一部と相補的な塩基配列を有する第二のトランスポゾン末端配列を含む第二アダプターと、
(c)トランスポゼースと
を含むトランスポソームによって二本鎖DNAを断片化し、該二本鎖DNAの5’末端又は3’末端に、前記第一アダプター及び前記第二アダプターのいずれか一方のアダプターを転移鎖として連結させる工程、
(ii)第二のタグメント配列を含むアディショナルオリゴを前記第二アダプターに連結させる工程、及び
(iii)前記第一アダプター及び前記第二アダプターのうち、二本鎖DNAに連結していない非転移鎖のアダプターを、該二本鎖DNAの5’末端及び3’末端のうち前記工程(i)において転移鎖のアダプターを連結させていない末端に連結させる工程、
を含み、前記工程(ii)は、前記工程(iii)の前、後、又は同時に実施される、方法。 - 前記第一アダプターが、前記第一のトランスポゾン末端配列よりも5’末端側に第一のタグメント配列を含み、トランスポゼースによって前記二本鎖DNAの5’末端に連結する転移鎖となる、請求項1記載の方法。
- 前記アディショナルオリゴが、前記第一アダプターの塩基配列の一部に相補的な塩基配列を含む、請求項1に記載の方法。
- 前記トランスポゼースが、高活性Tn5トランスポゼースであり、前記第一及び第二のトランスポゾン末端配列がTn5型のトランスポゾン末端配列である、請求項1に記載の方法。
- 前記工程(ii)において、DNAリガーゼにより、アディショナルオリゴを第二アダプターに連結させる、請求項1に記載の方法。
- 前記工程(iii)において、DNAポリメラーゼ及びDNAリガーゼにより、前記二本鎖DNAに連結していない非転移鎖のアダプターを前記二本鎖DNAに連結させる、請求項1に記載の方法。
- 前記工程(iii)において、二本鎖DNAに連結していない非転移鎖のアダプターが5’末端側がリン酸化修飾されている第二アダプターであり、前記第二アダプターを前記二本鎖DNAの3’末端に連結させる、請求項1に記載の方法。
- 前記工程(i)において、前記二本鎖DNAの5’末端に第一アダプターを転移鎖として連結させ、前記工程(ii)において、5’末端側がリン酸化修飾されているアディショナルオリゴを第二アダプターの3’末端に連結させる、請求項1に記載の方法。
- 前記工程(i)において、前記二本鎖DNAの5’末端に第一アダプターを転移鎖として連結させ、前記工程(ii)において、3’末端側のOH基が修飾されているアディショナルオリゴを第二アダプターの3’末端に連結させる、請求項1に記載の方法。
- 前記OH基の修飾が、リン酸基又はinverted dTによる修飾である、請求項9に記載の方法。
- ストランド情報を保持している二本鎖DNAライブラリーを生成する、請求項1に記載の方法。
- 前記二本鎖DNAの少なくとも一方の鎖が修飾されている、請求項1に記載の方法。
- 前記修飾がメチル化修飾である、請求項12に記載の方法。
- 前記第一タグメント配列におけるシトシン塩基がメチル化されている前記第一アダプター及び前記第二タグメント配列におけるシトシン塩基がメチル化されている前記アディショナルオリゴを使用し、バイサルファイト解析に用いられる二本鎖DNAライブラリーを生成する、請求項12に記載の方法。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP23846314.5A EP4570971A1 (en) | 2022-07-25 | 2023-07-19 | Fragmentation and tagmentation method for next-generation sequence analysis and like |
| CN202380055698.4A CN119654454A (zh) | 2022-07-25 | 2023-07-19 | 用于下一代测序分析等的片段化及标签片段化方法 |
| JP2024537625A JPWO2024024583A1 (ja) | 2022-07-25 | 2023-07-19 |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022-118079 | 2022-07-25 | ||
| JP2022118079 | 2022-07-25 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2024024583A1 true WO2024024583A1 (ja) | 2024-02-01 |
Family
ID=89706283
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2023/026339 Ceased WO2024024583A1 (ja) | 2022-07-25 | 2023-07-19 | 次世代シーケンサー解析等のための断片化及びタグメント化方法 |
Country Status (4)
| Country | Link |
|---|---|
| EP (1) | EP4570971A1 (ja) |
| JP (1) | JPWO2024024583A1 (ja) |
| CN (1) | CN119654454A (ja) |
| WO (1) | WO2024024583A1 (ja) |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8563478B2 (en) | 2005-11-01 | 2013-10-22 | Illumina Cambridge Limited | Method of preparing libraries of template polynucleotides |
| US10287574B2 (en) | 2011-01-28 | 2019-05-14 | Illumina, Inc. | Oligonucleotide replacement for di-tagged and directional libraries |
| JP2020510401A (ja) * | 2017-02-21 | 2020-04-09 | イルミナ インコーポレイテッド | リンカーを用いた固定化トランスポソームを使用するタグメンテーション |
| JP2022516821A (ja) * | 2019-01-11 | 2022-03-03 | イルミナ ケンブリッジ リミテッド | 複合体が表面結合されたトランスポソーム複合体 |
-
2023
- 2023-07-19 JP JP2024537625A patent/JPWO2024024583A1/ja active Pending
- 2023-07-19 CN CN202380055698.4A patent/CN119654454A/zh active Pending
- 2023-07-19 EP EP23846314.5A patent/EP4570971A1/en active Pending
- 2023-07-19 WO PCT/JP2023/026339 patent/WO2024024583A1/ja not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8563478B2 (en) | 2005-11-01 | 2013-10-22 | Illumina Cambridge Limited | Method of preparing libraries of template polynucleotides |
| US10287574B2 (en) | 2011-01-28 | 2019-05-14 | Illumina, Inc. | Oligonucleotide replacement for di-tagged and directional libraries |
| JP2020510401A (ja) * | 2017-02-21 | 2020-04-09 | イルミナ インコーポレイテッド | リンカーを用いた固定化トランスポソームを使用するタグメンテーション |
| JP2022516821A (ja) * | 2019-01-11 | 2022-03-03 | イルミナ ケンブリッジ リミテッド | 複合体が表面結合されたトランスポソーム複合体 |
Non-Patent Citations (13)
| Title |
|---|
| ADEY A. ET AL., GENOME RES., vol. 22, 2012, pages 1139 - 1143 |
| D.J. LAMPE ET AL., PROC. NATL. ACAD. SCI. U.S.A., vol. 96, no. 20, 1999, pages 11428 - 11433 |
| F. VOIGT ET AL., NAT. COMMUN., vol. 7, no. 11126, 2016 |
| I.Y. GORYSHINW.S. REZNIKOFF, J. BIOL. CHEM., vol. 273, 1998, pages 7367 - 7374 |
| K. YUSA ET AL., PROC. NATL. ACAD. SCI. U.S.A., vol. 108, no. 4, 2010, pages 1531 - 1536 |
| M. ZHOUW.S. REZNIKOFF, J. MOL. BIOL., vol. 271, 1997, pages 362 - 373 |
| M.D. WEINREICHA. GASCHW.S. REZNIKOFF, GENES DEV., vol. 8, 1994, pages 2363 - 2374 |
| PICELLI ET AL., GENOME RES., vol. 24, no. 12, 2014, pages 2033 - 40 |
| S. GERMON ET AL., GENETICA, vol. 137, no. 265, 2009, pages 265 - 276 |
| T.A. NAUMANNW.S. REZNIKOFF, PROC. NATL. ACAD. SCI. U. S. A., vol. 97, 2000, pages 8944 - 8949 |
| T.S. RASILA ET AL., NUCLEIC ACIDS RES., vol. 46, 2018, pages 4649 - 4661 |
| T.W. WIEGANDW.S. REZNIKOFF, J. BACTERIOL., vol. 174, 1992, pages 1229 - 1239 |
| WANG ET AL., NATURE PROTOCOLS, vol. 8, no. 10, 2013, pages 2022 - 2032 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN119654454A (zh) | 2025-03-18 |
| EP4570971A1 (en) | 2025-06-18 |
| JPWO2024024583A1 (ja) | 2024-02-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6594955B2 (ja) | シントン形成 | |
| JP6886962B2 (ja) | Rnaシークエンシングライブラリーを生成する方法 | |
| CN105283558A (zh) | 使用热稳定的TthPrimPol扩增和测序的方法 | |
| JP2023540797A (ja) | 塩基編集酵素 | |
| JP7025552B2 (ja) | 無細胞系でdnaを編集する方法 | |
| JP6249947B2 (ja) | アニオン性ポリマーを含む、rt−pcr用組成物及び方法 | |
| KR20160034305A (ko) | 리가제-연관 핵산 원형화 및 증폭 | |
| JP2003512075A (ja) | 転位および組換えを使用して核酸分子を操作および配列決定する方法 | |
| US20240368658A1 (en) | Demand Synthesis of Polynucleotide Sequences | |
| CN106661636A (zh) | 衔接子连接的扩增子的制备 | |
| JP7699390B2 (ja) | 一本鎖dnaポリヌクレオチドを生成するための方法および生成物 | |
| US20230348877A1 (en) | Base editing enzymes | |
| WO2024024583A1 (ja) | 次世代シーケンサー解析等のための断片化及びタグメント化方法 | |
| EP3673084B1 (en) | Method for introducing mutations | |
| EP4446431A2 (en) | Methods and kits for highly multiplex single primer extension | |
| JP4575338B2 (ja) | 相同組換えによる目的遺伝子のクローニング及び発現方法 | |
| JP5129498B2 (ja) | 核酸クローニング法 | |
| JP2003500063A (ja) | マグネシウム存在下におけるバチルスステアロテルモフィルス由来dnaポリメラーゼの逆転写活性 | |
| WO2021058145A1 (en) | Phage t7 promoters for boosting in vitro transcription | |
| US20240336913A1 (en) | Method for producing a population of symmetrically barcoded transposomes | |
| CN120608036A (zh) | 热稳定单链dna/rna连接酶及其应用 | |
| HK40075402A (en) | Method for introducing mutations | |
| KR20240004213A (ko) | 신규 중합효소 및 이의 용도 | |
| JP2008109874A (ja) | Dnaの自己環状化用酵素組成物 | |
| HK40031786B (en) | Method for introducing mutations |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 23846314 Country of ref document: EP Kind code of ref document: A1 |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2024537625 Country of ref document: JP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 202380055698.4 Country of ref document: CN |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2023846314 Country of ref document: EP |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2023846314 Country of ref document: EP Effective date: 20250225 |
|
| WWP | Wipo information: published in national office |
Ref document number: 202380055698.4 Country of ref document: CN |
|
| WWP | Wipo information: published in national office |
Ref document number: 2023846314 Country of ref document: EP |