WO2025206046A1 - 所望のヌクレオチド配列をノックインする方法、ノックイン細胞の製造方法、及びキット - Google Patents
所望のヌクレオチド配列をノックインする方法、ノックイン細胞の製造方法、及びキットInfo
- Publication number
- WO2025206046A1 WO2025206046A1 PCT/JP2025/012229 JP2025012229W WO2025206046A1 WO 2025206046 A1 WO2025206046 A1 WO 2025206046A1 JP 2025012229 W JP2025012229 W JP 2025012229W WO 2025206046 A1 WO2025206046 A1 WO 2025206046A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- amino acid
- dna
- domain
- acid sequence
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
Definitions
- the technique of inserting or substituting a desired nucleotide sequence into a specific region of target DNA, such as genomic DNA, is called “knock-in.”
- One known method involves using the CRISPR-Cas system to cut double-stranded DNA, then utilizing a repair mechanism called homology-directed repair (HDR) at the break to insert or replace donor DNA containing the desired nucleotide sequence at or near the break.
- HDR homology-directed repair
- the donor DNA used is single-strand DNA (ssDNA) that has sequences (homology arms) at the 5' and 3' ends of the nucleotide sequence to be inserted that are homologous to the surrounding sequences of the target region to which it is to be inserted, or, if the sequence to be inserted is long, a donor plasmid containing the nucleotide sequence of such single-strand DNA is used.
- ssDNA single-strand DNA
- a donor plasmid containing the nucleotide sequence of such single-strand DNA is used.
- Non-Patent Document 2 reports that efficient knock-in using the CRISPR-Cas9 system is possible even in cultured cells by using lssDNA (long single strand DNA: lssDNA) as donor DNA, which has homology arms of approximately 500 bases or more at both ends. Furthermore, while lssDNA is difficult to prepare and its use has been limited, for example, Inoue et al., Cells, 2021, 10, 1076. https://doi.org/10.3390/cells10051076 (Non-Patent Document 3) reports a simpler and less expensive method for preparing lssDNA.
- lssDNA long single strand DNA: lssDNA
- knock-in techniques using double-stranded DNA cleavage as described above have the problem of causing unintended insertions or deletions of nucleotide sequences.
- Techniques that do not use double-stranded DNA cleavage include, for example, a technique described by Nakajima et al., Genome Research, 28, 2018, pp.
- Non-Patent Document 4 in which a donor plasmid is combined with a nickase-type Cas9 (nCas9, Cas9D10A) that partially lacks the double-stranded DNA cleavage activity of Cas9, and the nucleotide sequence of the donor plasmid is inserted at the site of single-stranded DNA cleavage (nicking) caused by nCas9 (combination of single nicks in the target gene and donor plasmid: SNGD).
- nickase-type Cas9 nickase-type Cas9
- TALEN Transcription activator-like effector nuclease
- FokI FrokI nuclease domain
- TALE Transcription activator-like effector nuclease
- the TALEs of a pair of TALENs bind to opposite strands of the target DNA, and the FokI nuclease domains form a dimer with each other, thereby achieving site-specific double-stranded DNA cleavage activity (nuclease activity).
- FokI nuclease domain there have been reports of linking two FokI nuclease domains and binding them to a zinc finger array (ZF) or TALE to induce double-stranded DNA breaks (Minczuk et al., Nucleic Acids Research, 36(12), 2008, pp. 3926-3938 (Non-Patent Document 5)), and of inducing single-stranded DNA breaks (nicks) using a construct with a mutation in one of the FokI nuclease domains (Yan Luo et al., Scientific Reports, 6:20657, 2016, doi: 10.1038/srep20657 (Non-Patent Document 6)).
- ND1 domain nuclease domain 1
- ND1 domain nuclease domain 1
- an artificial nucleic acid cleaving enzyme that includes this ND1 domain and a DNA-binding domain such as a ZF or TALE (WO 2020/045281 (Patent Document 1)).
- ND1 domain nuclease domain 1 (ND1 domain) described in Patent Document 1, which is a substitute for the FokI nuclease domain, into a dND1 domain with a nuclease activity-deficient mutation and by combining ND1 and dND1 to form a dimer
- a nicking enzyme nickase active form
- nCas9 nickase-type Cas9
- Non-Patent Document 6 in which the FokI nuclease domain was modified, it would be expected that a nick would be introduced into the strand recognized and bound by a domain that has not been mutated to eliminate nuclease activity.
- ssDNA single-stranded DNA
- a method for inserting a donor sequence into a target region on a target DNA comprising: a donor DNA that is a single-stranded DNA containing a nucleotide sequence arranged in the following order from the 5' side: a 5' side homology arm sequence, a donor sequence, and a 3' side homology arm sequence; a site-specific nicking system comprising a first fusion protein comprising a first DNA-binding domain and an ND1 domain, and a second fusion protein comprising a second DNA-binding domain and a dND1 domain, wherein the ND1 domain and the dND1 domain form a dimer to introduce a nick within or near the target region; contacting the target DNA with The ND1 domain comprises the following (a) to (c): (a) a polypeptide comprising the amino acid sequence set forth in SEQ ID NO: 40; (b) a polypeptide comprising an amino acid sequence
- the present invention makes it possible to provide a method for specifically and highly efficiently inserting (knock-in) a desired nucleotide sequence into a target region using only a protein, a method for producing cells in which a desired nucleotide sequence has been inserted into a target region (knock-in cells), and kits for use in these methods.
- FIG. 1 is a conceptual diagram showing the positional relationship between the PAM sequences on the target genes APC (a) and Rosa26 (b), the cleavage points by nCas9 (D10A), and each TALE and guide RNA used in Test Example 1.
- This graph shows the EGFP fluorescence intensity (RFI) when the SSA assay reporter plasmid EGxRosa26xFP, which is equipped with Rosa26 as the target gene, is treated with a combination of TALE47(Rosa26-L)-ND1 and TALE47(Rosa26-R)-ND1, a combination of TALE47(Rosa26-L)-dND1 and TALE47(Rosa26-R)-ND1, or a combination of TALE47(Rosa26-L)-ND1 and TALE47(Rosa26-R)-dND1, or a combination of TALE47(Rosa26-L)-ND1 and TALE47(Rosa26-R)-dND1, or these, further treated with nCas9(D10A) and guide RNA (Rosa26_gRNA-C or Rosa26_gRNA-B).
- RPI EGFP fluorescence intensity
- Fluorescence images of each EGFP in the combinations shown in Table 9 ((a): Mock, (b) SNGD, (c) dND1+ND1+PD, (d) dND1+ND1+lssDNA). This is a graph showing the average number of EGFP-positive cells/total number of cells (%) for each of four wells obtained from the fluorescent images of each EGFP in the combinations shown in Table 9 ((a): Mock, (b) SNGD, (c) dND1+ND1+PD, (d) dND1+ND1+lssDNA).
- FIG. 10 is a graph showing the relative value (relative activity) and standard deviation of the average value of the number of EGFP-positive cells/total number of cells (%) for four wells obtained from the fluorescence images of each EGFP for the combinations shown in Table 10 ((a): PD-0 (base), (b): 20 ng lssDNA, (c): 40 ng lssDNA, (d): 60 ng lssDNA), where (a) the base value is set to 1.
- the nicking enzyme of the present invention is an artificial nicking enzyme comprising two domains, ND1 and dND1, and has single-stranded DNA cleavage activity (nickase activity) that cleaves only one strand of double-stranded DNA.
- ND1 domain The "ND1 domain” according to the present invention is nuclease domain 1, which is one of the nuclease domains discovered by the present inventors through screening for homologous sequences with 35 to 70% identity to the FokI nuclease domain (Patent Document 1).
- a typical nucleotide sequence of the ND1 domain is (a) a polypeptide comprising the amino acid sequence set forth in SEQ ID NO: 40, more preferably a polypeptide consisting of the amino acid sequence set forth in SEQ ID NO: 40.
- the amino acid sequence set forth in SEQ ID NO: 40 has 70% identity with the amino acid sequence of the FokI nuclease domain.
- ND1 domain of the present invention includes polypeptides containing an amino acid sequence highly homologous to the amino acid sequence set forth in SEQ ID NO: 40, as long as they have double-stranded DNA cleavage activity (nuclease activity) when two molecules of the ND1 domain are used.
- nuclease domains include, for example, ND1 domains derived from other bacteria and modified ND1 domains (natural mutants and artificial mutants).
- embodiments of the "ND1 domain" of the present invention also include (b) a polypeptide comprising an amino acid sequence in which one or more amino acids have been substituted, deleted, inserted, and/or added in the amino acid sequence set forth in SEQ ID NO: 40, and more preferably a polypeptide consisting of said amino acid sequence.
- a polypeptide comprising an amino acid sequence in which one or more amino acids have been substituted, deleted, inserted, and/or added in the amino acid sequence set forth in SEQ ID NO: 40, and more preferably a polypeptide consisting of said amino acid sequence.
- at least the amino acids corresponding to positions 66 and 83 of the amino acid sequence set forth in SEQ ID NO: 40 must be aspartic acid.
- substituted, deleted, inserted, and/or added amino acid sequence refers to an amino acid sequence in which amino acids (amino acid residues) in the amino acid sequence have been substituted, deleted, inserted, or added, or an amino acid sequence in which two or more of these have been combined.
- “multiple” refers to an integer of 30, 25, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, or 2.
- “one or multiple” preferably refers to 1 to 30, 1 to 25, or 1 to 20 amino acid residues (e.g., 1 to 10, 1 to 5, 1 to 3, or 2 or less).
- embodiments of the "ND1 domain” according to the present invention include (c) a polypeptide comprising an amino acid sequence having 90% or more homology with the amino acid sequence set forth in SEQ ID NO: 40, and more preferably a polypeptide consisting of said amino acid sequence.
- a polypeptide comprising an amino acid sequence having 90% or more homology with the amino acid sequence set forth in SEQ ID NO: 40, and more preferably a polypeptide consisting of said amino acid sequence.
- the sequence is not a nuclease activity-deficient mutant sequence described below, and therefore at least the amino acids corresponding to positions 66 and 83 of the amino acid sequence set forth in SEQ ID NO: 40 must be aspartic acid.
- amino acid sequence homology when referring to amino acid sequence homology, it means that when a control amino acid sequence (e.g., the amino acid sequence of the polypeptide (a)) and a target amino acid sequence (e.g., the amino acid sequence of the polypeptide (c)) are aligned using amino acid sequence analysis software, etc., the amino acid in the target amino acid sequence (target amino acid) that is at the same position as an amino acid in the control amino acid sequence (control amino acid) may be the same amino acid as the control amino acid, or an amino acid with the same properties as the control amino acid.
- the target amino acid is the same amino acid as the control amino acid.
- Groups of amino acids with similar properties are well known in the art to which this invention pertains, and can be classified into, for example, acidic amino acids (aspartic acid and glutamic acid); basic amino acids (lysine, arginine, histidine); and neutral amino acids can be classified into amino acids with hydrocarbon chains (glycine, alanine, valine, leucine, isoleucine, proline), amino acids with hydroxy groups (serine, threonine), amino acids containing sulfur (cysteine, methionine), amino acids with amide groups (asparagine, glutamine), amino acids with imino groups (proline), and amino acids with aromatic groups (phenylalanine, tyrosine, tryptophan).
- acidic amino acids aspartic acid and glutamic acid
- basic amino acids lysine, arginine, histidine
- neutral amino acids can be classified into amino acids with hydrocarbon chains (glycine, alanine, valine, leucine, iso
- sequence homology and identity are determined by comparing two sequences aligned to maximize sequence identity. Methods for determining sequence homology or identity (%) are known to those of skill in the art. Algorithms for achieving optimal alignment and sequence identity can be any algorithm known to those of skill in the art (e.g., the BLAST algorithm, the FASTA algorithm, etc.), and sequence homology or identity of amino acid sequences can be determined using sequence analysis software such as BLASTP or FASTA.
- the one or more amino acid residues are preferably 1 to 30, 1 to 25, or 1 to 20 (e.g., 1 to 10, 1 to 5, 1 to 3, or 2 or less).
- the homology with the amino acid sequence of polypeptide (da) may be 90% or more, but is preferably 95% or more (e.g., 96% or more, 97% or more, 97.5% or more, 98% or more, 98.5% or more, 99% or more, 99.5% or more, or 99.8% or more).
- a fusion product in which "TALE-L ⁇ domain to be confirmed” is linked in this order from the N-terminus, and a fusion product in which "TALE-R ⁇ amino acid sequence set forth in SEQ ID NO: 40 (ND1 domain)" is linked in this order from the N-terminus can be expressed in cells, and confirmation can be made by determining whether double-stranded DNA cleavage occurs in the target DNA corresponding to the TALE.
- an SSA assay system targeting a reporter gene on a plasmid e.g., an EGFP gene with a TALE recognition sequence inserted
- nickase activity a molecule containing two ND1 domains and two dND1 domains has the activity of cleaving single-stranded DNA (nickase activity) can be appropriately confirmed using methods known to those skilled in the art or methods similar thereto.
- TALE Transcription activator-like effector nuclease
- TALE Transcription activator-like effector nuclease
- the "TALE” according to the present invention contains at least an N-terminal domain and a TALE repeat domain, and may further contain a C-terminal domain.
- a TALE repeat domain is composed of multiple, for example, 10 to 30, preferably 13 to 25, and more preferably 15 to 20 tandem repeats (TALE repeats) of TALE sequences that form a right-handed superhelical coil.
- a typical TALE repeat unit (one TALE sequence) consists of 33 to 35 amino acids, and recognizes specific bases in DNA via repeat variable residues (RVD) consisting of two amino acid residues at the 12th and 13th positions.
- RVDs repeat variable residues
- Examples of RVDs that specifically recognize bases include HD, which recognizes C; NG, which recognizes T; NI, which recognizes A; NN, which recognizes G or A; and NS, which recognizes A, C, G, or T.
- the TALE sequences of the TALEs of the present invention may each be appropriately modified from their native amino acid sequences, so long as the TALE repeat domain can recognize and bind to the TALE recognition sequence.
- the TALE sequences may each independently have a different RVD position, or one or more amino acid residues other than the RVD (e.g., 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4 or less, more preferably 3 or less or 2 or less) may be substituted, deleted, inserted, and/or added, and the two amino acid residues at positions 12 and 13 of the RVD may be substituted with other amino acid residues to enhance specificity for A, T, C, and G.
- one or more amino acid residues other than the RVD e.g., 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4 or less, more preferably 3 or less or 2 or less
- the N-terminal domain of the TALE of the present invention can be a naturally occurring amino acid sequence (e.g., the amino acid sequence of the N-terminal domain contained in Addgene's pTALETF_v2 (ID: 32185-32188)). However, as long as the N-terminal domain does not have a significant negative effect on the function of each fusion protein of the present invention (e.g., binding ability to the TALE recognition sequence, nickase activity, etc.), it may be modified as appropriate from the naturally occurring amino acid sequence.
- the chain length of such an N-terminal domain is preferably 49 to 287 amino acid residues, more preferably 80 to 200 amino acid residues, and even more preferably 120 to 180 amino acid residues.
- one or more amino acid residues may be substituted, deleted, inserted, and/or added.
- the C-terminal domain of the TALE may be a naturally occurring amino acid sequence with a portion of the C-terminal amino acid sequence removed.
- the chain length of such a C-terminal domain is preferably 1 to 200 amino acid residues, more preferably 5 to 150 amino acid residues, even more preferably 10 to 125 amino acid residues, and even more preferably 10 to 100 amino acid residues.
- a preferred embodiment of the TALE of the present invention is the Platinum TALEN (JP 2015-33365 A), in which amino acids at two specific positions in one TALE repeat unit are changed every four TALE repeat units.
- the zinc finger array of the present invention represents the DNA-binding domain of a zinc finger nuclease (ZFN) that contains a DNA-binding domain and a nuclease domain.
- ZFN zinc finger nuclease
- a zinc finger array typically comprises 2 to 15, preferably 3 to 8, and more preferably 4 to 6, zinc finger proteins, which are linked directly or via linkers.
- Each zinc finger protein contains one or more zinc atoms and a helix structure that recognizes specific bases, and each zinc finger protein recognizes three specific bases in DNA.
- the zinc finger array of the present invention is not particularly limited as long as it can recognize and bind to a DNA-binding domain recognition sequence, and may be modified as appropriate. For example, it may be modified by substitution, deletion, insertion, and/or addition of one or more amino acid residues (e.g., 50 or less, 30 or less, 20 or less, 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4 or less, and more preferably 3 or less or 2 or less).
- one or more amino acid residues e.g., 50 or less, 30 or less, 20 or less, 10 or less, 9 or less, 8 or less, 7 or less, 6 or less, preferably 5 or less or 4 or less, and more preferably 3 or less or 2 or less.
- the zinc finger array of the present invention is designed to recognize a nucleotide sequence or its complementary sequence located on the 5' or 3' side of a target site in a target DNA, preferably via a spacer of 1 to 10 bases, respectively.
- the zinc finger array recognition sequence or its complementary sequence recognized by the zinc finger array is a nucleotide sequence located on the 5' or 3' side of the target site, respectively, via a spacer of 1 to 10 bases.
- each DNA-binding domain and the ND1 domain or dND1 domain may be linked directly or via a linker.
- linker There are no particular limitations on the length or type of the linker, as long as it does not significantly negatively affect the function of each fusion protein of the present invention (e.g., binding ability to the DNA-binding domain recognition sequence, nickase activity, etc.).
- the length of the linker is typically 2 to 180 amino acid residues, preferably 2 to 120 amino acid residues.
- the chain length of the linker can be adjusted so that the distance between the TALE repeat domain and the ND1 domain or dND1 domain is 1 to 200 amino acid residues, preferably 5 to 150 amino acid residues, more preferably 10 to 125 amino acid residues, and even more preferably 10 to 100 amino acid residues, including the chain length of the N-terminal domain of the TALE (when the order is ND1 domain or dND1 domain ⁇ DNA-binding domain from the N-terminus) or C-terminal domain (when the order is DNA-binding domain ⁇ ND1 domain or dND1 domain from the N-terminus), more preferably the latter.
- the distance between the TALE repeat domain and the ND1 domain or dND1 domain is the number of amino acid residues from the N-terminus to the residue adjacent to the N-terminus of the ND1 domain or dND1 domain, starting from the amino acid residue adjacent to the C-terminus of the TALE repeat domain as the first residue, if the order is DNA-binding domain ⁇ ND1 domain or dND1 domain; and from the N-terminus to the residue adjacent to the C-terminus of the ND1 domain or dND1 domain, starting from the amino acid residue adjacent to the N-terminus of the TALE repeat domain as the first residue, if the order is ND1 domain or dND1 domain ⁇ DNA-binding domain, it is the number of amino acid residues from the amino acid residue adjacent to the N-terminus of the TALE repeat domain as the first residue, starting from the amino acid residue adjacent to the N-terminus of the TALE repeat domain as the first residue,
- linker is not particularly limited, and examples include the HTS95 linker consisting of the HTS95 amino acid sequence described in Sun, N., & Zhao, H. (2014) Molecular BioSystems, 10(3), pp. 446-453, GSS linker, SAGG linker, GGGGS linker, XTEN linker, etc.
- the DNA-binding domain and the ND1 domain or dND1 domain may be located on either the N-terminal or C-terminal side, with the linker interposed as needed.
- the fusion protein of the present invention is preferably linked in the following order from the N-terminal side: DNA-binding domain ⁇ (the linker as needed) ⁇ ND1 domain or dND1 domain, from the viewpoint of exhibiting excellent nickase activity that is particularly specific to DNA strands, i.e., specific to strands having a DNA-binding domain recognition sequence to which the second fusion protein binds.
- the DNA-binding domain and the ND1 domain or dND1 domain can be linked at the nucleic acid level and the amino acid level. That is, polynucleotides encoding each of the fusion proteins of the present invention can be prepared by ligating the respective polynucleotides in the order of "polynucleotide encoding the ND1 domain or dND1 domain ⁇ polynucleotide encoding the DNA-binding domain" or "polynucleotide encoding the DNA-binding domain ⁇ polynucleotide encoding the ND1 domain or dND1 domain.” The polynucleotides obtained in this manner can be inserted into an expression vector and expressed in an appropriate host cell, thereby obtaining each of the fusion proteins of the present invention in which the domains are linked at the amino acid level in the order of "ND1 domain or dND1 domain ⁇ DNA-binding domain" or "DNA-binding domain
- the expression vector can be appropriately selected from vectors used in the relevant field, and examples thereof include plasmid vectors, viral vectors, phage vectors, phagemid vectors, BAC vectors, YAC vectors, MAC vectors, and HAC vectors.
- Host cells into which the expression vector is introduced can be appropriately selected taking into consideration compatibility with the expression vector, and examples include prokaryotic cells such as Escherichia coli, actinomycetes, and archaea, and eukaryotic cells such as yeast, sea urchin, silkworm, zebrafish, mouse, rat, frog, tobacco, Arabidopsis, and rice.
- polynucleotide encompasses both DNA and RNA (mRNA), and each polynucleotide may have its codons optimized for purposes such as increasing expression efficiency within cells.
- Fusion proteins according to the present invention can also be prepared by artificial synthesis based on amino acid sequence information. Furthermore, fusion proteins according to the present invention may be added with epitope tags (e.g., flag tags, HA tags, etc.) for purification or detection, labeled proteins (e.g., fluorescent proteins, etc.), or various transport signals (e.g., nuclear transport signals, plastid transport signals, mitochondrial transport signals, etc.).
- epitope tags e.g., flag tags, HA tags, etc.
- labeled proteins e.g., fluorescent proteins, etc.
- transport signals e.g., nuclear transport signals, plastid transport signals, mitochondrial transport signals, etc.
- target DNA DNA containing this target region
- the target DNA according to the present invention is double-stranded DNA, and for the sake of convenience, in order to show its correspondence with the above-described nicking system of the present invention, at least one strand is defined as having a structure containing, from the 5' side, a 5' DNA-binding domain recognition sequence or its complementary sequence, optionally the spacer, the target region, optionally the spacer, and a 3' DNA-binding domain recognition sequence or its complementary sequence.
- the 5' DNA-binding domain recognition sequence and the 3' DNA-binding domain recognition sequence may be located on the same strand or on opposite strands, but are preferably located on opposite strands.
- the target DNA of the present invention includes, adjacent to the 5' side of the target region, a 5' side sequence that is identical to the 5' side homology arm sequence (5'HA) of the donor DNA described below, and also includes, adjacent to the 3' side, a 3' side sequence that is identical to the 3' side homology arm sequence (3'HA) of the donor DNA described below.
- the 5' side sequence and 3' side sequence may overlap with the 5' DNA-binding domain recognition sequence or its complementary sequence, or the 3' DNA-binding domain recognition sequence or its complementary sequence, respectively.
- target region in the present invention refers to a region into which a donor sequence of the donor DNA described below is inserted or replaced with the donor sequence.
- the target region is a region containing the cleavage site cleaved by the nicking enzyme or a region adjacent to the cleavage site. Its length may be a single location between two adjacent bases at the cleavage site or two bases adjacent to the cleavage site, a single base adjacent to the cleavage site or adjacent to the cleavage site, or two or more bases including the cleavage site or adjacent to the cleavage site.
- "inserting a donor sequence into a target region” includes not only an embodiment in which the donor sequence is inserted between two bases on either side of the cleavage site or adjacent to it, but also an embodiment in which one or more bases of the target region are replaced with the donor sequence.
- the length of a target region of one or more bases is, for example, preferably 1 to 500 bases, more preferably 2 to 300 bases, and even more preferably 2 to 100 bases.
- the "5' DNA-binding domain recognition sequence” and "3' DNA-binding domain recognition sequence” of the present invention are sequences recognized by either the first DNA-binding domain or the second DNA-binding domain, respectively.
- the first DNA-binding domain and the second DNA-binding domain may bind to each other's DNA-binding domain recognition sequence, and either may bind to the 5' DNA-binding domain recognition sequence or the 3' DNA-binding domain recognition sequence.
- the distance between DNA-binding domain recognition sequences according to the present invention is preferably 1 to 50 bases, more preferably 2 to 40 bases, and more preferably 3 to 30 bases, from the viewpoint of enabling the nicking enzyme of the present invention to form a dimer and specifically and efficiently introduce nicks within or near the target region.
- the nucleotide sequence of such target DNA is not particularly limited, and can be used as a target for the knock-in method of the present invention by designing the donor DNA described below and each DNA-binding domain in the first fusion protein and second fusion protein so that the 5' DNA-binding domain recognition sequence or its complementary sequence, the 3' DNA-binding domain recognition sequence or its complementary sequence, the distance between the DNA-binding domain recognition sequences, the 5' side sequence, and the 3' side sequence satisfy the above conditions.
- the target DNA of the present invention can be DNA present within a cell (endogenous DNA) or DNA present outside a cell, depending on the purpose.
- DNA present within a cell may be endogenous DNA or exogenous DNA.
- Examples of endogenous DNA include genomic DNA, chloroplast DNA, and mitochondrial DNA within the nucleus, while examples of exogenous DNA include DNA introduced into a cell.
- the target DNA of the present invention is DNA present within a cell (endogenous DNA)
- it is more preferable that the DNA is genomic DNA within a nucleus or exogenous DNA.
- DNA present outside a cell may be DNA derived from a cell, or DNA amplified and synthesized outside the cell.
- the knock-in method of the present invention is characterized by using single-stranded DNA (ssDNA) containing a donor sequence as the donor DNA.
- a "donor sequence” refers to a desired nucleotide sequence intended to be inserted into the target region of the target DNA, and is not particularly limited, and any nucleotide sequence can be used.
- the knock-in method of the present invention replaces the target region with this donor sequence.
- the donor sequence may be a sequence in which a mutation (e.g., base substitution, deletion, addition, or insertion) has been introduced into the target region.
- the donor sequence may be a sequence containing a foreign DNA sequence (e.g., a recombinase recognition sequence, a recombinase expression cassette, a drug resistance gene expression cassette, a negative selection marker expression cassette, a fluorescent protein expression cassette, etc.).
- the donor sequence may also be a sequence in which the foreign DNA sequence has been introduced into the target region (or a mutated sequence thereof).
- the length of such a donor sequence is not particularly limited and can be, for example, 1 to 10,000 bases, preferably 10 to 10,000 bases, more preferably 30 to 5,000 bases, and even more preferably 50 to 3,000 bases.
- the donor DNA of the present invention also includes, on the 5' side of the donor sequence, a 5' homology arm sequence (sometimes referred to herein as "5' HA”) that is identical to the nucleotide sequence adjacent to the 5' side of the target region (5' side sequence), and, on the 3' side, a 3' homology arm sequence (sometimes referred to herein as "3' HA”) that is identical to the nucleotide sequence adjacent to the 3' side of the target region (3' side sequence).
- a 5' homology arm sequence (sometimes referred to herein as "5' HA”) that is identical to the nucleotide sequence adjacent to the 5' side of the target region (5' side sequence)
- 3' homology arm sequence sometimes referred to herein as "3' HA”
- 5'HA is the same as the nucleotide sequence adjacent to the 5' side of the target region on the sense strand
- 3'HA is the same as the nucleotide sequence adjacent to the 3' side of the target region on the sense strand.
- 5'HA is the same as the nucleotide sequence adjacent to the 5' side of the target region on the antisense strand
- 3'HA is the same as the nucleotide sequence adjacent to the 3' side of the target region on the antisense strand.
- the length of each of the homology arms is preferably 10 to 800 bases, more preferably 20 to 750 bases, and even more preferably 30 to 700 bases.
- the donor DNA of the present invention is preferably a long single-stranded DNA (lssDNA) in which the length of each of the homology arms is independently 100 bases or more, and the length of each of the homology arms is more preferably 100 to 700 bases, and even more preferably 100 to 600 bases.
- the donor DNA of the present invention is preferably a single-stranded DNA consisting only of a nucleotide sequence arranged in the following order from the 5' end: 5' HA, donor sequence, 3' HA. However, it is not limited to this as long as it does not significantly impair the effects of the present invention (knock-in efficiency, etc.).
- a nucleotide sequence consisting of any number of bases preferably 100 bases or less may be added to the 5' end and/or 3' end.
- the length (total length) of such donor DNA is not particularly limited, but can be, for example, 21 to 11,600 bases, preferably 40 to 10,000 bases, more preferably 60 to 6,000 bases, and even more preferably 100 to 4,000 bases.
- the donor DNA of the present invention can be prepared by known methods for preparing single-stranded DNA or methods similar thereto. For example, it can be prepared using PCR, restriction enzyme digestion, DNA ligation techniques, etc. Furthermore, according to the method described in Inoue et al., Cells, 2021, 10, 1076.
- the sequence of single-stranded DNA can be amplified by PCR using a primer set in which one of the primers is phosphorylated at the 5' end, and the strand of the resulting double-stranded DNA with the phosphorylated 5' end is digested from the phosphorylated end, thereby preparing the desired single-stranded DNA even in the case of long single-stranded DNA.
- the donor DNA and a nicking system are brought into contact with the target DNA, and the nicking system cleaves within or near the target region, thereby inserting the donor sequence into the target region.
- in the vicinity preferably refers to a position within 100 bases, and more preferably within 50 bases, counting the base adjacent to the target region as the first base.
- the knock-in method of the present invention may be performed within a cell or in a cell-free system.
- the "inside the cell” where the knock-in method of the present invention is performed may be a eukaryotic cell or a prokaryotic cell, preferably a eukaryotic cell.
- eukaryotic cells include animal cells (such as cells of mammals, fish, birds, reptiles, amphibians, and insects), plant cells, algae cells, and yeast.
- prokaryotic cells include Escherichia coli, Salmonella, Bacillus subtilis, lactic acid bacteria, and extreme thermophiles.
- the donor DNA and nicking system are brought into contact with the target DNA by introducing the donor DNA and nicking system into the cell, or by introducing the donor DNA into the cell and expressing the nicking system within the cell.
- the nicking system of the present invention may be such that each of the fusion proteins constituting the system is introduced into the cell in the form of a protein, or in the form of RNA or DNA (polynucleotide) encoding the protein and expressed within the cell, or in the form of a vector (expression vector) containing the polynucleotide and expressing the protein and expressed within the cell.
- mammals When producing a model animal, mammals are preferably rodents such as mice, rats, guinea pigs, and hamsters, with mice being particularly preferred.
- Examples of the plant include grains, oilseed crops, forage crops, fruits, and vegetables.
- Specific examples of crops include rice, corn, banana, peanut, sunflower, tomato, rapeseed, tobacco, wheat, barley, potato, soybean, cotton, and carnation.
- the present invention also relates to a kit for use in the above-mentioned knock-in method of the present invention, the method for producing a knock-in cell of the present invention, or the method for producing a non-human individual of the present invention, At least one selected from the group consisting of a first fusion protein, a first fusion protein expression vector that expresses the first fusion protein, and a polynucleotide that encodes the first fusion protein; at least one selected from the group consisting of a second fusion protein, a second fusion protein expression vector that expresses the second fusion protein, and a polynucleotide that encodes the second fusion protein;
- a kit comprising:
- the first fusion protein and the second fusion protein are each as described above in the nicking system of the present invention, including their preferred embodiments. These may each independently be in the form of a protein, a polynucleotide encoding the protein, or a vector (expression vector) that expresses the protein.
- the expression vectors for the first fusion protein and the second fusion protein, and the polynucleotides encoding them, are also as described above, including their preferred embodiments.
- the kit of the present invention may further include the donor DNA, as described above in the knock-in method of the present invention, including its preferred embodiments. However, the donor DNA to be used in each method may be designed and synthesized by the user as appropriate depending on the target region of the target DNA.
- TALE Vector Set Confirmation of nickase activity by single-strand annealing (SSA) assay [Method]
- SSA single-strand annealing
- module sequences were then inserted into pEX-A2J2 (Eurofins Genomics, Tokyo, Japan) to prepare a module plasmid set (16 types in total: pEX1HD to pEX4HD, pEX1NG to pEX4NG, pEX1NI to pEX4NI, and pEX1NN to pEX4NN).
- a destination vector (TALE47 vector) was created by inserting one of the module sequences and a sequence encoding the TALE C-terminal domain following the 3' end of the N-terminal domain of the TALE, created by artificial DNA synthesis, into pcDNA3.1s, which was prepared by removing the drug resistance gene expression unit from pcDNA3.1(+) (Thermo Fisher Scientific).
- the C-terminal domain of the TALE used was one with 47 amino acids (47), and the sequence encoding "47” was synthesized using artificial DNA based on the C-terminal domain sequence contained in Addgene's ptCMV-153/47-VR-NG (Addgene ID: 50704).
- TALE-ND1 Expression Plasmid and TALE-dND1 Expression Plasmid Using DNA encoding an artificially synthesized ND1 domain (nucleotide sequence number: 39, amino acid sequence number: 40) as a template, a fragment (ND1) was amplified by PCR using the primer set shown in Table 1 below, and using the TALE47 vector prepared in (1) above as a template, a fragment (TALE47) was amplified by PCR using the primer set shown in Table 1 below. These fragments were then ligated by the in-fusion method to prepare a TALE47-ND1 expression plasmid that expresses a fusion protein in which the ND1 domain is fused to the C-terminus of TALE47.
- TALE47-ND1 expression plasmid As a template, fragments amplified by PCR using the two primer sets shown in Table 1 below were ligated by the in-fusion method to create a site-directed mutagenesis method to prepare a TALE47-dND1 expression plasmid that expresses a fusion protein in which a dND1 domain (nucleotide sequence number: 41, amino acid sequence number: 42) in which the D66N mutation was introduced into the ND1 domain was fused to the C-terminus of TALE47.
- a dND1 domain nucleotide sequence number: 41, amino acid sequence number: 42
- TALE47 in the TALE47-ND1 expression plasmid and TALE47-dND1 expression plasmid prepared above contained TALE repeat domains (APC-L, APC-R, Rosa26-L, Rosa26-R) corresponding to the TALE recognition sequences listed in Table 2 below, respectively, and was subjected to the SSA assay described below.
- TALE repeat domains APC-L, APC-R, Rosa26-L, Rosa26-R
- a nickase-type nCas9(D10A) expression plasmid (pX330(D10A)_BS) and a guide RNA expression plasmid (pX330_BS- ⁇ Cas9) were prepared in a manner similar to that described in WO 2023-038023.
- Each guide RNA was designed to correspond to the guide RNA target sequence on each target gene shown in Table 3 below (Table 3 shows the complementary sequence (sequences other than those underlined) and the PAM sequence (underlined sequence) of the guide RNA target sequence (on the antisense strand)).
- Figure 1 shows a conceptual diagram of the positional relationship between the PAM sequences on the target genes APC and Rosa26 (the positions corresponding to the PAM sequences on the guide RNA are shown in Figure 1), the cleavage point by nCas9(D10A), and each TALE and guide RNA.
- HEK293T cells grown in DMEM medium containing 10% FBS were seeded at 1 x 10 cells per well of a 96-well plate the day before transfection.
- 33 ng of TALE-L (APC-L, Rosa26-L) expression plasmid, 33 ng of TALE-R (APC-R, Rosa26-R) expression plasmid, and 33 ng of SSA assay reporter plasmids were transfected into the HEK293T cells using Lipofectamine 3000 (Thermo Fisher Scientific).
- pBluescript II SK+
- Stratagene was used to supplement the amount of the introduced plasmid, making the total amount of the introduced plasmid 100 ng.
- the cells were cultured for 48 hours, and the amount of fluorescence from the EGFP protein per unit area in each well was measured using a plate reader.
- the above combination was also transfected in combination with an nCas9 (D10A) expression plasmid and a guide RNA expression plasmid, and measurements were performed in the same manner as above.
- measurements were taken at 16 points per well, and the average value was used as the EGFP fluorescence intensity (RFI). The average and standard deviation of the values from three independent wells were graphed.
- Figure 2 shows the results when the SSA assay reporter plasmid EGxAPCxFP, which carries APC as the target gene, was treated with a combination of TALE47(APC-L)-ND1 and TALE47(APC-R)-ND1, or a combination of TALE47(APC-L)-dND1 and TALE47(APC-R)-ND1 (where one ND1 is dND1), or a combination of TALE47(APC-L)-ND1 and TALE47(APC-R)-dND1, or these were further treated with nCas9(D10A) and guide RNA (APC_gRNA-C or APC_gRNA-B).
- Figure 3 shows the results when the SSA assay reporter plasmid EGxRosa26xFP, which carries Rosa26 as the target gene, was treated with a combination of TALE47(Rosa26-L)-ND1 and TALE47(Rosa26-R)-ND1, or a combination of TALE47(Rosa26-L)-dND1 and TALE47(Rosa26-R)-ND1, where one ND1 is a dND1, or a combination of TALE47(Rosa26-L)-ND1 and TALE47(Rosa26-R)-dND1, or these were further treated with nCas9(D10A) and guide RNA (Rosa26_gRNA-C or Rosa26_gRNA-B).
- nCas9 and a guide RNA corresponding to the guide RNA target sequence on the same strand as the TALE recognition sequence of TALE47-dND1 (APC_gRNA-C for TALE47(APC-L)-dND1, and APC_gRNA-B for TALE47(APC-R)-dND1), double-nicking double-stranded DNA cleavage activity was confirmed, confirming that the combination of the ND1 domain and the dND1 domain has nickase activity.
- mCherry-P2a-EGFP(C321G)/pcDNA3.1Zeo+ was prepared to establish a reporter cell line inserted into the genome.
- the mCherry expression plasmid pmCherry-C1 was purchased from Takara Bio Inc., and the DNA encoding EGFP was fully synthesized.
- PCR was performed using the primer sets listed in Table 4 below for these DNAs and the expression vector pcDNA3.1Zeo+ (manufactured by Thermo Fisher Scientific), and the resulting fragments were ligated by the in-fusion method to produce the plasmid mCherry-P2A-EGFP/pcDNA3.1Zeo+ (nucleotide sequence number: 43, amino acid sequence number: 44 for mCherry-P2A-EGFP).
- mCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+ was created by substituting the 321st base, C, in the nucleotide sequence encoding EGFP on the plasmid mCherry-P2a-EGFP/pcDNA3.1Zeo+ with G to create a mutant called mCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+.
- PCR was performed with the two primer sets listed in Table 4 below, and the resulting fragments were ligated using the in-fusion method to create the plasmid mCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+ by site-directed mutagenesis.
- PCR was performed using the two primer sets listed in Table 5 below using EGFP / pBS as a template, and the resulting fragments were ligated by the In-Fusion method to produce the donor plasmid PD-0 / pBS.
- Guide RNA expression plasmids were prepared by inserting sgEGFP_332s and sgUC57N2 into the guide RNA expression plasmid (pX330_BS- ⁇ Cas9) in the same manner as in Test Example 1 (3) above.
- TALE repeat domains corresponding to each TALE recognition sequence on the EGFP gene listed in Table 7 below were inserted into TALE47 of the TALE47-dND1 expression plasmid and TALE47-ND1 expression plasmid prepared in Test Example 1 (2) above, in order to generate similar nicking near the site of nicking by nCas9 and guide RNA (sgEGFP_332s), to create the TALE47(EGFP-3)-dND1 expression plasmid and TALE47(EGFP-3R)-ND1 expression plasmid.
- sgEGFP_332s guide RNA
- mCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+ linear fragment was introduced into HEK293T cells using Lipofectamine 3000 (Thermo Fisher Scientific). Two days after transfection, the cells were detached, appropriately diluted with 125 ⁇ g/mL Zeocin-containing medium (hereafter, cell lines were established in this medium), and seeded onto 10 cm dishes. Approximately two weeks later, single colonies were collected and seeded onto 96-well plates. The 24 strains in which mCherry fluorescence was observed were expanded and cultured. Knock-in efficiency was evaluated according to the SNGD method described below in (5).
- #7, #8, #22 Three strains (#7, #8, #22) with high knock-in efficiency were selected, and single clones were obtained again from these three strains by limiting dilution.
- the resulting clones #7-1, #7-2, #7-3, #8-1, #8-2, #8-3, #22-1, #22-2, and #22-3 were compared in terms of knock-in efficiency, cell proliferation, etc., and #7-2, #8-1, and #22-3 were selected as strains with equivalent activity and proliferation capacity.
- the #22-3 cell line was used as a reporter cell line (a line expressing a fluorescent activity-loss mutant) in which the mCherry-P2A-EGFP (C321G) expression unit was inserted into the genome.
- one of the primers used was a primer with a phosphorylated 5' end.
- the resulting PCR product was purified using NucleoSpin Gel and PCR Clean-up (MACHEREY-NAGEL), and then approximately 5 ⁇ g was digested from the 5′ phosphorylated end with Lambda exonuclease (New England BioLab). The remaining double-stranded DNA was then digested with Exonuclease III (Takara Bio) and further purified using the above-mentioned NucleoSpin Gel and PCR Clean-up to obtain each lssDNA (PD-0, PD-3).
- Donor plasmids (PD-0, PD-3), lssDNA (PD-0, PD-3), guide RNA (sgEGFP_332s) expression plasmid, guide RNA (sgUC57N2) expression plasmid, nCas9 expression plasmid, TALE47(EGFP-3)-dND1 expression plasmid, and TALE47(EGFP-3R)-ND1 expression plasmid were introduced into HEK293T cells (#22-3 strain) in the combinations and amounts shown in Table 9 below, with a total of 100 ng of plasmid and DNA using Lipofectamine 3000 (Thermo Fisher Scientific). When the type or amount of introduced plasmid was reduced, pBluescript II (SK+) (Stratagene) was used to supplement the amount, so that the total amount of introduced plasmid and DNA was 100 ng.
- pBluescript II (SK+) (Stratagene) was used to supplement the amount, so that the total amount of
- the cells were cultured for 72 hours and then stained with Hoechst 33342 (10 ⁇ L of a 50 ⁇ g/mL solution was added to each well for 10 minutes at room temperature). Furthermore, 100 ⁇ L of 4% paraformaldehyde solution was added and treated at room temperature for 1 hour to fix the cells. After washing with PBS(-), 100 ⁇ L of PBS(-) was added to each well, and two types of fluorescence image data (fluorescence from Hoechst 33342 staining and EGFP fluorescence) were acquired from four locations in each well using an In Cell Analyzer 6000 (Cytiva).
- Hoechst 33342 10 ⁇ L of a 50 ⁇ g/mL solution was added to each well for 10 minutes at room temperature. Furthermore, 100 ⁇ L of 4% paraformaldehyde solution was added and treated at room temperature for 1 hour to fix the cells. After washing with PBS(-), 100 ⁇ L of PBS(-) was added to each well, and two types of flu
- the number of fluorescent cells was quantified using image analysis software ImageJ, and the average and standard deviation of the number of EGFP-positive cells/total cell count (%) for the four locations were graphed. The higher the average value of the number of EGFP-positive cells/total cell count (%) obtained, the higher the knock-in efficiency.
- Figure 4 shows the EGFP fluorescence images for each of the combinations shown in Table 9 ((a): Mock, (b) SNGD, (c) dND1 + ND1 + PD, (d) dND1 + ND1 + lssDNA), and Figure 5 shows the number of EGFP-positive cells/total number of cells (%).
- the average number of EGFP-positive cells/total number of cells (%) was calculated in the same manner as above, except that the combinations and amounts of each donor DNA and expression plasmid were as shown in Table 10 below.
- the value (a) when the donor plasmid was used was set to 1, and the relative activity and standard deviation were graphed. The results are shown in Figure 6.
- Figures 4 to 5 show the results of confirming the knock-in efficiency by nicking the target genome and donor plasmid using an EGFP fluorescence activity loss mutant expression strain (#22-3 strain) using nCas9 by the SNGD method (SNGD: combination of single nicks in the target gene and donor plasmid) described in Non-Patent Document 4.
- FIGS 4 to 5 show the results of confirming the knock-in efficiency when nicking using a combination of the ND1 domain and dND1 domain was performed using lssDNA instead of a donor plasmid as the donor DNA.
- lssDNA PD-3
- TALE47 EGFP-3-dND1 expression plasmid
- EGFP-3R TALE47
- the nicking system of the present invention is a site-specific nicking system that comprises a first fusion protein comprising a first DNA-binding domain and an ND1 domain, and a second fusion protein comprising a second DNA-binding domain and a dND1 domain, and thereby exhibits nickase activity that can replace the nickase activity of nickase-type Cas9 (nCas9) using only the proteins.
- nickase-type Cas9 nickase-type Cas9
- the present invention makes it possible to provide a method for specifically and highly efficiently inserting (knock-in) a desired nucleotide sequence into a target region using only proteins, a method for producing cells in which a desired nucleotide sequence has been inserted into a target region (knock-in cells), and kits for use in these methods. Therefore, the present invention is expected to be used as an excellent genome editing tool in a wide range of industrial fields, including medicine, agriculture, and manufacturing.
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
5'側から、5'側ホモロジーアーム配列、ドナー配列、3'側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して標的領域内又は標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、を標的DNAに接触させる工程を含む、標的DNA上の標的領域にドナー配列を挿入する方法。
Description
本発明は、所望のヌクレオチド配列をノックインする方法、ノックイン細胞の製造方法に関し、より詳しくは、標的DNA上の標的領域に所望のヌクレオチド配列を挿入(ノックイン)する方法、標的DNA上の標的領域に所望のヌクレオチド配列が挿入された細胞(ノックイン細胞)を製造する方法、及びこれらの方法に用いるためのキットに関する。
ゲノムDNA等の標的DNA上の特定の領域に所望のヌクレオチド配列を挿入又は置換する技術は「ノックイン」と称され、例えば、CRISPR-Casシステムによって二本鎖DNAを切断し、その切断箇所の相同性依存的修復(homology-directed repair:HDR)と呼ばれる修復機構を利用して、当該切断箇所又はその近傍に挿入したいヌクレオチド配列を含むドナーDNAを挿入又は置換する方法が知られている。例えば、Y Wu et al.,Cell Stem Cell 13,Dec 5,2013,p.659-662(非特許文献1)には、マウス受精卵において、CRISPR-Cas9システムで二本鎖DNA(DNA double-strand break;DSB)を切断し、その切断箇所の近傍に、HDRによって変異を導入したことが報告されている。
このようなCRISPR-Casシステムによるノックイン技術においては、ドナーDNAとして、挿入したいヌクレオチド配列の5’末端及び3’末端に、これを挿入したい標的領域の周辺配列と相同な配列(homology arm)を有する一本鎖DNA(single strand DNA:ssDNA)を用いるか、挿入したい配列が長い場合等には、かかる一本鎖DNAのヌクレオチド配列を含むドナープラスミドを用いることが知られている。例えば、Li H.et al.,bioRxiv,21 Aug 2017,doi: https://doi.org/10.1101/178905(非特許文献2)には、ドナーDNAを、両末端に約500塩基以上のホモロジーアームを有するlssDNA(long single strand DNA:lssDNA)とすることにより、培養細胞においてもCRISPR-Cas9システムで効率的にノックインが可能となることが報告されている。また、lssDNAは作製が難しくその使用が制限されていたが、例えば、Inoue et al.,Cells,2021,10,1076.https://doi.org/10.3390/cells10051076(非特許文献3)には、より簡便で安価なlssDNAの調製方法が報告されている。
しかしながら、上記のような二本鎖DNA切断を用いたノックイン技術では、意図しないヌクレオチド配列の挿入や欠失を引き起こすことが問題となっていた。二本鎖DNA切断を用いない技術としては、例えば、Cas9の二本鎖DNA切断活性を一部欠失させたニッカーゼ型のCas9(nCas9、Cas9D10A)にドナープラスミドを組み合わせて、nCas9で一本鎖DNA切断(ニッキング)を生じさせた箇所にドナープラスミドのヌクレオチド配列を挿入する技術(combination of single nicks in the target gene and donor plasmid:SNGD)が、Nakajima et al.,Genome Research,28,2018,p.223-230(非特許文献4))が記載されている。
しかしながらこれらの従来技術はいずれもCRISPR-Casシステムに依存するものであって、これらを用いてゲノム編集をするためにはガイドRNAも細胞に導入する必要があるため、タンパク質のみでゲノム編集が可能な、より安全性の高い技術が望まれている。
タンパク質のみでゲノム編集が可能な技術として、2010年に第二世代ゲノム編集技術として開発された人工制限酵素である、TALEN(転写活性化因子様エフェクターヌクレアーゼ:Transcription activator-like effector nuclease)が知られている。TALENは、タイプIIS制限酵素であるFokIのヌクレアーゼドメイン(FokIヌクレアーゼドメイン)をヌクレアーゼドメイン、TALEをDNA結合ドメインとした融合タンパク質であり、一対のTALENのTALEがそれぞれ標的DNAの反対鎖に結合し、FokIヌクレアーゼドメインが互いに2量体を形成することで部位特異的な二本鎖DNA切断活性(ヌクレアーゼ活性)を奏する。FokIヌクレアーゼドメインに関しては、これまでに、2個のFokIヌクレアーゼドメインを連結し、ジンクフィンガーアレイ(ZF)やTALEに結合させて二本鎖DNA切断を誘導した報告(Minczuk et al.,Nucleic Acids Research,36(12),2008,p.3926-3938(非特許文献5))や、FokIヌクレアーゼドメインの片方に変異を入れた構造体を用いて一本鎖DNA切断(ニック)を誘導した報告(Yan Luo et al.,Scientific Reports,6:20657,2016,doi: 10.1038/srep20657(非特許文献6))がある。
また、本発明者らは、従来のFokIヌクレアーゼドメインとは異なる、新規なヌクレアーゼドメイン1(ND1ドメイン)を開発し、かかるND1ドメインとZFやTALE等のDNA結合ドメインとを含む人工核酸切断酵素により、標的DNA上の標的部位を編集することに成功している(国際公開第2020/045281号明細書(特許文献1))。
Y Wu et al.,Cell Stem Cell 13,Dec 5,2013,p.659-662
Li H.et al.,bioRxiv,21 Aug 2017,doi: https://doi.org/10.1101/178905
Inoue et al.,Cells,2021,10,1076.https://doi.org/10.3390/cells10051076
Nakajima et al.,Genome Research,28,2018,p.223-230
Minczuk et al.,Nucleic Acids Research,36(12),2008,p.3926-3938
Yan Luo et al.,Scientific Reports,6:20657,2016,doi: 10.1038/srep20657
本発明は、上記従来技術の有する課題に鑑みてなされたものであり、一本鎖DNA切断をタンパク質のみで行い、特異的かつ高効率に、標的領域に所望のヌクレオチド配列の挿入(ノックイン)ができる方法、及び標的領域に所望のヌクレオチド配列が挿入された細胞(ノックイン細胞)を製造できる方法、並びに、これらの方法に用いるためのキットを提供することを目的とする。
本発明者らは、上記目的を達成すべく鋭意研究を重ねた結果、FokIヌクレアーゼドメインの代替因子である特許文献1に記載のヌクレアーゼドメイン1(ND1ドメイン)を、ヌクレアーゼ活性欠損変異を導入したdND1ドメインとし、ND1とdND1とを組み合わせた2量体型とすることにより、タンパク質のみで、ニッカーゼ型のCas9(nCas9)のニッカーゼ活性に代替可能なニッカーゼ活性を奏するニッキング酵素(ニッカーゼ活性体)とできることを見出した。さらに、このニッキング酵素を標的DNA上の標的領域へ誘導するために、各ドメインにそれぞれDNA結合ドメインを結合させた融合タンパク質とすることで、部位特異的なニッキングシステムを開発することに成功した。
なお、FokIヌクレアーゼドメインを改変した非特許文献6の記載に基づけば、ヌクレアーゼ活性欠損変異を導入していないドメインが認識して結合する鎖にニックが導入されることが想定されるが、これに反して、ND1ドメインを改変した上記ニッキング酵素では、驚くべきことに、ヌクレアーゼ活性欠損変異を導入したdND1ドメインが認識する鎖の方にニックが導入されることも本発明者らは見出した。
さらに、本発明者らは、この新たなニッキングシステムにおいては、ドナーDNAとして、ドナープラスミドではなく一本鎖DNA(ssDNA)を用いることで、ノックイン効率を顕著に増大させることが可能となることも見出した。これは、ニッカーゼ型のCas9では確認されない、当該ニッキングシステムに特異的な現象であることを見出し、本発明を完成するに至った。
かかる知見により提供される本発明の態様は以下のとおりである。
[1]
標的DNA上の標的領域にドナー配列を挿入する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。
[2]
前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、[1]に記載の方法。
[3]
標的DNA上の標的領域にドナー配列が挿入された細胞を製造する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を細胞内に導入又は細胞内で発現させ、前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドを含むドメインであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。
[4]
前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、[3]に記載の方法。
[5]
[1]~[4]のうちのいずれか一項に記載の方法に用いるためのキットであり、
第1の融合タンパク質、第1の融合タンパク質を発現する第1の融合タンパク質発現ベクター、及び第1の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
第2の融合タンパク質、第2の融合タンパク質を発現する第2の融合タンパク質発現ベクター、及び第2の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
を含み、
第1の融合タンパク質発現ベクターが、(i)ND1ドメイン及び第1のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(ii)ND1ドメインをコードするポリヌクレオチドと、第1のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種であり、
第2の融合タンパク質発現ベクターが、(iii)dND1ドメイン及び第2のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(iv)dND1ドメインをコードするポリヌクレオチドと、第2のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種である、
キット。
[1]
標的DNA上の標的領域にドナー配列を挿入する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。
[2]
前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、[1]に記載の方法。
[3]
標的DNA上の標的領域にドナー配列が挿入された細胞を製造する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を細胞内に導入又は細胞内で発現させ、前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドを含むドメインであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。
[4]
前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、[3]に記載の方法。
[5]
[1]~[4]のうちのいずれか一項に記載の方法に用いるためのキットであり、
第1の融合タンパク質、第1の融合タンパク質を発現する第1の融合タンパク質発現ベクター、及び第1の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
第2の融合タンパク質、第2の融合タンパク質を発現する第2の融合タンパク質発現ベクター、及び第2の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
を含み、
第1の融合タンパク質発現ベクターが、(i)ND1ドメイン及び第1のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(ii)ND1ドメインをコードするポリヌクレオチドと、第1のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種であり、
第2の融合タンパク質発現ベクターが、(iii)dND1ドメイン及び第2のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(iv)dND1ドメインをコードするポリヌクレオチドと、第2のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種である、
キット。
本発明によれば、タンパク質のみで、特異的かつ高効率に、標的領域に所望のヌクレオチド配列の挿入(ノックイン)ができる方法、及び標的領域に所望のヌクレオチド配列が挿入された細胞(ノックイン細胞)を製造できる方法、並びに、これらの方法に用いるためのキットを提供することが可能となる。
以下、本発明の好ましい実施形態を例に挙げてより具体的に説明するが、本発明はこれに限定されるものではない。
<ニッキング酵素>
本発明のニッキング酵素は、2つのドメインND1及びdND1を含む人工ニッキング酵素である。本発明のニッキング酵素は、二本鎖DNAの一方の鎖のみを切断する一本鎖DNA切断活性(ニッカーゼ活性)を有する。
本発明のニッキング酵素は、2つのドメインND1及びdND1を含む人工ニッキング酵素である。本発明のニッキング酵素は、二本鎖DNAの一方の鎖のみを切断する一本鎖DNA切断活性(ニッカーゼ活性)を有する。
(ND1ドメイン)
本発明に係る「ND1ドメイン」は、FokIヌクレアーゼドメインとの同一性が35~70%の範囲に存在する相同配列のスクリーニングによって、本発明者らが見出したヌクレアーゼドメインの一つであるヌクレアーゼドメイン1である(特許文献1)。ND1ドメインの典型的ヌクレオチド配列は、(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド、より好ましくは配列番号:40に記載のアミノ酸配列からなるポリペプチドである。なお、配列番号:40に記載のアミノ酸配列は、FokIヌクレアーゼドメインのアミノ酸配列と70%の同一性を有する。
本発明に係る「ND1ドメイン」は、FokIヌクレアーゼドメインとの同一性が35~70%の範囲に存在する相同配列のスクリーニングによって、本発明者らが見出したヌクレアーゼドメインの一つであるヌクレアーゼドメイン1である(特許文献1)。ND1ドメインの典型的ヌクレオチド配列は、(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド、より好ましくは配列番号:40に記載のアミノ酸配列からなるポリペプチドである。なお、配列番号:40に記載のアミノ酸配列は、FokIヌクレアーゼドメインのアミノ酸配列と70%の同一性を有する。
本発明に係る「ND1ドメイン」には、ND1ドメインを2分子用いた場合に、DNAの二本鎖DNA切断活性(ヌクレアーゼ活性)を有する限り、配列番号:40に記載のアミノ酸配列と高い相同性を有するアミノ酸配列を含むポリペプチドが含まれる。このようなヌクレアーゼドメインには、例えば、他の細菌由来のND1ドメインやND1ドメインの改変体(天然の変異体及び人工的な変異体)が含まれる。
したがって、本発明に係る「ND1ドメイン」の態様には、(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列を含むポリペプチド、より好ましくは前記アミノ酸配列からなるポリペプチドも含まれる。ただし、下記のヌクレアーゼ活性欠損変異配列ではないことが必要であるため、(b)において、配列番号:40に記載のアミノ酸配列の少なくとも第66番目及び第83番目に対応するアミノ酸はアスパラギン酸であることが必要である。
ここで、アミノ酸配列において、「置換、欠失、挿入、及び/又は付加されたアミノ酸配列」とは、当該アミノ酸配列中のアミノ酸(アミノ酸残基)が、置換、欠失、挿入、若しくは付加されたアミノ酸配列、又は、これらのうちの2種以上の組み合わせがなされたアミノ酸配列であることを示す。また、「複数個」とは、30、25、20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、又は2個の整数であることを示す。(b)のポリペプチドのアミノ酸配列において、1若しくは複数個として好ましくは、アミノ酸残基が1~30個、1~25個、1~20個(例えば、1~10個、1~5個、1~3個、2個以下)である。
また、本発明に係る「ND1ドメイン」の態様には、(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列を含むポリペプチド、より好ましくは前記アミノ酸配列からなるポリペプチドも含まれる。ただし、(c)においても、下記のヌクレアーゼ活性欠損変異配列ではないことが必要であるため、配列番号:40に記載のアミノ酸配列の少なくとも第66番目及び第83番目に対応するアミノ酸はアスパラギン酸であることが必要である。
ここで、アミノ酸配列の相同性という場合には、対照のアミノ酸配列(例えば、(a)のポリペプチドのアミノ酸配列)と対象のアミノ酸配列(例えば、(c)のポリペプチドのアミノ酸配列)とをアミノ酸配列解析ソフトウェア等を用いて整列させた際に、対照のアミノ酸配列上のアミノ酸(対照アミノ酸)と同位置になる対象のアミノ酸配列上のアミノ酸(対象アミノ酸)が、前記対照アミノ酸と同じアミノ酸であっても、前記対照アミノ酸と同じ性質を持つアミノ酸であってもよい。アミノ酸配列の同一性という場合には、前記対象アミノ酸は、前記対照アミノ酸と同じアミノ酸である。同じ性質を持つアミノ酸のグループは、本発明の属する技術分野でよく知られており、例えば、酸性アミノ酸(アスパラギン酸及びグルタミン酸);塩基性アミノ酸(リシン・アルギニン・ヒスチジン);中性アミノ酸においては、炭化水素鎖を持つアミノ酸(グリシン・アラニン・バリン・ロイシン・イソロイシン・プロリン)、ヒドロキシ基を持つアミノ酸(セリン・トレオニン)、硫黄を含むアミノ酸(システイン・メチオニン)、アミド基を持つアミノ酸(アスパラギン・グルタミン)、イミノ基を持つアミノ酸(プロリン)、芳香族基を持つアミノ酸(フェニルアラニン・チロシン・トリプトファン)で分類することができる。
このようなアミノ酸配列の相同性及び同一性は、配列の一致が最大となる状態にアラインメントされた2つの配列を比較することにより決定される。配列相同性又は同一性の数値(%)を求める方法は、当業者に公知である。最適なアラインメント及び配列同一性を得るためのアルゴリズムとしては、当業者に既知のいずれかのアルゴリズム(例えば、BLASTアルゴリズム、FASTAアルゴリズム等)を利用することができ、アミノ酸配列の配列相同性又は同一性は、例えば、BLASTP、FASTA等の配列解析ソフトウェアを用いて決定することができる。また、(c)のポリペプチドのアミノ酸配列において、(a)のポリペプチドのアミノ酸配列との相同性は、90%以上であればよいが、好ましくは、95%以上(例えば、96%以上、97%以上、97.5%以上、98%以上、98.5%以上、99%以上、99.5%以上、99.8%以上)である。より好ましくは、同一性で、90%以上、95%以上(例えば、96%以上、97%以上、97.5%以上、98%以上、98.5%以上、99%以上、99.5%以上、99.8%以上)である。
また、アミノ酸配列において、特定のアミノ酸に「対応する」アミノ酸とは、アミノ酸配列解析ソフトウェア(例えば、GENETYX-MAC、SequencherやClustalW等)を用いて(例えば、パラメータ:デフォルト値(すなわち初期設定値))アミノ酸配列を整列させた際に、前記特定のアミノ酸(前記対照アミノ酸(対照アミノ酸残基)、例えば、配列番号:40に記載のアミノ酸配列の第66番目又は第83番目のアスパラギン酸)と同位置になるアミノ酸を示す。
(dND1ドメイン)
本発明に係る「dND1ドメイン」は、ND1ドメインのアミノ酸配列を、ヌクレアーゼ活性が欠損するような変異配列(ヌクレアーゼ活性欠損変異配列)に改変した改変ドメインである。このようなdND1ドメインのヌクレアーゼ活性欠損変異配列としては、ND1ドメインと2分子で用いた場合に、二本鎖DNA切断活性が欠損され、かつ、一本鎖DNA切断活性を有すればよく、典型的には、(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド、より好ましくは前記置換アミノ酸を含む前記アミノ酸配列からなるポリペプチドである。前記置換アミノ酸に置換されるアスパラギン酸としては、第66番目のアスパラギン酸及び第83番目のアスパラギン酸のうちのいずれかであっても両方であってもよいが、少なくとも第66番目のアスパラギン酸を含むことが好ましい。
本発明に係る「dND1ドメイン」は、ND1ドメインのアミノ酸配列を、ヌクレアーゼ活性が欠損するような変異配列(ヌクレアーゼ活性欠損変異配列)に改変した改変ドメインである。このようなdND1ドメインのヌクレアーゼ活性欠損変異配列としては、ND1ドメインと2分子で用いた場合に、二本鎖DNA切断活性が欠損され、かつ、一本鎖DNA切断活性を有すればよく、典型的には、(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド、より好ましくは前記置換アミノ酸を含む前記アミノ酸配列からなるポリペプチドである。前記置換アミノ酸に置換されるアスパラギン酸としては、第66番目のアスパラギン酸及び第83番目のアスパラギン酸のうちのいずれかであっても両方であってもよいが、少なくとも第66番目のアスパラギン酸を含むことが好ましい。
また、本発明に係る「dND1ドメイン」には、このような(da)と高い相同性を有するアミノ酸配列からなる改変体も含まれる。したがって、本発明に係る「dND1ドメイン」の態様には、(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド;並びに、(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチドも含まれる。
(db)のポリペプチドのアミノ酸配列において、1若しくは複数個として好ましくは、アミノ酸残基が1~30個、1~25個、1~20個(例えば、1~10個、1~5個、1~3個、2個以下)である。また、(dc)のポリペプチドのアミノ酸配列において、(da)のアミノ酸配列との相同性は、90%以上であればよいが、好ましくは、95%以上(例えば、96%以上、97%以上、97.5%以上、98%以上、98.5%以上、99%以上、99.5%以上、99.8%以上)である。より好ましくは、同一性で、90%以上、95%以上(例えば、96%以上、97%以上、97.5%以上、98%以上、98.5%以上、99%以上、99.5%以上、99.8%以上)である。
(db)及び(dc)において、前記置換アミノ酸に置換されるアスパラギン酸としては、第66番目のアスパラギン酸に対応するアミノ酸及び第83番目のアスパラギン酸に対応するアミノ酸のうちのいずれかであっても両方であってもよいが、少なくとも第66番目のアスパラギン酸に対応するアミノ酸を含むことが好ましい。また、(da)、(db)、(dc)において、アスパラギン酸以外の任意のアミノ酸に置換されるときの置換アミノ酸としては、前記酸性アミノ酸以外のアミノ酸が好ましく、アラニン又はアスパラギンがより好ましい。
第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸、又はかかるアスパラギン酸に対応するアミノ酸を前記置換アミノ酸に置換する方法としては、従来公知の方法又はそれに準じた方法を適宜採用することができ、例えば、部位特異的変異誘発法(Kunkel et al.,Proc.Natl.Acad.Sci.USA(1985)82,p.488-492)、重複伸長PCR等の公知の方法を適宜採用することができる。また、前記アミノ酸の改変に用いるプライマー等は、目的のアミノ酸配列(配列番号:40に記載のアミノ酸配列等)及び目的の改変に基づいて、従来公知の方法又はそれに準じた方法により適宜設計することができる。
なお、本発明において、ND1ドメイン及びdND1ドメインが、ND1ドメインと2分子で用いた場合にDNAの二本鎖DNA切断活性(ヌクレアーゼ活性)を有するか欠損しているかは、当業者に公知の方法又はそれに準じた方法で適宜確認することができる。例えば、下記の試験例に記載のように、「TALE-L→確認対象のドメイン」をN末側からこの順で結合した融合体と、「TALE-R→配列番号:40に記載のアミノ酸配列(ND1ドメイン)」をN末側からこの順で結合した融合体とを細胞内で発現させ、TALEに対応する標的DNAが二本鎖DNA切断されるか否かにより確認することができる。この方法においては、プラスミド上のレポーター遺伝子(例えば、TALE認識配列が挿入されたEGFP遺伝子)を標的としたSSAアッセイ系を用い、レポーター活性を指標に評価してもよい。例えば、前記融合体の組み合わせを用いた場合のヌクレアーゼ活性が、「TALE-L→配列番号:40に記載のアミノ酸配列(ND1ドメイン)」をN末側からこの順で結合した融合体と、「TALE-R→配列番号:40に記載のアミノ酸配列(ND1ドメイン)」をN末側からこの順で結合した融合体とを細胞内で発現させたときのヌクレアーゼ活性の20%以上であれば、ヌクレアーゼ活性を有すると判断することができ、20%未満であれば、ヌクレアーゼ活性を欠損していると判断することができる。
また、本発明において、ND1ドメインとdND1ドメインとを2分子で用いた場合にDNAの一本鎖DNA切断活性(ニッカーゼ活性)を有するか否かも、当業者に公知の方法又はそれに準じた方法で適宜確認することができる。例えば、下記の試験例に記載のように、上記によりヌクレアーゼ活性を有することが確認された「TALE-L→確認対象のドメイン1」をN末側からこの順で結合した融合体(又は「TALE-L→配列番号:40に記載のアミノ酸配列(ND1ドメイン)」をN末側からこの順で結合した融合体)と、上記によりヌクレアーゼ活性の欠損が確認された「TALE-R→確認対象のドメイン2」をN末側からこの順で結合した融合体とを組み合わせて、ヌクレアーゼ活性が欠損されることを確認した上で、これに、ヌクレアーゼ活性の欠損が確認された融合体のTALE認識配列の近傍かつ反対鎖を一本鎖DNA切断するnCas9とガイドRNAとの組み合わせを作用させ、TALEに対応する標的DNAの二本鎖DNA切断活性が復活するか否かにより確認することができる。この方法においても、上記SSAアッセイ系を用い、レポーター活性を指標に評価してよい。
<ニッキングシステム>
本発明のニッキングシステムは、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び
第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質
を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムである。
本発明のニッキングシステムは、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び
第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質
を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムである。
(融合タンパク質)
本発明に係る第1の融合タンパク質及び第2の融合タンパク質(本明細書中、場合により単に「融合タンパク質」と総称する)は、DNA結合ドメインと上記のND1ドメイン又はdND1ドメインとを含む融合タンパク質である。本発明の融合タンパク質は、DNA結合ドメインを介して標的DNA上の標的領域の近傍(DNA結合ドメイン認識配列)にそれぞれ結合し、ND1ドメインとdND1ドメインとが互いに2量体を形成して、当該標的領域内又は当該標的領域の近傍で二本鎖DNAの一方の鎖を切断する(ニックを導入する)、部位特異的ニッキングシステムとして機能する。前記ND1ドメイン及びdND1ドメインとしては、その好ましい態様も含めて、それぞれ上述のとおりである。
本発明に係る第1の融合タンパク質及び第2の融合タンパク質(本明細書中、場合により単に「融合タンパク質」と総称する)は、DNA結合ドメインと上記のND1ドメイン又はdND1ドメインとを含む融合タンパク質である。本発明の融合タンパク質は、DNA結合ドメインを介して標的DNA上の標的領域の近傍(DNA結合ドメイン認識配列)にそれぞれ結合し、ND1ドメインとdND1ドメインとが互いに2量体を形成して、当該標的領域内又は当該標的領域の近傍で二本鎖DNAの一方の鎖を切断する(ニックを導入する)、部位特異的ニッキングシステムとして機能する。前記ND1ドメイン及びdND1ドメインとしては、その好ましい態様も含めて、それぞれ上述のとおりである。
(DNA結合ドメイン)
本発明において、ND1ドメインと共に第1の融合タンパク質を構成するDNA結合ドメインを第1のDNA結合ドメインと称し、dND1ドメインと共に第2の融合タンパク質を構成するDNA結合ドメインを第2のDNA結合ドメインと称し、第1のDNA結合ドメイン及び第2のDNA結合ドメインを総称して場合により単に「DNA結合ドメイン」と称する。
本発明において、ND1ドメインと共に第1の融合タンパク質を構成するDNA結合ドメインを第1のDNA結合ドメインと称し、dND1ドメインと共に第2の融合タンパク質を構成するDNA結合ドメインを第2のDNA結合ドメインと称し、第1のDNA結合ドメイン及び第2のDNA結合ドメインを総称して場合により単に「DNA結合ドメイン」と称する。
本発明に係る「DNA結合ドメイン」としては、任意のDNA配列(DNA結合ドメイン認識配列)に特異的に結合させることが可能なタンパク質ドメインであれば特に制限はない。DNA結合ドメインとしては、例えば、TALE、ジンクフィンガーアレイ(ZF)、PPRタンパク質(Pentatricopeptide Repeat Protein)が挙げられ、TALE及びジンクフィンガーアレイ(ZF)からなる群から選択される少なくとも1種が好ましく、TALEがより好ましい。本発明に係る第1のDNA結合ドメイン及び第2のDNA結合ドメインとしては、互いに同種であっても異種であってもよいが、同種(例えば、いずれもTALE)であることが好ましい。
〔TALE〕
TALE(転写活性化因子様エフェクターヌクレアーゼ:Transcription activator-like effector nuclease)は、典型的には、Xanthomonas属プロテオバクテリアが分泌し宿主植物の遺伝子転写を活性化するタンパク質であり、Ralstonia属細菌が有するTALE様タンパク質を含む総称である。本発明に係る「TALE」は、少なくとも、N末ドメイン及びTALEリピートドメインを含み、C末ドメインをさらに含んでいてもよい。
TALE(転写活性化因子様エフェクターヌクレアーゼ:Transcription activator-like effector nuclease)は、典型的には、Xanthomonas属プロテオバクテリアが分泌し宿主植物の遺伝子転写を活性化するタンパク質であり、Ralstonia属細菌が有するTALE様タンパク質を含む総称である。本発明に係る「TALE」は、少なくとも、N末ドメイン及びTALEリピートドメインを含み、C末ドメインをさらに含んでいてもよい。
TALEリピートドメインは、右巻き超らせん(superhelical)を形成するTALE配列の、複数、例えば10~30、好ましくは13~25、より好ましくは15~20のタンデムリピート(TALEリピート)で構成される。典型的なTALEリピート1単位(1つのTALE配列)は、33~35アミノ酸からなり、その12番目と13番目の2アミノ酸残基からなる可変残基(repeat variable diresidue:RVD)によって、DNAの特定の塩基を認識する。塩基を特異的に認識するRVDの例としては、Cを認識するHD、Tを認識するNG、Aを認識するNI、G又はAを認識するNN、及びA、C、G又はTを認識するNS等が挙げられる。かかるTALEリピートドメインのDNA認識機構に基づき、特定の塩基を認識するTALE配列を人工的に連結することにより、DNA上の特定のヌクレオチド配列(TALE認識配列)を認識して結合できるTALEを作製することができる。
本発明に係るTALEの前記TALE配列は、それぞれ、TALEリピートドメインがTALE認識配列を認識して結合できるものである限り、天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、前記TALE配列においては、それぞれ独立に、RVDの位置が変更されていても、RVD以外のアミノ酸残基が1個又は複数個(例えば、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)置換、欠失、挿入及び/又は付加されたものでもよく、また、RVDの12番目と13番目の2アミノ酸残基は、A、T、C及びGに対する特異性を増強するために他のアミノ酸残基に置換されてもよい。
本発明に係るTALEのTALEリピートドメインは、標的DNAの標的領域の5’側又は3’側に、それぞれ好ましくは0~30塩基のスペーサーを介して存在するヌクレオチド配列又はその相補配列を認識するように、すなわち、TALEが認識するTALE認識配列又はその相補配列が、前記標的領域の5’側又は3’側にそれぞれ好ましくは0~30塩基のスペーサーを介して存在するヌクレオチド配列となるように、より好ましくは、両TALE認識配列の間の距離が1~50塩基となるように、設計される。このような所望のTALEを設計、作製する技術は公知であり、例えば、Miller et al.,Nat Biotechnol 29,2011,p.143-148;Sakuma et al.,Sci Rep 3,3379(2013)や、前記Sakuma et al.(2013)に記載のPlatinum Gateシステムによって、前記ヌクレオチド配列に対する高い結合活性を有するTALEを作製することができる。
本発明に係るTALEのN末ドメインとしては、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるN末ドメインのアミノ酸配列)を用いることができるが、本発明に係る各融合タンパク質の機能(TALE認識配列への結合能、ニッカーゼ活性等)に著しく負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、欠失、挿入及び/又は付加されたものでもよい。また、精製や検出のためのフラグタグ、TALE-ND1ドメイン及びTALE-dND1ドメインを細胞核へ移行するための核局在化シグナル(NLS)等を含んでいてもよい。
このようなN末ドメインの鎖長としては、49~287アミノ酸残基であることが好ましく、80~200アミノ酸残基であることがより好ましく、120~180アミノ酸残基であることがさらに好ましい。
本発明に係るTALEのN末ドメインの具体例としては、上記の他、例えば、AddgeneのptCMV-136/63-VR-HD(ID:50699)に含まれるN末ドメインのアミノ酸配列や、AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインのアミノ酸配列が挙げられるが、これらに限定されるものではない。
本発明に係るTALEがC末ドメインをさらに含む場合、かかるTALEのC末ドメインとしても、天然型のアミノ酸配列(例えば、AddgeneのpTALETF_v2(ID:32185~32188)に含まれるC末ドメインのアミノ酸配列(WT:アミノ酸残基数=180))を用いることができるが、本発明に係る第2の融合タンパク質の機能(TALE認識配列への結合能、ニッカーゼ活性等)に著しく負の影響を与えない限り、前記天然型のアミノ酸配列に対して、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、欠失、挿入及び/又は付加されたものでもよい。
本発明に係るTALEがC末ドメインをさらに含む場合、前記TALEのC末ドメインとしては、天然型のアミノ酸配列においてC末側の一部のアミノ酸配列が除去されたものであってもよい。このようなC末ドメインとしては、C末ドメインの鎖長が、1~200アミノ酸残基であることが好ましく、5~150アミノ酸残基であることがより好ましく、10~125アミノ酸残基であることがさらに好ましく、10~100アミノ酸残基であることがさらにより好ましい。
前記C末ドメインの具体例としては、上記の他、例えば、AddgeneのpTALEN_v2(ID:32189~32192)に含まれるC末ドメインのアミノ酸配列(アミノ酸残基数=63)、AddgeneのptCMV-153/47-VR-NG(ID:50704)に含まれるC末ドメインのアミノ酸配列(アミノ酸残基数=47)が挙げられるが、これに限定されるものではない。
本発明に係るTALEの好ましい態様としては、TALEリピート1単位の2つの特定の位置のアミノ酸がTALEリピート4単位ごとに変化している、Platinum TALEN(特開2015-33365号公報)のTALEの態様が好ましいものとして挙げられる。
〔ジンクフィンガーアレイ〕
本発明に係るジンクフィンガーアレイは、DNA結合領域及びヌクレアーゼドメインを含むジンクフィンガーヌクレアーゼ(ZFN)のうちのDNA結合領域を示す。ジンクフィンガーアレイは、通常、2~15、好ましくは3~8、より好ましくは4~6個のジンクフィンガータンパク質からなり、各ジンクフィンガータンパク質の間は直接、又はリンカーを介して結合される。各ジンクフィンガータンパク質は、1つ以上の亜鉛と特定の塩基を認識するヘリックス構造とを含み、1つのジンクフィンガータンパク質でDNAの特定の3塩基を認識する。
本発明に係るジンクフィンガーアレイは、DNA結合領域及びヌクレアーゼドメインを含むジンクフィンガーヌクレアーゼ(ZFN)のうちのDNA結合領域を示す。ジンクフィンガーアレイは、通常、2~15、好ましくは3~8、より好ましくは4~6個のジンクフィンガータンパク質からなり、各ジンクフィンガータンパク質の間は直接、又はリンカーを介して結合される。各ジンクフィンガータンパク質は、1つ以上の亜鉛と特定の塩基を認識するヘリックス構造とを含み、1つのジンクフィンガータンパク質でDNAの特定の3塩基を認識する。
本発明に係るジンクフィンガーアレイは、それぞれ、DNA結合ドメイン認識配列を認識して結合できるものである限り、特に制限されず、適宜改変されたものであってもよい。例えば、1個又は複数個(例えば、50個以下、30個以下、20個以下、10個以下、9個以下、8個以下、7個以下、6個以下、好ましくは5個以下又は4個以下、さらに好ましくは3個以下又は2個以下)のアミノ酸残基が置換、欠失、挿入及び/又は付加されたものでもよい。
本発明に係るジンクフィンガーアレイは、標的DNAの標的部位の5’側又は3’側に、それぞれ好ましくは1~10塩基のスペーサーを介して存在するヌクレオチド配列又はその相補配列を認識するように、すなわち、ジンクフィンガーアレイが認識するジンクフィンガーアレイ認識配列又はその相補配列が、前記標的部位の5’側又は3’側にそれぞれ1~10塩基のスペーサーを介して存在するヌクレオチド配列となるように、設計される。このようなジンクフィンガーアレイを設計、作製する技術は公知であり、例えば、Beerli et al.,Nat Biotechnol 20,135-141(2002)、Sander et al.,Nat Methods 8,67-69(2011)等に記載の方法を参照して適宜設計、作製することができる。
(リンカー)
本発明の融合タンパク質において、各DNA結合ドメインとND1ドメイン又はdND1ドメインとは、それぞれ、直接結合されていても、リンカーを介して結合されていてもよい。前記リンカーとしては、本発明に係る各融合タンパク質の機能(DNA結合ドメイン認識配列への結合能、ニッカーゼ活性等)に著しく負の影響を与えない限り、その鎖長や種類において、特に制限はない。前記リンカーの鎖長としては、通常、2~180アミノ酸残基であり、好ましくは2~120アミノ酸残基である。例えば、前記DNA結合ドメインがTALEである場合、TALEリピートドメインと前記ND1ドメイン又はdND1ドメインとの間の距離が、TALEのN末ドメイン(N末側から、ND1ドメイン又はdND1ドメイン→DNA結合ドメインの順の場合)又はC末ドメイン(N末側から、DNA結合ドメイン→ND1ドメイン又はdND1ドメインの順の場合)、より好ましくは後者の場合であってC末ドメインの鎖長も含めた距離で、1~200アミノ酸残基、好ましくは5~150アミノ酸残基、より好ましくは10~125アミノ酸残基、さらに好ましくは10~100アミノ酸残基となるように前記リンカーの鎖長を調整することができる。この場合、TALEリピートドメインと前記ND1ドメイン又はdND1ドメインとの間の距離は、N末側から、DNA結合ドメイン→ND1ドメイン又はdND1ドメインの順の場合には、TALEリピートドメインのC末端のC末側に隣接するアミノ酸残基を1残基目として、ND1ドメイン又はdND1ドメインのN末端のN末側に隣接する残基までのアミノ酸残基の数であり、N末側から、ND1ドメイン又はdND1ドメイン→DNA結合ドメインの順の場合には、TALEリピートドメインのN末端のN末側に隣接するアミノ酸残基を1残基目として、ND1ドメイン又はdND1ドメインのC末端のC末側に隣接する残基までのアミノ酸残基の数である。
本発明の融合タンパク質において、各DNA結合ドメインとND1ドメイン又はdND1ドメインとは、それぞれ、直接結合されていても、リンカーを介して結合されていてもよい。前記リンカーとしては、本発明に係る各融合タンパク質の機能(DNA結合ドメイン認識配列への結合能、ニッカーゼ活性等)に著しく負の影響を与えない限り、その鎖長や種類において、特に制限はない。前記リンカーの鎖長としては、通常、2~180アミノ酸残基であり、好ましくは2~120アミノ酸残基である。例えば、前記DNA結合ドメインがTALEである場合、TALEリピートドメインと前記ND1ドメイン又はdND1ドメインとの間の距離が、TALEのN末ドメイン(N末側から、ND1ドメイン又はdND1ドメイン→DNA結合ドメインの順の場合)又はC末ドメイン(N末側から、DNA結合ドメイン→ND1ドメイン又はdND1ドメインの順の場合)、より好ましくは後者の場合であってC末ドメインの鎖長も含めた距離で、1~200アミノ酸残基、好ましくは5~150アミノ酸残基、より好ましくは10~125アミノ酸残基、さらに好ましくは10~100アミノ酸残基となるように前記リンカーの鎖長を調整することができる。この場合、TALEリピートドメインと前記ND1ドメイン又はdND1ドメインとの間の距離は、N末側から、DNA結合ドメイン→ND1ドメイン又はdND1ドメインの順の場合には、TALEリピートドメインのC末端のC末側に隣接するアミノ酸残基を1残基目として、ND1ドメイン又はdND1ドメインのN末端のN末側に隣接する残基までのアミノ酸残基の数であり、N末側から、ND1ドメイン又はdND1ドメイン→DNA結合ドメインの順の場合には、TALEリピートドメインのN末端のN末側に隣接するアミノ酸残基を1残基目として、ND1ドメイン又はdND1ドメインのC末端のC末側に隣接する残基までのアミノ酸残基の数である。
前記リンカーの種類としては特に制限されず、例えば、Sun,N.,&Zhao,H.(2014)Molecular BioSystems,10(3),p.446-453に記載のHTS95アミノ酸配列からなるHTS95リンカー、GSSリンカー、SAGGリンカー、GGGGSリンカー、XTENリンカー等が挙げられる。
本発明に係る融合タンパク質において、DNA結合ドメインとND1ドメイン又はdND1ドメインとは、必要に応じて前記リンカーを介して、どちらがN末側にあってもC末側にあってもよい。これらの中でも、本発明に係る融合タンパク質としては、特にDNA鎖に特異的、つまり、第2の融合タンパク質が結合するDNA結合ドメイン認識配列のある鎖に特異的に優れたニッカーゼ活性を示す観点からは、N末側から、DNA結合ドメイン→(必要に応じて前記リンカー)→ND1ドメイン又はdND1ドメインの順に結合されていることが好ましい。
本発明に係る融合タンパク質において、DNA結合ドメインとND1ドメイン又はdND1ドメインとの結合は、核酸レベル及びアミノ酸レベルで行うことができる。すなわち、「ND1ドメイン又はdND1ドメインをコードするポリヌクレオチド→DNA結合ドメインをコードするポリヌクレオチド」又は「DNA結合ドメインをコードするポリヌクレオチド→ND1ドメイン又はdND1ドメインをコードするポリヌクレオチド」の順となるように、それぞれのポリヌクレオチドをライゲーション反応により連結することにより、本発明に係る各融合タンパク質をコードするポリヌクレオチドを調製することができる。こうして得られたポリヌクレオチドを発現ベクターに挿入し、適当な宿主細胞内で発現させることにより、「ND1ドメイン又はdND1ドメイン→DNA結合ドメイン」又は「DNA結合ドメイン→ND1ドメイン又はdND1ドメイン」の順にアミノ酸レベルで結合された本発明に係る各融合タンパク質を得ることができる。
前記発現ベクターとしては、当該分野で使用されるベクターから適宜選択することができ、例えば、プラスミドベクター、ウイルスベクター、ファージベクター、ファージミドベクター、BACベクター、YACベクター、MACベクター、HACベクターが挙げられる。前記発現ベクターを導入する宿主細胞としては、発現ベクターとの適合性を考慮して適宜選択することができ、例えば、大腸菌、放線菌、古細菌などの原核生物や酵母、ウニ、カイコ、ゼブラフィッシュ、マウス、ラット、カエル、タバコ、シロイヌナズナ、イネ等の真核生物の細胞が挙げられる。なお、「ポリヌクレオチド」には、DNA及びRNA(mRNA)のいずれも包含し、各ポリヌクレオチドにおいては、細胞内での発現効率を高める等の目的で、コドンの最適化を行っていてもよい。
また、本発明に係る融合タンパク質は、アミノ酸配列情報を基に人工合成して調製することも可能である。さらに、本発明に係る融合タンパク質としては、精製や検出のためのエピトープタグ(例えば、フラグタグ、HAタグなど)や標識タンパク質(例えば、蛍光タンパク質など)、各種移行シグナル(例えば、核移行シグナル、色素体移行シグナル、ミトコンドリア移行シグナルなど)が付加されていてもよい。
<所望のヌクレオチド配列をノックインする方法>
本発明は、標的DNA上の標的領域にドナー配列を挿入する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
上記本発明のニッキングシステムと、
を標的DNAに接触させる工程を含む、
方法(本明細書中、場合により単に「本発明のノックイン方法」ともいう)を提供する。
本発明は、標的DNA上の標的領域にドナー配列を挿入する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
上記本発明のニッキングシステムと、
を標的DNAに接触させる工程を含む、
方法(本明細書中、場合により単に「本発明のノックイン方法」ともいう)を提供する。
(標的DNA)
本発明においては、所望のヌクレオチド配列、すなわち、下記のドナーDNAのドナー配列を挿入する領域を標的領域として、該標的領域を含むDNAを「標的DNA」という。本発明に係る標的DNAは二本鎖DNAであり、上記の本発明のニッキングシステムとの対応を示すために、便宜的に、少なくとも一方の鎖が、5’側から順に、5’DNA結合ドメイン認識配列又はその相補配列、必要に応じて前記スペーサー、前記標的領域、必要に応じて前記スペーサー、3’DNA結合ドメイン認識配列又はその相補配列を含む構造であるものとする。5’DNA結合ドメイン認識配列及び3’DNA結合ドメイン認識配列は、互いに同じ鎖上に設定しても、互いに反対鎖上に設定してもよいが、互いに反対鎖上に設定することが好ましい。
本発明においては、所望のヌクレオチド配列、すなわち、下記のドナーDNAのドナー配列を挿入する領域を標的領域として、該標的領域を含むDNAを「標的DNA」という。本発明に係る標的DNAは二本鎖DNAであり、上記の本発明のニッキングシステムとの対応を示すために、便宜的に、少なくとも一方の鎖が、5’側から順に、5’DNA結合ドメイン認識配列又はその相補配列、必要に応じて前記スペーサー、前記標的領域、必要に応じて前記スペーサー、3’DNA結合ドメイン認識配列又はその相補配列を含む構造であるものとする。5’DNA結合ドメイン認識配列及び3’DNA結合ドメイン認識配列は、互いに同じ鎖上に設定しても、互いに反対鎖上に設定してもよいが、互いに反対鎖上に設定することが好ましい。
また、本発明に係る標的DNAには、前記標的領域の5’側に隣接して、下記のドナーDNAの5’側ホモロジーアーム配列(5’HA)と同一配列である5’側配列を含み、また、3’側に隣接して、下記のドナーDNAの3’側ホモロジーアーム配列(3’HA)と同一配列である3’側配列を含むものとする。かかる5’側配列及び3’側配列は、それぞれ、5’DNA結合ドメイン認識配列若しくはその相補配列、又は、3’DNA結合ドメイン認識配列若しくはその相補配列と重複していてもよい。
本発明に係る「標的領域」は、下記のドナーDNAのドナー配列が挿入される、又は前記ドナー配列で置換される領域を示す。前記標的領域は、前記ニッキング酵素によって切断される切断部位を含む領域又はその近傍の領域であり、その長さとしては、隣接する2塩基の間の前記切断部位又はその近傍に存在する2塩基の間の1箇所であってもよく、当該切断部位に隣接する、又は当該切断部位の近傍に存在する1塩基であってもよく、当該切断部位を含む、又は当該切断部位の近傍に存在する2塩基以上であってもよい。本発明において、「標的領域にドナー配列を挿入」には、前記切断部位を挟む又はその近傍に存在する2塩基の間に前記ドナー配列が挿入される態様の他、1塩基以上の前記標的領域が前記ドナー配列で置換される態様を含むものとする。1塩基以上の標的領域の長さとしては、例えば、1~500塩基であることが好ましく、2~300塩基であることがより好ましく、2~100塩基であることがさらに好ましい。
なお、本発明において、「切断部位の近傍」という場合の「近傍」とは、好ましくは、前記切断部位との間の塩基数が100塩基以内であることを示し、50塩基以内であることがより好ましい。
本発明に係る「5’DNA結合ドメイン認識配列」及び「3’DNA結合ドメイン認識配列」は、それぞれ、第1のDNA結合ドメイン及び第2のDNA結合ドメインのうちのいずれかが認識する配列である。第1のDNA結合ドメイン及び第2のDNA結合ドメインは、互いに他方のDNA結合ドメイン認識配列に結合すればよく、どちらが5’DNA結合ドメイン認識配列に結合しても3’DNA結合ドメイン認識配列に結合してもよい。
本発明に係る「5’DNA結合ドメイン認識配列」及び「3’DNA結合ドメイン認識配列」(本明細書中、場合により単に「DNA結合ドメイン認識配列」と総称する)の長さとしては、DNA結合ドメインの種類に応じて設定されるが、例えば、前記各DNA結合ドメインがTALEである場合には、それぞれ独立に、10~30塩基であることが好ましく、13~25塩基であることが好ましく、15~22塩基であることがさらに好ましい。また例えば、前記各DNA結合ドメインがジンクフィンガーアレイである場合には、それぞれ独立に、6~45塩基であることが好ましく、9~24塩基であることが好ましく、12~18塩基であることがさらに好ましい。
本発明に係るDNA結合ドメイン認識配列の間の距離(5’DNA結合ドメイン認識配列又はその相補配列の5’側又は3’側に隣接する塩基を1塩基目として、3’DNA結合ドメイン認識配列又はその相補配列の3’側又は5’側に隣接する塩基までの長さ、標的領域を含む)としては、上記本発明のニッキング酵素が2量体を形成でき、特異的かつ高効率で前記標的領域内又は前記標的領域の近傍にニックを導入できる観点から、1~50塩基であることが好ましく、2~40塩基であることが好ましく、3~30塩基であることがより好ましい。
このような標的DNAのヌクレオチド配列としては、特に制限されず、5’DNA結合ドメイン認識配列又はその相補配列、3’DNA結合ドメイン認識配列又はその相補配列、DNA結合ドメイン認識配列の間の距離、5’側配列、及び3’側配列が上記条件を満たすように、下記のドナーDNA、並びに、第1の融合タンパク質及び第2の融合タンパク質における各DNA結合ドメインを設計することにより、本発明のノックイン方法の標的とすることができる。
本発明に係る標的DNAとしては、目的に応じて、細胞内に存在するDNA(内在性DNA)又は細胞外に存在するDNAとすることができる。細胞内に存在するDNAとしては、内因性DNAであっても、外因性DNAであってもよい。内因性DNAとしては核内のゲノムDNA、葉緑体DNA、ミトコンドリアDNAが挙げられ、外因性DNAとしては、例えば、細胞内に導入したDNAが挙げられる。本発明に係る標的DNAが細胞内に存在するDNA(内因性DNA)である場合、当該DNAとしては、核内のゲノムDNA又は外因性DNAであることがより好ましい。細胞外に存在するDNAとしては、細胞に由来するDNAであっても、細胞外で増幅、合成したDNAであってもよい。
(ssDNA)
本発明のノックイン方法は、ドナーDNAとして、ドナー配列を含む一本鎖DNA(ssDNA)を用いることを特徴とする。
本発明のノックイン方法は、ドナーDNAとして、ドナー配列を含む一本鎖DNA(ssDNA)を用いることを特徴とする。
本発明において、「ドナー配列」とは、前記標的DNAの標的領域に挿入することを目的とする所望のヌクレオチド配列であり、特に制限されず、任意のヌクレオチド配列を採用することができる。本発明のノックイン方法により、前記標的領域がこのドナー配列に置き換えられる。一例として、前記ドナー配列としては、前記標的領域に変異(例えば、塩基の置換、欠失、付加、又は挿入)が導入されてなる配列が挙げられる。また、別の一例として、前記ドナー配列としては、外来DNA配列(例えば、組換え酵素認識配列、組換え酵素発現カセット、薬剤耐性遺伝子発現カセット、ネガティブセレクションマーカー発現カセット、蛍光タンパク質発現カセット等)を含む配列が挙げられる。また、前記ドナー配列としては、前記標的領域(又はその変異配列)に前記外来DNA配列が導入された配列とすることもできる。
このようなドナー配列の長さとしては、特に制限されず、例えば、1~10000塩基とすることができ、10~10000塩基であることが好ましく、30~5000塩基であることがより好ましく、50~3000塩基であることがさらに好ましい。
本発明に係るドナーDNAは、また、前記ドナー配列の5’側に、前記標的領域の5’側に隣接するヌクレオチド配列(5’側配列)と同一配列である5’側ホモロジーアーム配列(本明細書中、場合により「5’HA」とも称する)を含み、3’側に、前記標的領域の3’側に隣接するヌクレオチド配列(3’側配列)と同一配列である3’側ホモロジーアーム配列(本明細書中、場合により「3’HA」と称する)を含む。
本発明に係る一本鎖DNAを、センス鎖上にある標的領域を基に設計する場合、5’HAは、前記センス鎖上の標的領域の5’側に隣接するヌクレオチド配列の同一配列とし、3’HAは、前記センス鎖上の標的領域の3’側に隣接するヌクレオチド配列の同一配列とする。また、アンチセンス鎖上にある標的領域を基に設計する場合、5’HAは、前記アンチセンス鎖上の標的領域の5’側に隣接するヌクレオチド配列の同一配列とし、3’HAは、前記アンチセンス鎖上の標的領域の3’側に隣接するヌクレオチド配列の同一配列とする。
本発明に係る5’HA及び3’HA(本明細書中、場合により単に「ホモロジーアーム」と総称する)の、前記標的DNA上の5’側配列又は3’側配列との同一配列としては完全に同一(すなわち、同一性が100%)でなくとも、実質的に同一であればよく、例えば、それぞれ独立して、同一性が80%以上であればよく、85%以上であることが好ましく、90%以上であることがより好ましく、95%以上であることがさらに好ましく、97%以上、98%以上、99%以上であることがさらにより好ましい。
前記ホモロジーアームの長さとしては、それぞれ独立に、10~800塩基であることが好ましく、20~750塩基であることがより好ましく、30~700塩基であることがさらに好ましい。これらの中でも、本発明に係るドナーDNAとしては、前記ホモロジーアームの長さが、それぞれ独立に、100塩基以上である長鎖一本鎖DNA(lssDNA)であることが好ましく、前記ホモロジーアームの長さが、それぞれ独立に、100~700塩基であることがより好ましく、100~600塩基であることがさらに好ましい。
本発明のドナーDNAとしては、好ましくは、5’側から、5’HA、ドナー配列、3’HAの順で配置されてなるヌクレオチド配列のみからなる一本鎖DNAであるが、本発明の効果(ノックイン効率等)を著しく阻害しない限りこれに限定されず、例えば、5’末端及び/又は3’末端に、任意の複数塩基(好ましくは100塩基以下)からなるヌクレオチド配列が付加されていてもよい。
このようなドナーDNAの長さ(全長)としては、特に制限されないが、例えば、21~11600塩基とすることができ、40~10000塩基であることが好ましく、60~6000塩基であることがより好ましく、100~4000塩基であることがさらに好ましい。
本発明のドナーDNAとしては、公知の一本鎖DNAを作製する方法又はそれに準じた方法によって作製することができる。例えば、PCR、制限酵素切断、DNA連結技術等を利用して作製することができる。また、Inoue et al.,Cells,2021,10,1076.https://doi.org/10.3390/cells10051076(非特許文献3)に記載の方法にしたがって、一方のプライマーの5’末端をリン酸化したプライマーセットを用いてPCRにより一本鎖DNAの配列を増幅し、得られた二本鎖DNAのうち、5’末端がリン酸化された方の鎖を同リン酸化末端から消化することにより、長鎖一本鎖DNAの場合にも目的の一本鎖DNAを作製することができる。
(ノックイン)
本発明のノックイン方法では、前記ドナーDNA及びニッキングシステムを前記標的DNAに接触させ、前記ニッキングシステムによって前記標的領域内又は前記標的領域の近傍を切断することで当該標的領域に前記ドナー配列を挿入する。
本発明のノックイン方法では、前記ドナーDNA及びニッキングシステムを前記標的DNAに接触させ、前記ニッキングシステムによって前記標的領域内又は前記標的領域の近傍を切断することで当該標的領域に前記ドナー配列を挿入する。
なお、本発明において、ニックを導入する位置について「標的領域の近傍」という場合の「近傍」とは、好ましくは、前記標的領域に隣接する塩基を1塩基目として、100塩基以内であることを示し、50塩基以内であることがより好ましい。
前記ドナーDNAと、前記ニッキングシステム、すなわち、第1の融合タンパク質及び第2の融合タンパク質を標的DNAに接触させると、第1の融合タンパク質及び第2の融合タンパク質の各DNA結合ドメインが標的DNA上の対応するDNA結合ドメイン認識配列を認識して結合し、第1のDNA結合ドメインに連結されたND1ドメイン、及び、第2のDNA結合ドメインに連結されたdND1ドメインを当該標的DNA上の標的領域付近に誘導する。これにより、当該標的領域内又は前記標的領域の近傍において、ND1ドメイン及びdND1ドメインの2量体を含むニッキング酵素が二本鎖DNAの一方の鎖を切断してニックを導入する。このとき、例えば、第1の融合タンパク質の構成が、N末側から「TALE→ND1」の順に結合された構成であり、第2の融合タンパク質の構成が、N末側から「TALE→dND1」の順に結合された構成である場合、第2の融合タンパク質が結合するDNA結合ドメイン認識配列がある鎖に選択的にニックを導入することができる。ニックが導入された結果、前記ドナーDNAと前記標的DNAとの間におけるホモロジーアームとその同一配列(5’側配列、3’側配列)との相関により、前記ドナー配列が当該標的領域に挿入される。
本発明のノックイン方法は、細胞内において行っても、無細胞系において行ってもよい。本発明のノックイン方法の場となる「細胞内」としては、真核細胞内であっても原核細胞内であってもよく、好ましくは真核細胞内である。前記真核細胞としては、例えば、動物細胞(哺乳類、魚類、鳥類、爬虫類、両生類、昆虫類の細胞等)、植物細胞、藻細胞、酵母が挙げられ、前記原核細胞としては、例えば、大腸菌、サルモネラ菌、枯草菌、乳酸菌、高度好熱菌が挙げられる。
「動物細胞」には、例えば、動物の個体を構成している細胞、動物から摘出された器官・組織を構成する細胞、動物の組織に由来する培養細胞等が含まれる。具体的には、例えば、卵母細胞や精子などの生殖細胞;各段階の胚の胚細胞(例えば、1細胞期胚、2細胞期胚、4細胞期胚、8細胞期胚、16細胞期胚、桑実期胚など);誘導多能性幹(iPS)細胞や胚性幹(ES)細胞などの幹細胞;線維芽細胞、造血細胞、ニューロン、筋細胞、骨細胞、肝細胞、膵臓細胞、脳細胞、腎細胞などの体細胞などが挙げられる。ノックイン動物の作製に用いられる卵母細胞としては、受精前及び受精後の卵母細胞を利用することができるが、好ましくは受精後の卵母細胞、すなわち受精卵である。特に好ましくは、受精卵は前核期胚のものである。卵母細胞は、凍結保存されたものを解凍して用いることができる。
「植物細胞」には、例えば、植物の個体を構成している細胞、植物から分離した器官や組織を構成する細胞、植物の組織に由来する培養細胞等が含まれる。植物の器官や組織としては、例えば、葉、茎、茎頂(生長点)、根、塊茎、カルスなどが挙げられる。
また、本発明のノックイン方法の場となる「無細胞系」とは、生きた細胞(前記真核細胞、原核細胞)のない系を示す。本発明に係る無細胞系としては、前記ドナーDNA及びニッキングシステムと、前記標的DNAとが接触可能な系であれば特に制限されず、例えば、緩衝液内;前記真核細胞又は原核細胞の細胞破砕液内、細胞抽出液内等が挙げられる。
前記ドナーDNA及びニッキングシステムと前記標的DNAとを接触させる方法としては特に制限されない。細胞内においては、例えば、下記のノックイン細胞の製造方法のように、前記標的DNAを含む細胞に対して前記ドナーDNA及びニッキングシステムを導入又は発現させる方法が挙げられる。無細胞系においては、例えば、標的DNAの溶液と前記前記ドナーDNA及びニッキングシステムの溶液とを混合すればよい。これらの溶液の溶媒としては、特に制限されないが、例えば、リン酸緩衝液、Tris緩衝液、グッド緩衝液、ホウ酸緩衝液等の緩衝液が好ましい。
<ノックイン細胞の製造方法>
本発明は、標的DNA上の標的領域にドナー配列が挿入された細胞を製造する方法であり、
前記ドナーDNAと、
上記本発明のニッキングシステムと、
を細胞内に導入又は細胞内で発現させ、標的DNAに接触させる工程を含む、
方法(本明細書中、場合により「本発明のノックイン細胞の製造方法」ともいう)も提供する。
本発明は、標的DNA上の標的領域にドナー配列が挿入された細胞を製造する方法であり、
前記ドナーDNAと、
上記本発明のニッキングシステムと、
を細胞内に導入又は細胞内で発現させ、標的DNAに接触させる工程を含む、
方法(本明細書中、場合により「本発明のノックイン細胞の製造方法」ともいう)も提供する。
本発明のノックイン細胞の製造方法において、前記標的DNA、ドナーDNA、及びニッキングシステムは、それぞれ、その好ましい態様も含めて、上述したとおりである。本発明のノックイン細胞の製造方法における標的DNAとしては、細胞内のゲノムDNAであり、より好ましくは、核内のゲノムDNAであり、当該ゲノムDNAの編集目的に応じて、ドナーDNA、第1の融合タンパク質、及び第2の融合タンパク質を設計することができる。前記細胞としては、上記の本発明のノックイン方法の場として挙げた各細胞が挙げられる。
また、本発明のノックイン細胞の製造方法において、前記ドナーDNA及びニッキングシステムと前記標的DNAとの接触は、前記ドナーDNA及びニッキングシステムの細胞内への導入、又は、前記ドナーDNAの細胞内への導入及び前記ニッキングシステムの細胞内での発現により行う。したがって、本発明に係るニッキングシステムとしては、これを構成する各融合タンパク質を、それぞれタンパク質の形態で細胞に導入しても、当該タンパク質をコードするRNAやDNA(ポリヌクレオチド)の形態で細胞に導入して細胞内で発現させても、前記ポリヌクレオチドを含み、当該タンパク質を発現するベクター(発現ベクター)の形態で細胞に導入して細胞内で発現させてもよい。
前記各融合タンパク質を発現ベクターの形態で細胞に導入して細胞内で発現させる場合には、例えば、前記各融合タンパク質を発現するベクターをそれぞれ細胞内に導入してもよく、また、これらを組み合わせて発現するベクターを細胞内に導入してもよい。
また、前記各融合タンパク質を発現ベクターの形態やポリヌクレオチドの形態で細胞に導入して細胞内で発現させる場合、前記各融合タンパク質をコードするポリヌクレオチドとしては、それぞれ独立して、導入する細胞に応じて適宜コドン最適化されたものであってもよい。また、当該発現ベクターとしては、発現させるべきポリヌクレオチドに作動可能に連結しているプロモーター及び/又はその他の制御配列を含むことが好ましい。ここで、「作動可能に結合している」とは、調節エレメントに上記ポリヌクレオチドが発現可能に結合していることを意味する。「調節エレメント」としては、プロモーター、エンハンサー、内部リボソーム進入部位(IRES)、及び他の発現制御エレメント(例えば、転写終結シグナル、ポリアデニル化シグナルなど)が挙げられる。プロモーターとしては、例えば、polIIIプロモーター、polIIプロモーター、polIプロモーター、及びこれらの組み合わせが挙げられ、当業者であれば、導入する細胞の種類などに応じて、適切な発現ベクターを選択することができる。さらに、当該発現ベクターとしては、宿主ゲノムに組み込まれることなく、コードするタンパク質を安定して発現することができるものであることが好ましい。このような融合タンパク質発現ベクターは、適宜従来公知の方法に準じて作製することができる。
前記ドナーDNA、前記各融合タンパク質、各融合タンパク質をコードするポリヌクレオチド、各融合タンパク質を発現するベクターを細胞に導入する方法としては、タンパク質やDNA、RNA断片を細胞に導入するための公知の方法を細胞の種類に応じて適宜採用することができ、このような方法としては、例えば、電気穿孔法(エレクトロポレーション法)、マイクロインジェクション法、パーティクルガン法、リン酸カルシウム法、ポリエチレンイミン(PEI)法、リポソーム法(リポフェクション法)、DEAE-デキストラン法、カチオン性脂質媒介トランスフェクション、ウイルス(アデノウイルス、レンチウイルス、アデノ随伴ウイルス、バキュロウィルス等)、アグロバクテリウム法、酢酸リチウム法、スフェロプラスト法、熱ショック法(塩化カルシウム法、塩化ルビジウム法)等が挙げられる。このような方法は、「Daviset al.,Basic methods in molecular biology,New York:Elsevier,1986」等、多くの標準的研究室マニュアルに記載されている。
前記ドナーDNA及びニッキングシステムが細胞内に導入される又は細胞内で発現すると、前記ドナーDNAと各融合タンパク質と細胞内の標的DNAとが接触し、上記の本発明のノックイン方法で述べた標的領域へのドナー配列の挿入が起こり、かかる標的領域にドナー配列が挿入された細胞を得ることが可能となる。
本発明はまた、標的DNA上の標的領域にドナー配列が挿入された細胞(ノックイン細胞)を含む非ヒト個体の作製方法を提供する。この方法は、上記本発明のノックイン細胞の製造方法により得られた細胞から非ヒト個体を作製する工程を含む。前記非ヒト個体としては、例えば、非ヒト動物及び植物が挙げられる。前記非ヒト動物としては、哺乳類(マウス、ラット、モルモット、ハムスター、ウサギ、サル、ブタ、ウシ、ヤギ、ヒツジなど)、魚類、鳥類、爬虫類、両生類、昆虫類が挙げられる。モデル動物を作製する場合、哺乳動物は、好ましくは、マウス、ラット、モルモット、ハムスターなどのげっ歯類であり、特に好ましくはマウスである。前記植物としては、例えば、穀物類、油料作物、飼料作物、果物、野菜類が挙げられる。具体的な作物としては、例えば、イネ、トウモロコシ、バナナ、ピーナツ、ヒマワリ、トマト、アブラナ、タバコ、コムギ、オオムギ、ジャガイモ、ダイズ、ワタ、カーネーションを例示することができる。
前記ノックイン細胞から非ヒト個体を作製する方法としては、公知の方法を利用することができる。動物において細胞から非ヒト個体を作製する場合、通常、生殖細胞又は多能性幹細胞が利用される。例えば、前記ドナーDNA及びニッキングシステムを卵母細胞にマイクロインジェクションし、得られた卵母細胞を偽妊娠状態にした雌非ヒト哺乳動物の子宮に移植し、その後産仔を得ることができる。また、植物においては、古くから、その体細胞が分化全能性を有していることが知られており、例えば、前記ドナーDNA及びニッキングシステムを植物細胞にマイクロインジェクションし、得られた植物細胞から植物体を再生することにより、所望のヌクレオチド配列がゲノムに挿入された植物体を得ることができる。また、得られた非ヒト個体からは、所望のヌクレオチド配列がゲノムに挿入された子孫やクロ-ンを得ることもできる。
標的DNA上の標的領域へのドナー配列のノックインの有無の確認、及び遺伝子型の決定は、従来公知の方法に基づいて行うことができ、例えばPCR法、配列決定法、サザンブロッティング法等を利用することができる。
<キット>
本発明は、また、上記本発明のノックイン方法、本発明のノックイン細胞の製造方法、又は上記本発明の非ヒト個体の作製方法に用いるためのキットであり、
第1の融合タンパク質、第1の融合タンパク質を発現する第1の融合タンパク質発現ベクター、及び第1の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
第2の融合タンパク質、第2の融合タンパク質を発現する第2の融合タンパク質発現ベクター、及び第2の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
を含むキットを提供する。
本発明は、また、上記本発明のノックイン方法、本発明のノックイン細胞の製造方法、又は上記本発明の非ヒト個体の作製方法に用いるためのキットであり、
第1の融合タンパク質、第1の融合タンパク質を発現する第1の融合タンパク質発現ベクター、及び第1の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
第2の融合タンパク質、第2の融合タンパク質を発現する第2の融合タンパク質発現ベクター、及び第2の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
を含むキットを提供する。
第1の融合タンパク質及び第2の融合タンパク質は、それぞれ、その好ましい態様も含めて、上記の本発明のニッキングシステムで述べたとおりである。これらはそれぞれ独立して、タンパク質の形態であっても、当該タンパク質をコードするポリヌクレオチドの形態であっても、当該タンパク質を発現するベクター(発現ベクター)の形態であってもよい。第1の融合タンパク質及び第2の融合タンパク質の各発現ベクター、並びに、これらをコードする各ポリヌクレオチドも、それぞれ、その好ましい態様も含めて上述のとおりである。また、本発明のキットとしては、前記ドナーDNAをさらに含んでいてもよく、これは、その好ましい態様も含めて、上記の本発明のノックイン方法で述べたとおりであるが、各方法に用いるためのドナーDNAは、標的DNAの標的領域に応じて、ユ-ザ-が適宜設計、合成してよい。
本発明に係る融合タンパク質が発現ベクターの形態である場合、標的DNAの標的領域に応じて、ユ-ザ-が前記各融合タンパク質を設計することができる形態であってもよく、第1の融合タンパク質発現ベクターは、
(i)ND1ドメイン及び第1のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、
(ii)ND1ドメインをコードするポリヌクレオチドと、第1のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクター
からなる群から選択される少なくとも1種とすることができ、第2の融合タンパク質発現ベクターは、
(iii)dND1ドメイン及び第2のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、
(iv)dND1ドメインをコードするポリヌクレオチドと、第2のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクター
からなる群から選択される少なくとも1種とすることができる。
(i)ND1ドメイン及び第1のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、
(ii)ND1ドメインをコードするポリヌクレオチドと、第1のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクター
からなる群から選択される少なくとも1種とすることができ、第2の融合タンパク質発現ベクターは、
(iii)dND1ドメイン及び第2のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、
(iv)dND1ドメインをコードするポリヌクレオチドと、第2のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクター
からなる群から選択される少なくとも1種とすることができる。
上記(i)~(iv)のベクターにおいて、各構成(ドメイン、必要に応じてリンカー、挿入部位等)の順は、発現させる目的の第1の融合タンパク質及び第2の融合タンパク質に応じて適宜調整することができる。また、例えば、第1のDNA結合ドメイン及び第2のDNA結合ドメインがTALEである場合、(ii)、(iv)における挿入部位に挿入されるポリヌクレオチドはそのTALEリピート配列のみであってもよく、この場合、(ii)、(iv)のベクターには、TALEのN末ドメインをコードするポリヌクレオチド及び必要に応じてC末ドメインをコードするポリヌクレオチドを含んでいてよい。さらに、第1の融合タンパク質発現ベクター及び第2の融合タンパク質発現ベクターは、第1の融合タンパク質及び第2の融合タンパク質を発現する1つのベクターであってもよい。なお、(i)~(iv)の各ベクターとしては、それぞれ、各ポリヌクレオチドを発現可能にする発現ユニットを含むものであることが好ましい。
本発明のキットとしては、一つ又は複数の追加の試薬をさらに含んでいてもよい。このような追加の試薬としては、例えば、希釈緩衝液、再構成溶液、洗浄緩衝液、核酸導入試薬、タンパク質導入試薬、対照試薬が挙げられるが、これらに制限されるものではない。また、当該キットは、本発明の各方法を実施するための使用説明書をさらに含んでいてもよい。
本発明のキットに含まれる各要素は、それぞれ別個の容器に収容されていてもよいし、同一の容器に収容されていてもよい。各要素は、一回の使用量ごとに容器に収容されていてもよいし、複数回分の量が一つの容器に収容されていてもよい。各要素は乾燥形態で容器に収容されていてもよいし、適当な溶媒(緩衝液、安定剤、保存剤、防腐剤等を含む溶媒)中に溶解した形態で容器に収容されていてもよい。
以下、試験例に基づいて本発明をより具体的に説明するが、本発明は以下の試験例に限定されるものではない。
(試験例1)シングルストランドアニーリング(SSA)アッセイによるニッカーゼ活性確認
〔方法〕
(1)TALEベクターセット及びTALE発現プラスミドの作製
TALEベクターセットの配列及び構成は、各TALE認識配列に対応するように、Sakuma et al.,Sci.Rep.,3:3379(2013)にしたがって構築した。先ず、12番目と13番目の2アミノ酸で構成される可変残基の4種(RVD:HD、NG、NI、NN)をコードする配列以外のモジュ-ル配列(non-repeat-variable di-residue(non-RVD))に改変(特に、4番目と32番目)を加え、さらにその両端に制限酵素BsAI認識サイトを付加した配列(モジュ-ル配列)を人工DNA合成した(計16種:1HD~4HD、1NG~4NG、1NI~4NI、1NN~4NN)。次いで、これらモジュ-ル配列をpEX-A2J2(Eurofins Genomics社製,Tokyo,Japan)に挿入して、モジュ-ルプラスミドセット(計16種:pEX1HD~pEX4HD、pEX1NG~pEX4NG、pEX1NI~pEX4NI、及びpEX1NN~pEX4NN)を作製した。
〔方法〕
(1)TALEベクターセット及びTALE発現プラスミドの作製
TALEベクターセットの配列及び構成は、各TALE認識配列に対応するように、Sakuma et al.,Sci.Rep.,3:3379(2013)にしたがって構築した。先ず、12番目と13番目の2アミノ酸で構成される可変残基の4種(RVD:HD、NG、NI、NN)をコードする配列以外のモジュ-ル配列(non-repeat-variable di-residue(non-RVD))に改変(特に、4番目と32番目)を加え、さらにその両端に制限酵素BsAI認識サイトを付加した配列(モジュ-ル配列)を人工DNA合成した(計16種:1HD~4HD、1NG~4NG、1NI~4NI、1NN~4NN)。次いで、これらモジュ-ル配列をpEX-A2J2(Eurofins Genomics社製,Tokyo,Japan)に挿入して、モジュ-ルプラスミドセット(計16種:pEX1HD~pEX4HD、pEX1NG~pEX4NG、pEX1NI~pEX4NI、及びpEX1NN~pEX4NN)を作製した。
また、アレイプラスミドを構成するDNA配列FUS2_aXX(計7種:XX=1a、2a、2b、3a、3b、4a、4b)及びFUS2_b(1-4)(計4種)を人工DNA合成により作製した。これらをpCR8/GW/TOPO (Thermo Fisher Scientific社製,Waltham,MA,USA)に挿入して、pCR8_FUS2_aXX及びpCR8_FUS_b(1-4)を作製した。次いで、これを上記Sakuma et al.(2013)に記載のPlatinum Gateシステムにおける最初のアセンブルステップ(ステップ1)の捕捉ベクターとして使用し、同文献に記載の方法にしたがって、TALE配列を連結したアレイプラスミドを作製した。
次いで、pcDNA3.1(+)(Thermo Fisher Scientific社製)から薬剤耐性遺伝子発現ユニットを除去したpcDNA3.1sに、人工DNA合成により作製した、TALEのN末ドメインをコードする配列に加え、前記モジュ-ル配列を1つと、この3’末に続くTALEのC末ドメインをコードする配列と、を挿入したデスティネーションベクター(TALE47ベクター)を作製した。TALEのC末ドメインとしては、C末ドメインのアミノ酸数が47のもの(47)を用い、「47」をコードする配列はAddgeneのptCMV-153/47-VR-NG(Addgene ID:50704)に含まれるC末ドメインの配列を参照して人工DNA合成した。また、TALEのN末ドメインとしては、C末ドメインに対応させて、AddgeneのptCMV-153/47-VR-HD(ID:50703)に含まれるN末ドメインの配列を参照して人工DNA合成した。上記で作製したアレイプラスミド及びデスティネーションベクターを用いて、上記Sakuma et al.(2013)に記載の方法にしたがい、Golden Gate法によってTALE発現プラスミドを作製した。
(2)TALE-ND1発現プラスミド及びTALE-dND1発現プラスミドの作製
人工合成したND1ドメイン(ヌクレオチド配列番号:39、アミノ酸配列番号:40)をコードしているDNAを鋳型として、下記の表1に示すプライマーセットを用いてPCRにより増幅した断片(ND1)と、上記(1)で調製したTALE47ベクターを鋳型として、下記の表1に示すプライマーセットを用いてPCRにより増幅した断片(TALE47)とを、In-Fusion法により連結することにより、TALE47のC末側にND1ドメインが融合した融合タンパク質を発現するTALE47-ND1発現プラスミドを作製した。次いで、TALE47-ND1発現プラスミドを鋳型として、下記の表1に示す2種のプライマーセットを用いてPCRにより増幅した断片をIn-Fusion法により連結する部位特異的変異導入法により、TALE47のC末側にND1ドメインにD66N変異を導入したdND1ドメイン(ヌクレオチド配列番号:41、アミノ酸配列番号:42)が融合した融合タンパク質を発現するTALE47-dND1発現プラスミドを作製した。
人工合成したND1ドメイン(ヌクレオチド配列番号:39、アミノ酸配列番号:40)をコードしているDNAを鋳型として、下記の表1に示すプライマーセットを用いてPCRにより増幅した断片(ND1)と、上記(1)で調製したTALE47ベクターを鋳型として、下記の表1に示すプライマーセットを用いてPCRにより増幅した断片(TALE47)とを、In-Fusion法により連結することにより、TALE47のC末側にND1ドメインが融合した融合タンパク質を発現するTALE47-ND1発現プラスミドを作製した。次いで、TALE47-ND1発現プラスミドを鋳型として、下記の表1に示す2種のプライマーセットを用いてPCRにより増幅した断片をIn-Fusion法により連結する部位特異的変異導入法により、TALE47のC末側にND1ドメインにD66N変異を導入したdND1ドメイン(ヌクレオチド配列番号:41、アミノ酸配列番号:42)が融合した融合タンパク質を発現するTALE47-dND1発現プラスミドを作製した。
上記で調製したTALE47-ND1発現プラスミド及びTALE47-dND1発現プラスミドのTALE47には、それぞれ、下記の表2に記載のTALE認識配列に対応するTALEリピートドメイン(APC-L、APC-R、Rosa26-L、Rosa26-R)を挿入し、下記のSSAアッセイに供した。
(3)SSAアッセイによる二本鎖DNA切断活性の定量
SSAアッセイ用レポータープラスミドの作製には、特開2023-38023号公報において作製したpcEGxxFPを用いた。SSAアッセイに用いる各標的遺伝子として、APC(human adenomatous polyposis coli)をヒトゲノムから、Rosa26及びHPRT1をハムスターゲノムから、それぞれPCRにより単離し、それらをpcEGxxFP内のEGFPのN末側とC末側の間に挿入したリンカー内の制限酵素BamHI/EcoRI認識配列にIn-Fusion法により挿入することにより、各SSAアッセイ用レポータープラスミド(pcEGxAPCxFP、pcEGxRosa26xFP)とした。
SSAアッセイ用レポータープラスミドの作製には、特開2023-38023号公報において作製したpcEGxxFPを用いた。SSAアッセイに用いる各標的遺伝子として、APC(human adenomatous polyposis coli)をヒトゲノムから、Rosa26及びHPRT1をハムスターゲノムから、それぞれPCRにより単離し、それらをpcEGxxFP内のEGFPのN末側とC末側の間に挿入したリンカー内の制限酵素BamHI/EcoRI認識配列にIn-Fusion法により挿入することにより、各SSAアッセイ用レポータープラスミド(pcEGxAPCxFP、pcEGxRosa26xFP)とした。
また、国際公開第2023-038023号と同様にしてニッカーゼタイプのnCas9(D10A)発現プラスミド(pX330(D10A)_BS)、及びガイドRNA発現プラスミド(pX330_BS-ΔCas9)を作製し、各ガイドRNAは、下記の表3に示した各標的遺伝子上のガイドRNA標的配列(表3には、ガイドRNA標的配列(アンチセンス鎖上)の相補配列(下線以外の配列)及びPAM配列(下線配列)を示す)に対応するように設計した。標的遺伝子APC及びRosa26上のPAM配列(図1ではガイドRNA上のPAM配列に対応する位置を示す)、及びnCas9(D10A)による切断点と、各TALE及びガイドRNAとの位置関係の概念図を図1に示す。
10%FBSを含むDMEM培地で生育させたHEK293T細胞を、1×104細胞ずつ、96ウェルプレートの各ウェルにトランスフェクション前日に播種した。TALE-L(APC-L、Rosa26-L)発現プラスミド33ng、TALE-R(APC-R、Rosa26-R)発現プラスミド33ng、及びSSAアッセイ用レポータープラスミド(pcEGxAPCxFP、pcEGxRosa26xFP)33ngを、Lipofectamine 3000(Thermo Fisher Scientific社製)を用いてHEK293T細胞に導入した。導入プラスミドの種類又は導入量を減らす場合においては、pBluescript II(SK+)(Stratagene社製)で補い、導入プラスミド全量を100ngとした。
トランスフェクション後48時間培養し、各ウェルの単位面積当たりのEGFPタンパク質による蛍光量をプレートリーダーで測定した。また、上記組み合わせに、nCas9(D10A)発現プラスミド及びガイドRNA発現プラスミドもさらに組み合わせてトランスフェクションし、上記と同様に測定した。ウェル内の細胞の局在によるばらつきを低減させるために、各ウェルにつき16ポイントで測定を行い、その平均値をEGFP蛍光強度(RFI)とした。独立した3ウェルの値の平均値及び標準偏差をグラフ化した。
標的遺伝子としてAPCを搭載したSSAアッセイ用レポータープラスミドEGxAPCxFPに対して、TALE47(APC-L)-ND1とTALE47(APC-R)-ND1との組み合わせ、又は、一方のND1をdND1としたTALE47(APC-L)-dND1とTALE47(APC-R)-ND1との組み合わせ、若しくはTALE47(APC-L)-ND1とTALE47(APC-R)-dND1との組み合わせ、これらにさらにnCas9(D10A)及びガイドRNA(APC_gRNA-C又はAPC_gRNA-B)を作用させたときの結果を図2に示す。
また、標的遺伝子としてRosa26を搭載したSSAアッセイ用レポータープラスミドEGxRosa26xFPに対して、TALE47(Rosa26-L)-ND1とTALE47(Rosa26-R)-ND1との組み合わせ、又は、一方のND1をdND1としたTALE47(Rosa26-L)-dND1とTALE47(Rosa26-R)-ND1との組み合わせ、若しくはTALE47(Rosa26-L)-ND1とTALE47(Rosa26-R)-dND1との組み合わせ、これらにさらにnCas9(D10A)及びガイドRNA(Rosa26_gRNA-C又はRosa26_gRNA-B)を作用させたときの結果を図3に示す。
〔結果〕
図2に示したように、標的遺伝子としてAPCを搭載したレポータープラスミドEGxAPCxFPに対して、TALE47(APC-L)-ND1とTALE47(APC-R)-ND1との組み合わせを作用させることにより、二本鎖DNA切断活性が確認され、ND1ドメインがダイマー型のヌクレアーゼとして機能することを再確認した。他方、一方のND1ドメインをdND1ドメインとした場合には、二本鎖DNA切断活性が消失することが確認された。さらに、nCas9と、TALE47-dND1のTALE認識配列と同じ鎖上のガイドRNA標的配列に対応するガイドRNAとを同時に発現させること(TALE47(APC-L)-dND1に対してAPC_gRNA-C、TALE47(APC-R)-dND1に対してAPC_gRNA-B)によって、ダブルニッキングによる二本鎖DNA切断活性が確認され、ND1ドメインとdND1ドメインとの組み合わせがニッカーゼ活性を有することが確認された。
図2に示したように、標的遺伝子としてAPCを搭載したレポータープラスミドEGxAPCxFPに対して、TALE47(APC-L)-ND1とTALE47(APC-R)-ND1との組み合わせを作用させることにより、二本鎖DNA切断活性が確認され、ND1ドメインがダイマー型のヌクレアーゼとして機能することを再確認した。他方、一方のND1ドメインをdND1ドメインとした場合には、二本鎖DNA切断活性が消失することが確認された。さらに、nCas9と、TALE47-dND1のTALE認識配列と同じ鎖上のガイドRNA標的配列に対応するガイドRNAとを同時に発現させること(TALE47(APC-L)-dND1に対してAPC_gRNA-C、TALE47(APC-R)-dND1に対してAPC_gRNA-B)によって、ダブルニッキングによる二本鎖DNA切断活性が確認され、ND1ドメインとdND1ドメインとの組み合わせがニッカーゼ活性を有することが確認された。
また、図3に示したように、標的遺伝子としてRosa26を搭載したレポータープラスミドEGxRosa26xFPに対して、TALE47(Rosa26-L)-ND1とTALE47(Rosa26-R)-ND1との組み合わせを作用させた場合にも同様に、二本鎖DNA切断活性が確認され、ND1ドメインがダイマー型のヌクレアーゼとして機能することを再確認した。また、この場合でも、一方のND1ドメインをdND1ドメインとした場合には、二本鎖DNA切断活性が消失することが確認された。さらにこの場合でも同様に、nCas9と、TALE47-dND1のTALE認識配列と同じ鎖上のガイドRNA標的配列に対応するガイドRNAとを同時に発現させること(TALE47(Rosa26-L)-dND1に対してRosa26_gRNA-C、TALE47(Rosa26-R)-dND1に対してRosa26_gRNA-B)によって、ダブルニッキングによる二本鎖DNA切断活性が確認され、ND1ドメインとdND1ドメインとの組み合わせがニッカーゼ活性を有することが確認された。
また、これらの結果より、ND1ドメインとdND1ドメインとの組み合わせでは、驚くべきことに、dND1ドメインに結合するTALEが認識する鎖の方にニックが導入されることが確認された。
(試験例2)ND1-dND1及びドナーlssDNAによるノックイン効率の評価
〔方法〕
(1)レポーター細胞株樹立用プラスミドの作製
先ず、Nakajima et al.,Genome Research,28,2018,p.223-230(非特許文献4)の記載にならって、EGFP遺伝子の321番目の塩基CをGに置換して終止コドンに置換し、EGFPタンパク質が蛍光を発することのできない変異体としたmCherry-P2A-EGFP(C321G)(ヌクレオチド配列番号:45、アミノ酸配列番号:46)発現ユニットをゲノムに挿入したレポーター細胞株を樹立するための、mCherry-P2a-EGFP(C321G)/pcDNA3.1Zeo+を作製した。mCherry発現プラスミドpmCherry-C1は、タカラバイオ社から購入し、EGFPをコードするDNAは全合成した。これらDNA、及び発現ベクターpcDNA3.1Zeo+(Thermo Fisher Scientific社製)について、それぞれ、下記の表4に記載のプライマーセットを用いてPCRを行い、得られた断片をIn-Fusion法により連結することにより、プラスミドmCherry-P2A-EGFP/pcDNA3.1Zeo+を作製した(mCherry-P2A-EGFPのヌクレオチド配列番号:43、アミノ酸配列番号:44)。
〔方法〕
(1)レポーター細胞株樹立用プラスミドの作製
先ず、Nakajima et al.,Genome Research,28,2018,p.223-230(非特許文献4)の記載にならって、EGFP遺伝子の321番目の塩基CをGに置換して終止コドンに置換し、EGFPタンパク質が蛍光を発することのできない変異体としたmCherry-P2A-EGFP(C321G)(ヌクレオチド配列番号:45、アミノ酸配列番号:46)発現ユニットをゲノムに挿入したレポーター細胞株を樹立するための、mCherry-P2a-EGFP(C321G)/pcDNA3.1Zeo+を作製した。mCherry発現プラスミドpmCherry-C1は、タカラバイオ社から購入し、EGFPをコードするDNAは全合成した。これらDNA、及び発現ベクターpcDNA3.1Zeo+(Thermo Fisher Scientific社製)について、それぞれ、下記の表4に記載のプライマーセットを用いてPCRを行い、得られた断片をIn-Fusion法により連結することにより、プラスミドmCherry-P2A-EGFP/pcDNA3.1Zeo+を作製した(mCherry-P2A-EGFPのヌクレオチド配列番号:43、アミノ酸配列番号:44)。
次いで、プラスミドmCherry-P2a-EGFP/pcDNA3.1Zeo+上のEGFPをコードするヌクレオチド配列の321番目の塩基CをGに置換した変異体としたmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+を作製した。プラスミドmCherry-P2a-EGFP/pcDNA3.1Zeo+を鋳型として、下記の表4に記載の2種のプライマーセットによりPCRを実施し、得られた断片をIn-Fusion法により連結する部位特異的変異導入法により、プラスミドmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+を作製した。
(2)ドナープラスミド及び各発現プラスミドの作製
上記非特許文献4に記載のSNGD法にならって、nCas9によるニッキングによってドナープラスミドのノックインが誘発されてEGFPが野生型に戻された後の、nCas9による再度のアタックを回避するため、EGFPに、標的遺伝子EGFP上にニックを入れるためのガイドRNA(sgEGFP_332s(下記の表6に、ガイドRNA標的配列(アンチセンス鎖上)の相補配列(下線以外の配列)及びPAM配列(下線配列)を示す))の、標的配列への再結合を抑制する、アミノ酸置換を伴わない変異を導入したドナーPD-0(ヌクレオチド配列番号:47)を発現するプラスミド(ドナープラスミド)を作製した。すなわち、野生型のEGFP翻訳領域配列をpBluescript II(SK+)にクローニングするために、EGFPをコードするヌクレオチドの全合成配列を鋳型として、下記の表5に記載のプライマーセットでPCRを実施し、制限酵素EcoRVとBamHIとで切断したpBluescript II(SK+)と共にIn-Fusion法により連結し、プラスミドEGFP/pBSを作製した。さらに、EGFP/pBSを鋳型として、下記の表5に記載の2種のプライマーセットを用いてPCRを実施し、得られた断片をIn-Fusion法により連結し、ドナープラスミドPD-0/pBSを作製した。
上記非特許文献4に記載のSNGD法にならって、nCas9によるニッキングによってドナープラスミドのノックインが誘発されてEGFPが野生型に戻された後の、nCas9による再度のアタックを回避するため、EGFPに、標的遺伝子EGFP上にニックを入れるためのガイドRNA(sgEGFP_332s(下記の表6に、ガイドRNA標的配列(アンチセンス鎖上)の相補配列(下線以外の配列)及びPAM配列(下線配列)を示す))の、標的配列への再結合を抑制する、アミノ酸置換を伴わない変異を導入したドナーPD-0(ヌクレオチド配列番号:47)を発現するプラスミド(ドナープラスミド)を作製した。すなわち、野生型のEGFP翻訳領域配列をpBluescript II(SK+)にクローニングするために、EGFPをコードするヌクレオチドの全合成配列を鋳型として、下記の表5に記載のプライマーセットでPCRを実施し、制限酵素EcoRVとBamHIとで切断したpBluescript II(SK+)と共にIn-Fusion法により連結し、プラスミドEGFP/pBSを作製した。さらに、EGFP/pBSを鋳型として、下記の表5に記載の2種のプライマーセットを用いてPCRを実施し、得られた断片をIn-Fusion法により連結し、ドナープラスミドPD-0/pBSを作製した。
また、上記SNGD法で使用するnCas9発現プラスミドとしては、上記の試験例1の(3)で作製した、ニッカーゼタイプのnCas9(D10A)発現プラスミド(pX330(D10A)_BS)を用いた。さらに、上記SNGD法で使用するガイドRNA発現プラスミドとしては、上記のsgEGFP_332s、及び、ドナープラスミド(pBS)上でニッキングを生じさせるためのガイドRNA(sgUC57N2(下記の表6に、ガイドRNA標的配列(アンチセンス鎖上)の相補配列(下線以外の配列)及びPAM配列(下線配列)を示す)について、上記の試験例1の(3)と同様にして、ガイドRNA発現プラスミド(pX330_BS-ΔCas9)にsgEGFP_332s、sgUC57N2を挿入したガイドRNA発現プラスミドをそれぞれ作製した。
また、nCas9に代えて、TALE47-dND1とTALE47-ND1との組み合わせを用いたときのノックイン効率評価のために、nCas9及びガイドRNA(sgEGFP_332s)によるニッキング箇所付近に同様のニッキングを発生させる目的で、上記試験例1(2)で作製したTALE47-dND1発現プラスミド及びTALE47-ND1発現プラスミドのTALE47に、EGFP遺伝子上にある下記の表7に記載の各TALE認識配列に対応するTALEリピートドメイン(EGFP-3、EGFP-3R)を挿入し、TALE47(EGFP-3)-dND1発現プラスミド、及びTALE47(EGFP-3R)-ND1発現プラスミドとした。
さらに、TALE47-dND1とTALE47-ND1との組み合わせに対するドナープラスミドとして、EGFPに、前記TALE認識配列への再結合を抑制する、アミノ酸置換を伴わない変異を導入したドナーPD-3(ヌクレオチド配列番号:48)を発現するプラスミド(ドナープラスミド:PD-3/pBS)を、下記の表5に記載の2種のプライマーセットを用い、上記PD-0/pBSと同様にして作製した。
(3)レポーター細胞株の樹立
上記(1)で作製したプラスミドmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+を制限酵素ScaI切断部位(プラスミド上に1か所のみ、アンピシリン耐性遺伝子上に存在)で切断し、直鎖状断片をアガロースゲル電気泳動により単離精製した。10%FBSを含むDMEM培地で生育させたHEK293T細胞2.5×105細胞を、6ウェルプレートにトランスフェクション前日に播種した。上記のmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+直鎖状断片2.5μgをLipofectamine 3000(Thermo Fisher Scientific社製)を用いてHEK293T細胞に導入した。導入2日後に細胞を剥がし、125μg/mLのZeocin含有培地(以後、この培地で細胞株を樹立)で適宜希釈し、10cmディッシュに播種した。約2週間後に単一コロニーを回収し、96ウェルプレートに播種した。mCherryの蛍光が観察された24株を拡大培養し、下記(5)のSNGD法にしたがったノックイン効率評価を実施して、ノックイン効率の高かった3株(#7、#8、#22)を選択し、これら3株について限界希釈法により再度単一クローンを取得した。得られたクローン#7-1、#7-2、#7-3、#8-1、#8-2、#8-3、#22-1、#22-2、#22-3について、ノックイン効率、細胞増殖等を比較検討し、同等の活性及び増殖能を有する株として、#7-2、#8-1、#22-3株を選択した。以後の実験には、mCherry-P2A-EGFP(C321G)発現ユニットをゲノムに挿入したレポーター細胞株(蛍光活性消失変異体発現株)として、#22-3株を使用した。
上記(1)で作製したプラスミドmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+を制限酵素ScaI切断部位(プラスミド上に1か所のみ、アンピシリン耐性遺伝子上に存在)で切断し、直鎖状断片をアガロースゲル電気泳動により単離精製した。10%FBSを含むDMEM培地で生育させたHEK293T細胞2.5×105細胞を、6ウェルプレートにトランスフェクション前日に播種した。上記のmCherry-P2A-EGFP(C321G)/pcDNA3.1Zeo+直鎖状断片2.5μgをLipofectamine 3000(Thermo Fisher Scientific社製)を用いてHEK293T細胞に導入した。導入2日後に細胞を剥がし、125μg/mLのZeocin含有培地(以後、この培地で細胞株を樹立)で適宜希釈し、10cmディッシュに播種した。約2週間後に単一コロニーを回収し、96ウェルプレートに播種した。mCherryの蛍光が観察された24株を拡大培養し、下記(5)のSNGD法にしたがったノックイン効率評価を実施して、ノックイン効率の高かった3株(#7、#8、#22)を選択し、これら3株について限界希釈法により再度単一クローンを取得した。得られたクローン#7-1、#7-2、#7-3、#8-1、#8-2、#8-3、#22-1、#22-2、#22-3について、ノックイン効率、細胞増殖等を比較検討し、同等の活性及び増殖能を有する株として、#7-2、#8-1、#22-3株を選択した。以後の実験には、mCherry-P2A-EGFP(C321G)発現ユニットをゲノムに挿入したレポーター細胞株(蛍光活性消失変異体発現株)として、#22-3株を使用した。
(4)lss(long single stranded)DNAの作製
ドナーlssDNAとしては、Inoue et al.,Cells,2021,10,1076.https://doi.org/10.3390/cells10051076(非特許文献3)に記載の方法にしたがってlssDNA(全長:720nt、5’HA:320nt、3’HA:399nt、PD-0又はPD-3と同じヌクレオチド配列)をそれぞれ調製した。先ず、ドナープラスミドPD-0/pBS又はPD-3/pBSを鋳型として、下記の表8に記載のプライマーセットによりPCRを実施した。このとき、使用するプライマーの一方を5’末端をリン酸化したプライマーとした。得られたPCR産物をNucleoSpin Gel and PCR Clean―up(MACHEREY-NAGEL社製)を用いて精製した後、約5μgをLambda exonuclease(New England BioLab社製)により5’リン酸化末端側から消化し、次いで、残存する二本鎖DNAをExonuclease III(Takara Bio社製)により消化し、さらに上記NucleoSpin Gel and PCR Clean―upを用いて精製することにより、各lssDNA(PD-0、PD-3)を得た。
ドナーlssDNAとしては、Inoue et al.,Cells,2021,10,1076.https://doi.org/10.3390/cells10051076(非特許文献3)に記載の方法にしたがってlssDNA(全長:720nt、5’HA:320nt、3’HA:399nt、PD-0又はPD-3と同じヌクレオチド配列)をそれぞれ調製した。先ず、ドナープラスミドPD-0/pBS又はPD-3/pBSを鋳型として、下記の表8に記載のプライマーセットによりPCRを実施した。このとき、使用するプライマーの一方を5’末端をリン酸化したプライマーとした。得られたPCR産物をNucleoSpin Gel and PCR Clean―up(MACHEREY-NAGEL社製)を用いて精製した後、約5μgをLambda exonuclease(New England BioLab社製)により5’リン酸化末端側から消化し、次いで、残存する二本鎖DNAをExonuclease III(Takara Bio社製)により消化し、さらに上記NucleoSpin Gel and PCR Clean―upを用いて精製することにより、各lssDNA(PD-0、PD-3)を得た。
(5)ノックイン効率評価
10%FBSを含むDMEM培地で生育させたHEK293T細胞を1×104細胞ずつ、ポリ-L-リジンコート又はコラーゲンコートの96ウェルプレートの各ウェルにトランスフェクション前日に播種した。ドナープラスミド(PD-0、PD-3)、lssDNA(PD-0、PD-3)、ガイドRNA(sgEGFP_332s)発現プラスミド、ガイドRNA(sgUC57N2)発現プラスミド、nCas9発現プラスミド、TALE47(EGFP-3)-dND1発現プラスミド、及びTALE47(EGFP-3R)-ND1発現プラスミドを、下記の表9に示す組み合わせ及び量で、総計100ngのプラスミド及びDNAをLipofectamine 3000(Thermo Fisher Scientific)を用いてHEK293T細胞(#22-3株)に導入した。導入プラスミドの種類又は導入量を減らす場合においては、pBluescript II(SK+)(Stratagene社製)で補い、導入プラスミド及びDNAの全量が100ngとなるようにした。
10%FBSを含むDMEM培地で生育させたHEK293T細胞を1×104細胞ずつ、ポリ-L-リジンコート又はコラーゲンコートの96ウェルプレートの各ウェルにトランスフェクション前日に播種した。ドナープラスミド(PD-0、PD-3)、lssDNA(PD-0、PD-3)、ガイドRNA(sgEGFP_332s)発現プラスミド、ガイドRNA(sgUC57N2)発現プラスミド、nCas9発現プラスミド、TALE47(EGFP-3)-dND1発現プラスミド、及びTALE47(EGFP-3R)-ND1発現プラスミドを、下記の表9に示す組み合わせ及び量で、総計100ngのプラスミド及びDNAをLipofectamine 3000(Thermo Fisher Scientific)を用いてHEK293T細胞(#22-3株)に導入した。導入プラスミドの種類又は導入量を減らす場合においては、pBluescript II(SK+)(Stratagene社製)で補い、導入プラスミド及びDNAの全量が100ngとなるようにした。
トランスフェクション後72時間培養し、Hoechst 33342染色(各ウェルに50μg/mL溶液を10μL添加、10分、室温)し、さらに、4%パラホルムアルデヒド溶液を100μL添加し、室温で1時間処理して細胞を固定した。PBS(-)で洗浄後、各ウェルにPBS(-)100μLを添加し、In Cell Analyzer 6000(Cytiva社製)により2種類の蛍光画像データ(Hoechst 33342染色による蛍光、EGFP蛍光)を各ウェル4か所ずつ取得した。蛍光を発した細胞数を画像解析ソフトImageJにより数値化して、EGFP陽性細胞数/全細胞数(%)について前記4か所の平均値及び標準偏差をグラフ化した。得られたEGFP陽性細胞数/全細胞数(%)の平均値が高いほど、ノックイン効率が高いといえる。
表9に示す組み合わせ((a):Mock、(b)SNGD、(c)dND1+ND1+PD、(d)dND1+ND1+lssDNA)における各EGFPの蛍光画像を図4に、EGFP陽性細胞数/全細胞数(%)を図5に、それぞれ示す。
また、nCas9に、ドナーDNAとして、ドナープラスミドに代えてlssDNAを組み合わせた場合についても比較検証するために、各ドナーDNA及び発現プラスミドの組み合わせを、下記の表10に示す組み合わせ及び量としたこと以外は上記と同様にして、EGFP陽性細胞数/全細胞数(%)の平均値を求め、ドナープラスミドを用いたとき(a)の値を1として、各相対活性及び標準偏差をグラフ化した。結果を図6に示す。
〔結果〕
図4~図5の(b)は、非特許文献4に記載にならったSNGD法(SNGD:combination of single nicks in the target gene and donor plasmid)により、EGFP蛍光活性消失変異体発現株(#22-3株)を用い、nCas9によってターゲットゲノム上及びドナープラスミド上にニッキングを入れることによるノックイン効率を確認した結果である。図4~図5に示したように、非特許文献4に記載のSNGD法と同様に、ドナープラスミドPD-0/pBS、ガイドRNA(sgEGFP_332s)発現プラスミド、及びガイドRNA(sgUC57N2)発現プラスミド、及びnCas9発現プラスミドを導入した場合(b)には、全細胞のうちの約6%でノックインが観察された。
図4~図5の(b)は、非特許文献4に記載にならったSNGD法(SNGD:combination of single nicks in the target gene and donor plasmid)により、EGFP蛍光活性消失変異体発現株(#22-3株)を用い、nCas9によってターゲットゲノム上及びドナープラスミド上にニッキングを入れることによるノックイン効率を確認した結果である。図4~図5に示したように、非特許文献4に記載のSNGD法と同様に、ドナープラスミドPD-0/pBS、ガイドRNA(sgEGFP_332s)発現プラスミド、及びガイドRNA(sgUC57N2)発現プラスミド、及びnCas9発現プラスミドを導入した場合(b)には、全細胞のうちの約6%でノックインが観察された。
図4~図5の(c)は、ターゲットゲノムに対するニッキングを、nCas9に代えてTALE47-dND1とTALE47-ND1との組み合わせに担わせたときのノックイン効率を確認した結果である。図4~図5に示したように、ドナープラスミドPD-3/pBS、ガイドRNA(sgEGFP_332s)発現プラスミド、nCas9発現プラスミド、TALE47(EGFP-3)-dND1発現プラスミド、及びTALE47(EGFP-3R)-ND1発現プラスミドを導入した場合(c)にも、(b)と同様に全細胞のうちの約6%でノックインが観察され、本発明のND1ドメインとdND1ドメインとの組み合わせによるニッカーゼ活性はnCas9のニッカーゼ活性に代替できることが確認された。
図4~図5の(d)は、ND1ドメインとdND1ドメインとの組み合わせによるニッキングに対し、ドナーDNAとして、ドナープラスミドに代えてlssDNAを組み合わせたときのノックイン効率を確認した結果である。図4~図5に示したように、lssDNA(PD-3)、TALE47(EGFP-3)-dND1発現プラスミド、及びTALE47(EGFP-3R)-ND1発現プラスミドを導入した場合((d):実施例)には、全細胞のうちの約18%でノックインが観察され、ドナープラスミドを使用した場合(c)に対して約3倍の顕著に高いノックイン効率を示すことが確認された。
他方、図6に示したように、nCas9によるニッキングに対しても、ドナープラスミドに代えてlssDNAを組み合わせた場合(比較例)について比較検証したが、nCas9によるニッキングにおいては、ドナーDNAをlssDNAとしても(b)、また、lssDNAの量をさらに増やしても((c)~(d))、ドナープラスミドを用いた場合(a)に比べてノックイン効率(EGFP陽性細胞数/全細胞数(%))の向上は観察されず、本発明のTALE-ND1とTALE-dND1とlssDNAとの組み合わせとしたときのような顕著なノックイン効率の増強作用は確認されなかった。
以上説明したように、本発明のニッキングシステムは、第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含むことにより、タンパク質のみで、ニッカーゼ型のCas9(nCas9)のニッカーゼ活性に代替可能なニッカーゼ活性を奏する部位特異的ニッキングシステムである。そればかりか、かかるニッキングシステムをノックイン技術に用いる際には、ノックインするドナーDNAとして特に一本鎖DNAを組み合わせることにより、顕著にノックイン効率を向上させることができる。
このように、本発明によれば、タンパク質のみで、特異的かつ高効率に、標的領域に所望のヌクレオチド配列の挿入(ノックイン)ができる方法、及び標的領域に所望のヌクレオチド配列が挿入された細胞(ノックイン細胞)を製造できる方法、並びに、これらの方法に用いるためのキットを提供することが可能となる。よって本発明は、優れたゲノム編集ツールとして、医療、農業、工業などの幅広い産業分野での活用が期待される。
Claims (5)
- 標的DNA上の標的領域にドナー配列を挿入する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。 - 前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、請求項1に記載の方法。
- 標的DNA上の標的領域にドナー配列が挿入された細胞を製造する方法であり、
5’側から、5’側ホモロジーアーム配列、ドナー配列、3’側ホモロジーアーム配列の順で配置されたヌクレオチド配列を含む一本鎖DNAであるドナーDNAと、
第1のDNA結合ドメインとND1ドメインとを含む第1の融合タンパク質、及び第2のDNA結合ドメインとdND1ドメインとを含む第2の融合タンパク質を含み、ND1ドメインとdND1ドメインとが2量体を形成して前記標的領域内又は前記標的領域の近傍にニックを導入する部位特異的ニッキングシステムと、
を細胞内に導入又は細胞内で発現させ、前記標的DNAに接触させる工程を含み、
ND1ドメインが、下記(a)~(c):
(a)配列番号:40に記載のアミノ酸配列を含むポリペプチド
(b)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
(c)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目及び第83番目のアミノ酸に対応するアミノ酸がアスパラギン酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドを含むドメインであり、かつ、
dND1ドメインが、下記(da)~(dc):
(da)配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸が他の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(db)配列番号:40に記載のアミノ酸配列において1若しくは複数個が置換、欠失、挿入及び/又は付加されたアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
(dc)配列番号:40に記載のアミノ酸配列と90%以上の相同性を有するアミノ酸配列であり、かつ、配列番号:40に記載のアミノ酸配列の第66番目のアスパラギン酸及び/又は第83番目のアスパラギン酸に対応するアミノ酸が、アスパラギン酸以外の任意のアミノ酸に置換された置換アミノ酸であるアミノ酸配列を含むポリペプチド
からなる群から選択される少なくとも1種のポリペプチドである、
方法。 - 前記ドナーDNAが、5’側ホモロジーアーム配列及び3’側ホモロジーアーム配列の長さがそれぞれ独立に100塩基以上の長鎖一本鎖DNAである、請求項3に記載の方法。
- 請求項1~4のうちのいずれか一項に記載の方法に用いるためのキットであり、
第1の融合タンパク質、第1の融合タンパク質を発現する第1の融合タンパク質発現ベクター、及び第1の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
第2の融合タンパク質、第2の融合タンパク質を発現する第2の融合タンパク質発現ベクター、及び第2の融合タンパク質をコードするポリヌクレオチドからなる群から選択される少なくとも1種と、
を含み、
第1の融合タンパク質発現ベクターが、(i)ND1ドメイン及び第1のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(ii)ND1ドメインをコードするポリヌクレオチドと、第1のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種であり、
第2の融合タンパク質発現ベクターが、(iii)dND1ドメイン及び第2のDNA結合ドメインをコードするポリヌクレオチドを含むベクター、並びに、(iv)dND1ドメインをコードするポリヌクレオチドと、第2のDNA結合ドメインをコードするポリヌクレオチドの挿入部位と、を含むベクターからなる群から選択される少なくとも1種である、
キット。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2024052232 | 2024-03-27 | ||
| JP2024-052232 | 2024-03-27 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2025206046A1 true WO2025206046A1 (ja) | 2025-10-02 |
Family
ID=97220074
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2025/012229 Pending WO2025206046A1 (ja) | 2024-03-27 | 2025-03-26 | 所望のヌクレオチド配列をノックインする方法、ノックイン細胞の製造方法、及びキット |
Country Status (1)
| Country | Link |
|---|---|
| WO (1) | WO2025206046A1 (ja) |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018097257A1 (ja) * | 2016-11-28 | 2018-05-31 | 国立大学法人大阪大学 | ゲノム編集方法 |
| WO2019189147A1 (ja) * | 2018-03-26 | 2019-10-03 | 国立大学法人神戸大学 | 細胞の有する二本鎖dnaの標的部位を改変する方法 |
| WO2020045281A1 (ja) * | 2018-08-27 | 2020-03-05 | 国立大学法人広島大学 | 新規ヌクレアーゼドメインおよびその利用 |
| WO2020075399A1 (ja) * | 2018-10-12 | 2020-04-16 | 国立研究開発法人産業技術総合研究所 | 植物細胞の核内へのタンパク質導入法 |
| JP2023038023A (ja) * | 2021-09-06 | 2023-03-16 | 国立大学法人広島大学 | Dnaを二本鎖切断するヌクレアーゼドメイン |
| WO2024181446A1 (ja) * | 2023-02-28 | 2024-09-06 | 住友化学株式会社 | ニッキング酵素、dna編集システム、標的dnaの編集方法、及び標的dnaが編集された細胞の製造方法 |
-
2025
- 2025-03-26 WO PCT/JP2025/012229 patent/WO2025206046A1/ja active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2018097257A1 (ja) * | 2016-11-28 | 2018-05-31 | 国立大学法人大阪大学 | ゲノム編集方法 |
| WO2019189147A1 (ja) * | 2018-03-26 | 2019-10-03 | 国立大学法人神戸大学 | 細胞の有する二本鎖dnaの標的部位を改変する方法 |
| WO2020045281A1 (ja) * | 2018-08-27 | 2020-03-05 | 国立大学法人広島大学 | 新規ヌクレアーゼドメインおよびその利用 |
| WO2020075399A1 (ja) * | 2018-10-12 | 2020-04-16 | 国立研究開発法人産業技術総合研究所 | 植物細胞の核内へのタンパク質導入法 |
| JP2023038023A (ja) * | 2021-09-06 | 2023-03-16 | 国立大学法人広島大学 | Dnaを二本鎖切断するヌクレアーゼドメイン |
| WO2024181446A1 (ja) * | 2023-02-28 | 2024-09-06 | 住友化学株式会社 | ニッキング酵素、dna編集システム、標的dnaの編集方法、及び標的dnaが編集された細胞の製造方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7216877B2 (ja) | 新規なCRISPR/Cas12f酵素およびシステム | |
| JP7731156B2 (ja) | Dnaが編集された真核細胞を製造する方法、および当該方法に用いられるキット | |
| JP4968498B2 (ja) | ジンクフィンガーヌクレアーゼを用いる、標的化された染色体変異誘発 | |
| JP2022518329A (ja) | CRISPR-Cas12j酵素およびシステム | |
| EP3845651B1 (en) | Novel nuclease domain and uses thereof | |
| US20200029538A1 (en) | Genome editing method | |
| CN112048493B (zh) | 一种增强Cas9及其衍生蛋白介导的基因操纵系统的方法及应用 | |
| CN111575319B (zh) | 一种高效的crispr rnp和供体dna共位介导的基因插入或替换方法及其应用 | |
| JP7720053B2 (ja) | Dnaを二本鎖切断するヌクレアーゼドメイン | |
| CN115975986B (zh) | 突变的Cas12j蛋白及其应用 | |
| CN114686456B (zh) | 基于双分子脱氨酶互补的碱基编辑系统及其应用 | |
| WO2024181446A1 (ja) | ニッキング酵素、dna編集システム、標的dnaの編集方法、及び標的dnaが編集された細胞の製造方法 | |
| US20040091966A1 (en) | Polypeptide regulation by conditional inteins | |
| WO2025206046A1 (ja) | 所望のヌクレオチド配列をノックインする方法、ノックイン細胞の製造方法、及びキット | |
| JP7752342B2 (ja) | FokIヌクレアーゼドメインの変異体 | |
| WO2025170018A1 (ja) | ジンクフィンガータンパク質及びその組み合わせ、ジンクフィンガーヌクレアーゼ及びジンクフィンガーヌクレアーゼ対、標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びキット | |
| WO2022050377A1 (ja) | 標的dnaの編集方法、標的dnaが編集された細胞の製造方法、及びそれらに用いるdna編集システム | |
| EP4628580A1 (en) | Nuclease domain for breaking dna into two strands | |
| JP7356739B2 (ja) | 核酸結合性タンパク質 | |
| JP2023131616A (ja) | Dna編集システム、並びに、それを用いた標的dnaの編集方法及び標的dnaが編集された細胞の製造方法 | |
| JP2025174633A (ja) | 逆転写酵素、dna編集システム、並びに、これらを用いて標的dnaを編集する方法及び標的dnaが編集された細胞を製造する方法 | |
| WO2025198005A1 (ja) | crRNA、タイプI CRISPR-Casシステム、標的DNAを編集する方法、標的DNAが編集された細胞を製造する方法、標的DNAを検出する方法、及びキット | |
| WO2024175015A1 (zh) | CRISPR/Cas效应蛋白及系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 25776707 Country of ref document: EP Kind code of ref document: A1 |