[go: up one dir, main page]

WO2018034554A1 - 인위적으로 조작된 신생혈관형성 조절 시스템 - Google Patents

인위적으로 조작된 신생혈관형성 조절 시스템 Download PDF

Info

Publication number
WO2018034554A1
WO2018034554A1 PCT/KR2017/009078 KR2017009078W WO2018034554A1 WO 2018034554 A1 WO2018034554 A1 WO 2018034554A1 KR 2017009078 W KR2017009078 W KR 2017009078W WO 2018034554 A1 WO2018034554 A1 WO 2018034554A1
Authority
WO
WIPO (PCT)
Prior art keywords
gene
nucleic acid
domain
sequence
complementary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/KR2017/009078
Other languages
English (en)
French (fr)
Inventor
김정훈
박성욱
김석중
송동우
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toolgen Inc
SNU R&DB Foundation
Seoul National University Hospital
Original Assignee
Toolgen Inc
Seoul National University R&DB Foundation
Seoul National University Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to SG11201901306XA priority Critical patent/SG11201901306XA/en
Priority to CA3033939A priority patent/CA3033939A1/en
Priority to JP2019510289A priority patent/JP7050215B2/ja
Priority to BR112019003124A priority patent/BR112019003124A2/pt
Priority to RU2019103691A priority patent/RU2019103691A/ru
Priority to AU2017313616A priority patent/AU2017313616B2/en
Priority to CN201780064951.7A priority patent/CN109844123A/zh
Priority to EP17841736.6A priority patent/EP3502261B1/en
Priority to EP21210792.4A priority patent/EP4012032A1/en
Application filed by Toolgen Inc, Seoul National University R&DB Foundation, Seoul National University Hospital filed Critical Toolgen Inc
Publication of WO2018034554A1 publication Critical patent/WO2018034554A1/ko
Priority to US15/953,141 priority patent/US20180237771A1/en
Anticipated expiration legal-status Critical
Priority to US17/236,660 priority patent/US11999952B2/en
Priority to JP2021212083A priority patent/JP7276422B2/ja
Priority to AU2022204172A priority patent/AU2022204172B2/en
Ceased legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • A61K38/465Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0048Eye, e.g. artificial tears
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • C07K14/515Angiogenesic factors; Angiogenin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1136Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against growth factors, growth regulators, cytokines, lymphokines or hormones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Definitions

  • the present invention relates to artificially engineered angiogenesis related factors and their use for regulating angiogenesis. More specifically, a system capable of artificially regulating angiogenesis, comprising an artificially engineered angiogenesis related factor for regulating angiogenesis and / or a composition capable of artificially manipulating the angiogenesis related factor. It is about.
  • neovascularization occurs in diseases such as cancer, macular degeneration, diabetic retinopathy, arthritis and psoriasis.
  • diseases such as cancer, macular degeneration, diabetic retinopathy, arthritis and psoriasis.
  • new blood vessels are supplied to diseased tissues, destroying normal tissues, and in cancer, new blood vessels introduce tumor cells into the circulatory system and allow them to settle in other organs (tumor metastases).
  • neovascularization is essential for cancer growth and metastasis because cancer cells are nourishd and metastasized to other organs through neovascularization.
  • rheumatoid arthritis a representative disease of inflammatory diseases, is caused by autoimmune abnormalities, but as the disease progresses, chronic inflammation in the synovial cavity between joints induces neovascularization and cartilage is destroyed.
  • Many ocular diseases which cause millions of blindness worldwide each year, are also responsible for neovascularization. Diabetic blindness, a representative example, is a complication of diabetes.
  • the angiogenesis inhibitor may be usefully used as a therapeutic agent and preventive agent for various diseases such as cancer, rheumatoid arthritis and diabetic blindness in which neovascularization continuously occurs.
  • VEGF vascular endothelial growth factor
  • the present invention relates to an artificially manipulated neovascularization system with improved neovascularization effect. More specifically, the present invention relates to angiogenesis-related factors that have been artificially manipulated and thereby angiogenesis systems that have been artificially modified in function.
  • the present invention provides angiogenesis related factors genetically engineered or modified for specific purposes.
  • the present invention seeks to provide an artificially engineered neovascularization control system.
  • the present invention seeks to provide artificially engineered angiogenesis related factors and expression products thereof.
  • the present invention as an embodiment to provide a composition for genetic manipulation for the manipulation of angiogenesis-related factors and methods of using the same.
  • the method is to provide a method for regulating angiogenesis in one embodiment.
  • the present invention provides a pharmaceutical composition for treating angiogenesis-related diseases and various uses thereof.
  • angiogenesis-related factors such as artificially engineered VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 and / or expression products thereof.
  • One embodiment of the present invention to provide a composition for genetic manipulation for artificial manipulation of angiogenesis-related factors such as VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4.
  • angiogenesis-related factors such as artificially engineered VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 and / or the therapeutic use of the composition for genetic manipulation for the artificial manipulation.
  • angiogenesis-related factors such as artificially engineered VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 and / or additional uses of the composition for genetic engineering for the artificial manipulation.
  • the present invention includes artificially engineered angiogenesis-related factors for regulating angiogenesis and / or compositions comprising an artificially manipulated angiogenesis-related factors, artificially neovascularization It relates to a system capable of controlling formation.
  • the present invention provides angiogenesis related factors that have been artificially engineered for specific purposes.
  • a "neovascularization-associated factor” is any substance that directly participates in or indirectly affects neovascularization and has an unnatural, artificially engineered, neovascularization control function. It includes all of the various materials that can be used. DNA, RNA, genes, peptides, polypeptides or proteins. For example, it may be a gene or protein expressed in a genetically engineered or modified cell.
  • the angiogenesis-related factors may promote or increase angiogenesis and, conversely, inhibit or inhibit angiogenesis.
  • angiogenesis-related factors for example, it may be an artificially engineered VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene or ANGPTL4 gene.
  • the invention may comprise two or more genes artificially engineered as angiogenesis-related factors.
  • two or more genes selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene and ANGPTL4 gene can be artificially manipulated.
  • one embodiment of the present invention provides one or more artificially engineered angiogenesis related factors selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene and ANGPTL4 gene in which modifications in nucleic acid sequences have occurred.
  • Modifications in the nucleic acid sequence can be artificially manipulated by, but not limited to, guide nucleic acid-editor protein complexes.
  • Guide nucleic acid-editor protein complex means a complex formed through the interaction of a guide nucleic acid and an editor protein, and the nucleic acid-protein complex includes a guide nucleic acid and an editor protein.
  • Guide nucleic acid-editor protein complexes can modify a subject.
  • the subject may be a target nucleic acid, gene, chromosome or protein.
  • the gene is an angiogenesis related factor artificially manipulated by the guide nucleic acid-editor protein complex.
  • an artificially engineered angiogenesis-related factor characterized in that it comprises a chemical modification of one or more nucleotides in the nucleic acid sequence constituting the angiogenesis-related factor.
  • the modification of the nucleic acid can occur in the promoter region of the gene.
  • the modification of the nucleic acid can occur in the exon region of the gene. In one embodiment, the modification may occur in a region within the top 50% of the coding regions of the gene.
  • the modification of the nucleic acid can occur in the intron region of the gene.
  • the modification of the nucleic acid can occur in the enhancer region of the gene.
  • the PAM sequence can be, for example, one or more of the following sequences (described in the 5 'to 3' direction).
  • N is A, T, C or G
  • N is each independently A, T, C or G, R is A or G, and Y is C or T;
  • NNAGAAW N is each independently A, T, C or G, and W is A or T;
  • N are each independently A, T, C, or G;
  • N is each independently A, T, C or G, R is A or G and Y is C or T);
  • TTN (N is A, T, C or G).
  • the editor proteins include Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus, and Nocardiopsis dasonville ), Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptosporangium roseum (Streptosporangium) ), Streptosporangium roseum, AlicyclobacHlus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireductus bacilli Exiguobacterium sibiricum, lactose Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polarolamonas naphthalenivorans naphthalenolarans ), Polaramonas sp., Crocosphaera watsoni
  • Arthrospira maxima Arthrospira platensis, Arthrospira sp., Ring Lygbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosphopho africanus or Acario It can be derived from Acaryochloris marina.
  • Streptococcus Cas9 protein from pyogenes Campylobacter Cas9 protein derived from jejuni
  • Cas9 protein derived from Streptococcus thermophilus Streptocuccus Cas9 protein from aureus
  • Neisseria meningitidis Cas9 protein
  • Cpf1 protein may be one or more selected from the group consisting of. In one example, it may be a Cas9 protein from Streptococcus pyogenes or a Cas9 protein from Campylobacter jejuni .
  • the present invention provides SEQ ID NOs: 1 to 1522, eg, SEQ ID NO: 1, among nucleic acid sequences of one or more genes selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, and ANGPTL4 gene.
  • SEQ ID NOs: 1 to 1522 eg, SEQ ID NO: 1
  • genes selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, and ANGPTL4 gene.
  • the guide nucleic acid may form a complementary binding with a part of the nucleic acid sequence of at least one gene selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene and ANGPTL4 gene, respectively. 0 to 5, 0 to 4, 0 to 3, 0 to 2 mismatching.
  • the guide nucleic acid may be a nucleotide which forms a complementary bond to each of at least one of the target sequences of SEQ ID NOs: 1 to 1522, for example, SEQ ID NOs: 1 to 79.
  • one or more guide nucleic acids selected from the following groups may be provided:
  • a guide nucleic acid capable of complementary binding to the target sequences of SEQ ID NOs: 64, 66, 67, 73, 76, and 79 of the ANGPTL4 gene nucleic acid sequence, respectively.
  • the guide nucleic acid may be, but is not limited to, 18 to 25 bp, 18 to 24 bp, 18 to 23 bp, 19 to 23 bp, 19 to 23 bp, or 20 to 23 bp.
  • the present invention also provides a composition for genetic manipulation that can artificially manipulate angiogenesis-related factors for a specific purpose.
  • compositions may comprise guide nucleic acid-editor protein complexes or nucleic acid sequences encoding them.
  • Cas9 protein from Streptococcus pyogenes Campylobacter Cas9 protein derived from jejuni
  • Cas9 protein derived from Streptococcus thermophilus Streptocuccus aureus
  • Cas9 protein derived from, Neisseria meningitidis Cas9 protein derived from Neisseria meningitidis
  • the guide nucleic acid is SEQ ID NO: 3, 4, 7, 9, 10 and 11 (VEGFA), SEQ ID NO: 14, 18, 19, 20, 26, 29 and 31 (HIF1A), SEQ ID NO: 33, 34 , 37, 38, 39 and 43 (ANGPT2), SEQ ID NOs: 47, 48, 49, 50, 53, 54 and 55 (EPAS1) and target sequences of SEQ ID NOs: 64, 66, 67, 73, 76 and 79 (ANGPTL4) It may be a nucleic acid sequence that each forms a complementary bond to one or more of them.
  • the genetic modification composition may be a viral vector system.
  • the viral vector may be one or more selected from the group consisting of retrovirus, lentivirus, adenovirus, adeno-associated virus (AAV), vaccinia virus, poxvirus and herpes virus.
  • the invention is directed to a cell
  • Cas9 protein from Streptococcus pyogenes Cas9 protein from Campylobacter jejuni , Cas9 protein from Streptococcus thermophilus , Streptococcus aureus
  • An editor protein comprising a Cas9 protein derived from Streptocuccus aureus , a Cas9 protein derived from Neisseria meningitidis , and at least one protein selected from the group consisting of Cpf1 protein or a nucleic acid sequence encoding the same
  • It provides a method of artificially manipulating the cell, comprising the step of introducing.
  • the guide nucleic acid and the editor protein may be present in one or more vectors in the form of a nucleic acid sequence, or may be present by forming a complex by combining the guide nucleic acid and the editor protein.
  • the introduction step can be performed in vivo or ex vivo.
  • the introduction step may be performed by one or more methods selected from electroporation, liposomes, plasmids, viral vectors, nanoparticles, and protein translocation domain (PTD) fusion protein methods.
  • the viral vector may be one or more selected from the group consisting of retroviruses, lentiviruses, adenoviruses, adeno-associated viruses (AAV), vaccinia virus, poxvirus and herpes virus.
  • retroviruses lentiviruses
  • adenoviruses lentiviruses
  • AAV adeno-associated viruses
  • vaccinia virus poxvirus and herpes virus.
  • the present invention provides a pharmaceutical composition for treating angiogenesis-related diseases.
  • the pharmaceutical composition may include a composition for genetic manipulation that can artificially manipulate angiogenesis-related factors.
  • composition related to the composition for genetic engineering is as described above.
  • a method for providing information about a sequence of a target position that is artificially manipulated in a subject by sequencing one or more genes selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, and ANGPTL4 gene. .
  • kit for genetic engineering comprising:
  • Cas9 protein from Streptococcus pyogenes Campylobacter Cas9 protein derived from jejuni
  • Cas9 protein derived from Streptococcus thermophilus Streptocuccus
  • kits can be used to artificially manipulate the gene of interest.
  • the invention in an embodiment, the invention
  • composition for treating angiogenic disorders comprising a.
  • the target sequence may be at least one of the target sequences of SEQ ID NOs: 1 to 1522, for example, SEQ ID NOs: 1 to 79.
  • the editor protein used Cas9 protein derived from Campylobacter jejuni.
  • the angiogenic disorder may be ischemic retinopathy or retinopathy of prematurity.
  • the present invention provides all aspects of a disease therapeutic use using an artificially engineered angiogenesis-related factor or an angiogenic composition for artificially manipulating angiogenesis-related factors for a subject.
  • the subject to be treated may be a mammal including humans, primates such as monkeys, rodents such as mice, rats and the like.
  • angiogenesis-related factors and thereby an angiogenesis system that has been artificially modified in function can exploit the therapeutic use of effective neovascular-related diseases such as neovascular-related ocular diseases. It is possible to improve the efficacy of angiogenesis systems by regulating various body mechanisms involving various angiogenesis-related factors.
  • VEGFA gene HIF1A gene
  • ANGPT2 gene EPAS1 gene
  • ANGPTL4 gene a gene of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, and ANGPTL4 gene can be used.
  • CNV laser induced choroidal neovascularization
  • ALD age-related macular degeneration
  • CjCas9 target sequence in the Vegfa and Hif1a / HIF1A genes PAM sequence and target sequence of sgRNA are indicated by dotted lines and solid lines, respectively
  • B All-in-one AAV vector encoding CjCas9 and in vivo experiment schedule
  • D Vegfa expression level measurement graph in RPE cells using ELISA
  • Figure 3 relates to opsin positive sites in the retina of mice injected with AAV / CjCas9, (A) RPE cells expressing HA tagged CjCas9 in mice injected with Rosa26-, Vegfa-, or Hif1a-specific CjCas9.
  • Figure 4 relates to the decrease in the expression of VEGF by CjCas9 targeting Vegfa or Hif1a in retinal tissue
  • Figure 5 relates to the effect of Vegfa-targeted CjCas9 in retinal rupture and blood leakage in diabetic retinopathy mouse model, (a) in vivo experimental schedule, (b) AAV2-CjCa9 targeting Vegfa Images of the effects of vascular rupture and blood leakage reduction in the mouse retina are shown.
  • FIG. 6 relates to the effect of Vegfa-targeting CjCas9 on retinal rupture and blood leakage in diabetic retinopathy mouse model.
  • FIG. 6A shows an in vivo experiment schedule (a), in which AAV2-CjCa9 targeting Vegfa was injected.
  • Image (b) for the effect of vascular rupture and blood leakage reduction in the mouse retina
  • FIG. 6B shows a graph comparing vascular rupture (%) by CjCas9 targeting Rosa26 or Vegfa.
  • FIG. 8 relates to CjCas9 target position screening of human HIF1A for genetic engineering, comprising: (A) CjCas9 target position screening results and indel frequency of human HIF1A, (B) conserved target positions between various mammals of HIF1A
  • FIG. 11 shows CjCas9 target site screening results and indel frequency of human ANGPTL4 for genetic engineering.
  • An artificially engineered neovascularization system having a controlled angiogenic effect.
  • the present invention relates to the configuration of various aspects capable of regulating angiogenesis or ameliorating or treating angiogenesis related diseases by artificially manipulating angiogenesis related factors.
  • the mechanism may be regulated by targeting a third function in the body as well as an angiogenesis function in which specific factors artificially manipulated are involved.
  • One embodiment of the invention relates to improvements and modifications of angiogenesis-related systems.
  • Angiogenesis refers to a process of tissue vascularization that involves the creation, development and / or differentiation of new blood vessels, and includes both angiogenesis and neovascularization. Angiogenesis may occur when several factors are closely related to each other to promote or inhibit the proliferation of vascular endothelial cells.
  • Angiogenesis includes both mechanisms in which blood vessels extend from existing vessels, new vessels are formed from progenitor cells, and / or larger diameters of existing small vessels.
  • neoangiogenesis encompasses both angiogenesis related mechanisms related to rupture of blood vessels or repair of ruptured vessels.
  • Angiogenesis includes mechanisms involving excessive and / or abnormal neovascularization in many severe disease states.
  • neovascularization occurs in diseases such as cancer, macular degeneration, diabetic retinopathy, arthritis and psoriasis.
  • diseases such as cancer, macular degeneration, diabetic retinopathy, arthritis and psoriasis.
  • new blood vessels are supplied to diseased tissues to destroy normal tissues, and in cancer, new blood vessels can enter tumor cells into the circulatory system and allow them to settle in other organs (tumor metastases).
  • the neovascularization may be neovascularization in the eye.
  • AMD senile macular degeneration
  • AMD diabetic retinopathy
  • Exudative AMD is characterized by angiogenesis and pathogenic angiogenesis.
  • neovascularization in the eye may include choroidal neovascularization (CNV), corneal neovascularization and / or Rubeosis iridis.
  • CNV choroidal neovascularization
  • corneal neovascularization corneal neovascularization
  • Rubeosis iridis Rubeosis iridis
  • Choroidal neovascularization is the creation of neovascularization in the choroidal layer, and CNV occurs rapidly in people with defects in Bruch's membrane, the innermost layer of the choroid. CNV is also associated with excessive amounts of vascular endothelial growth factor (VEGF). CNV can cause severe myopia, malignant myopia degeneration or neovascular degenerative macular degeneration (eg, wet macular degeneration).
  • VEGF vascular endothelial growth factor
  • Corneal neovascularization is the production of neovascularization from the pericorneal plexus due to oxygen deficiency to avascular corneal, which is primarily either congenital or inflammatory (e.g., corneal).
  • infectious e.g., bacteria (chlamydia, syphilis, pseduomonas), viruses (herpes and herpes) Herpes virus), fungi
  • Rubiosis iridis is angiogenesis on the surface of the iris, which is associated with diabetic retinopathy, and is also known to cause irisemia due to central retinal vein occlusion, ocular ischemia syndrome, and chronic retinal detachment.
  • neovascularization may be associated with survival, proliferation, persistence, cytotoxicity, and cytokine-release functions of vascular endothelial cells. .
  • neovascularization may be associated with increased expression of angiogenic cytokines.
  • neovascularization may be related to receptor function of vascular endothelial cells.
  • neovascularization may be related to the motility of vascular endothelial cells.
  • neovascularization may be related to adhesion of vascular endothelial cells.
  • Neovascularization-related factors neovascularization - associated factor
  • One embodiment of the invention is an artificially engineered or modified angiogenesis related factor.
  • Angiogenesis related factors means all factors that directly participate in or indirectly affect angiogenesis or angiogenesis.
  • the element may be DNA, RNA, gene, peptide, polypeptide or protein.
  • it includes all of a variety of materials that may have unnatural, ie, artificially engineered, angiogenic regulatory functions.
  • it may be a genetically engineered or modified gene or protein.
  • artificially manipulated refers to a state in which an artificial modification has been made, not a state as it occurs in nature.
  • genetically engineered refers to a case where an artificial genetic modification is made to a biological or non-living material referred to in the present invention, for example, to artificially modify a genome for a specific purpose.
  • Genes and / or gene products polypeptides, proteins, etc.
  • the present invention provides angiogenesis related factors genetically engineered or modified for a particular purpose.
  • Genes or proteins having the functions listed below may not only have one type of neovascularization related function, but may have multiple types of functions. In addition, two or more angiogenic functions and factors may be provided as needed.
  • Angiogenesis-related factors may promote or increase angiogenesis
  • Angiogenesis related factors may inhibit or inhibit angiogenesis.
  • Angiogenesis related factors may induce or activate an angiogenic environment.
  • Angiogenesis related factors may induce angiogenesis inhibitory environment or inactivate angiogenesis environment.
  • Angiogenesis related factors can modulate (promote, increase, inhibit and / or inhibit, etc.) angiogenesis.
  • Angiogenesis related factors can be used to ameliorate and treat neovascularization related diseases.
  • Angiogenesis-related factors include ABCA1, ACAT, ACC2, ADAMTS12, ADCY2, ADIPOQ, ADIPOR1, ADIPOR2, ADRB2, AGPAT5, AIP4, AKAP2, AKR1C2, AMPK, ANG2, ANGPT2, ANGPTL4, ANK1, ANXA1, AHAP, AHAP AUH, AUTOTAXIN, BAI3, BCAR1, BIN1, BMP3A, CA10, CAMK1D, CAMKK2, CD36, CD44, CDC42, CDH13, CHAT, CNTFR, COL4A2, CPT, CSH1, CTNN, CUBN, CYP7B1, CYSLTR1, CY, DGKZ, DHCR7, DHFR, DRD2, DRD5, EDG1, EDG2, EDG3, EDG4, EDG5, EDG6, EDG7, EDG8, EDNRA, EHHADH, ENPP6, EPAS1, ERBB4, ERK1, ERK2, ESRRG,
  • the angiogenesis related factor may be one or more selected from the group consisting of VEGFA, HIF1A, ANGPT2, EPAS1, and ANGPTL4.
  • the angiogenesis related factor may be VEGFA.
  • Vascular endothelial growth factor A (VEGFA) gene refers to a gene (full length DNA, cDNA or mRNA) encoding the protein VEGFA, also referred to as MVCD1, VEGF or VPF.
  • the VEGFA gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human VEGFA (eg, NCBI Accession No. NP_001020537.2, NP_001020538.2, etc.), such as NCBI Accession No. VEGFA gene represented by NM_001025366.2, NM_001025367.2, NM_003376, NG_008732.1, and the like.
  • the angiogenesis related factor may be HIF1A.
  • HIF1A (Hypoxia-inducible factor 1-alpha, HIF-1-alpha) gene refers to a gene (full length DNA, cDNA or mRNA) encoding the protein HIF1A, also called HIF1, MOP1, PASD8 or bHLHe78.
  • the HIF1A gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human HIF1A (eg, NCBI Accession No. NP_001230013.1, NP_001521.1, etc.), such as NCBI Accession No. HIF1A gene represented by NM_001243084.1, NM_001530.3, NM_181054.2, NG_029606.1 and the like.
  • the angiogenesis related factor may be ANGPT2.
  • Angiopoietin-2 (ANGPT2) gene refers to a gene (full length DNA, cDNA or mRNA) encoding protein ANGPT2, also called AGPT2 or ANG2.
  • the ANGPT2 gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human ANGPT2 (eg, NCBI Accession No. NP_001112359.1, NP_001112360.1, NP_001138.1, etc.).
  • NCBI Accession No. ANGPT2 gene represented by NM_001118887.1, NM_001118888.1, NM_001147.2, NG_029483.1 and the like.
  • the angiogenesis related factor may be EPAS1.
  • Endothelial PAS domain-containing protein 1 (EPAS1) gene refers to a gene (full length DNA, cDNA or mRNA) encoding protein EPAS1, also referred to as ECYT4, HIF2A, HLF, MOP2, PASD2 or bHLHe73.
  • the EPAS1 gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human EPAS1 (e.g., NCBI Accession No. NP — 001421.2, etc.), such as NCBI Accession No. EPAS1 gene represented by NM_001430.4, NG_016000.1 and the like.
  • the angiogenesis related factor may be ANGPTL4.
  • Angiopoietin-like 4 (ANGPTL4) gene means a gene (full length DNA, cDNA or mRNA) encoding protein ANGPTL4, also called ARP4, FIAF, HARP, HFARP, NL2, PGAR, TGQTL or UNQ171.
  • the ANGPTL4 gene may be one or more selected from the group consisting of, but is not limited to: a gene encoding human ANGPTL4 (eg, NCBI Accession No. NP_001034756.1, NP_647475.1, etc.), such as NCBI Accession No. ANGPTL4 gene represented by NM_001039667.2, NM_139314.2, NG_012169.1 and the like.
  • the angiogenesis-related factors may be derived from mammals including primates such as humans and monkeys, rodents such as rats and mice.
  • Gene information can be obtained from known databases such as GenBank of the National Center for Biotechnology Information (NCBI).
  • angiogenesis related factors such as VEGFA, HIF1A, ANGPT2, EPAS1, or ANGPTL4, may be artificially engineered angiogenesis related factors.
  • the artificially engineered angiogenesis related factor may be genetically engineered.
  • Such genetic manipulation or modification can be obtained by artificially inserting, deleting, replacing, or inverting mutations in some or all regions of the genomic sequence of a wild type gene.
  • the genetic manipulation or modification may also be obtained by fusing the manipulation or modification of two or more genes.
  • such genetic manipulation or modification may inactivate the gene so that the protein encoded from the gene is not expressed in the form of a protein having an original function.
  • such genetic manipulation or modification may further enable the gene to be expressed so that the protein encoded from the gene is expressed in the form of a protein having an improved function than the original function.
  • the function of a protein encoded by a particular gene is A
  • the function of the protein expressed by the engineered gene may be completely different from A or have additional functions (A + B) including A together. have.
  • such genetic manipulation or modification may be such that two or more proteins are expressed in a fused form using two or more genes having different or complementary functions.
  • such genetic manipulation or modification may be used to allow two or more proteins to be expressed in separate and independent forms in cells using two or more genes having different or complementary functions.
  • the engineered angiogenesis related factors may promote or increase angiogenesis.
  • the engineered angiogenesis related factors may inhibit or inhibit angiogenesis.
  • the engineered angiogenesis related factors may induce or activate an angiogenic environment.
  • the engineered angiogenesis-related factors may induce angiogenesis inhibition environments or inactivate angiogenesis conditions.
  • the engineered angiogenesis related factors can modulate (promote, increase, inhibit and / or inhibit, etc.) angiogenesis.
  • the engineered angiogenesis-related factors can be used to ameliorate and treat neovascularization-related diseases.
  • Such manipulations involve both structural or functional modification of angiogenesis related factors.
  • Structural modifications of the angiogenesis related factors include all modifications that are not identical to the wildtype present in nature.
  • angiogenesis-related factor is DNA, RNA or genes
  • the structural modification may be the loss of one or more nucleotides.
  • the structural modification may be one or more nucleotides inserted.
  • the inserted nucleotide includes all of the nucleotides introduced from or outside the subject including angiogenesis-related factors.
  • the structural modification may be one or more nucleotides are substituted.
  • the structural modification may be to include chemical modification of one or more nucleotides.
  • chemical modification includes all additions, removals or substitutions of chemical functional groups.
  • angiogenesis-related factor is a peptide, polypeptide or protein
  • the structural modification may be the loss of one or more amino acids.
  • the structural modification may be one or more amino acid is inserted.
  • the inserted amino acid includes all of the amino acids introduced from or outside the subject including angiogenesis-related factors.
  • the structural modification may be one or more amino acid is substituted.
  • the structural modification may include chemical modification of one or more amino acids.
  • chemical modification includes all additions, removals or substitutions of chemical functional groups.
  • the structural modification may be to which some or all of the other peptides, polypeptides or proteins are attached.
  • the other peptide, polypeptide or protein may be angiogenesis-related factors, or may be a peptide, polypeptide or protein that performs other functions.
  • the functional modification of the angiogenesis-related factor includes all modifications having improved or degraded function as compared to the wildtype present in nature or all modifications having a third, different function.
  • angiogenesis-related factor is a peptide, polypeptide or protein
  • the functional modification may be a mutation of angiogenesis related factors.
  • the mutation may be a mutation in which the function of angiogenesis-related factors is enhanced or inhibited.
  • the functional modification is an addition of the function of angiogenesis-related factors.
  • the added function may be the same function or another function.
  • angiogenesis-related factors with added function may be fused with other peptides, polypeptides or proteins.
  • the functional modification may be an increase in function due to increased expression of angiogenesis related factors.
  • the functional modification may be a decrease in function due to decreased expression of angiogenesis related factors.
  • the engineered angiogenesis related factor may be induced by one or more of the following:
  • Angiogenesis related factors ie all or some deletions of the engineered gene (hereinafter, the target gene), such as 1 bp or more nucleotides of the target gene, such as 1 to 30, 1 to 27, 1 to 25, 1 Deletion of from 23 to 1, 1 to 20, 1 to 15, 1 to 10, 1 to 5, 1 to 3, or 1 nucleotide,
  • the target gene such as 1 bp or more nucleotides of the target gene, such as 1 to 30, 1 to 27, 1 to 25, 1 Deletion of from 23 to 1, 1 to 20, 1 to 15, 1 to 10, 1 to 5, 1 to 3, or 1 nucleotide,
  • nucleotides of a target gene such as 1 to 30, 1 to 27, 1 to 25, 1 to 23, 1 to 20, 1 to 15, 1 to 10, 1 to 5, 1 Substitution of nucleotides of 3 to 1, or 1, nucleotides with a different nucleotide than the wild type, and
  • nucleotides such as 1 to 30, 1 to 27, 1 to 25, 1 to 23, 1 to 20, 1 to 15, 1 to 10, 1 to 5, 1 to 3
  • insertion of one nucleotide (each independently selected from A, T, C and G) into any position of the target gene.
  • the modified portion ('target site') of the target gene is at least 1bp, at least 3bp, at least 5bp, at least 7bp, at least 10bp, at least 12bp, at least 15bp, at least 17bp, at least 20bp, for example, 1bp to 30bp, in the gene.
  • it may be involved in the regulation of a third body mechanism of VEGF.
  • Increased vascular permeability by VEGF can cause edema in addition to tumor growth, so that artificially engineered VEGF can be used in various tumors, for example, by inactivating VEGF.
  • VEGF E.g., brain tumors, uterine cancer, vestibular Schwannomas, etc.
  • decreased vascular permeability by artificially engineered VEGF may provide therapeutic effects such as renal failure, arthritis psoriasis, and coronary heart disease.
  • VEGF may also provide therapeutic effects for autoimmune diseases. For example, by artificially regulating the inflammatory activity induced by VEGF, Uveitis, rheumatoid arthritis, systemic lupus erythematosus, inflammatory bowel disease, psoriasis therapeutic effects such as psoriasis, systemic sclerosis, multiple sclerosis and the like.
  • VEGF can also provide therapeutic effects for mental illness. For example, by artificially regulating the expression of neurotransmitter-related factors by VEGF, it is possible to provide a therapeutic effect for depression.
  • the HIF may be HIF1 or HIF2.
  • HIF ulcerative colitis
  • rheumatoid arthritis rheumatoid arthritis
  • systemic lupus erythematosus inflammatory bowel disease
  • psoriasis and systemic Therapeutic effects such as systemic sclerosis, multiple sclerosis and the like.
  • the artificially manipulated exemplary factors of the present invention may regulate the mechanism by targeting not only angiogenic function but also a third function in the body.
  • One embodiment of the present invention includes such angiogenic factors and methods for their preparation, artificially modified functions, compositions comprising them, and their therapeutic uses capable of ameliorating or treating diseases associated with third functions. do.
  • One aspect of the invention is an angiogenesis control system that modulates angiogenesis by artificially manipulating angiogenesis related factors.
  • Angiogenesis control system of the present invention is a term that includes all phenomena that affect the promotion, increase, inhibition and / or inhibition of angiogenesis by altering the function of artificially engineered angiogenesis related factors. As such, including all substances, compositions, methods and uses that are directly or indirectly involved in such angiogenesis control systems.
  • Each element of the neovascularization control system may be collectively referred to as a "neovascularization controlling factor.”
  • the system of the present invention includes a modified body mechanism in which artificially engineered angiogenesis related factors are involved.
  • artificially engineered angiogenesis related factors By artificially engineered angiogenesis related factors,
  • hematopoietic stem surface antigens such as CD34, CD117, CD133, and the like and vascular endothelial antigens such as Flk-1 / KDR, Tie-2, and the like may be regulated.
  • angiogenesis may be regulated in which cells constituting blood vessels are sprouted and proliferated to form new vessels.
  • the activity of a direct angiogenic factor (DAF) that directly stimulates endothelial cells can be modulated. May promote or inhibit endothelial cell proliferation and / or migration.
  • DAF direct angiogenic factor
  • direct angiogenesis factors include vascular endothelial growth factor (VEGF), basic fibroblast growth factor (bFGF), hepatocyte growth factor (HGF), epidermal growth factor (EGF), thymidine phosphorylase (PD-ECGF), and placental (PlGF).
  • VEGF vascular endothelial growth factor
  • bFGF basic fibroblast growth factor
  • HGF hepatocyte growth factor
  • EGF epidermal growth factor
  • PD-ECGF thymidine phosphorylase
  • PlGF placental
  • TGF transforming growth factor
  • proliferin proliperin
  • interleukin-8 cytokine interleukin-8
  • angiogenin angiogenesis protein
  • fibrin fibrin
  • nicotinamide nicotinamide
  • PAF platelet activating factor
  • 12-HETE 12-hydroxy eicosatetraenoate: toxic degradation products of arykidonic acid.
  • MMPs stromal protease
  • S1P sphingosine 1-phosphate
  • leptin leptin
  • two different intercellular communication signaling pathways that operate in vascular cells ie, PDGF and VEGF signaling pathways, can be used.
  • the activity of an indirect angiogenic factor (IAF) that stimulates perivascular cells to induce angiogenesis through generation of DAF may be regulated.
  • IAF indirect angiogenic factor
  • vascular endothelial cells differentiate from endothelial progenitor cells (EPCs) to form primary vascular plexus can be regulated.
  • the resolution of extracellular matrix components for migration of endothelial cells can be controlled.
  • cell migration related signaling pathways can be regulated.
  • receptors of vascular endothelial growth factor VEGFR-1 (flt-1; fmslike-tyrosine kinase-1), VEGFR-2 (flk-1 / KDR), VEGFR-3, platelet derived growth factor (PDGF)
  • flt-1 vascular endothelial growth factor-1
  • VEGFR-2 flk-1 / KDR
  • VEGFR-3 vascular endothelial growth factor (flt-1; fmslike-tyrosine kinase-1
  • VEGFR-2 flk-1 / KDR
  • VEGFR-3 VEGFR-3
  • PDGF platelet derived growth factor
  • system angiogenesis control system of the present invention comprises a composition for manipulating angiogenesis-related factors.
  • the manipulation composition is a composition capable of artificially manipulating angiogenesis-related factors, and preferably may be a composition for genetic manipulation.
  • Manipulation or modification of the angiogenesis-related factors and substances involved in the angiogenesis system of the present invention may be accomplished, preferably through genetic manipulation.
  • compositions and methods can be provided that target and genetically engineer some or all of the non-coding or coding regions of angiogenesis related factors.
  • one or more of the angiogenic regulatory genes involved therein can be engineered or modified for formation of the desired neovascularization system. This can be done through modification of the nucleic acids that make up the gene. As a result of the operation, knock down, knock out, and knock in forms are all included.
  • a promoter region, or transcriptional sequence, such as an intron or exon sequence can be targeted.
  • Coding sequences, such as coding regions, initial coding regions, can be targeted for alteration and knockout of expression.
  • the nucleic acid modification is one or more nucleotides, such as 1 to 30 bp, 1 to 27 bp, 1 to 25 bp, 1 to 23 bp, 1 to 20 bp, 1 to 15 bp, 1 to 10 bp, 1 to 5 bp, 1 to 3 bp, or Substitution, deletion, and / or insertion of 1 bp of nucleotides.
  • one of the angiogenesis related genes to knock out one or more of the angiogenesis related genes, or to eliminate one or more expressions, or to knock out one or more one or two alleles It may be targeted to include deletions or mutations in the above.
  • gene knockdown can be used to reduce expression of unwanted alleles or transcripts.
  • it can be used to alter angiogenesis related genes that affect angiogenesis function by targeting non-coding sequences of promoters, enhancers, introns, 3'UTRs, and / or polyadenylation signals.
  • said gene nucleic acid alteration may result in the regulation of activity, such as activation or inactivation, of angiogenesis-related genes.
  • said genetic nucleic acid modification may be to inactivate the targeted gene by catalyzing single stranded or double stranded cleavage, i.e., nucleic acid strand damage, of a specific site within the gene targeted by the guide nucleic acid-editor protein complex.
  • nucleic acid strand breaks can be repaired through mechanisms such as homologous recombination or nonhomologous end joining (NHEJ).
  • NHEJ nonhomologous end joining
  • the present invention provides a composition for manipulating angiogenesis-related factors.
  • the manipulation composition is a composition capable of artificially manipulating angiogenesis-related factors, and preferably may be a composition for genetic manipulation.
  • the composition may genetically engineer one or more of the angiogenesis related factors involved therein to form a desired neovascularization control system.
  • the genetic manipulation may be performed in consideration of a gene expression control process.
  • RNA processing regulation RNA processing regulation
  • RNA transport regulation RNA degradation regulation
  • translation regulation protein modification regulation step
  • RNAi RNA interference or RNA silencing
  • small RNA sRNA
  • sRNA small RNA
  • Expression can be controlled.
  • the genetic manipulation may be made through modification of nucleic acid constituting angiogenesis related factors. As a result of the operation, knock down, knockout and knockin forms are all included.
  • the nucleic acid modification is one or more nucleotides, such as 1 to 30 bp, 1 to 27 bp, 1 to 25 bp, 1 to 23 bp, 1 to 20 bp, 1 to 15 bp, 1 to 10 bp, 1 to 5 bp, 1 to 3 bp Or substitution, deletion, and / or insertion of 1 bp of nucleotides.
  • an angiogenesis related factor to knock out one or more of the angiogenesis related factors, or to eliminate one or more expressions, or to knock out one or more one or two alleles It can be engineered to include deletions or mutations in one or more of.
  • knockdown of angiogenesis related factors can be used to reduce expression of unwanted alleles or transcripts.
  • the nucleic acid modification may be insertion of one or more nucleic acid fragments or genes.
  • the nucleic acid fragment is a nucleic acid sequence consisting of one or more nucleotides
  • the length of the nucleic acid fragment is 1 to 40bp, 1 to 50bp, 1 to 60bp, 1 to 70bp, 1 to 80bp, 1 to 90bp, 1 to 100bp, 1 to 500bp Or 1 to 1000 bp.
  • the gene to be inserted may be one of the factors related to angiogenesis or a gene having a different function.
  • nucleic acid modifications utilize wild type or variant enzymes capable of catalyzing the hydrolysis (cleavage) of bonds between nucleic acids in a DNA or RNA molecule, preferably a DNA molecule.
  • a DNA or RNA molecule preferably a DNA molecule.
  • Guide nucleic acid-editor protein complexes can be used.
  • At least one nuclease selected from the group consisting of meganuclease, zinc finger nuclease, CRISPR / Cas9 (Cas9 protein), CRISPR-Cpf1 (Cpf1 protein), and TALE-nuclease Genes can be manipulated using clease to control the expression of genetic information.
  • non-homologous end joining or homologous recombination repair (eg, using, but not limited to, guide nucleic acid-editor protein complexes, eg, using a CRISPR / Cas system) homology-directed repair (HDR).
  • NHEJ non-homologous end joining
  • HDR homology-directed repair
  • NHEJ NHEJ mechanism
  • a change in the DNA sequence at the cleavage site can be caused, whereby the gene can be inactivated.
  • Repair via NHEJ causes substitutions, insertions or deletions of short gene fragments and can be used to induce gene knockout.
  • the invention may provide said genetically engineered site.
  • when altered by an NHEJ-mediated alteration refers to a location within said gene that results in a reduction or elimination of the expression of angiogenic regulatory gene products.
  • composition for manipulating angiogenesis-related factors comprises
  • the VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene which are angiogenesis-related factors affecting angiogenesis control, can be targeted.
  • target sequences for target sites of the genes ie, sites where genetic engineering occurs or are recognized for genetic engineering, are summarized in Tables 1, 2, 3, 4, and 5.
  • the target sequence may target one or more genes.
  • the target sequence may target two or more genes simultaneously.
  • two or more genes may be homologous or heterologous.
  • the gene may comprise one or more target sequences.
  • Genes can be targeted simultaneously to two or more target sequences.
  • Genes may vary in location and number of genetically engineered objects depending on the number of target sequences.
  • Genetic engineering can be designed in various ways depending on the number and location of target sequences.
  • Genetic engineering can occur simultaneously on two or more target sequences.
  • two or more target sequences may be present in homologous or heterologous genes.
  • Genetic engineering can generate two or more genes simultaneously.
  • two or more genes may be homologous or heterologous.
  • VEGFA One GTAGAGCAGCAAGGCAAGGCTC (SEQ ID NO: 1) VEGFA 2 CTTTCTGTCCTCAGTGGTCCCA (SEQ ID NO: 2) VEGFA 3 GAGACCCTGGTGGACATCTTCC (SEQ ID NO: 3) VEGFA 4 TTCCAGGAGTACCCTGATGAGA (SEQ ID NO: 4) VEGFA 5 TTGAAGATGTACTCGATCTCAT (SEQ ID NO: 5) VEGFA 6 AGGGGCACACAGGATGGCTTGA (SEQ ID NO: 6) VEGFA 7 AGCAGCCCCCGCATCGCATCAG (SEQ ID NO: 7) VEGFA 8 GCAGCAGCCCCCGCATCGCATC (SEQ ID NO: 8) VEGFA 9 GTGATGTTGGACTCCTCAGTGG (SEQ ID NO: 9) VEGFA 10 TGGTGATGTTGGACTCCTCAGT (SEQ ID NO: 10) VEGFA 11 CATGGTGATGTTGGACTCCTCA (SEQ ID NO: 1) VEG
  • HIF1A One ACTCACCAGCATCCAGAAGTTT (SEQ ID NO: 14) HIF1A 2 ATTTGGATATTGAAGATGACAT (SEQ ID NO: 15) HIF1A 3 ATTTACATTTCTGATAATGTGA (SEQ ID NO: 16) HIF1A 4 ATGTGTTTACAGTTTGAACTAA (SEQ ID NO: 17) HIF1A 5 CTGTGTCCAGTTAGTTCAAACT (SEQ ID NO: 18) HIF1A 6 ATGGTCACATGGATGAGTAAAA (SEQ ID NO: 19) HIF1A 7 CATGAGGAAATGAGAGAAATGC (SEQ ID NO: 20) HIF1A 8 CCCAGTGAGAAAAGGGAAAGAA (SEQ ID NO: 21) HIF1A 9 TTGTGAAAAAGGGTAAAGAACA (SEQ ID NO: 22) HIF1A 10 ATAGTTCTTCCTCGGCTAGTTA (SEQ ID NO: 23) HIF1A 11 TCATAGTT
  • ANGPT2 One TCAGGTCCAGCATGGGTCCTGC (SEQ ID NO: 32) ANGPT2 2 CGGCGTCCCTCTGCACAGCA (SEQ ID NO: 33) ANGPT2 3 GCTGTGCAGAGGGACGCGCCGC (SEQ ID NO: 34) ANGPT2 4 ATCGTATTCGAGCGGCGCGTCC (SEQ ID NO: 35) ANGPT2 5 GATGTTCTCCAGCACTTGCAGC (SEQ ID NO: 36) ANGPT2 6 AGTGCTGGAGAACATCATGGAA (SEQ ID NO: 37) ANGPT2 7 ACAACATGAAGAAAGAAATGGT (SEQ ID NO: 38) ANGPT2 8 AAATGGTAGAGATACAGCAGAA (SEQ ID NO: 39) ANGPT2 9 TTCTATCATCACAGCCGTCTGG (SEQ ID NO: 40) ANGPT2 10 AAGTTCAAGTCTCGTGGTCTGA (SEQ ID NO: 41) ANGPT2 11 ACG
  • ANGPTL4 One GCATCAGGGCTGCCCCGGCCGT (SEQ ID NO 57) ANGPTL4 2 CACGGGTCCGCCCTGAGCGCTC (SEQ ID NO: 58) ANGPTL4 3 GGACGCAAAGCGCGGCGACTTG (SEQ ID NO: 59) ANGPTL4 4 TCCTGGGACGAGATGAATGTCC (SEQ ID NO: 60) ANGPTL4 5 CTGCAGCTCGGCCAGGGGCTGC (SEQ ID NO: 61) ANGPTL4 6 CCAGGGGCTGCGCGAACACGCG (SEQ ID NO: 62) ANGPTL4 7 CCCTCGGTTCCCTGACAGGCGG (SEQ ID NO: 63) ANGPTL4 8 ACCCTGAGGTCCTTCACAGCCT (SEQ ID NO: 64) ANGPTL4 9 TTCCACAAGGTGGCCCAGCAGC (SEQ ID NO: 65) ANGPTL4 10 CAGCAGCAGCGGCACCTGGAGA
  • Angiogenesis control system of the present invention is a composition for manipulating angiogenesis-related factors, may comprise a guide nucleic acid-editor protein complex.
  • Guide nucleic acid-editor protein complex means a complex formed through the interaction of a guide nucleic acid with an editor protein, and the nucleic acid-protein complex includes a guide nucleic acid and an editor protein.
  • guide nucleic acid refers to a nucleic acid capable of recognizing a target nucleic acid, gene, chromosome or protein.
  • the guide nucleic acid may be in the form of DNA, RNA or DNA / RNA mixture, and may have 5 to 150 nucleic acid sequences.
  • the guide nucleic acid may comprise one or more domains.
  • the domain may be a guide domain, a first complementary domain, a connecting domain, a second complementary domain, a proximal domain, a tail domain, and the like, but is not limited thereto.
  • the guide nucleic acid may include two or more domains, and may include the same domain repeatedly or include different domains.
  • the guide nucleic acid may be one continuous nucleic acid sequence.
  • one contiguous nucleic acid sequence may be (N) m , where N is A, T, C or G, or A, U, C or G, and m means an integer from 1 to 150 .
  • the guide nucleic acid may be two or more consecutive nucleic acid sequences.
  • two or more consecutive nucleic acid sequences may be (N) m and (N) o , where N is A, T, C or G, or A, U, C or G, and m and o are It means an integer of 1 to 150, m and o may be the same or different from each other.
  • editing protein refers to a peptide, polypeptide or protein that may bind directly to, or may not interact with, a nucleic acid.
  • the editor protein may be an enzyme.
  • the editor protein may be a fusion protein.
  • fusion protein refers to a protein produced by fusing an enzyme and an additional domain, peptide, polypeptide or protein.
  • enzyme refers to a protein comprising a domain capable of cleaving a nucleic acid, gene, chromosome or protein.
  • the additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the enzyme.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or may comprise additional domains, peptides, polypeptides or proteins in one or more of these combinations.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or one or more of these combinations may comprise a functional domain, peptide, polypeptide or protein.
  • Guide nucleic acid-editor protein complexes can modify a subject.
  • the subject may be a target nucleic acid, gene, chromosome or protein.
  • the guide nucleic acid-editor protein complex may ultimately regulate (eg, inhibit, inhibit, decrease, increase or promote) expression of a target protein, or may remove or express a new protein. To be able.
  • the guide nucleic acid-editor protein complex may act at the DNA, RNA, gene or chromosome level.
  • the guide nucleic acid-editor protein complex may act at the stage of transcription and translation of the gene.
  • the guide nucleic acid-editor protein complex may act at the protein level.
  • Guide nucleic acids are nucleic acids capable of recognizing target nucleic acids, genes, chromosomes or proteins, forming guide nucleic acid-protein complexes.
  • the guide nucleic acid serves to recognize or target the nucleic acid, gene, chromosome or protein to which the guide nucleic acid-protein complex is targeted.
  • the guide nucleic acid may be in the form of DNA, RNA or DNA / RNA mixture, and may have 5 to 150 nucleic acid sequences.
  • the guide nucleic acid may be linear or circular.
  • the guide nucleic acid may be one continuous nucleic acid sequence.
  • one contiguous nucleic acid sequence may be (N) m , where N is A, T, C or G, or A, U, C or G, and m means an integer from 1 to 150 .
  • the guide nucleic acid may be two or more consecutive nucleic acid sequences.
  • two or more consecutive nucleic acid sequences may be (N) m and (N) o , where N is A, T, C or G, or A, U, C or G, and m and o are It means an integer of 1 to 150, m and o may be the same or different from each other.
  • the guide nucleic acid may comprise one or more domains.
  • the domain may be a guide domain, a first complementary domain, a connecting domain, a second complementary domain, a proximal domain, a tail domain, and the like, but is not limited thereto.
  • the guide nucleic acid may include two or more domains, and may include the same domain repeatedly or include different domains.
  • a "guide domain” is a domain that contains complementary guide sequences capable of complementary binding to a target sequence on a target gene or nucleic acid and serves for specific interaction with the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% or 95 It may be at least% complementary or completely complementary nucleic acid sequence.
  • the guide domain may be 5 to 50 base sequences.
  • the guide domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the guide domain may include 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence may be a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary. Nucleic acid sequence.
  • the guide sequence may be 5 to 50 nucleotide sequences.
  • the guide domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the guide sequence is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the guide domain may include a guide sequence and an additional nucleotide sequence.
  • the additional base sequence may be for improving or decreasing the function of the guide domain.
  • the additional base sequence may be for improving or decreasing the function of the guide sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may be 5 to 35 base sequences, 10 to 35 base sequences, 15 to 35 base sequences, 20 to 35 base sequences, 25 to 35 base sequences, or 30 to 35 base sequences. Can be.
  • the additional base sequence is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences Or 30 to 35 base sequences.
  • the additional base sequence may be located at the 5 'end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide sequence.
  • a "first complementary domain” is a nucleic acid sequence comprising a complementary nucleic acid sequence and a second complementary domain, and is complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may be 5 to 35 nucleotide sequences, 10 to 35 nucleotide sequences, 15 to 35 nucleotide sequences, 20 to 35 nucleotide sequences, 25 to 35 nucleotide sequences, or 30 to 35 nucleotide sequences. Can be.
  • the first complementary domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 It can be a base sequence or 30 to 35 base sequences.
  • a “linking domain” is a nucleic acid sequence that connects two or more domains, wherein the linking domain connects two or more domains, the same or different.
  • the linking domain may be covalently or non-covalently linked to two or more domains, or may connect two or more domains covalently or non-covalently.
  • the linking domain may be 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. Can be.
  • the linking domain may include 1 to 30 base sequences, 5 to 30 base sequences, 10 to 30 base sequences, 15 to 30 base sequences, 20 to 30 base sequences, or 25 to 30 base sequences. Can be.
  • a “second complementary domain” is a nucleic acid sequence comprising a complementary nucleic acid sequence with a first complementary domain, and has a complementarity enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 base sequences.
  • the second complementary domain may include 1 to 35 base sequences, 5 to 35 base sequences, 10 to 35 base sequences, 15 to 35 base sequences, 20 to 35 base sequences, and 25 to 35 bases. Sequence or 30 to 35 nucleotide sequences.
  • the second complementary domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, and 25 to 30 nucleotide sequences. Base sequence or 30 to 35 base sequences.
  • Proximal domain is a nucleic acid sequence located proximal to a second complementary domain.
  • the proximal domain may comprise complementary nucleotide sequences within the proximal domain and may form double strands by the complementary nucleotide sequences.
  • the proximal domain may be 1 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 20 nucleotide sequences, 5 to 20 nucleotide sequences, 10 to 20 nucleotide sequences, or 15 to 20 nucleotide sequences.
  • the proximal domain may be 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, or 15 to 20 base sequences.
  • Tiil domain is a nucleic acid sequence located at one or more ends of both ends of the guide nucleic acid.
  • the tail domain may comprise complementary sequences within the tail domain, and may form double strands by complementary sequences.
  • the tail domain may be 1 to 50 nucleotide sequences.
  • the tail domain is 5 to 50 base sequences, 10 to 50 base sequences, 15 to 50 base sequences, 20 to 50 base sequences, 25 to 50 base sequences, 30 to 50 base sequences, 35 To 50 nucleotide sequences, 40 to 50 nucleotide sequences, or 45 to 50 nucleotide sequences.
  • the tail domain is 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • nucleic acid sequences included in the domains may include selective or additional chemical modification. have.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • Guide nucleic acids include one or more domains.
  • the guide nucleic acid may include a guide domain.
  • the guide nucleic acid may comprise a first complementary domain.
  • the guide nucleic acid may comprise a linking domain.
  • the guide nucleic acid may comprise a second complementary domain.
  • the guide nucleic acid may comprise a proximal domain.
  • the guide nucleic acid may comprise a tail domain.
  • the number of domains may be 1, 2, 3, 4, 5, 6 or more.
  • the guide nucleic acid may include 1, 2, 3, 4, 5, 6 or more guide domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more first complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more linking domains.
  • the guide nucleic acid may comprise one, two, three, four, five, six or more second complementary domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more proximal domains.
  • the guide nucleic acid may comprise 1, 2, 3, 4, 5, 6 or more tail domains.
  • the guide nucleic acid may be included by overlapping one domain.
  • the guide nucleic acid may be included without overlapping or overlapping multiple domains.
  • the guide nucleic acid may include the same kind of domain, wherein the same kind of domain may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide nucleic acid may include two kinds of domains, wherein the other two kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include three kinds of domains, wherein the other three kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include four kinds of domains, wherein the other four kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include five kinds of domains, wherein the other five kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid may include six kinds of domains, wherein the other six kinds of domains may have different nucleic acid sequences or the same nucleic acid sequences.
  • the guide nucleic acid is [guide domain]-[first complementary domain]-[linking domain]-[second complementary domain]-[linking domain]-[guide domain]-[first complementary domain] -[Linking domain]-[second complementary domain], wherein the two guide domains may comprise guide sequences for different or identical targets, and the two first complementary domains Two second complementary domains may have the same nucleic acid sequence or different nucleic acid sequences.
  • the guide domains contain guide sequences for different targets, the guide nucleic acids can specifically bind to two targets, where specific binding can occur simultaneously or sequentially.
  • the linking domain may be cleaved by a specific enzyme, and in the presence of a specific enzyme, the guide nucleic acid may be divided into two or three parts.
  • gRNA As an embodiment of the guide nucleic acid of the present invention, gRNA is described below.
  • gRNA refers to a nucleic acid capable of specific targeting of a gRNA-CRISPR enzyme complex, ie, a CRISPR complex, to a target gene or nucleic acid.
  • gRNA refers to a target gene or nucleic acid specific RNA, and can bind to the CRISPR enzyme to direct the CRISPR enzyme to the target gene or nucleic acid.
  • the gRNA may comprise a plurality of domains. Each domain allows for intra- or inter-strand interaction of three-dimensional behavior or active forms of gRNAs.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • a single stranded gRNA comprises a guide domain in the 5 'to 3' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; Connecting domains; A second complementary domain, a domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain; Proximal domain; And optionally a tail domain.
  • the dual gRNA comprises a guide domain from the 5 'to 3' direction, ie a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid and a first complementary domain.
  • the first strand and a second complementary domain, a domain having a sequence complementary to the first complementary domain sequence, capable of forming a double stranded nucleic acid with the first complementary domain, and a proximal domain; And optionally a second strand comprising a tail domain.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • the crRNA may comprise a guide domain and a first complementary domain
  • the tracrRNA may comprise a second complementary domain, a proximal domain and optionally a tail domain.
  • the single stranded gRNA comprises a guide domain in the 3 'to 5' direction, ie, a domain comprising a guide sequence capable of complementary binding to a target gene or nucleic acid; A first complementary domain; And a second complementary domain having a sequence complementary to the first complementary domain sequence and thus capable of forming a double stranded nucleic acid with the first complementary domain.
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences.
  • the guide domain includes 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. It may be a nucleotide sequence or 25 base sequences.
  • the guide domain includes 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. It may include the base sequence or 25 base sequences.
  • the guide domain may include a guide sequence.
  • the guide sequence may be a complementary base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence may be a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary. Nucleic acid sequence.
  • the guide sequence may be a nucleic acid sequence that is complementary to a target gene, ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • a target gene ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • the guide sequence may be 5 to 50 nucleotide sequences.
  • the guide sequence includes 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. It may be a nucleotide sequence or 25 base sequences.
  • the guide sequence includes 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. It may include the base sequence or 25 base sequences.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the VEGFA gene, 16 base sequence, 17 base sequence, 18 base sequence, 19 base sequence, 20 base sequence, 21 base sequence, It may be 22 base sequences, 23 base sequences, 24 base sequences, or 25 base sequences.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the HIF1A gene, 16 base sequence, 17 base sequence, 18 base sequence, 19 base sequence, 20 base sequence, 21 base sequence, It may be 22 base sequences, 23 base sequences, 24 base sequences, or 25 base sequences.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPT2 gene, 16 base sequence, 17 base sequence, 18 base sequence, 19 base sequence, 20 base sequence, 21 base sequence, It may be 22 base sequences, 23 base sequences, 24 base sequences, or 25 base sequences.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the EPAS1 gene, 16 base sequence, 17 base sequence, 18 base sequence, 19 base sequence, 20 base sequence, 21 base sequence, It may be 22 base sequences, 23 base sequences, 24 base sequences, or 25 base sequences.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPTL4 gene, 16 base sequence, 17 base sequence, 18 base sequence, 19 base sequence, 20 base sequence, 21 base sequence, It may be 22 base sequences, 23 base sequences, 24 base sequences, or 25 base sequences.
  • the guide sequence is a target gene, that is, the target sequence of the angiogenesis-related factors, such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described in Table 1, Table 2, Table 3, Table 4, Although described in 5, it is not limited thereto.
  • the target sequence of the angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described in Table 1, Table 2, Table 3, Table 4, Although described in 5, it is not limited thereto.
  • the guide domain may include a guide sequence and an additional nucleotide sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence is 1 base sequence, 2 base sequences, 3 base sequences, 4 base sequences, 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, It may be 9 nucleotide sequences or 10 nucleotide sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide sequence.
  • some or all of the base sequences of the guide domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the first complementary domain comprises a complementary nucleic acid sequence with a second complementary domain, and is complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may include 5 to 35 base sequences.
  • the first complementary domain is 5 base sequence, 6 base sequence, 7 base sequence, 8 base sequence, 9 base sequence, 10 base sequence, 11 base sequence, 12 base Sequence, 13 bases, 14 bases, 15 bases, 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases Sequence, 23 nucleotide sequences, 24 nucleotide sequences, or 25 nucleotide sequences.
  • the first complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to a species present in nature, may be derived from a first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides of the first complementary domain or a derived first complementary domain 50% or more, or complete homology.
  • the first complementary domain when the first complementary domain is a first complementary domain of Streptococcus pyogenes or a first complementary domain derived from Streptococcus pyogenes, the first complementary domain is 5′-GUUUUAGAGCUA-3 Or may be a sequence having at least 50% or more homology with 5′-GUUUUAGAGCUA-3 ′.
  • the first complementary domain may further include (X) n , that is, 5′-GUUUUAGAGCUA (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, wherein n is the number of base sequences, and may be an integer of 5 to 15.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the first complementary domain when the first complementary domain is a first complementary domain of Campylobacter jejuni or a first complementary domain derived from Campylobacter jejuni, the first complementary domain is 5'-GUUUUAGUCCCUUUUUAAAUUUCUUU. It may be -3 ', or may be a nucleotide sequence having at least 50% or more homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'. In this case, the first complementary domain may further include (X) n , that is, 5′-GUUUUAGUCCCUUUUUAAAUUUCUU (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, wherein n is the number of base sequences, and may be an integer of 5 to 15. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii ( Boyrivibrio proteoclasii ) , Tampere Greenwich bacterium tumefaciens (Peregrinibacteria bacterium (GW2011_GWA_33_10)), liquid Let Mino Caucus Supervisors (Acidaminococcus sp.
  • BV3L6 Fort fatigue Monastir marker caviar (Porphyromonas macacae), racheu furnace Fira seae tumefaciens (Lachnospiraceae bacterium (ND2006) ), Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the first complementary domain is a first complementary domain of a Falcobacteria bacterium or a first complementary domain from Falcubacteria bacterium
  • the first complementary domain is 5'-UUUGUAGAU-3 ' Or a nucleotide sequence having at least 50% or more homology with 5′-UUUGUAGAU-3 ′.
  • the first complementary domain may further include (X) n , that is, 5 ′-(X) n UUUGUAGAU-3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, and n may be an integer of 1 to 5 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • part or all of the base sequence of the first complementary domain may comprise a chemical modification.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • Linking domains are nucleic acid sequences that link two or more domains, and linking domains link two or more domains that are the same or different.
  • the linking domain may be covalently or non-covalently linked to two or more domains, or may connect two or more domains covalently or non-covalently.
  • the linking domain may be a nucleic acid sequence that connects the first and second complementary domains to generate a single stranded gRNA.
  • the linking domain may be covalently or non-covalently bonded to the first and second complementary domains.
  • the linking domain may connect the first and second complementary domains covalently or non-covalently.
  • the linking domain may be 1 to 30 nucleotide sequences.
  • the linking domain may include 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. Can be.
  • the linking domain may include 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. It may include.
  • the linking domain is suitable for use in single-stranded gRNA molecules and can be covalently or non-covalently linked to the first and second strands of a double gRNA, or covalently or non-covalently linked to the first and second strands.
  • Single stranded gRNAs can be used to generate.
  • the linking domain may be used to generate single-stranded gRNAs either covalently or non-covalently with the crRNA and tracrRNA of the double gRNA, or by covalently or non-covalently linking the crRNA and tracrRNA.
  • the linking domain may be homologous to or derived from a naturally occurring sequence, such as some sequences of tracrRNA.
  • some or all of the base sequences of the linking domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the second complementary domain comprises a complementary nucleic acid sequence with the first complementary domain and is complementary enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 base sequences.
  • the first complementary domain may include 5 to 35 base sequences.
  • the second complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, 11 nucleotide sequences, and 12 nucleotide sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 nucleotide sequences, 24 nucleotide sequences, or 25 nucleotide sequences.
  • the second complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, 11 nucleotide sequences, and 12 nucleotide sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 base sequences, 24 base sequences or 25 base sequences may be included.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally occurring second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides second complementary domain or derived second complementary domain 50% or more, or complete homology.
  • the second complementary domain is a second complementary domain of Streptococcus pyogenes or a second complementary domain derived from Streptococcus pyogenes
  • the second complementary domain is 5′- UAGC AAGU UAAAA.
  • U-3 ', or 5'- UAGC AAGU UAAAA U-3' may be a sequence having at least 50% homology with at least 50% (underlined marks to form a double strand with the first complementary domain) Sequence).
  • the second complementary domain may further include (X) n or / and (X) m , that is, 5 ′-(X) n UAGC AAGU UAAAA U (X) m ⁇ 3 ′.
  • the X may be selected from the group consisting of bases A, T, U and G, wherein n and m are the number of base sequences, n may be an integer of 1 to 15, and m may be 1 to 6 have.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences of the base A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • the second complementary domain when the first complementary domain is a second complementary domain of Campylobacter jejuni or a second complementary domain derived from Campylobacter jejuni, the second complementary domain is 5′- AAGAAAUUUAAAAAGGGACUAAAA U-3 'or 5'- AAGAAAUUUAAAAAGGGACUAAAA U-3' may be a sequence having a part, at least 50% or more homology with the U-3 '(underlined sequences forming a double strand with the first complementary domain) ).
  • the second complementary domain may further comprise (X) n or / and (X) m , ie, 5 ′-(X) n AAGAAAUUUAAAAAGGGACUAAAA U (X) m ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, n may be an integer of 1 to 15, and m may be 1 to 6.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii ( Boyrivibrio proteoclasii ) , Tampere Greenwich bacterium tumefaciens (Peregrinibacteria bacterium (GW2011_GWA_33_10)), liquid Let Mino Caucus Supervisors (Acidaminococcus sp.
  • BV3L6 Fort fatigue Monastir marker caviar (Porphyromonas macacae), racheu furnace Fira seae tumefaciens (Lachnospiraceae bacterium (ND2006) ), Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the second complementary domain when the second complementary domain is a second complementary domain of a Falcobacteria bacterium or a second complementary domain derived from Falcubacteria bacterium, the second complementary domain is 5′-AAAUU UCUAC U-3 Or a base sequence having at least 50% homology with at least 50% homology with 5′-AAAUU UCUAC U-3 ′ (an underlined sequence forms a double strand with the first complementary domain).
  • the second complementary domain may further include (X) n or / and (X) m , that is, 5 ′-(X) n AAAUU UCUAC U (X) m ⁇ 3 ′.
  • the X may be selected from the group consisting of bases A, T, U and G, wherein n and m are the number of base sequences, n may be an integer of 1 to 10, and m may be 1 to 6 have.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • (X) m may be repeated as many as m integers of the same base sequence, or may be m integer sequences of base A, T, U and G mixed.
  • some or all of the base sequences of the second complementary domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the proximal domain is one to twenty nucleotide sequences located close to the second complementary domain and is located in the 3 'direction of the second complementary domain. In this case, the proximal domain may form a double-stranded bond between complementary nucleotide sequences in the proximal domain.
  • the proximal domain is 5 bases, 6 bases, 7 bases, 8 bases, 8 bases, 9 bases, 10 bases, 11 bases, 12 It can be a base sequence, 13 base sequences 14 base sequences or 15 base sequences.
  • the proximal domain is 5 nucleotide sequences, 6 nucleotide sequences, 7 nucleotide sequences, 8 nucleotide sequences, 8 nucleotide sequences, 9 nucleotide sequences, 10 nucleotide sequences, 11 nucleotide sequences, 12 It may include the base sequence, 13 base sequences 14 base sequences or 15 base sequences.
  • proximal domain may have homology with a naturally occurring proximal domain or may be derived from a naturally occurring proximal domain.
  • proximal domain may have a difference in the nucleotide sequence of the proximal domain according to the species present in nature, may be derived from the proximal domain including the species present in nature, or the proximal domain including the species present in nature It may have some or complete homology with.
  • the proximal domain is Streptococcus pyogenes , Campylobacter jejuni), Streptococcus thermo-pillar's (Streptococcus thermophilus), Streptococcus aureus (Streptocuccus aureus) or Nay Serie mening gidi teeth (proximal domain or derived from a proximal domain and some, at least 50% of Neisseria meningitides), or complete It may have homology.
  • the proximal domain when the proximal domain is a proximal domain of Streptococcus pyogenes or a proximal domain derived from Streptococcus pyogenes, the proximal domain may be 5'-AAGGCUAGUCCG-3 ', or 5'-AAGGCUAGUCCG-3 'And some, at least 50% homology may be a base sequence.
  • the proximal domain may further include (X) n , that is, 5′-AAGGCUAGUCCG (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences of the base A, T, U and G are mixed.
  • the proximal domain may be 5'-AAAGAGUUUGC-3 ', or 5'-AAAGAGUUUGC And a base sequence having at least 50% homology with -3 '.
  • the proximal domain may further include (X) n , that is, 5′-AAAGAGUUUGC (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U and G, and n may be an integer of 1 to 40 as the number of base sequences.
  • (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • some or all of the base sequences of the proximal domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the tail domain is a domain that can be optionally added to the 3 'end of a single stranded or double gRNA, the tail domain can be from 1 to 50 nucleotide sequences, or the tail domain can comprise from 1 to 50 nucleotide sequences. can do. In this case, the tail domain may form a double-stranded bond between complementary nucleotide sequences in the tail domain.
  • the tail domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the tail domain includes 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, 25 to 30 nucleotide sequences, It may include 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences.
  • the tail domain may have homology with a naturally occurring tail domain or may be derived from a naturally occurring tail domain.
  • the tail domain may have a difference in the nucleotide sequence of the tail domain according to the species present in nature, may be derived from the tail domain including the species present in nature, or the tail domain including the species present in nature It may have some or complete homology with.
  • the tail domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides , or at least 50% or more of the tail domain or derived tail domain It may have homology.
  • the tail domain may be 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ', or 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 'And some, at least 50% homology may be a base sequence.
  • the tail domain may further include (X) n , that is, 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the tail domain is a Campylobacter jejuni's tail domain or a Campylobacter jejuni derived tail domain
  • the tail domain can be 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ', or 5'-GGGACUCUGCGGGGUUACAAUCCCCUAUAACCG And a base sequence having at least 50% homology with -3 '.
  • the tail domain may further include (X) n , that is, 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU (X) n ⁇ 3 ′.
  • X may be selected from the group consisting of bases A, T, U, and G, and n may be an integer of 1 to 15 as the number of base sequences. In this case, (X) n may be repeated as many as n integers of the same base sequence, or may be an integer number of n base sequences in which bases A, T, U and G are mixed.
  • the tail domain may comprise 1 to 10 nucleotide sequences at the 3 ′ end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • part or all of the nucleotide sequence of the tail domain may comprise a chemical modification.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the gRNA may comprise a plurality of domains as described above, allowing the length of the nucleic acid sequence to be adjusted depending on the domain that the gRNA contains, with each domain within or stranding the three-dimensional behavior or active form of the gRNA Can interact with each other.
  • gRNAs include single-stranded gRNAs (single RNA molecules); Or double gRNA (comprising more than one typically two separate RNA molecules).
  • Double gRNAs consist of a first strand and a second strand.
  • the first strand may be referred to as crRNA
  • the second strand may be referred to as tracrRNA.
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide domain may include 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. Or 25 sequences, or may include the same.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary nucleotide sequence or a base sequence having complementarity capable of complementary binding to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85% At least 90% or 95% complementary or completely complementary sequences.
  • the guide sequence may be a nucleic acid sequence that is complementary to a target gene, ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • a target gene ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • the guide sequence may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the VEGFA gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the HIF1A gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPT2 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the EPAS1 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPTL4 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a target gene, that is, the target sequence of the angiogenesis-related factors, such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described above in Table 1, Table 2, Table 3, Table 4, and Table Although described in 5, it is not limited thereto.
  • the target sequence of the angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described above in Table 1, Table 2, Table 3, Table 4, and Table Although described in 5, it is not limited thereto.
  • the guide domain may comprise a guide sequence and an additional base sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may include one nucleotide sequence, two nucleotide sequences, three nucleotide sequences, four nucleotide sequences, five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, and 9 nucleotide sequences. It can be a base sequence or 10 base sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide domain, or may be located at the 5' end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide domain, or may be located at the 3' end of the guide sequence.
  • the first complementary domain comprises a complementary nucleic acid sequence with the second complementary domain of the second strand, and is a domain having a complementary enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the first complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, twelve nucleotide sequences, 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, It may be 23 base sequences, 24 base sequences, or 25 base sequences, or may include the same.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to the species present in nature, may be derived from the first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides of the first complementary domain or a derived first complementary domain 50% or more, or complete homology.
  • the first complementary domain may comprise additional sequences that do not complementarily bind to the second complementary domain of the second strand.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • some or all of the base sequences of the guide domain and / or the first complementary domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the first strand may be composed of 5 '-[guide domain]-[first complementary domain] -3' as described above.
  • first strand may optionally include additional nucleotide sequences.
  • the first strand As an example, the first strand
  • the N target is a base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid
  • the N target is a base sequence region that can be changed according to the target sequence on the target gene or nucleic acid.
  • the N target may be a nucleotide sequence capable of complementarily binding to a target gene, that is, a target sequence of angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene. .
  • (Q) m is a nucleotide sequence including the first complementary domain, and includes a base sequence capable of complementary binding to the second complementary domain of the second strand.
  • the (Q) m may be a sequence having a part or complete homology with the first complementary domain of a species present in nature, and the base sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, and m may be an integer of 5 to 35 as the number of base sequences.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 ', or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3'.
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 'or a base sequence having at least 50% homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'.
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 ', or may be a base sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3'.
  • (X) a , (X) b and (X) c is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G, A, b and c are the number of base sequences, and may be 0 or an integer of 1 to 20.
  • the second strand consists of a second complementary domain and a proximal domain and may optionally further comprise a tail domain.
  • the second complementary domain in the second strand comprises a complementary nucleic acid sequence with the first complementary domain of the first strand and is complementary enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the second complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 base sequences, 24 base sequences or 25 base sequences, or may include the same.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally derived second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides second complementary domain or derived second complementary domain 50% or more, or complete homology.
  • the second complementary domain may comprise additional sequences that do not complementarily bind to the first complementary domain of the first strand.
  • the additional base sequence may be 1 to 25 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, or 20 to 25 base sequences.
  • the proximal domain in the second strand is 1-20 nucleotide sequences, which is located in the 3 'direction of the second complementary domain.
  • the proximal domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, and twelve nucleotide sequences. It may be a nucleotide sequence, 13 base sequences, 14 base sequences or 15 base sequences, or may include the same.
  • the proximal domain may form a double-stranded bond between complementary nucleotide sequences in the proximal domain.
  • proximal domain may have homology with a naturally occurring proximal domain or may be derived from a naturally occurring proximal domain.
  • proximal domain may have a difference in the nucleotide sequence of the proximal domain according to the species present in nature, may be derived from the proximal domain including the species present in nature, or the proximal domain including the species present in nature It may have some or complete homology with.
  • the proximal domain is Streptococcus pyogenes , Campylobacter jejuni), Streptococcus thermo-pillar's (Streptococcus thermophilus), Streptococcus aureus (Streptocuccus aureus) or Nay Serie mening gidi teeth (proximal domain or derived from a proximal domain and some, at least 50% of Neisseria meningitides), or complete It may have homology.
  • the tail domain in the second strand is a domain that can be selectively added to the 3 'end of the second strand
  • the tail domain can be 1 to 50 nucleotide sequences, or 1 to 50 nucleotide sequences It may include.
  • the tail domain may include 1 to 5 base sequences, 5 to 10 base sequences, 10 to 15 base sequences, 15 to 20 base sequences, 20 to 25 base sequences, 25 to 30 base sequences, It may be 30 to 35 base sequences, 35 to 40 base sequences, 40 to 45 base sequences or 45 to 50 base sequences, or may include the same.
  • the tail domain may form a double-stranded bond between complementary nucleotide sequences in the tail domain.
  • the tail domain may have homology with a naturally occurring tail domain or may be derived from a naturally occurring tail domain.
  • the tail domain may have a difference in the nucleotide sequence of the tail domain according to the species present in nature, may be derived from the tail domain including the species present in nature, or the tail domain including the species present in nature It may have some or complete homology with.
  • the tail domain is Streptococcus pyogenes , Campylobacter jejuni ), Streptococcus thermophilus , Streptocuccus aureus or Neisseria meningitides , or at least 50% or more of the tail domain or derived tail domain It may have homology.
  • the tail domain may comprise 1 to 10 nucleotide sequences at the 3 ′ end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 ′ end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • some or all of the base sequences of the second complementary domain, proximal domain, and / or tail domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the second strand may be 5 '-[second complementary domain]-[proximal domain] -3' or 5 '-[second complementary domain]-[proximal domain]-[tail domain]-as described above. 3 '.
  • the second strand may optionally include additional nucleotide sequences.
  • the second strand is
  • the second strand is
  • (Z) h is a nucleotide sequence including the second complementary domain, and includes a base sequence capable of complementary binding to the first complementary domain of the first strand.
  • the (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the base sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of base sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 ', or may be a base sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3'.
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'.
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3'.
  • (P) k is a nucleotide sequence including the proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species existing in nature, and the base sequence of the proximal domain is changed according to the derived species. Can be.
  • the P may be independently selected from the group consisting of A, U, C and G, and k may be an integer of 1 to 20 as the number of base sequences.
  • (P) k is 5'-AAGGCUAGUCCG-3 ' Or a base sequence having at least 50% homology with 5′-AAGGCUAGUCCG-3 ′.
  • (P) k may be 5′-AAAGAGUUUGC-3 ′. Or a base sequence having at least 50% homology with 5′-AAAGAGUUUGC-3 ′.
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′
  • a base sequence having at least 50% homology with 5′-AAGGCUUAGUCCG-3 ′ is 5′-AAGGCUUAGUCCG-3 ′.
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species existing in nature, and the nucleotide sequence of the tail domain is changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, and i may be an integer of 1 to 50 as the number of base sequences.
  • (F) i is 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ' Or a base sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′.
  • (F) i is 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ when the tail domain has part or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain Or a base sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′.
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '
  • (F) i may include 1 to 10 base sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • (X) d , (X) e and (X) f is a nucleotide sequence that can be optionally added, X may be independently selected from the group consisting of A, U, C and G, The d, e and f is the number of base sequences, it may be an integer of 0 or 1 to 20.
  • Single-stranded gRNAs can be divided into two types.
  • first and second strands of the double gRNA there is a single-stranded gRNA connecting the first and second strands of the double gRNA with a linking domain, wherein the single-stranded gRNA is 5 '-[first strand]-[linking domain]-[second strand ] -3 '.
  • the single stranded gRNA is
  • Each domain except the linking domain is identical to the description for each domain of the first and second strands of the double gRNA.
  • the linking domain is a domain connecting the first strand and the second strand, specifically, a nucleic acid sequence capable of connecting the first and second complementary domains to generate a single-stranded gRNA. to be.
  • the linking domain may be covalently or non-covalently coupled to the first complementary domain and the second complementary domain, or may be covalently or non-covalently linked to the first complementary domain and the second complementary domain.
  • the linking domain may be 1 to 30 nucleotide sequences, or may include 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. It may be, or may include it.
  • the linking domain is suitable for use in single-stranded gRNA molecules and can be covalently or non-covalently linked to the first and second strands of a double gRNA, or covalently or non-covalently linked to the first and second strands.
  • Single stranded gRNAs can be used to generate.
  • the linking domain may be used to generate single-stranded gRNAs either covalently or non-covalently with the crRNA and tracrRNA of the double gRNA, or by covalently or non-covalently linking the crRNA and tracrRNA.
  • the linking domain may be homologous to or derived from a naturally occurring sequence, such as some sequences of tracrRNA.
  • some or all of the base sequences of the linking domains may include chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • single-stranded gRNAs are 5 '-[guide domain]-[first complementary domain]-[linking domain]-[second complementary domain]-[proximal domain] -3' as described above. Or 5 '-[guide domain]-[first complementary domain]-[connection domain]-[second complementary domain]-[proximal domain]-[tail domain] -3'. have.
  • the single-stranded gRNA may optionally include additional nucleotide sequences.
  • the single stranded gRNA is
  • the single-stranded gRNA is
  • the N target is a base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid
  • the N target is a base sequence region that can be changed according to the target sequence on the target gene or nucleic acid.
  • the N target may be a nucleotide sequence capable of complementarily binding to a target gene, that is, a target sequence of angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene. .
  • (Q) m is a nucleotide sequence including the first complementary domain, and includes a base sequence capable of complementary binding to the second complementary domain.
  • the (Q) m may be a sequence having a part or complete homology with the first complementary domain of a species present in nature, and the base sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, and m may be an integer of 5 to 35 as the number of base sequences.
  • (Q) m May be 5'-GUUUUAGAGCUA-3 ', or may be a nucleotide sequence having at least 50% homology with 5'-GUUUUAGAGCUA-3'.
  • (Q) m is 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3 'or a base sequence having at least 50% homology with 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'.
  • (Q) m May be 5'-GUUUUAGAGCUGUGUUGUUUCG-3 ', or may be a base sequence having at least 50% homology with 5'-GUUUUAGAGCUGUGUUGUUUCG-3'.
  • (L) j is a nucleotide sequence including a linking domain, which is a base sequence that can be produced by connecting the first complementary domain and the second complementary domain to generate a single stranded gRNA.
  • L may be independently selected from the group consisting of A, U, C and G, wherein j is the number of base sequences, it may be an integer of 1 to 30.
  • (Z) h is a nucleotide sequence including a second complementary domain, and includes a base sequence capable of complementary binding to the first complementary domain.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the base sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of base sequences.
  • (Z) h May be 5'-UAGCAAGUUAAAAU-3 ', or may be a base sequence having at least 50% homology with 5'-UAGCAAGUUAAAAU-3'.
  • (Z) h is 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'.
  • (Z) h May be 5'-CGAAACAACACAGCGAGUUAAAAU-3 'or may be a base sequence having at least 50% homology with 5'-CGAAACAACACAGCGAGUUAAAAU-3'.
  • (P) k is a nucleotide sequence including the proximal domain, and may be a sequence having partial or complete homology with the proximal domain of a species existing in nature, and the base sequence of the proximal domain is changed according to the derived species. Can be.
  • the P may be independently selected from the group consisting of A, U, C and G, and k may be an integer of 1 to 20 as the number of base sequences.
  • (P) k is 5'-AAGGCUAGUCCG-3 ' Or a base sequence having at least 50% homology with 5′-AAGGCUAGUCCG-3 ′.
  • (P) k may be 5′-AAAGAGUUUGC-3 ′. Or a base sequence having at least 50% homology with 5′-AAAGAGUUUGC-3 ′.
  • (P) k is 5′-AAGGCUUAGUCCG-3 ′
  • a base sequence having at least 50% homology with 5′-AAGGCUUAGUCCG-3 ′ is 5′-AAGGCUUAGUCCG-3 ′.
  • (F) i is a nucleotide sequence including a tail domain, and may be a sequence having partial or complete homology with a tail domain of a species existing in nature, and the nucleotide sequence of the tail domain is changed according to the derived species.
  • F may be independently selected from the group consisting of A, U, C, and G, and i may be an integer of 1 to 50 as the number of base sequences.
  • (F) i is 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ' Or a base sequence having at least 50% homology with 5′-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3 ′.
  • (F) i is 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′ when the tail domain has part or complete homology with the tail domain of Campylobacter jejuni or the Campylobacter jejuni derived tail domain Or a base sequence having at least 50% homology with 5′-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3 ′.
  • tail domain has partial or complete homology with the tail domain of Streptococcus thermophilus or the Streptococcus thermophilus derived tail domain
  • (F) i is 5′-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3 '
  • (F) i may include 1 to 10 base sequences at the 3 'end associated with in vitro or in vivo transcription methods.
  • the tail domain can be any nucleotide sequence present at the 3 'end of the DNA template.
  • the tail domain may be UUUUUU
  • the tail domain may be UUUU
  • the pol-III promoter may comprise several uracil bases or alternative bases.
  • the (X) a , (X) b , (X) c , (X) d , (X) e and (X) f is a nucleotide sequence that can be optionally added, wherein X is A, U, It may be selected independently from the group consisting of C and G, wherein a, b, c, d, e and f is the number of base sequences, it may be an integer of 0 or 1 to 20.
  • the single stranded gRNA may then be a single stranded gRNA consisting of a guide domain, a first complementary domain and a second complementary domain,
  • the single-stranded gRNA is
  • the guide domain comprises a complementary guide sequence capable of complementary binding to the target sequence on the target gene or nucleic acid.
  • the guide sequence is a nucleic acid sequence that is complementary to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or completely complementary nucleic acid sequence. Can be.
  • the guide domain is believed to play a role in specific interactions with the target gene or nucleic acid of the gRNA-Cas complex, ie the CRISPR complex.
  • the guide domain may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide domain may include 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 nucleotide sequences. Or 25 sequences, or may include the same.
  • the guide domain may comprise a guide sequence.
  • the guide sequence may be a complementary nucleotide sequence or a base sequence having complementarity capable of complementary binding to the target sequence on the target gene or nucleic acid, for example at least 70%, 75%, 80%, 85% At least 90% or 95% complementary or completely complementary sequences.
  • the guide sequence may be a nucleic acid sequence that is complementary to a target gene, ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • a target gene ie, a target sequence of an angiogenesis-related factor, VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, for example at least At least 70%, 75%, 80%, 85%, 90% or 95% of the complementary or completely complementary nucleic acid sequences.
  • the guide sequence may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the VEGFA gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the HIF1A gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPT2 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the EPAS1 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a nucleic acid sequence complementary to the target sequence of the ANGPTL4 gene, may be 5 to 50 base sequences, or may include 5 to 50 base sequences.
  • the guide sequence is 16 bases, 17 bases, 18 bases, 19 bases, 20 bases, 21 bases, 22 bases, 23 bases, 24 bases It may be a base sequence or 25 base sequences, or may include the same.
  • the guide sequence is a target gene, that is, the target sequence of the angiogenesis-related factors, such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described in Table 1, Table 2, Table 3, Table 4, Although described in 5, it is not limited thereto.
  • the target sequence of the angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene, respectively, as described in Table 1, Table 2, Table 3, Table 4, Although described in 5, it is not limited thereto.
  • the guide domain may comprise a guide sequence and an additional base sequence.
  • the additional base sequence may be 1 to 35 base sequences.
  • the additional base sequence may include one nucleotide sequence, two nucleotide sequences, three nucleotide sequences, four nucleotide sequences, five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, and 9 nucleotide sequences. It can be a base sequence or 10 base sequences.
  • the additional base sequence may be one base sequence G (guanine), or may be two base sequences GG.
  • the additional base sequence may be located at the 5 'end of the guide domain, or may be located at the 5' end of the guide sequence.
  • the additional base sequence may be located at the 3 'end of the guide domain, or may be located at the 3' end of the guide sequence.
  • the first complementary domain includes a second complementary domain and a complementary nucleic acid sequence, and has a complementarity enough to form a double strand with the second complementary domain.
  • the first complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the first complementary domain includes five nucleotide sequences, six nucleotide sequences, seven nucleotide sequences, eight nucleotide sequences, nine nucleotide sequences, ten nucleotide sequences, eleven nucleotide sequences, twelve nucleotide sequences, 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, It may be 23 base sequences, 24 base sequences, or 25 base sequences, or may include the same.
  • the first complementary domain may have homology with a naturally occurring first complementary domain or may be derived from a naturally occurring first complementary domain.
  • the first complementary domain may have a difference in the nucleotide sequence of the first complementary domain according to the species present in nature, may be derived from the first complementary domain including a species present in nature, or It may have some or complete homology with the first complementary domain comprising the species present in nature.
  • the first complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii , Butyrivibrio proteoclasii Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp . (BV3L6), Porphyromonas macacae , Laznopyraceae bacterium bac , Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the first complementary domain may comprise additional sequences that do not complementarily bind to the second complementary domain.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • the second complementary domain comprises a complementary nucleic acid sequence with the first complementary domain of the first strand and has a complementarity enough to form a double strand with the first complementary domain.
  • the second complementary domain includes a complementary base sequence with the first complementary domain and a base sequence without complementarity with the first complementary domain, eg, a base sequence that does not form a double strand with the first complementary domain.
  • the base sequence may be longer than the first complementary domain.
  • the second complementary domain may be 5 to 35 nucleotide sequences, or may include 5 to 35 nucleotide sequences.
  • the second complementary domain includes 5 base sequences, 6 base sequences, 7 base sequences, 8 base sequences, 9 base sequences, 10 base sequences, 11 base sequences, and 12 base sequences.
  • nucleotide sequences 13 nucleotide sequences, 14 nucleotide sequences, 15 nucleotide sequences, 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences , 23 base sequences, 24 base sequences or 25 base sequences, or may include the same.
  • the second complementary domain may have homology with a naturally occurring second complementary domain or may be derived from a naturally derived second complementary domain.
  • the second complementary domain may have a difference in the nucleotide sequence of the second complementary domain according to a species present in nature, may be derived from a second complementary domain including a species present in nature, or It may have some or complete homology with the second complementary domain, including species present in nature.
  • the second complementary domain is Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasii , Butyrivibrio proteoclasii .
  • Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp . (BV3L6), Porphyromonas macacae , Laznopyraceae bacterium bac , Porphyromonas crevioricanis ), Prevotella disiens , Moraxella bovoculi (237)), Smiihella sp .
  • the second complementary domain may comprise additional sequences that do not complementarily bind to the first complementary domain.
  • the additional base sequence may be 1 to 15 base sequences.
  • the additional base sequence may be 1 to 5 base sequences, 5 to 10 base sequences, or 10 to 15 base sequences.
  • the linking domain is a nucleic acid sequence that allows the first and second complementary domains to be joined to produce a single stranded gRNA.
  • the linking domain may be covalently or non-covalently coupled to the first complementary domain and the second complementary domain, or may be covalently or non-covalently linked to the first complementary domain and the second complementary domain.
  • the linking domain may be 1 to 30 nucleotide sequences, or may include 1 to 30 nucleotide sequences.
  • the linking domain may be 1 to 5 nucleotide sequences, 5 to 10 nucleotide sequences, 10 to 15 nucleotide sequences, 15 to 20 nucleotide sequences, 20 to 25 nucleotide sequences, or 25 to 30 nucleotide sequences. It may be, or may include it.
  • some or all of the base sequences of the guide domain, the first complementary domain, the second complementary domain, and the linking domain may comprise chemical modifications.
  • the chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP). It is not limited.
  • the single-stranded gRNA is 5 '-[second complementary domain]-[first complementary domain]-[guide domain] -3' or 5 '-[second complementary domain]-[ Linking domain]-[first complementary domain]-[guide domain] -3 '.
  • the single-stranded gRNA may optionally include additional nucleotide sequences.
  • the single stranded gRNA is
  • the single-stranded gRNA is
  • the N target is a base sequence capable of complementary binding to the target sequence on the target gene or nucleic acid
  • the N target is a base sequence region that can be changed according to the target sequence on the target gene or nucleic acid.
  • the N target may be a nucleotide sequence capable of complementarily binding to a target gene, that is, a target sequence of angiogenesis-related factors such as VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, or ANGPTL4 gene. .
  • (Q) m is a nucleotide sequence including the first complementary domain, and includes a base sequence capable of complementary binding to the second complementary domain.
  • (Q) m may be a sequence having partial or complete homology with the first complementary domain of a species present in nature, and the base sequence of the first complementary domain may be changed according to the derived species.
  • Q may be independently selected from the group consisting of A, U, C, and G, and m may be an integer of 5 to 35 as the number of base sequences.
  • (Q) m is 5 It may be '-UUUGUAGAU-3', or may be a base sequence having at least 50% homology with 5'-UUUGUAGAU-3 '.
  • (Z) h is a nucleotide sequence including a second complementary domain, and includes a base sequence capable of complementary binding to the first complementary domain.
  • (Z) h may be a sequence having partial or complete homology with a second complementary domain of a species present in nature, and the base sequence of the second complementary domain may be changed according to the derived species.
  • Z may be independently selected from the group consisting of A, U, C, and G, and h may be an integer of 5 to 50 as the number of base sequences.
  • (Z) h is 5 It may be '-AAAUUUCUACU-3', or may be a base sequence having at least 50% homology with 5'-AAAUUUCUACU-3 '.
  • (L) j is a nucleotide sequence including a linking domain, and is a nucleotide sequence connecting the first complementary domain and the second complementary domain.
  • L may be independently selected from the group consisting of A, U, C and G, wherein j is the number of base sequences, it may be an integer of 1 to 30.
  • (X) a , (X) b and (X) c is a nucleotide sequence that can be optionally added, wherein X may be independently selected from the group consisting of A, U, C and G, A, b, and c are the number of base sequences, and may be 0 or an integer of 1 to 20.
  • Editor protein refers to a peptide, polypeptide or protein that binds directly to a nucleic acid or may not interact with it directly.
  • the nucleic acid may be a nucleic acid included in a target nucleic acid, gene or chromosome.
  • the nucleic acid may be a guide nucleic acid.
  • the editor protein may be an enzyme.
  • the editor protein may be a fusion protein.
  • the fusion protein refers to a protein produced by fusing an enzyme and an additional domain, peptide, polypeptide or protein.
  • the enzyme refers to a protein comprising a domain capable of cleaving a nucleic acid, gene, chromosome or protein.
  • the enzyme may be a nuclease, protease or restriction enzyme.
  • the additional domain, peptide, polypeptide or protein may be a functional domain, peptide, polypeptide or protein having the same or different function as the enzyme.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or may comprise additional domains, peptides, polypeptides or proteins in one or more of these combinations.
  • the fusion protein is at or near the amino terminus of the enzyme; At or near the carboxy terminus; Middle part of an enzyme; Or one or more of these combinations may comprise a functional domain, peptide, polypeptide or protein.
  • the functional domain, peptide, polypeptide or protein may be methylase activity, dimethylase activity, transcription activation activity, transcription repression activity, transcription release factor.
  • the functional domain, peptide, polypeptide or protein may be a deminase.
  • the tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag, a thioredoxin (Trx) tag, and the like, and the reporter gene is glutathione.
  • His histidine
  • HA influenza hemagglutinin
  • Trx thioredoxin
  • GST horseradish peroxidase
  • HRP horseradish peroxidase
  • CAT chloramphenicol acetyltransferase
  • GFP green fluorescent protein
  • HcRed HcRed
  • DsRed cyan fluorescent protein
  • BFP blue fluorescent protein
  • the functional domain, peptide, polypeptide or protein may be a NLS (nuclear localization sequence or signal) or NES (nuclear export sequence or signal).
  • NLS is NLS of SV40 virus large T-antigen with amino acid sequence PKKKRKV; NLS from nucleoplasmin (eg, nucleoplasmin bipartite NLS having the sequence KRPAATKKAGQAKKKK); C-myc NLS having the amino acid sequence PAAKRVKLD or RQRRNELKRSP; HRNPA1 M9 NLS having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; The sequence RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV of the IBB domain from importin-alpha; The sequences VSRKRPRP and PPKKARED of the myoma T protein; The sequence POPKKKPL of human p53; The sequence SALIKKKKKMAP of mouse c-abl IV; The sequences DRLRR and PKQKKRK of the influenza virus NS1; The sequence RKLKKKIKKL of the hepatitis virus delta anti
  • the editor protein may comprise a fully active enzyme.
  • the "fully active enzyme” means an enzyme having the same function as the function of the wild type (wild type) enzyme, for example, the wild type enzyme to cut the double strand of DNA is to cut all the DNA double strand Have complete enzymatic activity.
  • the fully active enzyme includes an enzyme having an enhanced function than that of the wild type enzyme, for example, a specific modified or engineered form of the wild type enzyme that cleaves double strands of DNA is more complete than the wild type enzyme.
  • Has enzymatic activity ie the activity of cleaving DNA double strands.
  • the editor protein may comprise an incomplete or partially active enzyme.
  • the "incomplete or partially active enzyme” means an enzyme having only a part of the function of the wild-type enzyme, for example, a specific modified or engineered form of the wild-type enzyme that cuts the double strand of DNA is DNA double strand Have an incomplete or partial enzymatic activity that cleaves only some, ie, single strands.
  • the editor protein may comprise an inactive enzyme.
  • the "inert enzyme” refers to an enzyme in which all the functions of the wild type enzyme are inactivated.
  • a specific modified or engineered form of the wild type enzyme that cuts the double strand of DNA cuts all the DNA double strands. Inert to prevent
  • the editor protein may be an enzyme or a fusion protein present in nature.
  • the editor protein may be in a form in which a part of an enzyme or a fusion protein existing in a natural state is modified.
  • the editor protein may be an artificially generated enzyme or fusion protein that does not exist in nature.
  • the editor protein may be a modified form of a part of an artificially generated enzyme or fusion protein that does not exist in a natural state.
  • the modification may be substitution, removal, addition, or a mixture of amino acids included in the editor protein.
  • the modification may be substitution, removal, addition, or a mixture of some bases in the base sequence encoding the editor protein.
  • the CRISPR enzyme is described below.
  • CRISPR enzyme is a major protein component of the CRISPR-Cas system, complexed with gRNA to form the CRISPR-Cas system.
  • the CRISPR enzyme is a nucleic acid or polypeptide (or protein) having a sequence encoding the CRISPR enzyme, and typically a Type II CRISPR enzyme or a Type V CRISPR enzyme is used.
  • the Type II CRISPR enzyme includes Cas9, and Cas9 is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Staphylococcus aureus , Nocardiopsis rougevillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptomyces viridochromogenes, Streptomyces viridochromogenes , Streptosporangium roseum, Streptosporangium roseum, AlicyclobacHlus acidocaldarius, Bacillus pseudomycoideles, Bacillus pseudomycoideles Bacillus selenitireducens, Exiguobacterium Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiares bacterium, Paulaholderas napolea naphthal
  • Cas9 is an enzyme that binds to a gRNA and cleaves or modifies a target sequence or position on a target gene or nucleic acid, which is non-complementary with an HNH domain, gRNA, capable of cleaving a nucleic acid strand to which the gRNA has a complementary binding. It may be composed of a RuvC domain capable of cleaving the binding nucleic acid strand, a target, that is, a REC domain that recognizes the target and a PI domain that recognizes the PAM. Specific structural characteristics of Cas9 are described in Hiroshi Nishimasu et al. (2014) Cell 156: 935-949.
  • Type V CRISPR enzymes include Cpf1, and Cpf1 is Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corbacterium, Carbacterium, Coryneter, P.
  • Clostridium Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutact Bacilus, M.C.
  • the Cpf1 has a similar RuvC domain corresponding to the RuvC domain of Cas9, and lacks the HNH domain of Cas9, and instead includes a Nuc domain, which is a REC domain that recognizes a target, a WED domain, and a PI domain that recognizes PAM. Can be configured. Specific structural properties of Cpf1 are described in Takashi Yamano et al. (2016) Cell 165: 949-962.
  • the CRISPR enzyme such as Cas9 or Cpf1 protein may be isolated from a microorganism existing in nature or may be produced unnaturally by a recombinant method or a synthetic method.
  • Type II CRISPR enzymes The crystal structure of Type II CRISPR enzymes was studied for two or more naturally-occurring microbial Type II CRISPR enzyme molecules (Jinek et al., Science, 343 (6176): 1247997, 2014) and Streptococcus pyogen complexed with gRNA.
  • Nes Cas9 SpCas9
  • SpCas9 Nes Cas9 (SpCas9) (Nishimasu et al., Cell, 156: 935-949, 2014; and Anders et al., Nature, 2014, doi: 10.1038 / nature13579).
  • Type II CRISPR enzymes comprise two lobes, namely recognition (REC) and nuclease (NUC) lobes, each lobe comprising several domains.
  • the REC lobe comprises an arginine-rich bridge helix (BH), a REC1 domain and a REC2 domain.
  • BH arginine-rich bridge helix
  • the BH domain is then a long ⁇ -helix and arginine rich region, and the REC1 and REC2 domains play an important role in the recognition of the double strands formed within the gRNA, eg, single stranded gRNA, double gRNA or tracrRNA.
  • the NUC lobe comprises a RuvC domain, an HNH domain and a PAM-interaction (PI) domain.
  • the RuvC domain is used to encompass the RuvC-like domain
  • the HNH domain is used to encompass the HNH-like domain.
  • the RuvC domain shares structural similarity with respect to the members of the microorganism existing in the natural state including the Type II CRISPR enzyme, and complements with a single strand, for example, a non-complementary strand of a target gene or nucleic acid, that is, gRNA. Cut strands that do not bond normally.
  • the RuvC domain is often referred to in the art as the RuvCI domain, RuvCII domain and RuvCIII domain, commonly referred to as RuvC I, RuvCII and RuvCIII.
  • the RuvC domain is assembled from three split RuvC domains (RuvC I, RuvCII and RuvCIII) located at amino acid sequences 1-59, 718-769 and 909-1098 of SpCas9, respectively.
  • the HNH domain shares structural similarity with the HNH endonuclease and cleaves a single strand, eg, the complementary strand of the target nucleic acid molecule, ie, the strand that complements the gRNA.
  • the HNH domain is located between the RuvC II and III motifs. For example, for SpCas9, the HNH domain is located at amino acid sequences 775-908 of SpCas9.
  • the PI domain recognizes or interacts with a specific nucleotide sequence within a target gene or nucleic acid, ie, Protospacer adjacent motif (PAM).
  • PAM Protospacer adjacent motif
  • the PI domain is located at amino acid sequences 1099 to 1368 of SpCas9.
  • the PAM may vary depending on the origin of the Type II CRISPR enzyme.
  • the CRISPR enzyme is SpCas9
  • the PAM may be 5'-NGG-3 '
  • the Streptococcus thermophilus Cas9 StCas9
  • PAM may be 5'-NNNNGATT-3 'for Neisseria meningititis Cas9 (NmCas9)
  • Type V CRISPR enzymes have a similar RuvC domain that corresponds to the RuvC domain of Type II CRISPR enzymes, which lacks the HNH domain of Type II CRISPR enzymes and instead includes a Nuc domain, a REC domain and a WED domain that recognize the target. And a PI domain that recognizes PAM.
  • the structural characteristics of specific Type V CRISPR enzymes are described in Takashi Yamano et al. (2016) Cell 165: 949-962.
  • Type V CRISPR enzymes can interact with gRNAs, form gRNA-CRISPR enzyme complexes, ie, CRISPR complexes, and cooperate with gRNAs to bring the guide sequence to the target sequence, including the PAM sequence.
  • the ability of the Type V CRISPR enzyme to interact with a target gene or nucleic acid is dependent on the PAM sequence.
  • the PAM sequence is a sequence present in a target gene or nucleic acid, and may be recognized by the PI domain of a Type V CRISPR enzyme.
  • the PAM sequence may have a different sequence depending on the origin of the Type V CRISPR enzyme. That is, there is a PAM sequence that can be specifically recognized for each species.
  • the PAM sequence recognized by Cpf1 may be 5'-TTN-3 '(N is A, T, C or G).
  • CRISPR enzymes cleave double or single strands of target genes or nucleic acids and have nuclease activity resulting in breakage or deletion of double or single strands.
  • Wild type II CRISPR enzymes or Type V CRISPR enzymes generally cleave the double strand of the target gene or nucleic acid.
  • the CRISPR enzyme may be engineered or modified, and such engineered or modified CRISPR enzyme may be modified with incomplete or partially active enzymes or inactive enzymes.
  • “Nickase” refers to a CRISPR enzyme engineered or modified to cleave only one of the double strands of a target gene or nucleic acid, said nickase being inconsistent with a single strand, eg, a gRNA of a target gene or nucleic acid.
  • a single strand eg, a gRNA of a target gene or nucleic acid.
  • the kinase may have nuclease activity by the RuvC domain. That is, the kinase may not include nuclease activity by the HNH domain, for which the HNH domain may be engineered or altered.
  • the CRISPR enzyme is a Type II CRISPR enzyme
  • the nuclease activity of the HNH domain is inactivated, so that it can be used as a kinase, and the generated kinase is RuvC. Having nuclease activity by the domain, it is possible to cleave non-complementary strands of the target gene or nucleic acid, ie, strands which do not complementaryly bind with the gRNA.
  • the nuclease activity of the HNH domain is inactivated, so that it may be used as a kinase. Having nuclease activity by the RuvC domain, it is possible to cleave non-complementary strands of the target gene or nucleic acid, ie, strands which do not complementaryly bind with the gRNA.
  • the kinase may have nuclease activity by the HNH domain. That is, the kinase may not include nuclease activity by the RuvC domain, for which the RuvC domain may be engineered or altered.
  • the CRISPR enzyme is a Type II CRISPR enzyme
  • the nuclease activity of the RuvC domain is inactivated, so that it can be used as a kinase, and the generated kinase Having nuclease activity by the HNH domain, one can cleave the complementary strand of the target gene or nucleic acid, ie, the strand complementary to the gRNA.
  • the nuclease activity of the RuvC domain is inactivated, so that it may be used as a kinase.
  • Has nuclease activity by the HNH domain and thus can cleave the complementary strand of the target gene or nucleic acid, ie, the strand complementary to the gRNA.
  • a CRISPR enzyme whose enzyme activity is completely inactivated by modifying the CRISPR enzyme is called an inactive CRISPR enzyme.
  • Inactive CRISPR enzyme refers to a CRISPR enzyme that is modified such that it is unable to cleave both double strands of a target gene or nucleic acid, wherein the inactive CRISPR enzyme is a nuclease due to a mutation in a domain having nuclease activity of a wild type CRISPR enzyme. Inert The inactive CRISPR enzyme may be one that is inactivated nuclease activity by the RuvC domain and the HNH domain.
  • the inactive CRISPR enzyme can engineer or alter the RuvC domain and the HNH domain to inactivate nuclease activity.
  • the CRISPR enzyme is a Type II CRISPR enzyme
  • the mutation of both the aspartic acid and the 840 histidine amino acid sequence of SpCas9 to alanine inactivates nuclease activity by the RuvC domain and the HNH domain, thereby causing a target gene or nucleic acid. It is not possible to cut all the double strands of.
  • nuclease activity by the RuvC domain and HNH domain is inactivated, and thus the target gene or Not all double strands of nucleic acid can be cut.
  • the CRISPR enzyme may have the ability to solve the endonuclease activity, exonuclease activity or helicase activity, ie the helix structure of the double stranded nucleic acid.
  • the CRISPR enzyme may modify the CRISPR enzyme such that the endonuclease activity, exonuclease activity, or helicase activity of the CRISPR enzyme is fully active, incomplete or partially active, or inactive.
  • the CRISPR enzyme may interact with the gRNA, form a gRNA-CRISPR enzyme complex, ie, a CRISPR complex, and cooperate with the gRNA to bring the guide sequence to the target sequence, including the PAM sequence.
  • a gRNA-CRISPR enzyme complex ie, a CRISPR complex
  • the ability of the CRISPR enzyme to interact with the target gene or nucleic acid is dependent on the PAM sequence.
  • the PAM sequence is a sequence present in a target gene or nucleic acid, and may be recognized by the PI domain of the CRISPR enzyme.
  • the PAM sequence may be different depending on the origin of the CRISPR enzyme. That is, there is a PAM sequence that can be specifically recognized for each species.
  • the CRISPR enzyme is a Type II CRISPR enzyme
  • the PAM sequence may be 5'-NGG-3 ', 5'-NAG-3' or / and 5'-NGA-3 ',
  • the PAM sequence may be 5'-NNNNGATT-3 'or / and 5'-NNNGCTT-3',
  • the CRISPR enzyme is a Type V CRISPR enzyme
  • the PAM sequence may be 5'-TTN-3 '.
  • N is A, T, G or C; Or A, U, G or C.
  • CRISPR enzymes that can recognize specific PAM sequences can be manipulated or modified.
  • a SpCas9 having a nuclease activity of SpCas9 and a PI domain of SpCas9 can be replaced with a PI domain of CjCas9 to recognize a CjCas9 specific PAM sequence, thereby recognizing SpCas9 which recognizes a CjCas9 specific PAM sequence.
  • Can be generated. Substitution or replacement of these PI domains can alter the design of specifically recognized PAM sequences.
  • the CRISPR enzyme may be mutated to enhance or inhibit various properties, such as nuclease activity, helicase activity, ability to interact with gRNAs, and proximity to target genes or nucleic acids, such as PAM recognition ability. Can be.
  • the CRISPR enzyme variant forms a gRNA-CRISPR enzyme complex through interaction with the gRNA, that is, a nontarget gene or nucleic acid that forms some complementary binding to the gRNA when the CRISPR complex is formed to approximate or localize to the target gene or nucleic acid.
  • modified or engineered CRISPR enzymes that enhance target specificity such that only the double or single strand of the target gene or nucleic acid is cleaved without cleaving the double or single strand of the nontarget gene or nucleic acid that does not have complementary binding. Can be.
  • the effect of cleaving the non-target gene or nucleic acid which is partially complementary to the gRNA and the non-target gene or nucleic acid which is not complementary to the gRNA is called an off-target effect.
  • the position or nucleotide sequence of the non-target gene or nucleic acid which is partially complementary to the gRNA and the non-target gene or nucleic acid which is not complementary to the gRNA is referred to as an off-target, wherein the number of off-targets is one It may be abnormal.
  • the location or target sequence of the target gene or nucleic acid is referred to as an on-target.
  • CRISPR enzyme variants are modifications of at least one or more amino acids of naturally occurring CRISPR enzymes, such as nuclease activity, helicase activity, ability to interact with gRNAs, proximity to target genes or nucleic acids as compared to unmodified CRISPR enzymes, and One or more properties of the target specificity can be modified, eg enhanced or inhibited.
  • the modification may be an amino acid substitution, removal, addition or a mixture thereof.
  • the modification may be a modification of one or more amino acids located in a region composed of positively charged amino acids present in a naturally occurring CRISPR enzyme.
  • the modification may be performed by one or two or more amino acids having positively charged amino acids present in naturally occurring CRISPR enzymes, such as lysine (K), arginine (R) and histidine (H). It may be a variant.
  • the modification may be a modification of one or more amino acids located in a region composed of non-positive amino acids present in naturally occurring CRISPR enzymes.
  • the modification may be a non-positive amino acid present in naturally occurring CRISPR enzymes, namely, aspartic aicd (D), glutamic acid (E), serine (S), threonine ( Threonine (T), Asparagine (N), Glutamine (Q), Cysteine (C), Proline (P), Glysin (G), Alanine (A), Valine (Valine) , V), one or more of isoleucine (I), leucine (L), methionine (M), phenylalanine (F), tyrosine (Y) and tryptophan (W) It may be a modification of an amino acid.
  • the modification is a non-charged amino acid present in naturally occurring CRISPR enzymes, namely serine (S), threonine (T), asparagine (N), and glutamine (Q).
  • the modification may also be a modification of one or more amino acids of amino acids having hydrophobic residues present in naturally occurring CRISPR enzymes.
  • the modification may include glycine (G), alanine (A), valine (V), isoleucine (I), leucine (Lucine, L) present in naturally occurring CRISPR enzymes. It may be a modification of one or more amino acids of Methionine (M), Phenylalanine (F), Tyrosine (Y) and Tryptophan (W).
  • the modification may be a modification of one or more amino acids of amino acids having polar residues present in naturally occurring CRISPR enzymes.
  • the modification may include serine (S), threonine (T), asparagine (N), glutamine (Q), cysteine (C), which are present in naturally occurring CRISPR enzymes.
  • S serine
  • T threonine
  • N asparagine
  • Q glutamine
  • C cysteine
  • P Proline
  • K Lysine
  • R Arginine
  • H Histidine
  • D Aspartic aicd
  • E Glutamic acid It may be a modification of an amino acid.
  • the modification may be a modification of one or two or more amino acids consisting of lysine (K), arginine (R) and histidine (H) present in a naturally occurring CRISPR enzyme.
  • the modification may be a substitution of one or more amino acids of amino acids consisting of lysine (K), arginine (R) and histidine (H) present in naturally occurring CRISPR enzymes. have.
  • the modification may be a modification of one or more amino acids of amino acids consisting of aspartic acid (D) and glutamic acid (E) present in naturally occurring CRISPR enzymes.
  • the modification may be a substitution of one or two or more amino acids consisting of aspartic acid (D) and glutamic acid (E) present in a naturally occurring CRISPR enzyme.
  • the modifications include serine (S), threonine (T), asparagine (N), glutamine (Q), cysteine (C) and proline (Proline) present in naturally occurring CRISPR enzymes.
  • P glycine
  • G alanine
  • A valine
  • V isoleucine
  • I leucine
  • M methionine
  • M phenylalanine
  • F a modification of one or more amino acids of amino acids consisting of Tyrosine (Y) and Tryptophan (W).
  • the modification may include serine (S), threonine (T), asparagine (N), glutamine (Q), cysteine (C), which are present in naturally occurring CRISPR enzymes.
  • the modification may be a modification of one, two, three, four, five, six, seven or more of the amino acids present in the naturally occurring CRISPR enzyme.
  • the modification may be a modification of one or two or more amino acids of the amino acids present in the RuvC domain of the CRISPR enzyme.
  • the RuvC domain may be a RuvCI, RuvCII or RuvCIII domain.
  • the modification may be a modification of one or more amino acids of the amino acids present in the HNH domain of the CRISPR enzyme.
  • the modification may be a modification of one or more amino acids of the amino acids present in the REC domain of the CRISPR enzyme.
  • the modification may be a modification of one or more amino acids of the amino acids present in the PI domain of the CRISPR enzyme.
  • the modification may be a modification of two or more amino acids of amino acids included in at least two or more domains of the REC, RuvC, HNH or PI domain of the CRISPR enzyme.
  • the modification may be a modification of two or more amino acids among the amino acids included in the REC and RuvC domains of the CRISPR enzyme.
  • the modification in the SpCas9 variant, may be a modification of at least two or more amino acids of A203, H277, G366, F539, I601, M763, D965 and F1038 amino acids included in the REC and RuvC domains of SpCas9.
  • the modification may be a modification of two or more amino acids among the amino acids included in the REC and HNH domains of the CRISPR enzyme.
  • the modification in the SpCas9 variant, may be a modification of at least two or more of the amino acids A203, H277, G366, F539, I601 and K890 contained in the REC and HNH domains of SpCas9.
  • the modification may be a modification of two or more amino acids among the amino acids included in the REC and PI domains of the CRISPR enzyme.
  • the modification in the SpCas9 variant, may be a modification of at least two or more amino acids of A203, H277, G366, F539, I601, T1102 and D1127 amino acids included in the REC and PI domains of SpCas9.
  • the modification may be a modification of three or more amino acids among the amino acids included in the REC, RuvC and HNH domains of the CRISPR enzyme.
  • the modification may be a modification of at least three or more amino acids of A203, H277, G366, F539, I601, M763, K890, D965 and F1038 amino acids included in the REC, RuvC and HNH domains of SpCas9 have.
  • the modification may be a modification of three or more amino acids among the amino acids included in the REC, RuvC and PI domains of the CRISPR enzyme.
  • the modification is a modification of at least three or more amino acids of A203, H277, G366, F539, I601, M763, D965, F1038, T1102 and D1127 amino acids included in the REC, RuvC and PI domains of SpCas9 Can be.
  • the modification may be a modification of three or more amino acids among the amino acids included in the REC, HNH, and PI domains of the CRISPR enzyme.
  • the modification may be a modification of at least three or more amino acids of A203, H277, G366, F539, I601, K890, T1102 and D1127 amino acids included in the REC, HNH and PI domains of SpCas9.
  • the modification may be a modification of three or more amino acids among the amino acids included in the RuvC, HNH, and PI domains of the CRISPR enzyme.
  • the modification in the SpCas9 variant, may be a modification of at least three or more amino acids of the M763, K890, D965, F1038, T1102 and D1127 amino acids included in the RuvC, HNH and PI domains of SpCas9.
  • the modification may be a modification of four or more amino acids among the amino acids included in the REC, RuvC, HNH, and PI domains of the CRISPR enzyme.
  • the modification is at least four of the amino acids A203, H277, G366, F539, I601, M763, K890, D965, F1038, T1102 and D1127 contained in the REC, RuvC, HNH and PI domains of SpCas9. It may be a modification of the above amino acids.
  • the modification may be a modification of one or more amino acids of amino acids participating in the nuclease activity of the CRISPR enzyme.
  • the modification may be one or two or more modifications of an amino acid group consisting of D10, E762, H840, N854, N863, and D986, or one or two of the corresponding amino acid groups of other Cas9 orthologs It may be a modification of the above amino acids.
  • the modification may be a modification that partially inactivates the nuclease activity of the CRISPR enzyme, and such CRISPR enzyme variant may be a kinase.
  • the modification may be a modification that inactivates the nuclease activity of the RuvC domain of the CRISPR enzyme, and the CRISPR enzyme variant cleaves non-complementary strands of the target gene or nucleic acid, ie, strands that do not complementally bind gRNA. Can not.
  • the nuclease activity of the RuvC domain is inactivated and thus can be used as a kinase.
  • the generated kinase cannot cleave non-complementary strands of the target gene or nucleic acid, ie, strands which do not complementarily bind with gRNA.
  • the nuclease activity of the RuvC domain is inactivated and thus can be used as a kinase.
  • the generated kinase cannot cleave non-complementary strands of the target gene or nucleic acid, ie, strands which do not complementarily bind with the gRNA.
  • the modification may be a modification that inactivates the nuclease activity of the HNH domain of the CRISPR enzyme, and the CRISPR enzyme variant may cleave the complementary strand of the target gene or nucleic acid, ie, the strand complementary to the gRNA. Can't.
  • the nuclease activity of the HNH domain is inactivated, and thus may be used as a kinase.
  • the generated kinase cannot cleave the complementary strand of the target gene or nucleic acid, ie, the strand complementary to the gRNA.
  • the nuclease activity of the HNH domain is inactivated and thus may be used as a kinase.
  • the generated kinase cannot cleave the complementary strand of the target gene or nucleic acid, ie, the strand complementary to the gRNA.
  • the modification may be a modification that completely inactivates the nuclease activity of the CRISPR enzyme, and such CRISPR enzyme variant may be an inactive CRISPR enzyme.
  • the modification may be a modification that inactivates the nuclease activity of the RuvC and HNH domains of the CRISPR enzyme, and such CRISPR enzyme variants cannot cut the double strand of the target gene or nucleic acid.
  • CRISPR enzyme variants may optionally further comprise a functional domain in addition to the original properties of the CRISPR enzyme, and such CRISPR enzyme variants may have additional properties in addition to the original properties.
  • the functional domain is methylase activity, dimethylase activity, transcription activation activity, transcription repression activity, transcription release factor activity, histone modification.
  • the functional domain, peptide, polypeptide or protein may be a deminase.
  • an incomplete or partial CRISPR enzyme may further comprise cytidine deaminase as a functional domain.
  • a fusion protein can be generated by adding a cytidine deminase, such as apolipoprotein B editing complex 1 (APOBEC1), to SpCas9 kinase.
  • APOBEC1 apolipoprotein B editing complex 1
  • SpCas9 kinase]-[APOBEC1] thus formed can be used for base calibration or editing with base C as T or U, or for base calibration or editing with base G as A.
  • the tag includes a histidine (His) tag, a V5 tag, a FLAG tag, an influenza hemagglutinin (HA) tag, a Myc tag, a VSV-G tag, a thioredoxin (Trx) tag, and the like, and the reporter gene is glutathione.
  • His histidine
  • HA influenza hemagglutinin
  • Trx thioredoxin
  • GST horseradish peroxidase
  • HRP horseradish peroxidase
  • CAT chloramphenicol acetyltransferase
  • beta-galactosidase beta-glucuronidase
  • luciferase green fluorescent protein Autofluorescent proteins including (GFP), HcRed, DsRed, cyan fluorescent protein (CFP), yellow fluorescent protein (YFP), and blue fluorescent protein (BFP).
  • the functional domain may be a nuclear localization sequence or signal (NLS) or a nuclear export sequence or signal (NES).
  • NLS nuclear localization sequence or signal
  • NES nuclear export sequence or signal
  • the CRISPR enzyme may comprise one or more NLS.
  • the NLS is at or near the amino terminus of the CRISPR enzyme; At or near the carboxy terminus; Or one or more NLSs in combination thereof.
  • the NLS may be, but is not limited to, an NLS sequence derived from: NLS of SV40 virus large T-antigen with amino acid sequence PKKKRKV; NLS from nucleoplasmin (eg, nucleoplasmin bipartite NLS having the sequence KRPAATKKAGQAKKKK); C-myc NLS having the amino acid sequence PAAKRVKLD or RQRRNELKRSP; HRNPA1 M9 NLS having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; The sequence RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV of the IBB domain from importin-alpha; The sequences VSRKRPRP and PPKKARED of the myom
  • the CRISPR enzyme variant may comprise a split form of CRISPR enzyme which is divided into two or more parts by dividing the CRISPR enzyme.
  • Split means splitting a protein functionally or structurally or optionally into two or more.
  • the split form of the CRISPR enzyme may be a fully active enzyme, an incomplete or partially active enzyme, or an inactive enzyme.
  • a split SpCas9 divided into two parts can be generated by dividing between tyrosine 656 and threonine 657.
  • split form of CRISPR enzyme may optionally comprise additional domains, peptides, polypeptides or proteins for reconstitution.
  • substitution means that the split form of the CRISPR enzyme is structurally identical or similar to the wild type CRISPR enzyme.
  • Additional domains, peptides, polypeptides or proteins for the reconstitution include FRB and FKBP dimerization domains; Inteins; ERT and VPR domains or domains that form dimers in certain conditions.
  • a split SpCas9 divided into two parts by dividing between serine 713 and glycine 714 can be linked to the FRB domain in one of two parts, and the FKBP domain in the other.
  • the split SpCas9 thus produced can generate a reconstituted CRISPR enzyme by forming a dimer of the FRB domain and the FKBP domain in the presence of rapamycin.
  • the CRISPR enzyme or CRISPR enzyme variant described in the present invention may be a polypeptide, a protein, or a nucleic acid having a sequence encoding the same, and is codon optimized for a subject to which the CRISPR enzyme or CRISPR enzyme variant is to be introduced. Can be.
  • Codon optimization refers to a nucleic acid for enhanced expression in a host cell of interest by maintaining the native amino phase sequence, replacing at least one codon of the native sequence with a codon that is used more frequently or most frequently in the gene of the host cell. Refers to a process of modifying a sequence.
  • Various species have specific biases for specific codons of specific amino acids, and codon bias (difference in codon usage between organisms) is often correlated with the efficiency of translation of mRNA, which is due to the nature of the codons being translated and the availability of specific tRNA molecules It is believed to be influenced by.
  • the preponderance of tRNAs selected in cells generally reflects the codons most frequently used for peptide synthesis. Thus, genes can be tailored for optimal gene expression in a given organism based on codon optimization.
  • a "target sequence” is a nucleotide sequence existing in a target gene or nucleic acid and has complementarity with a guide sequence included in a guide domain of a guide nucleic acid.
  • the target sequence may be variously designed according to the target gene or nucleic acid as a nucleotide sequence which may vary depending on the target gene or nucleic acid, that is, the subject to be genetically engineered or corrected.
  • the target sequence may bind complementary to the guide sequence included in the guide domain of the guide nucleic acid, and the length of the target sequence may be the same as the length of the guide sequence.
  • the target sequence may be 5 to 50 nucleotide sequences.
  • the target sequence includes 16 nucleotide sequences, 17 nucleotide sequences, 18 nucleotide sequences, 19 nucleotide sequences, 20 nucleotide sequences, 21 nucleotide sequences, 22 nucleotide sequences, 23 nucleotide sequences, and 24 base sequences. Sequence or 25 nucleotide sequences.
  • the target sequence may be a nucleic acid sequence complementary to the guide sequence included in the guide domain of the guide nucleic acid, for example at least 70%, 75%, 80%, 85%, 90% or 95% or more complementary or complete To nucleic acid sequences that are complementary to each other.
  • the target sequence may have or include 1 to 8 base sequences that are not complementary to the guide sequence included in the guide domain of the guide nucleic acid.
  • the target sequence may be a nucleotide sequence located close to the nucleic acid sequence that the editor protein can recognize.
  • the target sequence may be a contiguous 5 to 50 base sequences located adjacent to the 5 'end or / and 3' end of the nucleic acid sequence that the editor protein can recognize.
  • the target sequence for the gRNA-CRISPR enzyme complex is described below.
  • the target sequence has complementarity with the guide sequence included in the guide domain of the gRNA.
  • the target sequence may be variously designed according to the target gene or nucleic acid as a nucleotide sequence which may vary depending on the target gene or nucleic acid, that is, the subject to be genetically engineered or corrected.
  • the target sequence may be a nucleotide sequence located close to the PAM sequence that can be recognized by the CRISPR enzyme, that is, Cas9 or Cpf1.
  • the target sequence may be a contiguous 5 to 50 base sequences located adjacent to the 5 'end or / and 3' end of the PAM sequence that can be recognized by the CRISPR enzyme.
  • the target sequence may be a nucleic acid sequence included in one or more genes selected from the group consisting of VEGFA gene, HIF1A gene, ANGPT2 gene, EPAS1 gene, and ANGPTL4 gene.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Vascular Medicine (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Virology (AREA)
  • Ophthalmology & Optometry (AREA)
  • Immunology (AREA)
  • Endocrinology (AREA)
  • Cell Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mycology (AREA)
  • Cardiology (AREA)

Abstract

본 발명은 신생혈관형성 조절을 위한, 인위적으로 조작된 신생혈관형성 관련 인자 및 이의 이용에 관한 것이다. 보다 구체적으로, 신생혈관형성을 조절하기 위한 인위적으로 조작된 신생혈관형성 관련 인자 및/또는 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 신생혈관형성을 조절할 수 있는 시스템에 관한 것이다. 구체적인 양태로, 인위적으로 조작된 VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 등의 신생혈관형성 관련 인자 및/또는 이의 발현 산물에 의한 신생혈관형성 조절 시스템에 관한 것이다.

Description

인위적으로 조작된 신생혈관형성 조절 시스템
본 발명은 신생혈관형성 조절을 위한, 인위적으로 조작된 신생혈관형성 관련 인자 및 이의 이용에 관한 것이다. 보다 구체적으로, 신생혈관형성을 조절하기 위한 인위적으로 조작된 신생혈관형성 관련 인자 및/또는 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 신생혈관형성을 조절할 수 있는 시스템에 관한 것이다.
많은 중증 질환 상태에서 과도한 신생혈관형성은 암, 황반 변성(macular degeneration), 당뇨병성 망막증, 관절염 및 건선과 같은 질환에서 발생한다. 이러한 상태에서, 새로운 혈관이 질병에 걸린 조직에 공급되어, 정상 조직을 파괴시키며, 암의 경우, 새로운 혈관은 종양 세포를 순환계로 유입시켜 다른 장기에 정착가능하게 한다(종양 전이).
특히, 암세포는 신생혈관형성을 통해 영양분을 공급받고 다른 장기로 전이하기 때문에, 신생혈관형성은 암의 성장과 전이에 필수적이다. 실제 여러 종류의 암에서, 암조직에 형성된 모세혈관의 밀도와 암의 전이 가능성 간에는 밀접한 상관관계가 있는 것으로 알려져 있다. 또한, 염증성 질환의 대표적인 질환인 류마티스성 관절염은 자가면역 이상이 원인이지만, 병이 진행되면서 관절 사이의 활액강에 생긴 만성 염증이 신생혈관형성을 유도하여 연골이 파괴된다. 해마다 전 세계적으로 수백만 명이 실명하게 되는 많은 안과질환도 신생혈관형성이 원인이 되고 있다. 대표적인 예인 당뇨병성 실명증은 당뇨병의 합병증으로, 망막에 있는 모세혈관이 신생혈관형성을 통해 초자체를 침습하여 결국 눈이 멀게 된다. 따라서, 신생혈관형성 억제물질은 신생혈관형성이 지속적으로 일어나는 암, 류마티스성 관절염 및 당뇨병성 실명증등의 여러 질병의 치료제 및 예방제로 유용하게 사용될 수 있다.
한편, 종래에는 신생혈관형성을 억제하기 위해서 혈관 내피 성장 인자(VEGF) 신호전달의 억제에 관한 연구가 활발하였다. 그러나 종래기술에서는 초기에는 신생혈관형성이 억제되는듯한 양상을 보이다가, 이후에 암세포로 항암제가 전달되는 경로까지 억제하여 결국은 암세포가 더욱 공격적으로 변하는 부작용이 존재하였다.
이와 같이, 신생혈관형성에 의해 유도되는 질환들의 치료를 위한 다양한 연구가 진행되고 있으나, 아직 이를 위한 근본적인 치료 방법은 거의 없는 상황이다.
특히, 신생혈관형성에 의한 암 또는 암의 전이, 망막 또는 각막 변성에 의한 실명 등의 중증 질환의 치료를 위한 치료법은 전무한 상태로, 따라서, 이러한 신생혈관형성 관련 질환의 근본적인 치료법의 개발 요구가 매우 큰 실정이다.
상기 과제를 해결하기 위하여, 본 발명은 개선된 신생혈관형성 효과를 갖는, 인위적으로 조작한 신생혈관형성 시스템에 관한 것이다. 보다 구체적으로, 인위적으로 조작한 신생혈관형성 관련 인자 및 이에 의한, 인위적으로 기능을 변형시킨 신생혈관형성 시스템에 관한 것이다.
본 발명은 특정 목적을 위해 유전적으로 조작된 또는 변형된 신생혈관형성 관련 인자를 제공한다.
본 발명은 일 구체예로서 인위적으로 조작된 신생혈관형성 조절 시스템을 제공하고자 한다.
본 발명은 일 구체예로서 인위적으로 조작된 신생혈관형성 관련 인자 및 이의 발현 산물을 제공하고자 한다.
본 발명은 일 구체예로서 신생혈관형성 관련 인자의 조작을 위한 유전자 조작용 조성물 및 이를 이용하는 방법 제공하고자 한다.
본 방법은 일 구체예로서 신생혈관형성을 조절하는 방법을 제공하고자 한다.
본 발명은 일 구체예로서 신생혈관형성 관련 질환을 치료하기 위한 약학적 조성물 및 이의 다양한 용도를 제공하고자 한다.
본 발명의 일 구체예로서 인위적으로 조작된 VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 등의 신생혈관형성 관련 인자 및/또는 이의 발현 산물을 제공하고자 한다.
본 발명의 일 구체예로서 VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 등의 신생혈관형성 관련 인자의 인위적 조작을 위한 유전자 조작용 조성물을 제공하고자 한다.
본 발명의 일 구체예로서 인위적으로 조작된 VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 등의 신생혈관형성 관련 인자들 및/또는 상기 인위적 조작을 위한 유전자 조작용 조성물의 치료적 용도를 제공하고자 한다.
본 발명의 일 구체예로서 인위적으로 조작된 VEGFA, HIF1A, ANGPT2, EPAS1, ANGPTL4 등의 신생혈관형성 관련 인자들 및/또는 상기 인위적 조작을 위한 유전자 조작용 조성물의 부가적 용도를 제공하고자 한다.
상기 과제를 해결하기 위하여, 본 발명은 신생혈관형성을 조절하기 위한 인위적으로 조작된 신생혈관형성 관련 인자 및/또는 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 조성물을 포함하는, 인위적으로 신생혈관형성을 조절할 수 있는 시스템에 관한 것이다.
본 발명은 특정 목적을 위해 인위적으로 조작된 신생혈관형성 관련 인자를 제공한다.
"신생혈관형성 관련 인자(neovascularization-associated factor)"는 신생혈관형성에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 물질로, 비자연적인, 즉, 인위적으로 조작된, 신생혈관형성 조절 기능을 가질 수 있는 다양한 물질을 모두 포함한다. DNA, RNA, 유전자, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다. 예를 들어, 유전적으로 조작된 또는 변형된 세포에서 발현되는 유전자 또는 단백질일 수 있다.
상기 신생혈관형성 관련 인자는 신생혈관형성을 촉진시키거나 증가시킬 수 있으며, 반대로 신생혈관형성을 저해하거나 억제시킬 수 있다.
또한 신생혈관형성 환경 또는 신생혈관형성 억제환경을 유도하거나 활성 또는 비활성화시킬 수 있다.
본 발명의 일 구현예에서 신생혈관형성 관련 인자로서, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 또는 ANGPTL4 유전자일 수 있다.
본 발명의 일 구현예에서 신생혈관형성 관련 인자로서 인위적으로 조작된 2 개 이상의 유전자를 포함할 수 있다. 예를 들어, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 2 이상의 유전자를 인위적으로 조작할 수 있다.
그러므로, 본 발명의 일 구현예에서는 핵산서열 내 변형이 일어난 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 인위적으로 조작된 신생혈관형성 관련 인자를 제공한다.
상기 핵산서열 내 변형은 비제한적으로, 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작될 수 있다.
“가이드핵산-에디터단백질 복합체”는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미하며, 핵산-단백질 복합체는 가이드핵산과 에디터단백질을 포함한다.
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다. 상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 상기 유전자는 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 신생혈관형성 관련 인자로서,
상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
외부 유래의 하나 이상의 뉴클레오타이드 삽입
중 하나 이상의 핵산의 변형, 또는
상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형을 포함하는 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자일 수 있다.
상기 핵산의 변형은 유전자의 프로모터 영역에서 일어날 수 있다.
상기 핵산의 변형은 유전자의 엑손 영역에서 일어날 수 있다. 일 실시예에서는 유전자의 암호화 영역 중 상위 50% 내의 영역에서 변형이 일어날 수 있다.
상기 핵산의 변형은 유전자의 인트론 영역에서 일어날 수 있다.
상기 핵산의 변형은 유전자의 인핸서 영역에서 일어날 수 있다.
상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상일 수 있다(5'에서 3'방향으로 기재함).
NGG(N은 A, T, C 또는 G임);
NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
TTN(N은 A, T, C 또는 G임).
상기 에디터단백질은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina)로부터 유래될 수 있다.
일 구체예에서, 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상일 수 있다. 일 예에서, 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질 또는 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질일 수 있다.
또한, 다른 구현예에서, 본 발명은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산을 제공한다.
상기 가이드 핵산은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열의 일부와 각각 상보적인 결합을 형성할 수 있다. 0 내지 5, 0 내지 4, 0 내지 3, 0 내지 2개의 미스매치(mismatching)를 포함할 수 있다. 바람직한 예로서, 상기 가이드 핵산은 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 타겟 서열 중 1 이상에 각각 상보적인 결합을 형성하는 뉴클레오타이드일 수 있다.
예를 들어, 이하의 군으로부터 선택되는 하나 이상의 가이드 핵산을 제공할 수 있다:
VEGFA 유전자 핵산 서열 중 서열번호 3, 4, 7, 9, 10 및 11의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
HIF1A 유전자 핵산 서열 중 서열번호 14, 18, 19, 20, 26, 29 및 31의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
ANGPT2 유전자 핵산 서열 중 서열번호 33, 34, 37, 38, 39 및 43의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
EPAS1 유전자 핵산 서열 중 서열번호 47, 48, 49, 50, 53, 54 및 55의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산; 및
ANGPTL4 유전자 핵산 서열 중 서열번호 64, 66, 67, 73, 76 및 79의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산.
상기 가이드 핵산은 비제한적으로, 18 내지 25 bp, 18 내지 24 bp, 18 내지 23 bp, 19 내지 23 bp, 19 내지 23 bp, 또는 20 내지 23 bp의 뉴클레오타이드일 수 있다.
또한, 본 발명은 특정 목적을 위해 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 제공한다.
유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체 또는 이들을 암호화하는 핵산서열을 포함할 수 있다.
유전자 조작용 조성물은
(a) VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열
을 포함할 수 있다.
일 구현예에서, 상기 가이드핵산은 서열번호 3, 4, 7, 9, 10 및 11 (VEGFA), 서열번호 14, 18, 19, 20, 26, 29 및 31 (HIF1A), 서열번호 33, 34, 37, 38, 39 및 43 (ANGPT2), 서열번호 47, 48, 49, 50, 53, 54 및 55 (EPAS1) 및 서열번호 64, 66, 67, 73, 76 및 79 (ANGPTL4)의 표적 서열 중 1 이상에 각각 상보적인 결합을 형성하는 핵산서열일 수 있다.
일 구현예에서, 상기 유전자 조작용 조성물은 바이러스 벡터 시스템일 수 있다.
상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1 이상일 수 있다.
구현예에서, 본 발명은 세포에
(a) VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열
을 도입시키는 단계를 포함하는, 세포를 인위적으로 조작하는 방법을 제공한다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.
도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.
바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
또한, 구현예에서 본 발명은 신생혈관형성 관련 질환을 치료하기 위한 약학적 조성물을 제공한다.
약학적 조성물은 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 유전자 조작용 조성물을 포함할 수 있다.
상기 유전자 조작용 조성물 관련 구성 설명은 상기 기술한 바와 같다.
구현예에서, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자를 서열분석함으로써 대상체에서 인위적으로 조작 가능한 표적 위치의 서열에 대한 정보를 제공하는 방법을 제공한다.
또한, 이러한 방법으로 제공받은 정보를 이용하여 라이브러리를 구축하는 방법을 제공한다.
구현예에서, 다음을 포함하는 유전자 조작용 키트를 제공한다:
(a) VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열.
이러한 키트를 이용하여 목적하는 유전자를 인위적으로 조작할 수 있다.
구현예에서, 본 발명은
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 내 1 이상의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
에디터단백질 또는 이를 암호화하는 핵산서열
을 포함하는 혈관신생성 장애 치료용 조성물을 제공할 수 있다.
상기 표적 서열은 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열 중 1 이상일 수 있다.
일 실시예에서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질을 사용하였다.
일 실시예에서, 상기 혈관신생성 장애는 허혈성 망막병증 또는 미숙아 망막병증(retinopathy of prematurity)일 수 있다.
구현예에서, 본 발명은 대상체에 대한 인위적으로 조작된 신생혈관형성 관련 인자 또는 신생혈관형성 관련 인자를 인위적으로 조작하는 유전자 조작용 조성물을 이용한 질환 치료 용도의 모든 양태를 제공한다.
치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
인위적으로 조작한 신생혈관형성 관련 인자 및 이에 의해 인위적으로 기능을 변형시킨 신생혈관형성 시스템에 의해서, 효과적인 신생혈관 관련 질환, 예를 들어 신생혈관 관련 안구질환의 치료적 용도를 이용할 수 있다. 다양한 신생혈관형성 관련 인자들이 관여하는 다양한 체내 메커니즘을 조절을 통해 신생혈관형성 시스템의 효능을 개선시킬 수 있다.
예를 들어, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자 중 1이상의 유전자를 이용할 수 있다.
도 1은 노인성 황반변성(age-related macular degeneration (AMD))의 마우스 모델에서 Vegfa 또는 Hif1a를 표적하는 CjCas9에 의한 레이저에 의해 유도된 맥락막 신생혈관 형성(choroidal neovascularization, CNV) 부위의 감소 효과에 관한 것으로, (A) Vegfa 및 Hif1a / HIF1A 유전자 내의 CjCas9 표적 서열(PAM 서열 및 sgRNA의 표적 서열을 각 점선, 실선으로 표시), (B) CjCas9을 암호화하는 올인원 AAV 벡터 및 in vivo 실험 일정, (C) RPE 세포에서 Rosa26, Vegfa, 및 Hif1a 표적 위치의 인델 빈도를 나타낸 그래프(Error bars=s.e.m.(AAV 주입하지않은 대조군 n=4, AAV-CjCa9 주입한 실험군 n=5), Student's t-tests, * p < 0.05, *** p < 0.001), (D) ELISA를 이용한 RPE 세포에서 Vegfa 발현양 측정 그래프(Error bars=s.e.m.(AAV 주입하지않은 대조군 n=4, AAV-CjCa9 주입한 실험군 n=5), One-way ANOVA 및 Tukey post-hoc tests, * p < 0.05, *** p < 0.001), (E) 오프-타겟 위치(미스매치 되는 염기서열은 실선, PAM 서열은 점선으로 표시)의 인델 빈도를 나타낸 그래프, (F) Rosa26, Vegfa, 또는 Hif1a를 표적하는 AAV9-CjCa9을 주입한 마우스 안구에서 isolectin B4로 염색된 레이저에 의해 유도된 CNV 부위(Scale bar=200 μm), (G) 레이저에 의해 유도된 CNV 부위(%)(Error bars=s.e.m.(n=17-18), One-way ANOVA 및 Tukey post-hoc tests, * p < 0.05, ** p < 0.01, *** p < 0.001, ns: not significant)를 나타낸 그래프이다.
도 2는 마우스 RPE에서 CjCas9과 함께 eGFP의 in vivo 발현을 확인한 이미지이다(n=6, anti-GFP 항체(녹색) 및 DAPI(파란색), Scale bar=20 μm).
도 3은 AAV/CjCas9을 주입한 마우스의 망막에서 opsin 양성 부위에 관한 것으로, (A) Rosa26-, Vegfa-, 또는 Hif1a-특이적 CjCas9을 주입한 마우스에서 HA 태그된 CjCas9을 발현하는 RPE 세포에 상응하는 opsin 양성 부위의 이미지(Opsin: 빨간색, HA: 녹색, 및 DAPI: 파란색, Scale bar=20 μm, ONL: outer nuclear layer, IS: inner segment of photoreceptor cells, OS: outer segment of photoreceptor cells), (B) 상대적인 opsin 양성 부위(%)(Error bars=s.e.m.(n=4), One-way ANOVA 및 Tukey post-hoc tests, * p < 0.05)를 나타낸 그래프이다.
도 4는 망막 조직에서 Vegfa 또는 Hif1a를 표적하는 CjCas9에 의한 VEGF의 발현감소에 관한 것으로, (A) 망막 세포에서 Rosa26, Vegfa 및 Hif1a의 표적 위치에 인델 빈도를 나타낸 그래프(Error bars=s.e.m.(AAV 주입하지 않은 대조군 n=4, AAV-CjCa9 주입한 실험군 n=5), Student's t-tests, * p < 0.05, ** p < 0.01, *** p < 0.001), (B) ELISA를 이용한 망막 세포에서 Vegfa 발현양 측정 그래프(Error bars=s.e.m.(n=6-7), One-way ANOVA 및 Tukey post-hoc tests, * p < 0.05, *** p < 0.001)를 나타낸다.
도 5는 당뇨병성 망막증 마우스 모델에서 Vegfa를 표적하는 CjCas9에 의한 망막의 혈관 파열 및 혈액 누출 감소 효과에 관한 것으로, (a) in vivo 실험 일정, (b) Vegfa를 표적하는 AAV2-CjCa9을 주입한 마우스 망막에서 혈관 파열 및 혈액 누출 감소 효과에 대한 이미지를 보여준다.
도 6은 당뇨병성 망막증 마우스 모델에서 Vegfa를 표적하는 CjCas9에 의한 망막의 혈관 파열 및 혈액 누출 감소 효과에 관한 것으로, 도 6a는 in vivo 실험 일정(a), Vegfa를 표적하는 AAV2-CjCa9을 주입한 마우스 망막에서 혈관 파열 및 혈액 누출 감소 효과에 대한 이미지(b), 도 6b는 Rosa26 또는 Vegfa를 표적하는 CjCas9에 의한 혈관 파열(%) 비교 그래프를 나타낸다.
도 7는 유전자 조작을 위한 인간 VEGFA의 CjCas9 표적 위치 스크리닝 결과 및 인델 빈도를 나타낸다.
도 8는 유전자 조작을 위한 인간 HIF1A의 CjCas9 표적 위치 스크리닝에 관한 것으로, (A) 인간 HIF1A의 CjCas9 표적 위치 스크리닝 결과 및 인델 빈도, (B) HIF1A의 다양한 포유동물간의 보존된 표적 위치
도 9은 유전자 조작을 위한 인간 ANGPT2의 CjCas9 표적 위치 스크리닝 결과 및 인델 빈도를 나타낸다.
도 10은 유전자 조작을 위한 인간 EPAS1의 CjCas9 표적 위치 스크리닝 결과 및 인델 빈도를 나타낸다.
도 11는 유전자 조작을 위한 인간 ANGPTL4의 CjCas9 표적 위치 스크리닝 결과 및 인델 빈도를 나타낸다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술분야의 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다. 본 명세서에 기재된 것과 유사 또는 동일한 방법 및 물질이 본 발명의 실행 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 이하에 기재된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허 및 기타 다른 참고문헌은 전체가 참고로 포함된다. 추가로, 물질, 방법 및 실시예는 단지 예시적이며, 제한하는 것으로 의도되지 않는다.
본 발명의 일 태양은
조절된 신생혈관형성 효과를 가지는, 인위적으로 조작한 신생혈관형성 시스템에 관한 것이다.
구체적으로, 신생혈관형성 관련 인자를 인위적으로 조작함으로써 신생혈관형성을 조절하거나 또는 신생혈관형성 관련 질환을 개선 또는 치료할 수 있는 다양한 양태의 구성에 관한 것이다. 인위적으로 기능을 변형시킨 신생혈관형성 관련 인자 및 이의 제조방법, 이들을 포함하는 조성물, 및 이의 치료적 용도 등을 포함한다.
본 발명의 다른 태양은
인위적으로 기능을 변형시킨 특정 인자(예를 들어, 신생혈관형성 관련 인자로 알려져 있는 유전자 등)의 다양한 기능에 수반되는, 부가적인 제3의 체내 메커니즘의 조절 시스템에 관한 것이다.
구체적으로, 인위적으로 조작한 특정 인자들이 관여하는 신생혈관형성 기능뿐만 아니라, 체내의 제3의 기능을 표적화하여 해당 메커니즘을 조절할 수 있다. 인위적으로 기능을 변형시킨 신생혈관형성 관련 인자 및 이의 제조방법, 이들을 포함하는 조성물, 및 제3의 기능과 관련된 질환을 개선 또는 치료할 수 있는 이들의 치료적 용도 등을 포함한다.
[ 신생혈관형성 ]
본 발명의 일 구현예는 신생혈관형성 관련 시스템의 개선 및 변형에 관한 것이다.
"신생혈관형성"은 새로운 혈관의 생성, 발생 및/또는 분화가 포함된 조직 혈관화(vascularization) 과정을 의미하며, 여기서는 혈관신생(Angiogenesis) 및 혈관형성(neovascularization)을 모두 포함하는 것으로 한다. 신생혈관형성은 여러 인자들이 서로 밀접하게 연관되어 혈관내피세포의 증식을 촉진하거나 억제하면서 일어날 수 있다.
신생혈관형성은 기존 혈관으로부터 혈관이 뻗어나거나, 전구 세포로부터 혈관이 새로 생겨나거나, 및/또는 기존의 소형 혈관의 직경이 커지는 메커니즘을 모두 포함한다.
또한, 신생혈관형성은 혈관의 파열 또는 파열된 혈관의 수복에 관한 혈관형성 관련 메커니즘을 모두 포함한다.
혈관 형성은, 많은 중증 질환 상태에서의 과도한 및/또는 비정상적인 신생혈관형성을 수반하는 메커니즘을 포함한다.
예를 들어, 암, 황반 변성(macular degeneration), 당뇨병성 망막증, 관절염 및 건선과 같은 질환에서 과도한 신생혈관형성이 발생한다. 이러한 질환 상태에서, 새로운 혈관이 질병이 걸린 조직에 공급되어 정상 조직을 파괴시키고, 암의 경우, 새로운 혈관은 종양 세포를 순환계로 유입시켜 다른 장기에 정착 가능(종양 전이)할 수 있게 한다.
일 구체예에서, 신생혈관형성은 눈에서의 신생혈관 형성일 수 있다.
예를 들어, 노인성 황반 변성(AMD) 및 당뇨병성 망막증 등의 안 질환에서 나타날 수 있다. 특히 AMD는 미국, 캐나다, 잉글랜드, 웨일즈, 스코틀랜드 및 호주에서 65세 이상의 노년층의 법적 비가역성 실명에 가장 공통적인 원인으로, 환자의 약 10% 내지 15%에서는 삼출(습성)형 질환이 나타난다. 삼출형 AMD는 신생혈관형성 및 병인성 혈관신생을 특징으로 한다.
예를 들어, 눈에서의 신생혈관 형성은 맥락막 신생혈관 형성(choroidal neovascularization, CNV), 각막 신생혈관 형성(corneal neovascularization) 및/또는 홍채 혈증(Rubeosis iridis)을 포함할 수 있다.
맥락막 신생혈관 형성(choroidal neovascularization, CNV)은 맥락막 층에 신생 혈관이 생성되는 것으로, CNV는 맥락막의 가장 안쪽층인 Bruch의 막(Bruch's membrane)에 결함이 있는 사람에게서 빠르게 발생한다. 또한, CNV는 과도한 양의 혈관 내피 성장 인자(VEGF)와 관련이 있다. CNV는 극심한 근시, 악성근시 변성 또는 신생혈관성 퇴행성 황반 변증(예를 들면, 습식 황반 변성증)를 유발할 수 있다.
각막 신생혈관 형성(corneal neovascularization)은 산소 결핍에 의한 각막주변 혈관총(pericorneal plexus)에서 무혈관성 각막조직(avascular corneal)으로 신생혈관이 생성되는 것으로, 주로 선척적이거나 또는 염증성(예를 들면, 각막 이식술 후 이식 거부, 이식 조직 또는 숙주 질환, 아토피성 결막염, 주사제, 안구 천포창, 라이엘 증후군 및 스티븐 존슨 증후군), 감염성(예를 들면, 박테리아 (클라미디아, 매독, pseduomonas), 바이러스(단순 포진 및 포진 대상 포진 바이러스), 곰팡이(칸디다균 ,aspergillus, fusarium) 및 기생충 (onchocerca volvolus)), 퇴행성, 외상성 및 의원성(예를 들면, 콘택트 렌즈 마모) 질병에 의해 발생할 수 있다.
홍채 혈증(Rubeosis iridis)은 홍채의 표면에 신생혈관이 생성되는 것으로, 당뇨 망막 병증과 관련있으며, 이외에도 망막 중심 정맥 폐쇄, 안구 허혈 증후군, 만성 망막 박리 등에 의해 홍채 혈증이 유발된다고 알려져 있다.
임의의 구체예에서, 신생혈관 형성은 혈관내피세포의 생존(survival), 증식(proliferation), 지속(persistency), 세포독성(cytotoxicity), 사이토카인 분비(cytokine-release) 기능과 관련이 있을 수 있다.
임의의 구체예에서, 신생혈관 형성은 혈관 신생 사이토카인의 발현 증가와 관련이 있을 수 있다.
임의의 구체예에서, 신생혈관 형성은 혈관내피세포의 수용체 기능과 관련이 있을 수 있다.
임의의 구체예에서, 신생혈관 형성은 혈관내피세포의 이동능과 관련이 있을 수 있다.
임의의 구체예에서, 신생혈관 형성은 혈관내피세포의 부착능과 관련이 있을 수 있다.
[ 신생혈관형성 관련 인자 ]
신생혈관형성 관련 인자( neovascularization - associated factor )
본 발명의 일 구현예는 인위적으로 조작된 또는 변형된 신생혈관형성 관련 인자이다.
"신생혈관형성 관련 인자"는 혈관형성 또는 혈관신생에 직접적으로 참여하거나 또는 간접적으로 영향을 미치는 모든 요소를 의미한다. 이때, 요소는 DNA, RNA, 유전자, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
구현예에서, 비자연적인, 즉, 인위적으로 조작된, 신생혈관형성 조절 기능을 가질 수 있는 다양한 물질을 모두 포함한다. 예를 들어, 유전적으로 조작된 또는 변형된 유전자 또는 단백질일 수 있다.
"인위적으로 조작된"이라는 용어는 자연상태에서 일어나는 존재 그대로의 상태가 아닌, 인위적으로 변형을 가한 상태를 의미한다.
"유전적으로 조작된"이라는 용어는 본 발명에서 언급하는 생물 또는 비생물 유래 물질에 대하여 인위적으로 유전적 변형을 가하는 조작이 이루어진 경우를 의미하는 것으로, 예를 들어, 특정 목적 하 인위적으로 게놈을 변형시킨 유전자 및/또는 유전자 산물(폴리펩타이드, 단백질 등)일 수 있다.
바람직한 예로서, 본 발명은 특정 목적을 위해 유전적으로 조작된 또는 변형된 신생혈관형성 관련 인자를 제공한다.
이하 나열된 기능을 가지는 유전자 또는 단백질은 한 종류의 신생혈관형성 관련 기능만 갖는 것이 아니라, 복수 종류의 기능이 있을 수 있다. 또한, 필요에 따라 2 이상의 신생혈관형성 기능 및 인자를 제공할 수 있다.
신생혈관형성 관련 인자는 신생혈관형성을 촉진하거나 증가시킬 수 있다
신생혈관형성 관련 인자는 신생혈관형성을 저해하거나 억제시킬 수 있다.
신생혈관형성 관련 인자는 신생혈관형성 환경을 유도하거나 활성화시킬 수 있다.
신생혈관형성 관련 인자는 신생혈관형성 억제환경을 유도하거나 신생혈관형성 환경을 비활성화시킬 수 있다.
신생혈관형성 관련 인자는 신생혈관형성을 조절(촉진, 증가, 저해 및/또는 억제 등)할 수 있다.
신생혈관형성 관련 인자는 신생혈관형성 관련 질환의 개선 및 치료에 이용될 수 있다.
구현예에서,
신생혈관형성 관련 인자는 ABCA1, ACAT, ACC2, ADAMTS12, ADCY2, ADIPOQ, ADIPOR1, ADIPOR2, ADRB2, AGPAT5, AIP4, AKAP2, AKR1C2, AMPK, ANG2, ANGPT2, ANGPTL4, ANK1, ANXA1, APOA1, ARHGAP17, ATP10A, AUH, AUTOTAXIN, BAI3, BCAR1, BIN1, BMP3A, CA10, CAMK1D, CAMKK2, CD36, CD44, CDC42, CDH13, CHAT, CNTFR, COL4A2, CPT, CSH1, CTNN, CUBN, CYP7B1, CYSLTR1, CYSLTR2, DGKB, DGKH, DGKZ, DHCR7, DHFR, DRD2, DRD5, EDG1, EDG2, EDG3, EDG4, EDG5, EDG6, EDG7, EDG8, EDNRA, EHHADH, ENPP6, EPAS1, ERBB4, ERK1, ERK2, ESRRG, ETFA, F2, FDPS, FGF2, FLNA, FLT4, FOXO1, FOXO3A, FTO, GABBR2, GATA3, GH1, GNA12, GNA13, GRK2, GRK5, GRM5, HAPLN1, HAS1, HAS2, HAS3, HCRTR2, HIF1A, HSD11B1, HYAL1, HYAL2, HYAL3, IL20RA, IL20RB, IL6ST, IL8, ITGA6, ITGB1, KDR, LAMA1, LDLR, LEPR, LEPTIN, LIFR, LIPL2, LKB1, LRP, LTBP2, MAT2B, ME1, MEGALIN, MERLIN, MET, MGST2, MMP2, MMP9, MTOR, MTR, NCK2, NEDD9, NFKB1, NFKBIB, NOS2A, NOS3, NR1I2, NR3C2, NRG1, NRP1, NRP2, OPRS1, OSBPL10, OSBPL3, OSTEOPONTIN, P2RY1, P2RY12, PAI1, PAI2, PAK1, PAK6, PALLD, PAP1, PAR1, PAXILLIN, PC, PCTP, PDE11A, PDE1A, PDE3A, PDE4D, PDE5, PDGFA, PDGFB, PDGFRA, PDGFRB, PI3K, PITPNC1, PKA, PKCD, PLA1A, PLA2, PLAT, PLAU, PLCB1, PLD1, PLD2, PLG, PLXDC2, PPARA, PPARG, PPARGC1B, PRKG1, PRL, PTGS2, PTN, PTPN11, PYK2, RAC1, RAS, RHEB, RHOA, ROCK1, ROCK2, RPS6KA1, RPS6KB2, SCARB1, SCHIP1, SGPP2, SLC25A21, SMAD3, SMAD4, SNCA, SORBS2, SPLA2, SPOCK1, SRD5A1, SREBF1, SREBF2, STAT3, TGFBR1, TGFBR2, TGFBR3, THBS1, THBS2, THEM2, THRB, TIAM1, TIMP2, TLL2, TSC1, TSC2, TSPO, VEGFA, VEGFR1, 및 YES1 등으로 구성된 군에서 선택된 하나 이상일 수 있다.
본 발명의 바람직한 예로서, 신생혈관형성 관련 인자는 VEGFA, HIF1A, ANGPT2, EPAS1, 및 ANGPTL4으로 구성된 군에서 선택된 하나 이상일 수 있다.
임의의 구체예에서, 신생혈관형성 관련 인자는 VEGFA일 수 있다.
VEGFA(Vascular endothelial growth factor A) 유전자는 MVCD1, VEGF 또는 VPF로도 칭해지는 단백질 VEGFA를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, VEGFA 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 VEGFA(e.g., NCBI Accession No. NP_001020537.2, NP_001020538.2 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001025366.2, NM_001025367.2, NM_003376, NG_008732.1 등으로 표현되는 VEGFA 유전자.
임의의 구체예에서, 신생혈관형성 관련 인자는 HIF1A일 수 있다.
HIF1A(Hypoxia-inducible factor 1-alpha, HIF-1-alpha) 유전자는 HIF1, MOP1, PASD8 또는 bHLHe78로도 칭해지는 단백질 HIF1A를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, HIF1A 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 HIF1A(e.g., NCBI Accession No. NP_001230013.1, NP_001521.1 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001243084.1, NM_001530.3, NM_181054.2, NG_029606.1 등으로 표현되는 HIF1A 유전자.
임의의 구체예에서, 신생혈관형성 관련 인자는 ANGPT2일 수 있다.
ANGPT2(Angiopoietin-2) 유전자는 AGPT2 또는 ANG2로도 칭해지는 단백질 ANGPT2를 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, ANGPT2 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 ANGPT2(e.g., NCBI Accession No. NP_001112359.1, NP_001112360.1, NP_001138.1 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001118887.1, NM_001118888.1, NM_001147.2, NG_029483.1 등으로 표현되는 ANGPT2 유전자.
임의의 구체예에서, 신생혈관형성 관련 인자는 EPAS1일 수 있다.
EPAS1(Endothelial PAS domain-containing protein 1) 유전자는 ECYT4, HIF2A, HLF, MOP2, PASD2 또는 bHLHe73로도 칭해지는 단백질 EPAS1을 암호화하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, EPAS1 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 EPAS1(e.g., NCBI Accession No. NP_001421.2 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001430.4, NG_016000.1 등으로 표현되는 EPAS1 유전자.
임의의 구체예에서, 신생혈관형성 관련 인자는 ANGPTL4일 수 있다.
ANGPTL4(Angiopoietin-like 4) 유전자는 ARP4, FIAF, HARP, HFARP, NL2, PGAR, TGQTL 또는 UNQ171로도 칭해지는 단백질 ANGPTL4를 암호화 하는 유전자(전장 DNA, cDNA 또는 mRNA)를 의미한다. 일 예에서, ANGPTL4 유전자는 다음으로 이루어진 군에서 선택된 하나 이상일 수 있으나, 이에 제한되는 것은 아니다: 인간 ANGPTL4(e.g., NCBI Accession No. NP_001034756.1, NP_647475.1 등)을 암호화하는 유전자, 예컨대, NCBI Accession No. NM_001039667.2, NM_139314.2, NG_012169.1 등으로 표현되는 ANGPTL4 유전자.
상기 신생혈관형성 관련 인자는 인간, 원숭이 등의 영장류, 래트, 마우스 등의 설치류 등을 포함하는 포유류로부터 유래하는 것일 수 있다.
유전자 정보는 NCBI (National Center for Biotechnology Information)의 GenBank와 같은 공지의 데이터 베이스에서 얻을 수 있다.
본 발명의 일 구현예로서 신생혈관형성 관련 인자, 예를 들어, VEGFA, HIF1A, ANGPT2, EPAS1, 또는 ANGPTL4는 인위적으로 조작된 신생혈관형성 관련 인자일 수 있다.
임의의 구체예에서, 인위적으로 조작된 신생혈관형성 관련 인자는 유전적으로 조작된 것일 수 있다.
상기 유전자 조작 또는 변형은 야생 형태(wild type) 유전자의 게놈 서열 중 일부 또는 전부 영역에 인위적으로 삽입, 결실, 치환, 역위 변이를 일으킴으로써 수득할 수 있다. 또한, 상기 유전자 조작 또는 변형은 2 이상의 유전자의 조작 또는 변형을 융합시킴으로써 수득할 수도 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 상기 유전자를 불활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능을 갖는 단백질 형태로 발현되지 않도록 하는 것일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 상기 유전자를 더욱 활성화시킴으로써 이 유전자로부터 코딩되는 단백질이 본래의 기능보다 향상된 기능을 갖는 단백질 형태로 발현되도록 하는 것일 수 있다. 일 예로, 특정 유전자에 의해 코딩되는 단백질의 기능이 A인 경우, 조작된 유전자에 의해 발현되는 단백질의 기능은 A와 전혀 다르거나 또는 A를 포함하는 추가의 기능(A+B)을 함께 가질 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 서로 상이한 또는 서로 보완되는 기능을 가지는 2 이상의 유전자를 이용하여 2 이상의 단백질이 융합된 형태로 발현되도록 하는 것일 수 있다.
예를 들어, 이러한 유전자 조작 또는 변형으로 서로 상이한 또는 서로 보완되는 기능을 가지는 2 이상의 유전자를 이용하여 2 이상의 단백질이 세포 내에서 각각 분리된 독립적인 형태로 발현되도록 하는 것일 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성을 촉진하거나 증가시킬 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성을 저해하거나 억제시킬 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성 환경을 유도하거나 활성화시킬 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성 억제환경을 유도하거나 신생혈관형성 환경을 비활성화시킬 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성을 조절(촉진, 증가, 저해 및/또는 억제 등)할 수 있다.
상기 조작된 신생혈관형성 관련 인자는 신생혈관형성 관련 질환의 개선 및 치료에 이용될 수 있다.
상기 조작은 신생혈관형성 관련 인자의 구조적 또는 기능적 변형을 모두 포함한다.
상기 신생혈관형성 관련 인자의 구조적 변형은 자연상태의 존재하는 야생형(wildtype)과 동일하지 않는 모든 변형을 포함한다.
예를 들면, 신생혈관형성 관련 인자가 DNA, RNA 또는 유전자인 경우,
상기 구조적 변형은 하나 이상의 뉴클레오타이드가 손실되는 것 일 수 있다.
상기 구조적 변형은 하나 이상의 뉴클레오타이드가 삽입되는 것일 수 있다.
이때, 삽입된 뉴클레오타이드는 신생혈관형성 관련 인자를 포함하는 대상 또는 대상 외부에서 유입된 뉴클레오타이드를 모두를 포함한다.
상기 구조적 변형은 하나 이상의 뉴클레오타이드가 치환되는 것일 수 있다.
상기 구조적 변형은 하나 이상의 뉴클레오타이드의 화학적 변형을 포함하는 것일 수 있다.
이때, 화학적 변형은 화학적 기능기(functional groups)의 추가, 제거 또는 치환 모두 포함한다.
또 다른 예로, 신생혈관형성 관련 인자가 펩타이드, 폴리펩타이드 또는 단백질인 경우,
상기 구조적 변형은 하나 이상의 아미노산이 손실되는 것일 수 있다.
상기 구조적 변형은 하나 이상의 아마노산이 삽입되는 것일 수 있다.
이때, 삽입된 아미노산은 신생혈관형성 관련 인자를 포함하는 대상 또는 대상 외부에서 유입된 아미노산을 모두를 포함한다.
상기 구조적 변형은 하나 이상의 아미노산이 치환되는 것일 수 있다.
상기 구조적 변형은 하나 이상의 아미노산의 화학적 변형을 포함하는 것일 수 있다.
이때, 화학적 변형은 화학적 기능기(functional groups)의 추가, 제거 또는 치환 모두 포함한다.
상기 구조적 변형은 다른 펩타이드, 폴리펩타이드 또는 단백질의 일부 또는 전체가 부착된 것일 수 있다.
이때, 다른 펩타이드, 폴리펩타이드 또는 단백질은 신생혈관형성 관련 인자일 수 있고, 또는 다른 기능을 하는 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 신생혈관형성 관련 인자의 기능적 변형은 자연상태의 존재하는 야생형(wildtype)에 비해 향상된 기능 또는 저하된 기능을 가지는 모든 변형을 포함하거나, 또는 제3의 다른 기능을 가지는 모든 변형을 포함한다.
예를 들면, 신생혈관형성 관련 인자가 펩타이드, 폴리펩타이드 또는 단백질인 경우,
상기 기능적 변형은 신생혈관형성 관련 인자의 돌연변이일 수 있다.
이때, 돌연변이는 신생혈관형성 관련 인자의 기능이 향상되거나, 또는 저해되는 돌연변이일 수 있다.
상기 기능적 변형은 신생혈관형성 관련 인자의 기능이 추가된 것 있다.
이때, 추가된 기능은 동일한 기능이거나 다른 기능일 수 있다. 또한, 기능이 추가된 신생혈관형성 관련 인자는 다른 펩타이드, 폴리펩타이드 또는 단백질과 융합된 것일 수 있다.
상기 기능적 변형은 신생혈관형성 관련 인자 발현 증가로 인한 기능 증가일 수 있다.
상기 기능적 변형은 신생혈관형성 관련 인자 발현 감소로 인한 기능 저하일 수 있다.
일 구체예로, 조작된 신생혈관형성 관련 인자는 다음 중 하나 이상에 의하여 유도된 것일 수 있다:
신생혈관형성 관련 인자, 즉, 조작 대상 유전자(이하, 표적 유전자)의 전부 또는 일부 결실, 예컨대, 표적 유전자의 1bp 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드의 결실,
표적 유전자의 1bp 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드의 야생형과 상이한 뉴클레오타이드로의 치환, 및
하나 이상의 뉴클레오타이드, 예컨대, 1 내지 30개, 1 내지 27개, 1 내지 25개, 1 내지 23개, 1 내지 20개, 1 내지 15개, 1 내지 10개, 1 내지 5개, 1 내지 3개, 또는 1개의 뉴클레오타이드 (각각 독립적으로 A, T, C 및 G 중에서 선택됨)의 표적 유전자의 임의의 위치에의 삽입.
상기 표적 유전자의 변형되는 일부('표적 부위')는 상기 유전자 중의 1bp 이상, 3bp 이상, 5bp 이상, 7bp 이상, 10bp 이상, 12bp 이상, 15bp 이상,17bp 이상, 20bp 이상, 예컨대, 1bp 내지 30bp, 3bp 내지 30bp, 5bp 내지 30bp,7bp 내지 30bp, 10bp 내지 30bp, 12bp 내지 30bp, 15bp 내지 30bp, 17bp 내지 30bp, 20bp 내지 30bp, 1bp 내지 27bp, 3bp 내지 27bp, 5bp 내지 27bp, 7bp 내지 27bp, 10bp 내지 27bp, 12bp 내지 27bp, 15bp 내지 27bp, 17bp 내지 27bp, 20bp 내지 27bp, 1bp 내지 25bp, 3bp 내지 25bp, 5bp 내지 25bp, 7bp 내지 25bp, 10bp 내지 25bp, 12bp 내지 25bp, 15bp 내지 25bp, 17bp 내지 25bp, 20bp 내지 25bp, 1bp 내지 23bp, 3bp 내지 23bp, 5bp 내지 23bp, 7bp 내지 23bp, 10bp 내지 23bp, 12bp 내지 23bp, 15bp 내지 23bp, 17bp 내지 23bp, 20bp 내지 23bp, 1bp 내지 20bp, 3bp 내지 20bp, 5bp 내지 20bp, 7bp 내지 20bp, 10bp 내지 20bp, 12bp 내지 20bp, 15bp 내지 20bp, 17bp 내지 20bp, 21bp 내지 25bp, 18bp 내지 22bp, 또는 21bp 내지 23bp의 연속하는 염기서열 부위일 수 있다.
한편, 본 발명의 다른 구현예는
상기 설명한 인위적으로 기능을 변형시킨 신생혈관형성 관련 인자들의 다양한 기능에 수반되는, 부가적인 제3의 체내 메커니즘의 조절 시스템에 관한 것이다.
일 구체예로서, VEGF의 제3의 체내 메커니즘의 조절에 관여할 수 있다.
VEGF에 의한 혈관 투과성(vascular permeability)의 증가는 종양 성장(tumor growth)과 더불어 부종(edema)의 원인이 될 수 있으므로, 인위적으로 조작된 VEGF는, 예를 들어, VEGF의 불활성화 조작으로 각종 종양(예를 들어, 뇌종양, 자궁암, vestibular Schwannomas 등)에서 생존율을 증가시키거나, 청력상실(hearing loss)를 회복시킬 수 있다. 또한 인위적으로 조작된 VEGF에 의한 혈관 투과성 감소는 신장부전증(renal failure), 관절염(arthritis) 건선(psoriasis), 관상동맥성 심장질환(coronary disease) 등 치료 효과를 제공할 수 있다.
또한, 인위적으로 조작된 VEGF는 자가면역 질환의 치료 효과를 제공할 수 있다. 예를 들어, VEGF에 의한 염증유도 활성을 인위적으로 조절함으로써, 포도막염(Uveitis), 류머티스성 관절염(rheumatoid arthritis), 전신 홍반성 루프스(systemic lupus erythematosus), 염증성 장 질환(inflammatory bowel disease), 건선(psoriasis), 전신성 경화증(systemic sclerosis), 다발성 경화증(multiple sclerosis) 등의 치료 효과를 제공할 수 있다.
또한, 인위적으로 조작된 VEGF는 정신질환의 치료 효과를 제공할 수 있다. 예를 들어, VEGF에 의한 신경전달관련인자의 발현을 인위적으로 조절함으로써, 우울증을 위한 치료 효과를 제공할 수 있다.
다른 구체예에서, HIF의 제3의 체내 메커니즘의 조절에 관여할 수 있다. 상기 HIF는 HIF1 또는 HIF2일 수 있다.
인위적으로 조작된 HIF는 염증유도 활성을 조절함으로써 포도막염(Uveitis), 류머티스성 관절염(rheumatoid arthritis), 전신 홍반성 루프스(systemic lupus erythematosus), 염증성 장 질환(inflammatory bowel disease), 건선(psoriasis), 전신성 경화증(systemic sclerosis), 다발성 경화증(multiple sclerosis) 등의 치료 효과를 제공할 수 있다.
또한, 인위적으로 조작된 HIF는 자가면역 질환의 치료 효과를 제공할 수 있다.
이처럼, 인위적으로 조작한 본 발명의 예시적 인자들은 신생혈관형성 기능뿐만 아니라, 체내의 제3의 기능을 표적화하여 해당 메커니즘을 조절할 수 있다. 본 발명의 일 구현예는 인위적으로 기능을 변형시킨 이러한 신생혈관형성 인자 및 이의 제조방법, 이들을 포함하는 조성물, 및 제3의 기능과 관련된 질환을 개선 또는 치료할 수 있는 이들의 치료적 용도 등을 포함한다.
[ 신생혈관형성 시스템 ]
신생혈관형성 조절 시스템
본 발명의 일 양태는 신생혈관형성 관련 인자를 인위적으로 조작하여 신생혈관형성을 조절하는 신생혈관형성조절 시스템이다.
본 발명의 "신생혈관형성 조절 시스템(system)"은 인위적으로 조작된 신생혈관형성 관련 인자의 기능변경에 의해 신생혈관형성 촉진, 증가, 저해 및/또는 억제에 영향을 끼치는 모든 현상을 포함하는 용어로, 이러한 신생혈관형성 조절 시스템에 직접적으로 또는 간접적으로 관여하는 모든 물질, 조성물, 방법 및 용도를 포함한다.
이러한 신생혈관형성 조절 시스템을 구성하는 각 요소들을 통칭하여 "신생혈관형성 조절 요소(neovascularization controlling factor)"로 말하기도 한다.
본 발명의 시스템은 인위적으로 조작된 신생혈관형성 관련 인자가 관련되는, 변형된 체내 메커니즘을 포함한다. 인위적으로 조작된 신생혈관형성 관련 인자에 의해서,
임의의 구체예에서, CD34, CD117, CD133 등과 같은 조혈모세포 표면 항원과 Flk-1/KDR, Tie-2 등과 같은 혈관내피세포 항원의 발현이 조절될 수 있다.
임의의 구체예에서, 혈관을 구성하는 세포가 발아(sprouting)되고 증식하여 새로운 맥관(vessel)을 형성하는 혈관신생(Angiogenesis)이 조절될 수 있다.
임의의 구체예에서, 내피세포를 직접 자극하는 직접혈관신생인자(direct angiogenic factor : DAF)의 활성이 조절될 수 있다. 내피세포의 증식 및/또는 이동을 촉진 또는 억제시킬 수 있다.
예를 들어, 직접혈관신생인자는 VEGF(vascular endothelial growth factor), bFGF (basic fibroblast growth factor), HGF (hepatocyte growth Factor), EGF (epidermal growth factor), PD-ECGF(thymidine phosphorylase), PlGF (placental growth factor), TGF (transforming growth factor), proliferin(프롤리페린), interleukin-8(사이토카인의 인터루킨-8), angiogenin(혈관신생 유도단백질), fibrin(피브린), nicotinamide(니코틴산아미드 : 비타민B 복합체), angiopoietin(안지오포이에틴: 혈관신생 촉진단백질), PAF (platelet activating factor : 혈소판촉진인자), 12-HETE(12-hydroxy eicosatetraenoate : 아리키돈산의 독성 분해물. 상피세포의 혈관신생을 촉진인자), MMPs(기질분해 단백질효소), S1P (sphingosine 1-phosphate), leptin(렙틴)을 포함할 수 있다.
임의의 구체예에서, 혈관 세포에서 작동하는 두 가지 상이한 세포간 통신 신호전달 경로, 즉 PDGF 및 VEGF 신호전달 경로를 이용할 수 있다.
임의의 구체예에서, 혈관주위세포를 자극하여 DAF의 생성을 통하여 혈관신생을 유발하는 간접혈관신생인자(indirect angiogenic factor : IAF)의 활성이 조절될 수 있다.
임의의 구체예에서, 혈관 내피전구세포(endothelial progenitor cell, EPC)로부터 혈관내피세포(vascular endothelial cell)가 분화되어 혈관 망상구조(primary vascular plexus)를 형성하는 메커니즘이 조절될 수 있다.
임의의 구체예에서, 내피세포의 이동을 위한 세포외기질 성분의 분해능을 조절될 수 있다.
임의의 구체예에서, 세포이동관련 신호전달경로가 조절될 수 있다.
임의의 구체예에서, 혈관내피성장인자의 수용체 VEGFR-1 (flt-1; fmslike-tyrosine kinase-1), VEGFR-2 (flk-1/KDR), VEGFR-3, PDGF(platelet derived growth factor)수용체, NP-1 (neuropilin-1)의 활성이 조절될 수 있다.
구현예에서, 상기 시스템은 본 발명의 신생혈관형성 조절 시스템은 신생혈관형성 관련 인자 조작용 조성물을 포함한다.
상기 조작용 조성물은 인위적으로 신생혈관형성 관련 인자를 조작할 수 있는 조성물로, 바람직하게는 유전자 조작을 위한 조성물일 수 있다.
이하, 상기 유전자 조작을 위한 조성물에 대해 기술한다.
[ 신생혈관형성 관련 인자 조작용 조성물 ]
본 발명의 신생혈관형성 관련 인자 및 신생혈관형성 시스템에 관여하는 물질의 조작 또는 변형은, 바람직하게는 유전적 조작을 통해 이루어질 수 있다.
일 양태에서, 신생혈관형성 관련 인자의 비 암호 또는 암호 영역의 일부 또는 전부를 타겟팅하여 유전자 조작하는 조성물 및 방법을 제공할 수 있다.
상기 조성물 및 방법은
구현예에서, 목적하는 신생혈관형성 시스템의 형성을 위해, 이에 관여하는 신생혈관형성 조절 유전자 중 하나 이상을 조작하거나 변형시킬 수 있다. 이는 유전자를 구성하는 핵산의 변형을 통해 이루어질 수 있다. 조작 결과로서, 넉다운(knock down), 넉아웃(knock out), 넉인(knock in) 형태를 모두 포함한다.
구현예에서, 프로모터 영역, 또는 전사 서열, 예를 들어 인트론 또는 엑손 서열을 타겟으로 할 수 있다. 암호 서열, 예를 들어 암호 영역, 초기 암호 영역은 발현의 변경 및 넉아웃을 위해 표적화될 수 있다.
구현예에서, 핵산 변형은 하나 이상의 뉴클레오타이드, 예컨대, 1 내지 30bp, 1 내지 27bp, 1 내지 25bp, 1 내지 23bp, 1 내지 20bp, 1 내지 15bp, 1 내지 10bp, 1 내지 5bp, 1 내지 3bp, 또는 1bp의 뉴클레오타이드의 치환, 결실, 및/또는 삽입일 수 있다.
구현예에서, 신생혈관형성 관련 유전자 중 하나 이상을 넉아웃하기 위해, 또는 하나 이상의 발현을 제거하기 위해, 또는 하나 이상의 1 개 또는 2 개의 대립유전자를 넉아웃하기 위해, 신생혈관형성 관련 유전자 중 하나 이상에서의 결실 또는 돌연변이를 포함하도록 표적화될 수 있다.
구현예에서, 유전자 넉다운은 원치않는 대립유전자 또는 전사체의 발현을 감소시키기 위해 사용될 수 있다.
구현예에서, 프로모터, 인핸서, 인트론, 3'UTR, 및/또는 폴리아데닐화 신호의 비 암호 서열을 표적화함으로써 신생혈관형성 기능에 영향을 미치는 신생혈관형성 관련 유전자를 변경하기 위해 사용될 수 있다.
구현예에서, 상기 유전자 핵산 변경을 통해 신생혈관형성 관련 유전자의 활성 조절, 예컨대, 활성화 또는 불활성화를 야기할 수 있다.
구현예에서, 상기 유전자 핵산 변형은 가이드핵산-에디터단백질 복합체에 의하여 타겟된 유전자 내의 특정 부위의 단일가닥 또는 이중가닥 절단(cleavage), 즉 핵산 가닥 손상을 촉매화하여 타겟된 유전자를 불활성화시키는 것일 수 있다.
구현예에서, 핵산 가닥 손상(breaks)은 상동(homologous) 재조합(recombination) 또는 비상동 말단 연결 (nonhomologous end joining; NHEJ) 등의 메커니즘들을 통하여 수선될 수 있다.
이 경우, NHEJ 메커니즘이 일어나면, 절단 위치(cleavage site)에서 DNA 서열에 변화가 유발되고, 이에 의하여 유전자가 불활성화될 수 있다. NHEJ을 통한 수선은 짧은 유전자 단편의 치환들, 삽입들 또는 결실을 야기하고, 해당 유전자 넉아웃(knockouts)의 유도에 사용될 수 있다.
다른 양태에서, 본 발명은 신생혈관형성 관련 인자 조작용 조성물을 제공한다.
상기 조작용 조성물은 인위적으로 신생혈관형성 관련 인자를 조작할 수 있는 조성물로, 바람직하게는 유전자 조작을 위한 조성물일 수 있다.
상기 조성물은 목적하는 신생혈관형성 조절 시스템의 형성을 위해, 이에 관여하는 신생혈관형성 관련 인자 중 하나 이상을 유전자 조작할 수 있다.
상기 유전자 조작은 유전자 발현 조절 과정을 고려하여 이루어질 수 있다.
구현예에서, 전사조절, RNA 가공 조절, RNA 수송 조절, RNA 분해 조절, 번역 조절 또는 단백질 변형 조절 단계에서 각 단계에 적합한 조작수단을 선택하여 이루어질 수 있다.
구현예에서, RNAi (RNA 간섭 or RNA silencing)을 이용하여, small RNA(sRNA)가 mRNA를 방해하거나 안정성을 저하시키며, 경우에 따라서는 파괴하여 단백질 합성정보가 중간에서 전달되지 못하게 함으로써 유전정보의 발현을 제어할 수 있다.
상기 유전자 조작은 신생혈관형성 관련 인자를 구성하는 핵산의 변형을 통해 이루어질 수 있다. 조작 결과로, 넉다운(knock down), 넉아웃(knockout), 넉인(knockin) 형태를 모두 포함한다.
임의의 구체예에서, 핵산 변형은 하나 이상의 뉴클레오타이드, 예컨대, 1 내지 30bp, 1 내지 27bp, 1 내지 25bp, 1 내지 23bp, 1 내지 20bp, 1 내지 15bp, 1 내지 10bp, 1 내지 5bp, 1 내지 3bp, 또는 1bp의 뉴클레오타이드의 치환, 결실, 및/또는 삽입일 수 있다.
임의의 구체예에서, 신생혈관형성 관련 인자 중 하나 이상을 넉아웃하기 위해, 또는 하나 이상의 발현을 제거하기 위해, 또는 하나 이상의 1 개 또는 2 개의 대립유전자를 넉아웃하기 위해, 신생혈관형성 관련 인자 중 하나 이상에서의 결실 또는 돌연변이를 포함하도록 조작할 수 있다.
임의의 구체예에서, 신생혈관형성 관련 인자의 넉다운은 원치 않는 대립유전자 또는 전사체의 발현을 감소시키기 위해 사용될 수 있다.
임의의 구체예에서, 핵산 변형은 하나 이상의 핵산 절편(fragmant) 또는 유전자의 삽입일 수 있다. 이때, 핵산 절편은 하나 이상의 뉴클레오타이드로 이루어진 핵산 서열로, 핵산 절편의 길이는 1 내지 40bp, 1 내지 50bp, 1 내지 60bp, 1 내지 70bp, 1 내지 80bp, 1 내지 90bp, 1 내지 100bp, 1 내지 500bp 또는 1 내지 1000bp일 수 있다. 이때, 삽입되는 유전자는 신생혈관형성 관련 인자 중 하나이거나, 다른 기능을 하는 유전자일 수 있다.
구현예에서, 핵산 변형은 DNA 또는 RNA 분자, 바람직하게는 DNA 분자 내 핵산들 사이의 결합들(bonds)의 가수분해(절단(cleavage))을 촉매화할 수 있는 야생형 또는 변종(variant) 효소를 이용할 수 있다. 가이드핵산-에디터단백질 복합체를 이용할 수 있다.
예를 들어, 메가뉴클레아제(meganuclease), 징크핑거(Zinc finger) 뉴클레아제, CRISPR/Cas9(Cas9 단백질), CRISPR-Cpf1(Cpf1 단백질) 및 TALE-뉴클레아제로 이루어진 군에서 선택된 하나 이상의 뉴클레아제를 이용하여 유전자를 조작하여 유전정보의 발현을 제어할 수 있다.
임의의 구체예에서, 비제한적으로, 가이드핵산-에디터단백질 복합체를 이용하여, 예를 들어, CRISPR/Cas 시스템을 사용하여 비-상동성 말단 결합(nonhomologous end joining:NHEJ) 또는 상동성 재조합 복구(homology-directed repair:HDR)에 의해 매개될 수 있다.
이 경우, NHEJ 메커니즘이 일어나면, 절단 위치(cleavage site)에서 DNA 서열에 변화가 유발되고, 이에 의하여 유전자가 불활성화될 수 있다. NHEJ을 통한 수선은 짧은 유전자 단편의 치환들, 삽입들 또는 결실을 야기하고, 해당 유전자 넉아웃(knockout)의 유도에 사용될 수 있다.
다른 양태에서, 본 발명은 상기 유전자 조작 위치를 제공할 수 있다.
구현예에서, NHEJ-매개 변경에 의해 변경된다면, 신생혈관형성 조절 유전자 산물의 발현의 감소 또는 제거를 야기하는, 상기 유전자 내의 위치를 지칭한다.
예를 들어,
초기 암호 영역에 있을 수 있다.
프로모터 서열에 있을 수 있다.
인핸서 서열에 있을 수 있다.
특정 인트론 서열에 있을 수 있다
특정 엑손 서열에 있을 수 있다.
일 구체예로서, 신생혈관형성 관련 인자 조작용 조성물은
그 조작 대상으로서, 신생혈관형성 조절에 영향을 미치는 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자를 대상으로 할 수 있다.
상기 유전자들의 표적 부위, 즉, 유전자 조작이 발생하거나 유전자 조작을 위해 인지되는 부위에 대한 표적 서열의 일 예들을 표 1, 표 2, 표 3, 표 4, 표 5에 정리하였다.
표적 서열은 하나 이상의 유전자를 표적할 수 있다.
표적 서열은 둘 이상의 유전자를 동시에 표적할 수 있다. 이때, 둘 이상의 유전자는 동종 유전자이거나 이종 유전자 일 수 있다.
유전자는 하나 이상의 표적 서열을 포함할 수 있다.
유전자는 둘 이상의 표적 서열로 동시에 표적할 수 있다.
유전자는 표적 서열의 개 수에 따라 유전자 조작 위치와 수가 변할 수 있다.
유전자 조작은 표적 서열의 개수와 위치에 따라 다양하게 설계할 수 있다.
유전자 조작은 둘 이상의 표적 서열에서 동시에 발생할 수 있다. 이때, 둘 이상의 표적 서열은 동종 유전자 또는 이종 유전자 내에 존재할 수 있다.
유전자 조작은 둘 이상의 유전자를 동시에 발생할 수 있다. 이때, 둘 이상의 유전자는 동종 유전자이거나 이종 유전자 일 수 있다.
이하, 본 발명의 일 구체예에서 사용할 수 있는 표적 서열들의 일 예들을 표로 나타낸다:
표 1 VEGFA 유전자의 표적 서열(Target sequences of VEGFA gene)
표 2 HIF1A 유전자의 표적 서열(Target sequences of HIF1A gene)
표 3 ANGPT2 유전자의 표적 서열(Target sequences of ANGPT2 gene)
표 4 EPAS1 유전자의 표적 서열(Target sequences of EPAS1 gene)
표 5 ANGPTL4 유전자의 표적 서열(Target sequences of ANGPTL4 gene).
Gene No. Target sequence
VEGFA 1 GTAGAGCAGCAAGGCAAGGCTC (서열번호 1)
VEGFA 2 CTTTCTGTCCTCAGTGGTCCCA (서열번호 2)
VEGFA 3 GAGACCCTGGTGGACATCTTCC (서열번호 3)
VEGFA 4 TTCCAGGAGTACCCTGATGAGA (서열번호 4)
VEGFA 5 TTGAAGATGTACTCGATCTCAT (서열번호 5)
VEGFA 6 AGGGGCACACAGGATGGCTTGA (서열번호 6)
VEGFA 7 AGCAGCCCCCGCATCGCATCAG (서열번호 7)
VEGFA 8 GCAGCAGCCCCCGCATCGCATC (서열번호 8)
VEGFA 9 GTGATGTTGGACTCCTCAGTGG (서열번호 9)
VEGFA 10 TGGTGATGTTGGACTCCTCAGT (서열번호 10)
VEGFA 11 CATGGTGATGTTGGACTCCTCA (서열번호 11)
VEGFA 12 ATGCGGATCAAACCTCACCAAG (서열번호 12)
VEGFA 13 CACATAGGAGAGATGAGCTTCC (서열번호 13)
Gene No. Target sequence
HIF1A 1 ACTCACCAGCATCCAGAAGTTT (서열번호 14)
HIF1A 2 ATTTGGATATTGAAGATGACAT (서열번호 15)
HIF1A 3 ATTTACATTTCTGATAATGTGA (서열번호 16)
HIF1A 4 ATGTGTTTACAGTTTGAACTAA (서열번호 17)
HIF1A 5 CTGTGTCCAGTTAGTTCAAACT (서열번호 18)
HIF1A 6 ATGGTCACATGGATGAGTAAAA (서열번호 19)
HIF1A 7 CATGAGGAAATGAGAGAAATGC (서열번호 20)
HIF1A 8 CCCAGTGAGAAAAGGGAAAGAA (서열번호 21)
HIF1A 9 TTGTGAAAAAGGGTAAAGAACA (서열번호 22)
HIF1A 10 ATAGTTCTTCCTCGGCTAGTTA (서열번호 23)
HIF1A 11 TCATAGTTCTTCCTCGGCTAGT (서열번호 24)
HIF1A 12 TGTTCTTCATACACAGGTATTG (서열번호 25)
HIF1A 13 TACGTGAATGTGGCCTGTGCAG (서열번호 26)
HIF1A 14 CTGCACAGGCCACATTCACGTA (서열번호 27)
HIF1A 15 CTGAGGTTGGTTACTGTTGGTA (서열번호 28)
HIF1A 16 CAGGTCATAGGTGGTTTCTTAT (서열번호 29)
HIF1A 17 ACCAAGCAGGTCATAGGTGGTT (서열번호 30)
HIF1A 18 TTAGATAGCAAGACTTTCCTCA (서열번호 31)
Gene No. Target sequence
ANGPT2 1 TCAGGTCCAGCATGGGTCCTGC (서열번호 32)
ANGPT2 2 CGGCGCGTCCCTCTGCACAGCA (서열번호 33)
ANGPT2 3 GCTGTGCAGAGGGACGCGCCGC (서열번호 34)
ANGPT2 4 ATCGTATTCGAGCGGCGCGTCC (서열번호 35)
ANGPT2 5 GATGTTCTCCAGCACTTGCAGC (서열번호 36)
ANGPT2 6 AGTGCTGGAGAACATCATGGAA (서열번호 37)
ANGPT2 7 ACAACATGAAGAAAGAAATGGT (서열번호 38)
ANGPT2 8 AAATGGTAGAGATACAGCAGAA (서열번호 39)
ANGPT2 9 TTCTATCATCACAGCCGTCTGG (서열번호 40)
ANGPT2 10 AAGTTCAAGTCTCGTGGTCTGA (서열번호 41)
ANGPT2 11 ACGAGACTTGAACTTCAGCTCT (서열번호 42)
ANGPT2 12 AAGAAGGTGCTAGCTATGGAAG (서열번호 43)
ANGPT2 13 GATGATGTGCTTGTCTTCCATA (서열번호 44)
Gene No. Target sequence
EPAS1 1 AACACCTCCGTCTCCTTGCTCC (서열번호 45)
EPAS1 2 GAAGCTGACCAGCAGATGGACA (서열번호 46)
EPAS1 3 GCAATGAAACCCTCCAAGGCTT (서열번호 47)
EPAS1 4 AAAACATCAGCAAGTTCATGGG (서열번호 48)
EPAS1 5 GCAAGTTCATGGGACTTACACA (서열번호 49)
EPAS1 6 GGTCGCAGGGATGAGTGAAGTC (서열번호 50)
EPAS1 7 GCGGGACTTCTTCATGAGGATG (서열번호 51)
EPAS1 8 GAAGTGCACGGTCACCAACAGA (서열번호 52)
EPAS1 9 ACAGTACGGCCTCTGTTGGTGA (서열번호 53)
EPAS1 10 TCCAGGTGGCTGACTTGAGGTT (서열번호 54)
EPAS1 11 CAGGACAGCAGGGGCTCCTTGT (서열번호 55)
EPAS1 12 TAGCCCCCATGCTTTGCGAGCA (서열번호 56)
Gene No. Target sequence
ANGPTL4 1 GCATCAGGGCTGCCCCGGCCGT (서열번호 57)
ANGPTL4 2 CACGGGTCCGCCCTGAGCGCTC (서열번호 58)
ANGPTL4 3 GGACGCAAAGCGCGGCGACTTG (서열번호 59)
ANGPTL4 4 TCCTGGGACGAGATGAATGTCC (서열번호 60)
ANGPTL4 5 CTGCAGCTCGGCCAGGGGCTGC (서열번호 61)
ANGPTL4 6 CCAGGGGCTGCGCGAACACGCG (서열번호 62)
ANGPTL4 7 CCCTCGGTTCCCTGACAGGCGG (서열번호 63)
ANGPTL4 8 ACCCTGAGGTCCTTCACAGCCT (서열번호 64)
ANGPTL4 9 TTCCACAAGGTGGCCCAGCAGC (서열번호 65)
ANGPTL4 10 CAGCAGCAGCGGCACCTGGAGA (서열번호 66)
ANGPTL4 11 TCCTAGTTTGGCCTCCTGGACC (서열번호 67)
ANGPTL4 12 GACCCGGCTCACAATGTCAGCC (서열번호 68)
ANGPTL4 13 GCTGTTGCGGTCCCCCGTGATG (서열번호 69)
ANGPTL4 14 GGCGTTGCCATCCCAGTCCCGC (서열번호 70)
ANGPTL4 15 AACGCCGAGTTGCTGCAGTTCT (서열번호 71)
ANGPTL4 16 ATAGGCCGTGTCCTCGCCACCC (서열번호 72)
ANGPTL4 17 GTTCTCCGTGCACCTGGGTGGC (서열번호 73)
ANGPTL4 18 ACACGGCCTATAGCCTGCAGCT (서열번호 74)
ANGPTL4 19 CCACCGTCCCACCCAGCGGCCT (서열번호 75)
ANGPTL4 20 GTGATCCTGGTCCCAAGTGGAG (서열번호 76)
ANGPTL4 21 GACCCCGGCAGGAGGCTGGTGG (서열번호 77)
ANGPTL4 22 TGCAGCCATTCCAACCTCAACG (서열번호 78)
ANGPTL4 23 TGCCGCTGCTGTGGGATGGAGC (서열번호 79)
조작용 조성물-유전자 가위 시스템
본 발명의 신생혈관형성 조절 시스템은 신생혈관형성 관련 인자 조작용 조성물로서, 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
가이드핵산 - 에디터단백질 복합체
"가이드핵산-에디터단백질 복합체"는 가이드핵산과 에디터단백질의 상호작용을 통해 형성된 복합체를 의미하며, 핵산-단백질 복합체는 가이드핵산과 에디터단백질을 포함한다.
상기 "가이드핵산"은 표적 핵산, 유전자, 염색체 또는 단백질을 인식할 수 있는 핵산을 의미한다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리 도메인 등 일 수 있으며, 이에 제한되지 않는다.
상기 가이드핵산은 두 개 이상의 도메인을 포함할 수 있으며, 이때, 동일한 도메인을 반복적으로 포함하거나, 서로 다른 도메인을 포함할 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 "에디터단백질"은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.
상기 에디터단백질은 효소일 수 있다.
상기 에디터단백질은 융합 단백질일 수 있다.
이때, 상기 "융합 단백질"은 효소 및 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 "효소"는 핵산, 유전자, 염색체 또는 단백질을 절단할 수 있는 도메인을 포함하는 단백질을 의미한다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소와 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다.
상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 최종적으로 대상하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 할 수 있도록 하거나, 또는 단백질을 제거 또는 새로운 단백질을 발현할 수 있도록 한다.
이때, 상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 단백질 수준에서 작용할 수 있다.
1. 가이드핵산
가이드핵산은 표적 핵산, 유전자, 염색체 또는 단백질을 인식할 수 있는 핵산으로, 가이드핵산-단백질 복합체를 형성한다.
이때, 가이드핵산은 가이드핵산-단백질 복합체가 표적하는 핵산, 유전자, 염색체 또는 단백질을 인식 또는 표적하도록 역할한다.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태일 수 있고, 5 내지 150개의 핵산서열을 가질 수 있다.
상기 가이드핵산은 선형 또는 원형일 수 있다.
상기 가이드핵산은 하나의 연속된 핵산서열일 수 있다.
예를 들어, 하나의 연속된 핵산 서열은 (N)m 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m은 1 내지 150의 정수를 의미한다.
상기 가이드핵산은 연속된 핵산서열이 두 개 이상일 수 있다.
예를 들어, 두 개 이상의 연속된 핵산서열은 (N)m과 (N)o 일 수 있고, 이때 N은 A, T, C 또는 G, 또는 A, U, C 또는 G이며, m 및 o는 1 내지 150의 정수를 의미하며, m과 o는 서로 같거나 다를 수 있다.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.
이때, 상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리 도메인 등 일 수 있으며, 이에 제한되지 않는다.
상기 가이드핵산은 두 개 이상의 도메인을 포함할 수 있으며, 이때, 동일한 도메인을 반복적으로 포함하거나, 서로 다른 도메인을 포함할 수 있다.
상기 도메인에 대한 설명은 하단에 기술한다.
i) 가이드 도메인
"가이드 도메인"은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열이 포함된 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위해 역할한다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있다.
일 예로, 상기 가이드 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지 50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 가이드 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열일 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 서열은 5 내지 50개의 염기서열일 수 있다.
일 예로, 상기 가이드 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지 50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 가이드 서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
또한, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
상기 추가 염기서열은 가이드 도메인의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 염기서열은 가이드 서열의 기능 향상 또는 저하를 위한 것일 수 있다.
상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다.
일 예로, 상기 추가 염기서열은 5 내지 35개의 염기서열, 10 내지 35개의 염기서열, 15 내지 35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
다른 일 예로, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 5' 말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 3' 말단에 위치할 수 있다.
ii) 제 1 상보적 도메인
"제 1 상보적 도메인"은 제 2 상보적 도메인과 상보적 핵산서열을 포함하는 핵산 서열로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
상기 제 1 상보적 도메인은 5 내지 35개의 염기서열일 수 있다.
일 예로, 제 1 상보적 도메인은 5 내지 35개의 염기서열, 10 내지 35개의 염기서열, 15 내지 35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
다른 일 예로서, 상기 제 1 상보적 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
iii) 연결 도메인
"연결 도메인"은 두 개 이상의 도메인을 연결하는 핵산 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열일 수 있다.
일 예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
다른 일 예로서, 상기 연결 도메인은 1 내지 30개의 염기서열, 5 내지 30개의 염기서열, 10 내지 30개의 염기서열, 15 내지 30개의 염기서열, 20 내지 30개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
iv) 제 2 상보적 도메인
"제 2 상보적 도메인"은 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 핵산서열로, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
상기 제 2 상보적 도메인은 5 내지 35개의 염기서열일 수 있다.
일 예로, 상기 제 2 상보적 도메인은 1 내지 35개의 염기서열, 5 내지 35개의 염기서열, 10 내지 35개의 염기서열, 15 내지 35개의 염기서열, 20 내지 35개의 염기서열, 25 내지 35개의 염기서열 또는 30 내지 35 염기서열일 수 있다.
다른 일 예로, 상기 제 2 상보적 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열 또는 30 내지 35개의 염기서열일 수 있다.
v) 근위 도메인(proximal domain)
"근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 핵산서열이다.
근위 도메인은 근위 도메인 내의 상보적인 염기서열을 포함할 수 있으며, 상보적인 염기서열에 의해 이중가닥을 형성할 수 있다.
상기 근위 도메인은 1 내지 20개의 염기서열일 수 있다.
일 예로서, 상기 근위 도메인은 1 내지 20개의 염기서열, 5 내지 20개의 염기서열, 10 내지 20개의 염기서열 또는 15 내지 20개의 염기서열일 수 있다.
다른 일 예로서, 상기 근위 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열 또는 15 내지 20개의 염기서열일 수 있다.
vi) 꼬리 도메인
"꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 핵산서열이다.
꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열을 포함할 수 있으며, 상보적인 염기서열에 의해 이중가닥을 형성할 수 있다.
상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있다.
일 예로, 상기 꼬리 도메인은 5 내지 50개의 염기서열, 10 내지 50개의 염기서열, 15 내지 50개의 염기서열, 20 내지 50개의 염기서열, 25 내지 50개의 염기서열, 30 내지 50개의 염기서열, 35 내지 50개의 염기서열, 40 내지 50개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
다른 일 예로, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
한편, 상기 도메인들, 즉, 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인 및 꼬리 도메인이 포함하는 핵산 서열의 일부 또는 전부는 선택적 또는 추가적으로 화학적 변형을 포함할 수 있다.
상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
가이드핵산은 하나 이상의 도메인을 포함한다.
상기 가이드핵산은 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 꼬리 도메인을 포함할 수 있다.
이때, 상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상일 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 1 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 연결 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 제 2 상보적 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 근위 도메인을 포함할 수 있다.
상기 가이드핵산은 1, 2, 3, 4, 5, 6 또는 그 이상의 꼬리 도메인을 포함할 수 있다.
이때, 상기 가이드핵산은 하나의 도메인이 중복되어 포함될 수 있다.
상기 가이드핵산은 여러 도메인을 중복 또는 중복시키지 않고 포함할 수 있다.
상기 가이드핵산은 같은 종류의 도메인을 포함할 수 있으며, 이때, 같은 종류의 도메인은 동일한 핵산서열을 가지거나 또는 서로 다른 핵산서열을 가질 수 있다.
상기 가이드핵산은 두 종류의 도메인을 포함할 수 있으며, 이때, 다른 두 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 세 종류의 도메인을 포함할 수 있으며, 이때, 다른 세 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 네 종류의 도메인을 포함할 수 있으며, 이때, 다른 네 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 다섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 다섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
상기 가이드핵산은 여섯 종류의 도메인을 포함할 수 있으며, 이때, 다른 여섯 종류의 도메인은 서로 다른 핵산서열을 가지거나 또는 동일한 핵산서열을 가질 수 있다.
예를 들면, 가이드핵산은 [가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[연결 도메인]-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]으로 구성될 수 있으며, 이때, 두 개의 가이드 도메인은 서로 다른 또는 동일한 표적을 위한 가이드 서열을 포함할 수 있으며, 상기 두 개의 제 1 상보적 도메인과 두 개의 제 2 상보적 도메인 동일한 핵산서열을 가지거나 다른 핵산서열을 가질 수 있다. 가이드 도메인이 서로 다른 표적을 위한 가이드 서열을 포함하는 경우, 상기 가이드핵산은 두 개의 표적에 특이적으로 결합할 수 있으며, 이때, 특이적 결합을 동시에 일어나거나 순차적으로 일어날 수 있다. 또한, 상기 연결 도메인은 특정 효소에 의해 절단될 수 있으며, 특정 효소의 존재 하에서 상기 가이드핵산은 두 부분 또는 세 부분으로 나누어질 수 있다.
본 발명의 가이드핵산의 일 구체예로서, gRNA에 대해 하단에 기술하였다.
gRNA
"gRNA"는 표적 유전자 또는 핵산에 대한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체의 특이적 표적화할 수 있는 핵산을 지칭한다. 또한, 상기 gRNA는 표적 유전자 또는 핵산 특이적 RNA를 의미하며, CRISPR 효소과 결합하여 CRISPR 효소를 표적 유전자 또는 핵산으로 인도할 수 있다.
상기 gRNA는 다수의 도메인을 포함할 수 있다. 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥 내 또는 가닥 간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
일 구체예에서, 단일가닥 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 연결 도메인; 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인; 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함할 수 있다.
다른 일 구체예로서, 이중 gRNA는 5'으로부터 3' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인 및 제 1 상보적 도메인을 포함하는 제 1가닥; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인, 근위 도메인(proximal domain); 및 선택적으로 꼬리 도메인을 포함하는 제 2 가닥을 포함할 수 있다.
이때, 상기 제 1가닥은 crRNA라고 지칭될 수 있고, 상기 제 2가닥은 tracrRNA로 지칭될 수 있다. 상기 crRNA는 가이드 도메인과 제 1 상보적 도메인을 포함할 수 있으며, 상기 tracrRNA는 제 2 상보적 도메인, 근위 도메인 및 선택적으로 꼬리 도메인을 포함할 수 있다.
또 다른 일 구체예로서, 단일가닥 gRNA는 3'으로부터 5' 방향으로 가이드 도메인, 즉 표적 유전자 또는 핵산에 상보적인 결합을 할 수 있는 가이드 서열(guide sequence)를 포함하는 도메인; 제 1 상보적 도메인; 및 제 2 상보적 도메인, 상기 제 1 상보적 도메인 서열에 상보적인 서열을 가지므로 제 1 상보적 도메인과 이중가닥 핵산을 형성할 수 있는 도메인을 포함할 수 있다.
i) 가이드 도메인
상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있다.
구현예로서, 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
구현예로서, 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
이때, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열일 수 있다.
상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
일 구체예로서, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
상기 가이드 서열은 5 내지 50개의 염기서열일 수 있다.
구현예로서, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
구현예로서, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
일 구체예로서, 가이드 서열은 VEGFA 유전자의 표적 서열에 상보적인 핵산서열로, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 HIF1A 유전자의 표적 서열에 상보적인 핵산서열로, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 ANGPT2 유전자의 표적 서열에 상보적인 핵산서열로, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 EPAS1 유전자의 표적 서열에 상보적인 핵산서열로, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 ANGPTL4 유전자의 표적 서열에 상보적인 핵산서열로, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
이때, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열은 앞서 각각 표 1, 표 2, 표 3, 표 4, 표 5에 기재하였으나, 이에 제한하지 않는다.
이때, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
예를 들어, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 5'말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 서열의 3'말단에 위치할 수 있다.
선택적으로 상기 가이드 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
ii) 제 1 상보적 도메인
제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열일 수 있다. 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGAGCUA(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-GUUUUAGUCCCUUUUUAAAUUUCUU(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 5 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인인 경우, 상기 제 1 상보적 도메인은 5'-UUUGUAGAU-3'일 수 있고, 또는 5'-UUUGUAGAU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 제 1 상보적 도메인은 추가로 (X)n을 포함, 즉, 5'-(X)nUUUGUAGAU-3' 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 5의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
선택적으로 상기 제 1 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
iii) 연결 도메인
연결 도메인은 두 개 이상의 도메인을 연결하는 핵산 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결한다. 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열일 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있다.
상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열일 수 있다. 상기 연결 도메인은 1 내지 30개의 염기서열을 포함할 수 있다.
구현예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있다.
구현예로서, 상기 연결 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열을 포함할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다. 상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
상기 연결 도메인은 자연유래 서열, 예를 들어 tracrRNA의 일부 서열과 상동성을 같거나, 또는 이로부터 유래될 수 있다.
선택적으로 상기 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
iv) 제 2 상보적 도메인
제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열일 수 있다. 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열을 포함할 수 있다.
구현예로서, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
구현예로서, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열을 포함할 수 있다.
또한, 상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래 될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50 %이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n UAGCAAGUUAAAAU(X)m-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 염기서열의 개수로, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU -3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)n AAGAAAUUUAAAAAGGGACUAAAAU(X)m-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 1 내지 15의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
다른 일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50%이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인인 경우, 상기 제 2 상보적 도메인은 5'-AAAUUUCUACU-3' 일 수 있고, 또는 5'-AAAUUUCUACU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다(밑줄 표시는 제 1 상보적 도메인과 이중가닥을 형성하는 염기서열). 이때, 상기 제 2 상보적 도메인은 추가로 (X)n 또는/및 (X)m을 포함, 즉, 5'-(X)nAAAUUUCUACU (X)m-3' 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n 및 m은 염기서열의 개수로, 상기 n은 1 내지 10의 정수일 수 있고, 상기 m은 1 내지 6일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다. 또한 (X)m은 동일한 염기서열의 정수 m개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 m개의 염기서열일 수 있다.
선택적으로 상기 제 2 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
v) 근위 도메인(proximal domain)
근위 도메인은 제 2 상보적 도메인에 근접하게 위치하는 1 내지 20개의 염기서열로, 제 2 상보적 도메인의 3' 방향에 위치하는 도메인이다. 이때, 상기 근위 도메인은 근위 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
일 구체예로서, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열일 수 있다.
다른 구체예로서, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열을 포함할 수 있다.
또한, 상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래 될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAGGCUAGUCCG(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인인 경우, 상기 근위 도메인은 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 근위 도메인은 추가로 (X)n을 포함, 즉, 5'-AAAGAGUUUGC(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 40의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
선택적으로 상기 근위 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
vi) 꼬리 도메인
꼬리 도메인은 단일가닥 gRNA 또는 이중 gRNA의 3' 말단에 선택적으로 추가될 수 있는 도메인으로, 상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있으며, 또는 상기 꼬리 도메인은 1 내지 50개의 염기서열을 포함할 수 있다. 이때, 상기 꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열간의 이중가닥 결합을 형성할 수 있다.
구현예로서, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있다.
구현예로서, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열을 포함할 수 있다.
또한, 상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래 될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
또 다른 예를 들어, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인인 경우, 상기 꼬리 도메인은 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 일부, 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다. 이때, 상기 꼬리 도메인은 추가로 (X)n을 포함, 즉, 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU(X)n-3', 할 수 있다. 상기 X는 염기 A, T, U 및 G로 이루어진 군에서 선택될 수 있으며, 상기 n은 염기서열의 개수로, 1 내지 15의 정수일 수 있다. 이때, (X)n은 동일한 염기서열의 정수 n개 만큼의 반복일 수 있고, 또는 염기 A, T, U 및 G가 혼합된 정수 n개의 염기서열일 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관 내 또는 생체 내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관 내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체 내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU 일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU 일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안 될 수 있는 염기를 포함할 수 있다.
선택적으로 상기 꼬리 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
gRNA는 상기에 기재된 바와 같이 다수의 도메인을 포함할 수 있어, gRNA가 포함하는 도메인의 따라 핵산 서열의 길이를 조절할 수 있으며, 각각의 도메인에 의해 3차원 행태 또는 gRNA의 활성 형태의 가닥내 또는 가닥간 상호작용을 할 수 있다.
gRNA는 단일가닥 gRNA(단일 RNA 분자); 또는 이중 gRNA(하나 초과의 통상적으로 2개의 별개의 RNA 분자를 포함함)로서 지칭될 수 있다.
이중 gRNA
이중 gRNA는 제 1 가닥 및 제 2 가닥으로 구성된다.
이때, 상기 제 1 가닥은
5'-[가이드 도메인]-[제 1 상보적 도메인]-3'으로 구성될 수 있고,
상기 제 2 가닥은
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
이때, 상기 제 1 가닥은 crRNA라고 지칭될 수 있고, 상기 제 2 가닥은 tracrRNA로 지칭될 수 있다.
제 1 가닥
가이드 도메인
상기 제 1 가닥에서 상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
이때, 상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예들 들어 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
또한, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
이때, 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열 또는 상보성을 가지는 염기서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
이때, 상기 가이드 서열은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 VEGFA 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 HIF1A 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 ANGPT2 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 EPAS1 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 ANGPTL4 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열은 앞서 각각 표 1, 표 2, 표 3, 표 4, 표 5에 기재하였으나, 이에 제한하지 않는다.
선택적으로, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
이때, 상기 추가 염기서열은 상기 가이드 도메인의 5' 말단에 위치할 수 있으며, 또는 가이드 서열의 5' 말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 도메인의 3' 말단에 위치할 수 있으며, 또는 가이드 서열의 3' 말단에 위치할 수 있다.
제 1 상보적 도메인
제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도의 상보성을 가지는 도메인이다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예들 들어, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래 될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 하지 않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
선택적으로 상기 가이드 도메인 또는/및 제 1 상보적 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 제 1 가닥은 상기 기재와 같이 5’-[가이드 도메인]-[제 1 상보적 도메인]-3’으로 구성될 수 있다.
또한, 상기 제 1 가닥은 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 예로서, 상기 제 1 가닥은
5'-(Ntarget)-(Q)m-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
일 구체예로서, Ntarget은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열과 상보적인 결합을 할 수 있는 염기서열일 수 있다.
이때, 상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 가닥의 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
제 2 가닥
제 2 가닥은 제 2 상보적 도메인과 근위 도메인으로 구성되며, 선택적으로 꼬리 도메인을 추가로 포함할 수 있다.
제 2 상보적 도메인
상기 제 2 가닥에서 제 2 상보적 도메인은 상기 제 1 가닥의 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예를 들어, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래 될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 2 상보적 도메인은 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 하지않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 25개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열 또는 20 내지 25개의 염기서열일 수 있다.
근위 도메인
상기 제 2 가닥에서 근위 도메인은 1 내지 20개의 염기서열로, 제 2 상보적 도메인의 3’ 방향에 위치하는 도메인이다. 예를 들어, 상기 근위 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열 14개의 염기서열 또는 15개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 상기 근위 도메인은 근위 도메인 내의 상보적인 염기서열 간의 이중가닥 결합을 형성할 수 있다.
또한, 상기 근위 도메인은 자연유래의 근위 도메인과 상동성을 가지거나, 또는 자연유래의 근위 도메인으로부터 유래 될 수 있다. 또한, 상기 근위 도메인은 자연에 존재하는 종에 따라 근위 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 근위 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 근위 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 근위 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 근위 도메인 또는 유래된 근위 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
꼬리 도메인
선택적으로, 상기 제 2 가닥에서 꼬리 도메인은 제 2 가닥의 3' 말단에 선택적으로 추가될 수 있는 도메인으로, 상기 꼬리 도메인은 1 내지 50개의 염기서열일 수 있으며, 또는 1 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 꼬리 도메인은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열, 25 내지 30개의 염기서열, 30 내지 35개의 염기서열, 35 내지 40개의 염기서열, 40 내지 45개의 염기서열 또는 45 내지 50개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 상기 꼬리 도메인은 꼬리 도메인 내의 상보적인 염기서열 간의 이중가닥 결합을 형성할 수 있다.
또한, 상기 꼬리 도메인은 자연유래의 꼬리 도메인과 상동성을 가지거나, 또는 자연유래의 꼬리 도메인으로부터 유래 될 수 있다. 또한, 상기 꼬리 도메인은 자연에 존재하는 종에 따라 꼬리 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 꼬리 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 꼬리 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 꼬리 도메인은 스트렙토코커스 피요게네스(Streptococcus pyogenes), 캄필로박터 제주니(Campylobacter jejuni), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 아우레우스(Streptocuccus aureus) 또는 네이세리아 메닝기디티스(Neisseria meningitides)의 꼬리 도메인 또는 유래된 꼬리 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
다른 일 구체예에서, 상기 꼬리 도메인은 시험관 내 또는 생체 내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관 내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3’ 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체 내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU 일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU 일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안 될 수 있는 염기를 포함할 수 있다.
선택적으로 상기 제 2 상보적 도메인, 근위 도메인 또는/및 꼬리 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 제 2 가닥은 상기 기재와 같이 5'-[제 2 상보적 도메인]-[근위 도메인]-3' 또는 5'-[제 2 상보적 도메인]-[근위 도메인]-[꼬리 도메인]-3'으로 구성될 수 있다.
또한, 상기 제 2 가닥은 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-3' 일 수 있다.
다른 일 구체예로서, 상기 제 2 가닥은
5'-(Z)h-(P)k-(F)i-3'; 또는
5'-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3' 일 수 있다.
이때, 상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 가닥의 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래 된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 염기서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 염기서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 염기서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 염기서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (F)i는 시험관 내 또는 생체 내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관 내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체 내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU 일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU 일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안될 수 있는 염기를 포함할 수 있다.
또한, 상기 (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 d, e 및 f는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
단일가닥 gRNA
단일가닥 gRNA는 두 가지로 종류로 나뉠 수 있다.
i) 단일가닥 gRNA
우선, 상기 이중 gRNA의 제 1 가닥과 제 2 가닥을 연결 도메인으로 연결한 단일가닥 gRNA이 있으며, 이때, 상기 단일가닥 gRNA는 5'-[제 1 가닥]-[연결 도메인]-[제 2 가닥]-3'로 이루어져 있다.
구체적으로, 상기 단일가닥 gRNA는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는
5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
연결 도메인을 제외한 각각의 도메인은 상기 이중 gRNA의 제 1 가닥 및 제 2 가닥의 각 도메인에 관한 기재와 동일하다.
연결 도메인
상기 단일가닥 gRNA에서 상기 연결 도메인은 제 1 가닥과 제 2 가닥을 연결하는 도메인으로, 구체적으로는 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열이다. 이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열이거나, 또는 1 내지 30개의 염기서열을 포함할 수 있다. 예를 들어, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 연결 도메인은 단일가닥 gRNA 분자에 사용하기에 적합하며, 이중 gRNA의 제 1 가닥 및 제 2 가닥과 공유결합 또는 비공유결합 하거나, 또는 제 1 가닥 및 제 2 가닥을 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA을 생성에 사용될 수 있다. 상기 연결 도메인은 이중 gRNA의 crRNA 및 tracrRNA과 공유결합 또는 비공유결합 하거나, 또는 crRNA 및 tracrRNA를 공유적 또는 비공유적으로 연결하여 단일가닥 gRNA를 생성에 사용될 수 있다.
상기 연결 도메인은 자연유래 서열, 예를 들어 tracrRNA의 일부 서열과 상동성을 같거나, 또는 이로부터 유래될 수 있다.
선택적으로 상기 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 단일가닥 gRNA는 상기 기재와 같이 5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-3' 또는 5'-[가이드 도메인]-[제 1 상보적 도메인]-[연결 도메인]-[제 2 상보적 도메인]-[근위 도메인(proximal domain)]-[꼬리 도메인]-3'으로 구성될 수 있다.
또한, 상기 단일가닥 gRNA는 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 단일가닥 gRNA는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-3'; 또는
5'-(Ntarget)-(Q)m-(L)j-(Z)h-(P)k-(F)i-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-3'; 또는
5'-(X)a-(Ntarget)-(X)b-(Q)m-(X)c-(L)j-(X)d-(Z)h-(X)e-(P)k-(X)f-(F)i-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
일 구체예로서, Ntarget은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열과 상보적인 결합을 할 수 있는 염기서열일 수 있다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 스트렙토코커스 피요게네스의 제 1 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUA-3'일 수 있고, 또는 5'-GUUUUAGAGCUA-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 1 상보적 도메인이 캄필로박터 제주니의 제 1 상보적 도메인 또는 캄필로박터 제주니 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'일 수 있고, 또는 5'-GUUUUAGUCCCUUUUUAAAUUUCUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 1 상보적 도메인이 스트렙토코커스 써모필러스의 제 1 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-GUUUUAGAGCUGUGUUGUUUCG-3'일 수 있고, 또는 5'-GUUUUAGAGCUGUGUUGUUUCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 염기서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 염기서열의 개수로, 1 내지 30의 정수일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 스트렙토코커스 피요게네스의 제 2 상보적 도메인 또는 스트렙토코커스 피요게네스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-UAGCAAGUUAAAAU-3'일 수 있고, 또는 5'-UAGCAAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 제 2 상보적 도메인이 캄필로박터 제주니의 제 2 상보적 도메인 또는 캄필로박터 제주니 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'일 수 있고, 또는 5'-AAGAAAUUUAAAAAGGGACUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 제 2 상보적 도메인이 스트렙토코커스 써모필러스의 제 2 상보적 도메인 또는 스트렙토코커스 써모필러스 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-CGAAACAACACAGCGAGUUAAAAU-3'일 수 있고, 또는 5'-CGAAACAACACAGCGAGUUAAAAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (P)k는 근위 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 근위 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 근위 도메인의 염기서열은 변경될 수 있다. 상기 P는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 k은 염기서열의 개수로, 1 내지 20의 정수일 수 있다.
예를 들어, 상기 근위 도메인이 스트렙토코커스 피요게네스의 근위 도메인 또는 스트렙토코커스 피요게네스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 근위 도메인이 캄필로박터 제주니의 근위 도메인 또는 캄필로박터 제주니 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAAGAGUUUGC-3'일 수 있고, 또는 5'-AAAGAGUUUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 근위 도메인이 스트렙토코커스 써모필러스의 근위 도메인 또는 스트렙토코커스 써모필러스 유래 근위 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (P)k는 5'-AAGGCUUAGUCCG-3'일 수 있고, 또는 5'-AAGGCUUAGUCCG-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (F)i는 꼬리 도메인을 포함하는 염기서열로, 자연에 존재하는 종의 꼬리 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 꼬리 도메인의 염기서열은 변경될 수 있다. 상기 F는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 i은 염기서열의 개수로, 1 내지 50의 정수일 수 있다.
예를 들어, 상기 꼬리 도메인이 스트렙토코커스 피요게네스의 꼬리 도메인 또는 스트렙토코커스 피요게네스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'일 수 있고, 또는 5'-UUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
다른 예로, 상기 꼬리 도메인이 캄필로박터 제주니의 꼬리 도메인 또는 캄필로박터 제주니 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'일 수 있고, 또는 5'-GGGACUCUGCGGGGUUACAAUCCCCUAAAACCGCUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또 다른 예로, 상기 꼬리 도메인이 스트렙토코커스 써모필러스의 꼬리 도메인 또는 스트렙토코커스 써모필러스 유래 꼬리 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (F)i는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'일 수 있고, 또는 5'-UACUCAACUUGAAAAGGUGGCACCGAUUCGGUGUUUUU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (F)i는 시험관 내 또는 생체 내 전사 방법과 관련된 3' 말단에 1 내지 10개의 염기서열을 포함할 수 있다.
예를 들어, T7 프로모터가 gRNA의 시험관 내 전사를 위해 사용될 때, 상기 꼬리 도메인은 DNA 주형의 3' 말단에 존재하는 임의의 염기서열일 수 있다. 또한, U6 프로모터가 생체 내 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUUUU 일 수 있으며, H1 프로모터가 전사를 위해 사용되는 경우, 상기 꼬리 도메인은 UUUU 일 수 있고, pol-III 프로모터를 사용하는 경우에는, 상기 꼬리 도메인은 여러 개의 우라실 염기이거나 또는 대안 될 수 있는 염기를 포함할 수 있다.
또한, 상기 (X)a, (X)b, (X)c, (X)d, (X)e 및 (X)f는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b, c, d, e 및 f는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
ii) 단일가닥 gRNA
그 다음으로, 단일가닥 gRNA는 가이드 도메인, 제 1 상보적 도메인 및 제 2 상보적 도메인으로 구성되는 단일가닥 gRNA일 수 있으며,
이때, 상기 단일가닥 gRNA는
5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'; 또는
5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
가이드 도메인
상기 단일가닥 gRNA에서 상기 가이드 도메인은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열을 포함한다. 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열에 상보성인 핵산 서열로, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다. 가이드 도메인은 gRNA-Cas 복합체, 즉, CRISPR 복합체의 표적 유전자 또는 핵산과의 특이적인 상호작용을 할 수 있도록 역할을 한다고 여겨진다.
이때, 상기 가이드 도메인은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예들 들어 상기 가이드 도메인은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
또한, 상기 가이드 도메인은 가이드 서열을 포함할 수 있다.
이때, 상기 가이드 서열은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 염기서열 또는 상보성을 가지는 염기서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 염기서열일 수 있다.
일 구체예로서, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열에 상보성인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
이때, 상기 가이드 서열은 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 VEGFA 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 HIF1A 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 ANGPT2 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 EPAS1 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
일 구체예로서, 가이드 서열은 ANGPTL4 유전자의 표적 서열에 상보적인 핵산서열로, 5 내지 50개의 염기서열일 수 있으며, 또는 5 내지 50개의 염기서열을 포함할 수 있다. 예를 들어, 상기 가이드 서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
이때, 가이드 서열은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열은 앞서 각각 표 1, 표 2, 표 3, 표 4, 표 5에 기재하였으나, 이에 제한하지 않는다.
선택적으로, 상기 가이드 도메인은 가이드 서열 및 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 35개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1개의 염기서열, 2개의 염기서열, 3개의 염기서열, 4개의 염기서열, 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열 또는 10개의 염기서열일 수 있다.
일 구체예로서, 상기 추가 염기서열은 1개의 염기서열 G(구아닌)일 수 있으며, 또는 2개의 염기서열 GG일 수 있다.
이때, 상기 추가 염기서열은 상기 가이드 도메인의 5' 말단에 위치할 수 있으며, 또는 가이드 서열의 5' 말단에 위치할 수 있다.
상기 추가 염기서열은 상기 가이드 도메인의 3' 말단에 위치할 수 있으며, 또는 가이드 서열의 3' 말단에 위치할 수 있다.
제 1 상보적 도메인
제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 핵산서열을 포함하며, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도의 상보성을 가지는 도메인이다.
이때, 상기 제 1 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예들 들어, 상기 제 1 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 1 상보적 도메인은 자연유래의 제 1 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 1 상보적 도메인으로부터 유래 될 수 있다. 또한, 상기 제 1 상보적 도메인은 자연에 존재하는 종에 따라 제 1 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 1 상보적 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 1 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 1 상보적 도메인 또는 유래된 제 1 상보적 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 1 상보적 도메인은 제 2 상보적 도메인과 상보적 결합을 하지 않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
제 2 상보적 도메인
제 2 상보적 도메인은 상기 제 1 가닥의 제 1 상보적 도메인과 상보적 핵산서열을 포함하며, 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가진다. 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 염기서열 및 제 1 상보적 도메인과의 상보성이 없는 염기서열, 예를 들어, 제 1 상보적 도메인과 이중가닥을 형성하지 않는 염기서열을 포함할 수 있으며, 제 1 상보적 도메인보다 염기서열의 길이가 길 수 있다.
이때, 상기 제 2 상보적 도메인은 5 내지 35개의 염기서열이거나, 또는 5 내지 35개의 염기서열을 포함할 수 있다. 예를 들어, 상기 제 2 상보적 도메인은 5개의 염기서열, 6개의 염기서열, 7개의 염기서열, 8개의 염기서열, 9개의 염기서열, 10개의 염기서열, 11개의 염기서열, 12개의 염기서열, 13개의 염기서열, 14개의 염기서열, 15개의 염기서열, 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
상기 제 2 상보적 도메인은 자연유래의 제 2 상보적 도메인과 상동성을 가지거나, 또는 자연유래의 제 2 상보적 도메인으로부터 유래 될 수 있다. 또한, 상기 제 2 상보적 도메인은 자연에 존재하는 종에 따라 제 2 상보적 도메인의 염기서열에 차이가 존재할 수 있으며, 자연에 존재하는 종이 포함하는 제 2 상보적 도메인으로부터 유래 될 수 있고, 또는 자연에 존재하는 종이 포함하는 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 수 있다.
일 구체예로서, 상기 제 2 상보적 도메인은 팔쿠박테리아 박테리움(Parcubacteria bacterium (GWC2011_GWC2_44_17)), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MC2017)), 부티리비브리오 프로테오클라시커스(Butyrivibrio proteoclasiicus), 페레그리니박테리아 박테리움(Peregrinibacteria bacterium (GW2011_GWA_33_10)), 액시다미노코커스 에스피(Acidaminococcus sp . (BV3L6)), 포르피로모나스 마카캐(Porphyromonas macacae), 라츠노피라세애 박테리움(Lachnospiraceae bacterium (ND2006)), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디이엔스(Prevotella disiens), 모라셀라 보보쿨리(Moraxella bovoculi (237)), 스미이헬라 에스피(Smiihella sp . (SC_KO8D17)), 렙포스피라 이나다이(Leptospira inadai), 라츠노스피라세애 박테리움(Lachnospiraceae bacterium (MA2020)), 프란시셀라 노비시다(Francisella novicida (U112)), 캔디다투스 메타노플라즈마 털미툼(Candidatus Methanoplasma termitum) 또는 에유박테리움 엘리겐스(Eubacterium eligens)의 제 2 상보적 도메인 또는 유래된 제 2 상보적 도메인과 일부, 최소 50% 이상, 또는 완전한 상동성을 가질 수 있다.
선택적으로, 상기 제 2 상보적 도메인은 제 1 상보적 도메인과 상보적 결합을 하지 않는 추가 염기서열을 포함할 수 있다.
이때, 상기 추가 염기서열은 1 내지 15개의 염기서열일 수 있다. 예를 들어, 상기 추가 염기서열은 1 내지 5개의 염기서열, 5 내지 10개의 염기서열, 또는 10 내지 15개의 염기서열일 수 있다.
연결 도메인
선택적으로, 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하여 단일가닥 gRNA을 생성할 수 있도록 하는 핵산서열이다. 이때, 상기 연결 도메인은 제 1 상보적 도메인과 제 2 상보적 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 제 1 상보적 도메인과 제 2 상보적 도메인을 공유적 또는 비공유적으로 연결할 수 있다.
상기 연결 도메인은 1 내지 30개의 염기서열이거나, 또는 1 내지 30개의 염기서열을 포함할 수 있다. 예를 들어, 상기 연결 도메인은 1 내지 5개의 염기서열, 5내지 10개의 염기서열, 10 내지 15개의 염기서열, 15 내지 20개의 염기서열, 20 내지 25개의 염기서열 또는 25 내지 30개의 염기서열일 수 있으며, 또는 이를 포함할 수 있다.
선택적으로 상기 가이드 도메인, 제 1 상보적 도메인, 제 2 상보적 도메인 및 연결 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.
따라서, 상기 단일가닥 gRNA는 상기 기재와 같이 5'-[제 2 상보적 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3' 또는 5'-[제 2 상보적 도메인]-[연결 도메인]-[제 1 상보적 도메인]-[가이드 도메인]-3'으로 구성될 수 있다.
또한, 상기 단일가닥 gRNA는 선택적으로 추가적인 염기서열을 포함할 수 있다.
일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(X)b-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
다른 일 구체예로서, 상기 단일가닥 gRNA는
5'-(Z)h-(L)j-(Q)m-(Ntarget)-3'; 또는
5'-(X)a-(Z)h-(L)j-(Q)m-(X)c-(Ntarget)-3'일 수 있다.
이때, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열과 상보적인 결합을 할 수 있는 염기서열로서, 상기 Ntarget은 표적 유전자 또는 핵산 상의 표적 서열에 따라 변할 수 있는 염기서열 부위이다.
일 구체예로서, Ntarget은 표적 유전자, 즉, 신생혈관형성 관련 인자인 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 또는 ANGPTL4 유전자의 표적 서열과 상보적인 결합을 할 수 있는 염기서열일 수 있다.
상기 (Q)m은 제 1 상보적 도메인을 포함하는 염기서열로, 제 2 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Q)m은 자연에 존재하는 종의 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 1 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Q는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 m은 염기서열의 개수로, 5 내지 35의 정수일 수 있다.
예를 들어, 상기 제 1 상보적 도메인이 팔쿠박테리아 박테리움의 제 1 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 1 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Q)m은 5'-UUUGUAGAU-3'일 수 있고, 또는 5'-UUUGUAGAU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
상기 (Z)h는 제 2 상보적 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 상보적 결합을 할 수 있는 염기서열을 포함한다. 상기 (Z)h은 자연에 존재하는 종의 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가지는 서열일 수 있으며, 유래된 종에 따라 상기 제 2 상보적 도메인의 염기서열은 변경될 수 있다. 상기 Z는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 h은 염기서열의 개수로, 5 내지 50의 정수일 수 있다.
예를 들어, 상기 제 2 상보적 도메인이 팔쿠박테리아 박테리움의 제 2 상보적 도메인 또는 팔쿠박테리아 박테리움 유래 제 2 상보적 도메인과 일부 또는 완전한 상동성을 가질 경우에, 상기 (Z)h은 5'-AAAUUUCUACU-3'일 수 있고, 또는 5'-AAAUUUCUACU-3'와 적어도 50% 이상의 상동성을 가지는 염기서열일 수 있다.
또한, 상기 (L)j는 연결 도메인을 포함하는 염기서열로, 제 1 상보적 도메인과 제 2 상보적 도메인을 연결하는 염기서열이다. 이때, 상기 L은 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 j은 염기서열의 개수로, 1 내지 30의 정수일 수 있다.
또한, 상기 (X)a, (X)b 및 (X)c는 선택적으로 추가할 수 있는 염기서열로, 상기 X는 A, U, C 및 G로 이루어진 군에서 각각 독립적으로 선택될 수 있으며, 상기 a, b 및 c는 염기서열의 개수로, 0 또는 1 내지 20의 정수일 수 있다.
2. 에디터단백질
에디터단백질은 핵산과 직접적으로 결합하거나, 또는 직접 결합하지는 않지만 상호작용할 수 있는 펩타이드, 폴리펩타이드 또는 단백질을 의미한다.
상기 핵산은 타겟 핵산, 유전자 또는 염색체에 포함된 핵산일 수 있다.
상기 핵산은 가이드핵산일 수 있다.
상기 에디터단백질은 효소일 수 있다.
상기 에디터단백질은 융합 단백질일 수 있다.
이때, 상기 융합 단백질은 효소 및 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 융합하여 생성한 단백질을 의미한다.
상기 효소는 핵산, 유전자, 염색체 또는 단백질을 절단할 수 있는 도메인을 포함하는 단백질을 의미한다.
상기 효소는 뉴클레아제, 프로테아제 또는 제한효소일 수 있다.
상기 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 상기 효소와 동일하거나 다른 기능을 가지는 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질일 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 추가적인 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
상기 융합 단백질은 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 효소의 중간부; 또는 이들 조합의 하나 이상에 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
이때, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인, 펩타이드, 폴리펩타이드 또는 단백질 일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스래디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
상기 NLS는 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 또는 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다.
상기 에디터단백질은 완전 활성 효소를 포함할 수 있다.
이때, 상기 "완전 활성 효소"는 야생형(wild type)의 효소의 기능과 동일한 기능을 가지고 있는 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소는 DNA 이중 가닥을 모두 절단하는 완전한 효소 활성을 가진다.
또한, 상기 완전 활성 효소는 야생형의 효소의 기능보다 향상 된 기능을 가지고 있는 효소를 포함하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작 형태는 야생형 효소보다 증가 된 완전한 효소 활성, 즉, DNA 이중 가닥을 절단하는 활성을 가진다.
상기 에디터단백질은 불완전 또는 부분 활성 효소를 포함할 수 있다.
이때, 상기 "불완전 또는 부분 활성 효소"는 야생형의 효소의 기능의 일부만을 가지는 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 DNA 이중 가닥 중 일부, 즉 단일 가닥만 절단하는 불완전한 또는 일부의 효소 활성을 가진다.
상기 에디터단백질은 불활성 효소를 포함할 수 있다.
이때, 상기 "불활성 효소"는 야생형의 효소의 기능이 모두 불활성화 된 효소를 의미하며, 예를 들면, DNA의 이중 가닥을 절단하는 야생형 효소의 특정 변형 또는 조작된 형태는 DNA 이중 가닥을 모두 절단하지 못하도록 불활성을 가진다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하는 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질일 수 있다.
상기 에디터단백질은 자연 상태에 존재하지 않는 인위적으로 생성된 효소 또는 융합 단백질의 일부가 변형된 형태일 수 있다.
이때, 상기 변형은 에디터단백질에 포함된 아미노산의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
또는 상기 변형은 에디터단백질을 암호화하는 염기서열 중 일부 염기의 치환, 제거, 부가 또는 이의 혼합일 수 있다.
본 발명의 에디터단백질의 일 구체예로서, CRISPR 효소에 대해 하단에 기술하였다.
CRISPR 효소
"CRISPR 효소"는 CRISPR-Cas 시스템의 주요 단백질 구성 요소로, gRNA와 복합체를 형성하여 CRISPR-Cas 시스템을 형성한다.
상기 CRISPR 효소는 CRISPR 효소를 암호화하는 서열을 가지는 핵산 또는 폴리펩타이드(또는 단백질)로, 대표적으로 Type II CRISPR 효소 또는 Type V CRISPR 효소가 많이 사용된다.
상기 Type II CRISPR 효소으로는 Cas9이 있으며, 상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.
"Cas9"은 gRNA와 결합하여 표적 유전자 또는 핵산 상에서 표적 서열 또는 위치를 절단 또는 변형시키는 효소로서, gRNA가 상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 HNH 도메인, gRNA와 비상보적인 결합을 하는 핵산 가닥(strand)을 절단할 수 있는 RuvC 도메인, 표적, 즉, 타겟을 인식하는 REC 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.
또한, 상기 Type V CRISPR 효소으로는 Cpf1이 있으며, 상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다.
상기 Cpf1은 Cas9의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Cas9의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟을 인식하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
상기 Cas9 또는 Cpf1 단백질 등의 CRISPR 효소는 자연상태에서 존재하는 미생물에서 분리된 것 또는 재조합적 방법 또는 합성적 방법으로 비자연적으로 생산된 것일 수 있다.
Type II CRISPR 효소
Type II CRISPR 효소의 결정 구조는 2종 이상의 자연유래 미생물 Type II CRISPR 효소 분자에 대한 연구(Jinek et al., Science, 343(6176):1247997, 2014) 및 gRNA와 함께 복합체를 이루는 스트렙토코커스 피오게네스 Cas9(SpCas9)에 대한 연구(Nishimasu et al., Cell, 156:935-949, 2014; 및 Anders et al., Nature, 2014, doi: 10.1038/nature13579)를 통해 결정되었다.
Type II CRISPR 효소는 2개의 로브, 즉, 인식(REC) 및 뉴클레아제(NUC) 로브를 포함하며, 각각의 로브는 여러 개의 도메인을 포함한다.
상기 REC 로브는 아르기닌-풍부 브릿지 나선(BH), REC1 도메인 및 REC2 도메인을 포함한다.
이때, 상기 BH 도메인은 긴 α-나선 및 아르기닌 풍부 영역이며, 상기 REC1 및 REC2 도메인은 gRNA 내의 형성되는 이중가닥의, 예를 들어, 단일가닥 gRNA, 이중 gRNA 또는 tracrRNA의 인식에 중요한 역할을 한다.
상기 NUC 로브는 RuvC 도메인, HNH 도메인 및 PAM-상호작용(PI) 도메인을 포함한다. 이때, 상기 RuvC 도메인은 RuvC-유사 도메인을 포괄하는 의미로 사용되고, 또한 상기 HNH 도메인은 HNH-유사 도메인을 포괄하는 의미로 사용된다.
이때, 상기 RuvC 도메인은 Type II CRISPR 효소를 포함하는 자연상태에 존재하는 미생물의 구성원에 대해 구조적으로 유사성을 공유하며, 단일가닥, 예를 들어 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단한다. 상기 RuvC 도메인은 종종 당업계에서 RuvCI 도메인, RuvCII 도메인 및 RuvCIII 도메인으로서, 통상적으로 RuvC I, RuvCII 및 RuvCIII로 지칭된다. 예를 들어, SpCas9의 경우, 상기 RuvC 도메인은 SpCas9의 아미노산 서열 1 내지 59, 718 내지 769 및 909 내지 1098에 위치하는 각각 3 개의 분할 RuvC 도메인(RuvC I, RuvCII 및 RuvCIII)으로부터 조립된다.
상기 HNH 도메인은 HNH 엔도뉴클레아제와 구조적 유사성을 공유하며, 단일 가닥, 예를 들어 표적 핵산 분자의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단한다. HNH 도메인은 RuvC II와 III 모티프 사이에 위치한다. 예를 들어, SpCas9의 경우, HNH 도메인은 SpCas9의 아미노산 서열 775 내지 908에 위치한다.
상기 PI 도메인은 표적 유전자 또는 핵산 내의 특정 염기서열, 즉, PAM(Protospacer adjacent motif)을 인식하거나 또는 PAM과 상호작용한다. 예를 들어, SpCas9의 경우, PI 도메인은 SpCas9의 아미노산 서열 1099 내지 1368에 위치한다.
이때, 상기 PAM은 Type II CRISPR 효소의 유래에 따라 다를 수 있다. 예를 들어, CRISPR 효소가 SpCas9 인 경우 PAM은 5'-NGG-3'일 수 있고, 스트렙토코커스 써모필러스 Cas9(StCas9)인 경우 PAM은 5'-NNAGAAW-3'(W = A or T)일 수 있고, 네이세리아 메닝기디티스 Cas9(NmCas9)인 경우 PAM은 5'-NNNNGATT-3'일 수 있고, 캄필로박터 제주니 Cas9(CjCas9)의 경우 PAM은 5'-NNNVRYAC-3' (V = G or C or A, R = A or G, Y = C or T)일 수 있으며, 이때 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다.
Type V CRISPR 효소
Type V CRISPR 효소는 Type II CRISPR 효소의 RuvC 도메인에 상응하는 유사한 RuvC 도메인이 있으며, Type II CRISPR 효소의 HNH 도메인은 결핍되어 있고, 대신에 Nuc 도메인을 포함하며, 타겟을 인식하는 REC 도메인과 WED 도메인 및 PAM을 인식하는 PI 도메인으로 구성될 수 있다. 구체적인 Type V CRISPR 효소의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.
Type V CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 Type V CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, Type V CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 Type V CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다.
일 예로, Cpf1이 인식하는 PAM 서열은 5'-TTN-3' (N은 A, T, C 또는 G)일 수 있다.
CRISPR 효소 활성
CRISPR 효소는 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하며, 이중가닥 또는 단일가닥의 파손 또는 결손을 초래하는 뉴클레아제 활성을 가진다. 일반적으로 야생형 Type II CRISPR 효소 또는 Type V CRISPR 효소는 일반적으로 표적 유전자 또는 핵산의 이중가닥을 절단한다.
CRISPR 효소의 상기와 같은 뉴클레아제 활성을 변형 또는 변경하기 위해서, CRISPR 효소는 조작 또는 변형될 수 있으며, 이러한 조작 또는 변형된 CRISPR 효소는 불완전 또는 부분 활성 효소 또는 불활성 효소로 변형될 수 있다.
불완전 또는 부분 활성 효소
CRISPR 효소가 변형하여 효소 활성을 변경시켜 불완전 또는 부분 활성을 가지도록 한 CRISPR 효소를 니카아제(nickase)로 명칭한다.
"니카아제(nickase)"는 표적 유전자 또는 핵산의 이중가닥 중 한 가닥만 절단되도록 조작 또는 변형된 CRISPR 효소를 의미하며, 상기 니카아제는 단일가닥, 예를 들어, 표적 유전자 또는 핵산의 gRNA와 비상보성 가닥 또는 상보성 가닥을 절단하는 뉴클레아제 활성을 가진다. 따라서, 이중가닥을 절단하기 위해서는 2개의 니카아제의 뉴클레아제 활성이 필요하다.
예를 들어, 상기 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 HNH 도메인은 조작 또는 변경될 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
다른 일 구체예로, CjCas9의 경우, CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 있다.
예를 들어, 상기 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가질 수 있다. 즉, 상기 니카아제는 RuvC 도메인에 의한 뉴클레아제 활성을 포함하지 않을 수 있으며, 이를 위해 RuvC 도메인은 조작 또는 변경될 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 HNH 도메인에 의한 뉴클레아제 활성을 가지므로, 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 있다.
불활성 효소
CRISPR 효소를 변형시켜 효소 활성이 완전히 불활성화 된 CRISPR 효소를 불활성 CRISPR 효소로 명칭한다.
"불활성 CRISPR 효소"는 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없도록 변형된 CRISPR 효소를 의미하며, 상기 불활성 CRISPR 효소는 야생형 CRISPR 효소의 뉴클레아제 활성을 가지는 도메인에 변이로 인한 뉴클레아제 불활성을 가진다. 상기 불활성 CRISPR 효소는 RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성을 불화성화된 것일 수 있다.
예를 들어, 상기 불활성 CRISPR 효소는 뉴클레아제 활성을 불활성화시키기 위해, RuvC 도메인 및 HNH 도메인을 조작 또는 변경할 수 있다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
그 밖의 활성
CRISPR 효소는 상기 기재된 뉴클레아제 활성 외에도, 엔도뉴클레아제 활성, 엑소뉴클레아제 활성 또는 헬리카제 활성, 즉, 이중가닥 핵산의 나선 구조를 푸는 능력을 가질 수 있다.
또한, CRISPR 효소는 CRISPR 효소의 엔도뉴클레아제 활성, 엑소뉴클레아제 활성 또는 헬리카제 활성은 완전 활성, 불완전 또는 부분 활성, 또는 불활성이 되도록 CRISPR 효소를 변형시킬 수 있다.
CRISPR 효소의 표적화
CRISPR 효소는 gRNA와 상호작용할 수 있으며, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 형성할 수 있고, gRNA와 협력하여 가이드 서열을 및 PAM 서열을 포함하는 표적 서열로 근접시킬 수 있다. 이때, 표적 유전자 또는 핵산과 상호작용하기 위한 CRISPR 효소의 능력은 PAM 서열에 의존적이다.
상기 PAM 서열은 표적 유전자 또는 핵산 내에 존재하는 서열로, CRISPR 효소의 PI 도메인에 의해 인식될 수 있다. 상기 PAM 서열은 CRISPR 효소의 유래에 따라 그 서열이 다를 수 있다. 즉, 종마다 특이적으로 인식할 수 있는 PAM 서열이 존재한다.
일 예로, CRISPR 효소가 Type II CRISPR 효소일 때,
SpCas9인 경우, PAM 서열은 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3'일 수 있고,
StCas9인 경우, PAM 서열은 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3'(W = A 또는 T)일 수 있으며,
NmCas9인 경우, PAM 서열은 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3'일 수 있고,
CjCas9의 경우, PAM 서열은 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G; Y = C 또는 T)일 수 있으며,
스트렙토코커스 뮤탄스 Cas9(SmCas9)의 경우, PAM 서열은 5'-NGG-3' 및/또는 5'-NAAR-3'(R = A 또는 G)일 수 있고,
스타필로코커스 아우레우스 Cas9(SaCas9)의 경우, PAM 서열은 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G; V = G, C 또는 A)일 수 있다.
다른 일 예로, CRISPR 효소가 Type V CRISPR 효소일 때,
Cpf1의 경우, PAM 서열은 5'-TTN-3'일 수 있다.
이때, 상기 N은 A, T, G 또는 C; 또는 A, U, G 또는 C일 수 있다.
이러한 종마다 특이적으로 인식할 수 있는 PAM 서열을 이용하면, 특이적 PAM 서열을 인식할 수있는 CRISPR 효소를 조작 또는 변형할 수 있다. 예를 들어, SpCas9의 뉴클레아제 활성을 가지며, CjCas9 특이적 PAM 서열을 인식할 수 있도록 SpCas9의 PI 도메인을 CjCas9의 PI 도메인으로 교체할 수 있고, 이를 통해 CjCas9 특이적 PAM 서열을 인식하는 SpCas9을 생성할 수 있다. 이러한 PI 도메인의 치환 또는 교체를 통해, 특이적으로 인식하는 PAM 서열을 변경 설계할 수 있다.
CRISPR 효소 변이체
CRISPR 효소의 뉴클레아제 활성, 헬리카제 활성, gRNA와 상호작용 능력, 및 표적 유전자 또는 핵산에 근접 능력, 예를 들어 PAM 인식 능력 등의 다양한 특성을 향상 또는 저해시킬 수 있도록, CRISPR 효소를 변이시킬 수 있다.
또한, CRISPR 효소 변이체는 gRNA와 상호작용을 통한 gRNA-CRISPR 효소 복합체 형성, 즉, CRISPR 복합체를 형성하여 표적 유전자 또는 핵산에 근접 또는 국소화될 때, gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하지 않고, 오직 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥만을 절단할 수 있도록 표적 특이성을 향상시킨 변형 또는 조작된 CRISPR 효소일 수 있다.
이때, 상기 gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 이중가닥 또는 단일가닥이 절단되는 효과를 오프-타겟(off-target) 효과로 지칭되며, 상기 gRNA와 일부 상보적 결합을 하는 비표적 유전자 또는 핵산 및 상보적 결합을 하지 않는 비표적 유전자 또는 핵산의 위치 또는 염기서열은 오프-타겟으로 지칭되고, 이때, 오프-타겟의 개수는 하나 이상일 수 있다. 이와 반대로, 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥의 절단 효과는 온-타겟(on-target) 효과라 지칭되면, 표적 유전자 또는 핵산의 위치 또는 표적서열은 온-타겟으로 지칭된다.
CRISPR 효소 변이체는 자연적으로 발생하는 CRISPR 효소의 아미노산이 적어도 하나 이상 변형된 것으로, 변형되지 않은 CRISPR 효소에 비해 뉴클레아제 활성, 헬리카제 활성, gRNA와 상호작용 능력, 표적 유전자 또는 핵산에 근접 능력 및 표적 특이성 중 하나 이상의 특성이 변형, 예를 들어, 향상 또는 저해될 수 있다. 이때, 상기 변형은 아미노산 치환, 제거, 부가 또는 이의 혼합일 수 있다.
CRISPR 효소 변이체에서,
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지는 아미노산들로 구성된 부위(region)에 위치한 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지는 아미노산, 즉, 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지지 않는 아미노산들로 구성된 부위(region)에 위치한 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 양전하를 가지지 않는 아미노산, 즉, 아스파르트산(Aspartic aicd, D), 글루탐산(Glutamic acid, E), 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
다른 예로, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 전하를 가지지 않는 아미노산, 즉, 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
또한, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 소수성(hydrophobic) 잔기를 가지는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들면, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 극성(polar) 잔기를 가지는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 리신(Lysine, K), 아르기닌(Arginine, R), 히스티딘(histidine, H), 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E) 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
또는, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 리신(Lysine, K), 아르기닌(Arginine, R) 및 히스티딘(histidine, H)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아스파르트산(Aspartic aicd, D) 및 글루탐산(Glutamic acid, E)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 세린(Serine, S), 트레오닌(Threonine, T), 아스파라긴(Asparagine, N), 글루타민(Glutamine, Q), 시스테인(Cysteine, C), 프롤린(Proline, P), 글라이신(Glysin, G), 알라닌(Alanine, A), 발린(Valine, V), 이소류신(Isoleucine, I), 류신(Leucine, L), 메티오닌(Methionine, M), 페닐알라닌(Phenylalanine, F), 타이로신(Tyrosine, Y) 및 트립토판(Tryptophan, W)으로 구성된 아미노산들 중 하나 또는 둘 이상의 아미노산의 치환일 수 있다.
또한, 상기 변형은 자연적으로 발생하는 CRISPR 효소 내에 존재하는 아미노산들 중 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱 또는 그 이상의 아미노산들의 변형일 수 있다.
또한, CRISPR 효소 변이체에서,
상기 변형은 CRISPR 효소의 RuvC 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다. 이때, 상기 RuvC 도메인은 RuvCI, RuvCII 또는 RuvCIII 도메인일 수 있다.
상기 변형은 CRISPR 효소의 HNH 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 REC 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 PI 도메인에 존재하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 REC, RuvC, HNH 또는 PI 도메인 중 적어도 둘 이상의 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC 및 RuvC 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 RuvC 도메인에 포함된 A203, H277, G366, F539, I601, M763, D965 및 F1038 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC 및 HNH 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 HNH 도메인에 포함된 포함된 A203, H277, G366, F539, I601 및 K890 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC 및 PI 도메인에 포함된 아미노산 중 둘 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, T1102 및 D1127 아미노산 중 적어도 둘 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC 및 HNH 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC 및 HNH 도메인에 포함된 A203, H277, G366, F539, I601, M763, K890, D965 및 F1038 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, M763, D965, F1038, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, HNH 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, HNH 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, K890, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
일 예로, 상기 변형은 CRISPR 효소의 RuvC, HNH 및 PI 도메인에 포함된 아미노산 중 셋 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 RuvC, HNH 및 PI 도메인에 포함된 M763, K890, D965, F1038, T1102 및 D1127 아미노산 중 적어도 셋 이상의 아미노산의 변형일 수 있다.
다른 일 예로, 상기 변형은 CRISPR 효소의 REC, RuvC, HNH 및 PI 도메인에 포함된 아미노산 중 넷 이상의 아미노산의 변형일 수 있다.
일 구체예로서, SpCas9 변이체에서, 상기 변형은 SpCas9의 REC, RuvC, HNH 및 PI 도메인에 포함된 A203, H277, G366, F539, I601, M763, K890, D965, F1038, T1102 및 D1127 아미노산 중 적어도 넷 이상의 아미노산의 변형일 수 있다.
또한, CRISPR 효소 변이체에서,
상기 변형은 CRISPR 효소의 뉴클레아제 활성에 참여하는 아미노산 중 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
예를 들어, SpCas9 변이체에서, 상기 변형은 D10, E762, H840, N854, N863 및 D986로 구성된 아미노산 그룹 중에 하나 또는 둘 이상의 변형일 수 있으며, 또는 다른 Cas9 orthologs의 이에 대응되는 아미노산 그룹 중에 하나 또는 둘 이상의 아미노산의 변형일 수 있다.
상기 변형은 CRISPR 효소의 뉴클레아제 활성을 일부 불활성화시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 니카아제일 수 있다.
이때, 상기 변형은 CRISPR 효소의 RuvC 도메인의 뉴클레아제 활성을 불활성화시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산을 알라닌으로 변이(mutation)시키면, 즉, D10A로 변이시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산을 알라닌으로 변이(mutation)시키면, 즉, D8A로 변이시키면, RuvC 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 비상보성 가닥, 즉, gRNA와 상보적인 결합을 하지 않는 가닥을 절단할 수 없다.
또한 이때, 상기 변형은 CRISPR 효소의 HNH 도메인의 뉴클레아제 활성을 불활성화시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 840번 히스티딘을 알라닌으로 변이(mutation)시키면, 즉, H840A로 변이시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
다른 일 구체예로, CjCas9의 경우, CjCas9의 아미노산 서열 559번 히스티딘을 알라닌으로 변이(mutation)시키면, 즉, H559A로 변이시키면, HNH 도메인의 뉴클레아제 활성이 불활성화되므로 니카아제로 사용할 수 있으며, 이때 생성된 니카아제는 표적 유전자 또는 핵산의 상보성 가닥, 즉, gRNA와 상보적인 결합을 하는 가닥을 절단할 수 없다.
또한, 상기 변형을 CRISPR 효소의 뉴클레아제 활성을 완전히 불활성화시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 불활성 CRISPR 효소일 수 있다.
이때, 상기 변형은 CRISPR 효소의 RuvC 및 HNH 도메인의 뉴클레아제 활성을 불활성화 시키는 변형일 수 있으며, 이러한 CRISPR 효소 변이체는 표적 유전자 또는 핵산의 이중가닥을 절단할 수 없다.
일 구체예로, SpCas9의 경우, SpCas9의 아미노산 서열 10번 아스파르트산과 840번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, 즉, D10A 및 H840A로 변이시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
다른 일 구체예로서, CjCas9의 경우, CjCas9의 아미노산 서열 8번 아스파르트산과 559번 히스티딘을 모두 알라닌으로 변이(mutation)시키면, 즉, D8A 및 H559A로 변이시키면, RuvC 도메인 및 HNH 도메인에 의한 뉴클레아제 활성이 불활성화되므로, 표적 유전자 또는 핵산의 이중가닥을 모두 절단할 수 없다.
또한, CRISPR 효소 변이체는 CRISPR 효소의 원래 특성 이외에 선택적으로 기능적(functional) 도메인을 추가로 포함할 수 있으며, 이러한 CRISPR 효소 변이체는 원래의 특성 이외에 부가적인 특성을 가질 수 있다.
이때, 상기 기능적 도메인은 메틸라아제(methylase) 활성, 디메틸라아제(demethylase) 활성, 전사촉진(transcription activation) 활성, 전사 저해(transcription repression) 활성, 전사 방출 인자(transcription release factor) 활성, 히스톤 변형(histone modification) 활성, RNA 절단(cleavage) 활성 또는 핵산 결합(nucleic acid binding) 활성을 가지는 도메인일 수 있으며, 또는 단백질(펩타이드 포함)의 분리정제를 위한 태그(tag) 또는 리포터 유전자일 수 있으나, 이에 제한되지 않는다.
상기 기능적 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 디아미네이즈(deaminase)일 수 있다.
예를 들어, 불완전 또는 부분 CRISPR 효소에 시티딘 디아미네이즈(cytidine deaminase)를 기능적 도메인으로 추가로 포함할 수 있다. 일 구체예로, SpCas9 니카아제에 시티딘 디아미네이즈, 예를 들면, APOBEC1(apolipoprotein B editing complex 1)를 추가하여 융합 단백질을 생성할 수 있다. 이렇게 형성된 [SpCas9 니카아제]-[APOBEC1]은 염기 C를 T 또는 U로 염기 교정 또는 편집에 이용되거나, 또는 염기 G를 A로 염기 교정 또는 편집에 이용될 수 있다.
상기 태그는 히스티딘(His) 태그, V5 태그, FLAG 태그, 인플루엔자 헤마글루티닌(HA) 태그, Myc 태그, VSV-G 태그 및 티오레독신(Trx) 태그 등을 포함하며, 상기 리포터 유전자는 글루타티온-S-트랜스 퍼라제(GST), 호스라디시(horseradish) 과산화효소(HRP), 클로람페니콜 아세틸트랜스퍼라제(CAT) 베타-갈락토시다제, 베타-글루쿠로니다제, 루시퍼라제, 녹색 형광 단백질(GFP), HcRed, DsRed, 청록색 형광 단백질(CFP), 황색 형광 단백질(YFP) 및 청색 형광 단백질(BFP)을 포함하는 자가형광 단백질을 포함하나, 이들에 한정되지 않는다.
또한, 상기 기능적 도메인은 NLS(nuclear localization sequence or signal) 또는 NES(nuclear export sequence or signal)일 수 있다.
일 예로, CRISPR 효소는 하나 이상의 NLS를 포함할 수 있다. 이때, 상기 NLS는 CRISPR 효소의 아미노 말단 또는 그 근처; 카르복시 말단 또는 그 근처; 또는 이들의 조합에 하나 이상의 NLS를 포함할 수 있다. 상기 NLS는 하기로부터 유래된 NLS 서열일 수 있으나, 이에 제한되지 않는다: 아미노산 서열 PKKKRKV를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민(nucleoplasmin)으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK를 갖는 뉴클레오플라스민 이분(bipartite) NLS); 아미노산 서열 PAAKRVKLD 또는 RQRRNELKRSP를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY를 갖는 hRNPA1 M9 NLS; 임포틴-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV; 마이오마(myoma) T 단백질의 서열 VSRKRPRP 및 PPKKARED; 인간 p53의 서열 POPKKKPL; 마우스 c-abl IV의 서열 SALIKKKKKMAP; 인플루엔자 바이러스 NS1의 서열 DRLRR 및 PKQKKRK; 간염 바이러스 델타 항원의 서열 RKLKKKIKKL; 마우스 Mx1 단백질의 서열 REKKKFLKRR; 인간 폴리(ADP-리보스) 중합효소의 서열 KRKGDEVDGVDEVAKKKSKK; 및 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK.
또한, CRISPR 효소 변이체는 CRISPR 효소를 분할하여 두 개 이상의 부분으로 나눈 스플릿(split) 형태의 CRISPR 효소를 포함할 수 있다. "스플릿(split)"은 단백질을 기능적으로 또는 구조적으로 또는 임의로 두 개 이상으로 분할하는 것을 의미한다.
이때, 상기 스플릿(split) 형태의 CRISPR 효소는 완전 활성 효소, 불완전 또는 부분 활성 효소 또는 불활성 효소일 수 있다.
예를 들어, SpCas9의 경우, 656번 타이로신과 657번 트레오닌 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9을 생성할 수 있다.
또한, 상기 스플릿(split) 형태의 CRISPR 효소는 선택적으로 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질을 포함할 수 있다.
이때, 상기 "재구성"은 스플릿(split) 형태의 CRISPR 효소가 구조적으로 야생형 CRISPR 효소와 동일하거나 유사하도록 하는 것을 의미한다.
상기 재구성(reconstitution)을 위한 추가 도메인, 펩타이드, 폴리펩타이드 또는 단백질은 FRB 및 FKBP dimerization domains; 인테인(intein); ERT 및 VPR domains 또는 특정 조건에서 이량이질체(heterodimer)를 형성하는 도메인일 수 있다.
예를 들어, SpCas9의 경우, 713번 세린과 714번 글라이신 사이를 분할하여 두 개의 부분으로 나눈 스플릿 SpCas9에 두 부분 중 하나에 FRB 도메인을 연결하고, 나머지 하나에 FKBP 도메인을 연결할 수 있다. 이렇게 생성된 스플릿 SpCas9은 라파마이신이 존재하는 환경에서 FRB 도메인과 FKBP 도메인이 다이머를 형성하여 재구성된 CRISPR 효소를 생성할 수 있다.
본 발명에서 기재한 CRISPR 효소 또는 CRISPR 효소 변이체는 폴리펩타이드, 단백질 또는 이를 암호화하는 서열을 가지는 핵산일 수 있으며, 상기 CRISPR 효소 또는 CRISPR 효소 변이체를 도입하고자 하는 대상에 맞추어 코돈 최적화(codon optimization)된 것일 수 있다.
"코돈 최적화"는 고유 서열의 적어도 하나의 코돈을 숙주 세포의 유전자에 더욱 빈번하게 또는 가장 빈번하게 사용되는 코돈으로 대체하면서, 고유 아미노상 서열을 유지함으로써 관심 숙주 세포에서의 발현의 증진을 위해 핵산서열을 변형시키는 과정을 의미한다. 다양한 종은 특정 아미노산의 특정 코돈에 대한 특정 편향을 가지며, 코돈 편향(유기체 간의 코돈 사용의 차이)은 종종 mRNA의 번역의 효율과 상호관련 되며, 이는 번역되는 코돈의 특성 및 특정 tRNA 분자의 이용가능성에 의해 좌우되는 것을 여겨진다. 세포에서 선택된 tRNA의 우세는 일반적으로 펩타이드 합성에 가장 빈번하게 사용되는 코돈을 반영한 것이다. 따라서, 유전자는 코돈 최적화에 기초하여 주어진 유기체에서 최적의 유전자 발현을 위해 맞춤화될 수 있다.
3. 표적 서열
"표적 서열"은 표적 유전자 또는 핵산 내에 존재하는 염기서열로, 가이드핵산의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가진다. 표적 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 염기서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열과 상보적인 결합을 할 수 있으며, 상기 표적 서열의 길이는 가이드 서열의 길이와 동일할 수 있다.
상기 표적 서열은 5 내지 50개의 염기서열일 수 있다.
구현예로서 상기 표적서열은 16개의 염기서열, 17개의 염기서열, 18개의 염기서열, 19개의 염기서열, 20개의 염기서열, 21개의 염기서열, 22개의 염기서열, 23개의 염기서열, 24개의 염기서열 또는 25개의 염기서열일 수 있다.
상기 표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적인 핵산 서열일 수 있으며, 예를 들어 최소한 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상보적이거나 또는 완전하게 상보적인 핵산 서열일 수 있다.
일 예로, 상기 표적 서열은 가이드핵산의 가이드 도메인에 포함된 가이드 서열에 상보적이지 않은 1 내지 8개의 염기서열을 가지거나 또는 포함할 수 있다.
또한, 상기 표적 서열은 에디터단백질이 인식할 수 있는 핵산서열에 근접한 위치에 위치한 염기서열일 수 있다.
일 예로, 상기 표적 서열은 에디터단백질이 인식할 수 있는 핵산서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 염기서열일 수 있다.
본 발명의 표적 서열의 일 구체예로서, gRNA-CRISPR 효소 복합체에 대한 표적 서열을 하단에 기술하였다.
gRNA-CRISPR 효소 복합체를 이용하여 표적 유전자 또는 핵산을 표적하는 경우,
표적 서열은 gRNA의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가진다. 표적 서열은 표적 유전자 또는 핵산에 따라, 즉 유전자 조작 또는 교정하고자 하는 대상에 따라 달라질 수 있는 염기서열로, 표적 유전자 또는 핵산에 따라 다양하게 설계될 수 있다.
또한, 표적 서열은 CRISPR 효소, 즉 Cas9 또는 Cpf1이 인식할 수 있는 PAM 서열에 근접한 위치에 위치한 염기서열일 수 있다.
일 예로, 상기 표적 서열은 CRISPR 효소가 인식할 수 있는 PAM 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 SpCas9인 경우, 상기 표적 서열은 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
다른 일 구체예로서, CRISPR 효소가 StCas9인 경우, 상기 표적 서열은 5'-NGGNG-3' 또는/및 5'-NNAGAAW-3' (W = A 또는 T이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
또 다른 일 구체예로서, CRISPR 효소가 NmCas9인 경우, 상기 표적 서열은 5'-NNNNGATT-3' 또는/및 5'-NNNGCTT-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 CjCas9인 경우, 상기 표적 서열은 5'-NNNVRYAC-3' (V = G, C 또는 A; R = A 또는 G 이며, Y = C 또는 T 이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
다른 일 구체예로서, CRISPR 효소가 SmCas9인 경우, 상기 표적 서열은 5'-NGG-3' 및/또는 5'-NAAR-3'(R = A 또는 G이며, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
또 다른 일 구체예로서, CRISPR 효소가 SaCas9인 경우, 상기 표적 서열은 5'-NNGRR-3', 5'-NNGRRT-3' 또는/및 5'-NNGRRV-3' (R = A 또는 G이며, V = G, C 또는 A이고, N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
일 구체예로서, CRISPR 효소가 Cpf1인 경우, 상기 표적 서열은 5'-TTN-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.
본 발명의 일 구체예로서, 상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자에 포함된 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자에 포함된 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자에 포함된 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자에 포함된 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자에 포함된 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자에 포함된 핵산 서열일 수 있다.
또는
상기 표적서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 일부 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 일부 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 일부 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 일부 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 일부 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 일부 핵산 서열일 수 있다.
또는
상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 암호화, 비암호화 또는 이의 혼합 부분의 핵산 서열일 수 있다.
또는
상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 프로모터, 인핸서, 3’UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 프로모터, 인핸서, 3'UTR, 폴리아데닐(polyA) 또는 이의 혼합 부분의 핵산 서열일 수 있다.
또는
상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 엑손, 인트론 또는 이의 혼합 부분의 핵산 서열일 수 있다.
또는
상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 돌연변이 부분(예를 들면, 야생형 유전자와 다른 부분)을 포함하거나 또는 근접한 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 돌연변이 부분을 포함하거나 또는 근접한 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 돌연변이 부분을 포함하거나 또는 근접한 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 돌연변이 부분을 포함하거나 또는 근접한 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 돌연변이 부분을 포함하거나 또는 근접한 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 돌연변이 부분을 포함하거나 또는 근접한 핵산 서열일 수 있다.
또는
상기 표적 서열은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
상기 표적 서열은 VEGFA 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
상기 표적 서열은 HIF1A 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPT2 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
상기 표적 서열은 EPAS1 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
상기 표적 서열은 ANGPTL4 유전자의 연속하는 5 내지 50개의 핵산 서열일 수 있다.
본 발명의 일 구체예로서, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및 ANGPTL4 유전자의 표적 서열은 앞서 각각 표 1, 표 2, 표 3, 표 4, 표 5에 정리하였다.
신생혈관형성 관련 인자 조작 생성물
4. 가이드핵산 - 에디터단백질 복합체 및 이의 이용
가이드핵산-에디터단백질 복합체는 대상을 변형시킬 수 있다.
상기 대상은 표적 핵산, 유전자, 염색체 또는 단백질일 수 있다.
예를 들어, 가이드핵산-에디터단백질 복합체는 최종적으로 대상하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 할 수 있도록 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 새로운 단백질을 발현할 수 있도록 한다.
이때, 상기 가이드핵산-에디터단백질 복합체는 DNA, RNA, 유전자 또는 염색체 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 DNA를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 RNA를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 염색체를 조작 또는 변형하여 표적 DNA가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 하거나, 또는 단백질을 제거, 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진) 또는 변형된 단백질을 발현할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 유전자의 전사와 번역의 단계에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 전사를 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
다른 일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 유전자의 번역을 촉진 또는 저해하여 표적 유전자가 암호화하는 단백질의 발현을 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
상기 가이드핵산-에디터단백질 복합체는 단백질 수준에서 작용할 수 있다.
일 예로, 상기 가이드핵산-에디터단백질 복합체는 표적 단백질을 조작 또는 변형하여 표적 단백질 제거 또는 단백질 활성 조절(예를 들어, 억제, 저해, 감소, 증가 또는 촉진)할 수 있다.
일 구체예로서, 본 발명은 신생혈관형성 관련 인자, 예를 들면, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 조작하기 위해 사용되는 가이드핵산-에디터단백질 복합체를 제공한다. 바람직하게는 gRNA-CRISPR 효소 복합체를 제공한다.
특히, 유전자로부터의 표적 서열과 상보적 결합을 할 수 있는 가이드 도메인을 포함하는 gRNA, 예를 들어 단리된 또는 비천연 유래 gRNA 및 이를 암호화하는 DNA를 제공할 수 있다. 상기 gRNA 및 이를 암호화하는 DNA 서열은 표 1, 표 2, 표 3, 표 4 및 표 5의 표적 서열에 상보적으로 결합할 수 있도록 설계될 수 있다.
또한, gRNA의 표적 부위는 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자에서 핵산 변형, 예를 들어 이중 가닥 파손 또는 단일 가닥 파손; 또는 표적 위치에 특정 기능을 가지는 제 3의 유전자를 제공하도록 구성된다.
또한, 2 개 이상의 gRNA가 표적 유전자에서 2 개 이상의 절단 사건, 예를 들어 이중 가닥 또는 단일 가닥 파손을 위치시키기 위해 사용될 때, 2 개 이상의 절단 사건이 동일 또는 상이한 Cas9 단백질에 의해 생성될 수 있다.
상기 gRNA 는 예를 들어,
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자에서 2이상의 유전자를 표적으로 할 수 있고,
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 각각 유전자 내에서 2 이상의 부위를 표적으로 할 수 있고,
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 이중 가닥 및/또는 단일 가닥 절단을 독립적으로 유도할 수 있고,
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 절단 부위에 하나 외부 유래 뉴클레오타이드의 삽입을 유도할 수도 있다.
또한, 본 발명의 다른 구체예로서 가이드핵산-에디터단백질 복합체를 구성하는 핵산은
(a) 본 명세서에 개시된 바와 같은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 표적 서열에 상보성인 가이드 도메인을 포함하는 가이드핵산을 암호화하는 서열; 및
(b) 에디터단백질을 암호화하는 서열을 포함할 수 있다.
이때, 상기 (a)는 표적 부위에 따라 2 이상 존재할 수 있고, (b)는 동종 또는 2종 이상의 에디터단백질을 사용할 수 있다.
구현예에서, 핵산은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 발현을 감소시키거나, 줄이거나 또는 억제하기 위해 넉다운 표적 위치에 충분히 가깝도록 효소적으로 불활성인 에디터단백질 또는 이의 융합단백질(예를 들어, 전사 리프레서 도메인 융합)을 표적화하도록 구성한다.
이 밖에도, 앞서 설명한 가이드핵산-에디터단백질 복합체의 구조, 기능, 활용의 모든 양태를 적용하여, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 조작에 사용할 수 있음은 자명할 것이다.
가이드핵산 - 에디터단백질 복합체의 이용
본 발명의 가이드핵산-에디터단백질 복합체 이용의 일 구체예로서, gRNA-CRISPR 효소 복합체를 이용한 표적 DNA, RNA, 유전자 또는 염색체의 조작 또는 변형에 대해 하단에 기술하였다.
유전자 조작
앞서 기재한 gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 조작 또는 교정할 수 있다. 이때, 표적 유전자 또는 핵산을 조작 또는 교정은 i) 표적 유전자 또는 핵산의 절단 또는 손상과 ii) 손상된 표적 유전자 또는 핵산의 수선 또는 수복하는 단계를 모두 포함한다.
i) 표적 유전자 또는 핵산의 절단 또는 손상
i) 표적 유전자 또는 핵산의 절단 또는 손상은 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상일 수 있으며, 구체적으로는 표적 유전자 또는 핵산 내의 표적 서열의 절단 손상일 수 있다.
일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열의 이중가닥이 모두 절단 또는 손상되는 것일 수 있다.
일 구체예로서, 야생형의 SpCas9을 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 모두 절단될 수 있다.
다른 일 구체예로서, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
또 다른 일 구체예로서, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)와 서로 다른 표적 서열을 가지는 두 개의 gRNA를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 2 gRNS와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단될 수 있고, 각각의 절단은 순차적으로 또는 동시에 발생할 수 있다.
다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 표적 서열 중 단일가닥만 절단 또는 손상되는 것일 수 있다. 이때, 단일가닥은 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥일 수 있고, 또는 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥일 수 있다.
일 구체예로서, SpCas9 니카아제(D10A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 절단되지 않을 수 있다.
다른 일 구체예로서, SpCas9 니카아제(H840A)를 이용하는 경우, gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 절단되지 않을 수 있다.
또 다른 일 예로, 상기 CRISPR 복합체를 이용한 표적 유전자 또는 핵산의 절단 또는 손상은 일부 핵산 조각(fragment)를 제거하는 것일 수 있다.
일 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 야생형 SpCas9을 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥을 절단하여 제 1 gRNA와 제 2 gRNA 및 SpCas9에 의해 핵산 조각을 제거할 수 있다.
다른 일 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 야생형 SpCas9 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 야생형 SpCas9에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA와 제 2 gRNA 및 야생형 SpCas9, SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
또 다른 구체예로서, 서로 다른 표적 서열을 가지는 두 개의 gRNA와 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해, 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA와 제 2 gRNA 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
다른 구체예로서, 서로 다른 표적 서열을 가지는 세 개의 gRNA와 야생형 SpCas9 및 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 이중가닥은 야생형 SpCas9에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되며, 제 3 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA, 제 2 gRNA 및 제 3 gRNA와 야생형 SpCas9, SpCas9 니카아제(D10A) 및 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
또 다른 구체예로서, 서로 다른 표적 서열을 가지는 네 개의 gRNA와 SpCas9 니카아제(D10A)와 SpCas9 니카아제(H840A)를 이용하는 경우, 제 1 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 2 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되며, 제 3 gRNA와 상보적 결합을 하는 표적 서열의 상보성 단일가닥은 SpCas9 니카아제(D10A)에 의해 절단되고, 제 4 gRNA와 상보적 결합을 하는 표적 서열의 비상보성 단일가닥은 SpCas9 니카아제(H840A)에 의해 절단되어 제 1 gRNA, 제 2 gRNA, 제 3 gRNA 및 제 4 gRNA와 SpCas9 니카아제(D10A)및 SpCas9 니카아제(H840A)에 의해 핵산 조각을 제거할 수 있다.
ii) 손상된 표적 유전자 또는 핵산의 수선 또는 수복
상기 CRISPR 복합체에 의해 절단 또는 손상된 표적 유전자 또는 핵산은 비-상동성 말단-결합 (NHEJ) 및 상동 재조합 수리(HDR)을 통해 수선 또는 수복될 수 있다.
비- 상동성 말단-결합 (Non-homologous end joining, NHEJ )
NHEJ는 절단된 이중가닥 또는 단일가닥의 양 말단이 함께 결합함으로써 DNA 내 이중가닥 파손을 수복 또는 수선하는 방법으로, 일반적으로, 이중가닥의 파손(예를 들어, 절단)에 의해 형성된 2 개의 적합성 말단이 빈번한 접촉을 반복하여 2개의 말단이 완전히 결합되는 경우 파손된 이중가닥이 복구된다. NHEJ는 모든 세포주기에서 가능한 수복 방식으로, 주로 G1 시기와 같이 세포 내에 주형으로 쓸 상동유전체가 없을 때 발생한다.
NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에서 NHEJ 수선 부위에 핵산 서열의 일부 삽입 및/또는 결실(삽입결실)을 초래하며, 이러한 삽입 및/또는 결실은 리딩 프레임을 변경시키고, 프레임쉬프트 된 전사체 mRNA를 만들어내고, 결과적으로 넌센스-매개 붕괴(nonsense mediated decay)를 겪거나 정상적인 단백질을 합성하는데 실패함으로써 본래의 기능을 상실하게 된다. 또는 추가적으로, 리딩 프레임을 유지하지만, 상당한 양의 서열을 삽입 또는 결실시키는 돌연변이를 초래해 단백질의 기능성을 파괴할 수 있다. 이는 중요한 기능적 도메인의 돌연변이가 단백질의 비중요 영역에서의 돌연변이보다 덜 용인될 가능성이 있기 때문에 좌위 의존적이다.
NHEJ에 의해 생성된 삽입결실 돌연변이는 자연 상태에서 예측 불가능하지만, 주어진 파손 부위에서 특정 삽입 결실 서열이 선호되며, 이는 마이크로상동성의 작은 영역에 기인할 가능성이 있다. 통상적으로 결실 길이는 1 bp 내지 50 bp 범위이며, 삽입은 더 짧게 되는 경향이 있고, 종종 파손 부위를 바로 둘러싸는 짧은 중복 서열을 포함한다.
또한, NHEJ는 돌연변이를 유발하는 과정으로, 특이적 최종 서열의 생성이 필요하지 않은 경우, 작은 서열의 모티프를 결실시키는데 사용될 수 있다.
이러한 NHEJ를 이용하면, CRISPR 복합체에 의해 표적되는 유전자의 특이적 넉아웃(knockout)할 수 있다. CRISPR 효소, 예를 들어, Cas9 또는 Cpf1을 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥의 절단하고, 파손된 표적 유전자 또는 핵산의 이중가닥 또는 두 개의 단일가닥은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다. 이때, 상기 CRISPR 효소에 의해 절단되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있으며, 더불어 NHEJ에 의해 수복되는 표적 유전자 또는 핵산의 위치는 비암호 영역 또는 암호 영역일 수 있다.
상동 재조합 수리(homology directed repairing, HDR )
HDR은 손상된 유전자 또는 핵산을 수선 또는 수복하기 위해 상동성을 가진 서열을 주형으로 이용하는 방식으로 오류 없이 교정할 수 있는 방법으로, 일반적으로, 파손된 DNA을 수선 또는 수복하기 위해, 즉 세포가 가지고 있는 원래의 정보를 복원하기 위해, 변형이 이루어지지 않은 상보적인 염기서열의 정보를 이용하거나 자매 염색분체의 정보를 이용하여 파손된 DNA를 수선 또는 수복한다. HDR의 가장 일반적인 형태는 상동성 재조합(homologous recombination, HR)이다. HDR은 통상적으로 활발하게 분열하는 세포의 S나 G2/M 시기에 주로 발생하는 수선 또는 수복 방식이다.
HDR을 이용한 손상된 DNA 수선 또는 수복을 위해, 세포가 본래 가지는 상보적인 염기서열 또는 자매 염색분체를 이용하는 대신에, 상보적인 염기서열 또는 상동성 염기서열 정보를 이용한 인공적으로 합성한 DNA 주형, 즉, 상보적인 염기서열 또는 상동성 염기서열을 포함하는 핵산 주형을 세포에 제공하여 파손된 DNA를 수선 또는 수복할 수 있다. 이때, 상기 핵산 주형에 추가로 핵산 서열 또는 핵산 조각을 포함시켜 파손된 DNA를 수선 또는 수복 할 때, 파손된 DNA에 추가로 포함시킨 핵산 서열 또는 핵산 조작을 삽입(Knock-In)할 수 있다. 추가로 포함시킨 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있으나, 이에 제한되지 않는다.
일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 염기서열과 상보적인 염기서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 염기서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상보적인 염기서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상보적인 염기서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상보적인 염기서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 염기서열과 상보적인 결합을 하는 염기서열일 수 있다. 또는 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상보적인 결합을 하는 염기서열일 수 있다. 상기 상보적인 염기서열은 15 내지 3000개의 염기서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상보적인 염기서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
다른 일 예로, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산의 이중가닥 또는 단일가닥을 절단하고, 절단 위치와 근접한 염기서열과 상동성 염기서열을 포함하는 핵산 주형을 세포에 제공하여 표적 유전자 또는 핵산의 절단된 염기서열을 HDR 방법으로 수선 또는 수복할 수 있다.
이때, 상기 상동성 염기서열을 포함하는 핵산 주형은 파손된 DNA, 즉 절단된 이중가닥 또는 단일가닥의 상동성 염기서열을 가지며, 추가로 파손된 DNA에 삽입하기 원하는 핵산 서열 또는 핵산 조각을 포함할 수 있다. 이와 같이 상동성 염기서열과 삽입하고자 하는 핵산 서열 또는 핵산 조각을 포함하는 핵산 주형을 이용하여 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 위치에 추가적인 핵산 서열 또는 핵산 조각을 삽입할 수 있다. 이때, 상기 삽입하고자 하는 핵산 서열 또는 핵산 조각 및 추가적인 핵산 서열 또는 핵산 조각은 돌연변이의 변형된 표적 유전자 또는 핵산을 정상 유전자 또는 핵산으로 교정하기 위한 핵산 서열 또는 핵산 조각이거나 세포 내에서 발현을 원하는 유전자 또는 핵산일 수 있다. 상기 상동성 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 오른쪽 및 왼쪽의 염기서열과 상동성을 가지는 염기서열일 수 있다. 또는 상기 상보적인 염기서열은 파손된 DNA, 즉 표적 유전자 또는 핵산의 절단된 이중가닥 또는 단일가닥의 3' 및 5' 말단과 상동성을 가지는 염기서열일 수 있다. 상기 상동성 염기서열은 15 내지 3000개의 염기서열일 수 있으며, 핵산 주형의 크기 또는 표적 유전자 또는 핵산에 따라 적절하게 상기 상동성 염기서열의 길이 또는 크기를 설계할 수 있다. 이때, 핵산 주형을 이중가닥 또는 단일가닥의 핵산일 수 있으며, 선형 또는 원형일 수 있으나, 이에 제한되지 않는다.
상기의 NHEJ와 HDR 외에도 파손된 DNA를 수선 또는 수복하는 방법이 존재한다.
단일가닥 어닐링 (Single-strand annealing, SSA )
SSA는 표적 핵산 중에 존재하는 2개의 반복부 서열 사이의 이중가닥 파손을 수선하는 방법으로, 일반적으로 30개 초과의 염기서열의 반복부 서열을 이용한다. 파손 말단에서 표적 핵산의 이중가닥에 대해 반복부 서열을 각각의 단일가닥이 가지도록 절단(Sticky end가 되도록)되며, 절단 후 반복부 서열을 함유하는 단일가닥 돌출부는 반복체 서열이 자체적으로 부적절하게 어닐링되는 것을 방지하기 위해 RPA 단백질로 코팅된다. RAD52는 돌출부 상의 각각의 반복부 서열에 결합하고, 상보성 반복부 서열의 어닐링을 가능하게 하는 서열을 정렬한다. 어닐링 후에, 돌출부의 단일가닥 플랩(flap)은 절단되고, 새로운 DNA 합성이 임의의 갭을 채우면서 DNA 이중가닥을 복원한다. 이러한 수복 또는 수선의 결과로, 2개의 반복체 사이의 DNA 서열이 결실되며, 결실 길이는 이용되는 2개의 반복체의 위치를 포함하는 다수의 인자 및 절단 경로 또는 진행도에 의존될 수 있다.
SSA는 HDR 방식과 유사하게는 상보성 서열, 즉 상보성 반복부 서열을 이용하고, 대조적으로는 표적 핵산 서열을 변경 또는 수정하기 위한 핵산 주형을 필요로 하지 않는다.
단일가닥 파손 수선(Single-strand break repair, SSBA )
게놈 내 단일가닥 파손은 상기 논의된 수선 메커니즘과는 별도의 메커니즘인 SSBR을 통해 수선 또는 수복된다. DNA 파손의 형태가 단일가닥 파손일 때, PARP1 및/또는 PARP2는 파손을 인식하고 수선 기작을 동원한다. DAN 파손에서 PARP1의 결합 및 활성을 일시적이며, 손상부에 SSBR 단백질 복합체의 안정성을 촉진함으로써 SSBR을 촉진시킨다. SSBR 복합체에서 가장 중요한 단백질은 XRCC1으로, 이는 DNA의 3’ 및 5’ 말단 가공을 촉진하는 단백질과 상호작용하며, 안정화시킨다. 말단 가공은 일반적을 손상된 3’ 말단을 하이드록실화 된 상태 및/또는 5’ 말단을 인산염 모이어티로 복구하는 것을 수반하며, 말단이 가공되면, DNA 갭 채우기가 일어난다. DNA 갭 채우기에는 2가지 방법, 즉, 짧은 패치 수선 및 긴 패치 수선이 있으며, 이때 짧은 패치 수선은 빠져있는 단일 염기의 삽입을 수반한다. DNA 갭 채우기 후, DNA 리가아제는 말단의 결합을 촉진한다.
미스매치 수선(Mismatch repair, MMR )
MMR은 잘못 짝지어진 DNA 염기상에서 작용한다. MSH2/6 또는 MSH2/3 복합체는 둘 다 미스매치 인식 및 수선의 개시에서 중요한 역할을 하는 ATP 분해효소 활성을 가지며, MSH2/6는 염기-염기 미스매치를 우선적으로 인식하고, 1개 또는 2개의 염기의 미스매치를 동정하는 반면, MSH2/3는 더 큰 미스매치를 우선적으로 인식한다.
염기 절단 수선(Base excision repair, BER )
BER은 세포주기 전체에서 활성이며, 게놈으로부터 작은 비-나선-뒤틀림 염기 손상부를 제거하는데 이용되는 수선 방식이다. 손상된 DNA는 당 인산화 백본에 염기를 연결하는 N-글리코사이드 결합을 절단하여 손상된 염기를 절단하고, 이어서 포스포디에스테르 백본을 절단하여 DNA 단일가닥 파손을 생성한다. 이렇게 형성된 파손된 단일가닥 말단을 제거하고, 제거된 단일가닥에 의해 발생된 갭을 새로운 상보성 염기로 채운 후, DNA 리가아제로 새로 채워진 상보성 염기 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
뉴클레오타이드 절단 수선(Nucleotide excision repair, NER )
NER은 DNA로부터 큰 나선-뒤틀림 손상을 제거하는 중요한 절단 메커니즘으로, 손상이 인식되면, 손상부를 함유하는 짧은 단일가닥 DNA 세그먼트를 제거하여, 22개 내지 30개 염기의 단일가닥 갭을 생성한다. 생성된 갭은 새로운 상보성 염기로 채운 후, DNA 리가아제로 새로 채워진 상보성 염기 말단과 백본을 결합시켜 손상된 DNA를 수선 또는 수복한다.
유전자 조작 효과
표적 유전자 또는 핵산을 조작 또는 교정은 크게 넉아웃(knockout), 넉다운(knockdown), 넉인(knockin)의 효과를 초래할 수 있다.
넉아웃(Knockout)
"넉아웃(knockout)"은 표적 유전자 또는 핵산을 불활성화시키는 것을 의미하며, “표적 유전자 또는 핵산의 불활성화”는 표적 유전자 또는 핵산의 전사 및/또는 번역이 되지 못하는 상태를 의미한다. 넉아웃을 통해 질병을 유발하는 유전자 또는 비정상적 기능을 가지는 유전자의 전사 및 번역을 억제하여 단백질의 발현을 막을 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 NHEJ를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 파손된 표적 유전자 또는 핵산은 NHEJ에 의해 삽입결실이 생성되며, 이를 통해 표적 유전자 또는 핵산의 특이적 넉아웃을 유도할 수 있다.
넉다운(Knockdown)
"넉다운(knockdown)"은 표적 유전자 또는 핵산의 전사 및/또는 번역을 감소시키거나 표적 단백질의 발현이 감소하는 것을 의미한다. 넉다운을 통해 과발현되는 유전자 또는 단백질의 발현을 조절하여 질병의 발생을 막거나 질병을 치료할 수 있다.
예를 들어, gRNA- CRISPR 불활성 효소-전사 저해 활성 도메인 복합체, 즉, 전사 저해 활성 도메인을 포함하는 CRISPR 불활성 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, 상기 CRISPR 불활성 복합체가 표적 유전자 또는 핵산에 특이적으로 결합하고, CRISPR 불활성 복합체에 포함된 전사 저해 활성 도메인에 의해 표적 유전자 또는 핵산의 전사가 저해되어 해당 유전자 또는 핵산의 발현이 저해되는 넉다운을 유도할 수 있다.
넉인( Knockin )
"넉인(knockin)"은 표적 유전자 또는 핵산에 특정 핵산 또는 유전자를 삽입하는 것을 의미하며, 이때, "특정 핵산"은 삽입하고자 하는 또는 발현시키기 원하는 유전자 또는 핵산을 의미한다. 넉인을 통해 질병을 유발하는 돌연변이 유전자를 올바르게 교정하거나, 정상 유전자를 삽입하여 정상 유전자의 발현을 유도하여 질병 치료에 이용할 수 있다.
더불어, 넉인은 추가적으로 도너(donor)를 필요로 할 수 있다.
예를 들어, gRNA-CRISPR 효소 복합체, 즉, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 편집 또는 교정하는 경우, CRISPR 복합체를 이용하여 표적 유전자 또는 핵산을 절단할 수 있다. CRISPR 복합체를 이용하여 손상된 표적 유전자 또는 핵산은 HDR를 통해 손상된 유전자 또는 핵산이 수복될 수 있다. 이때, 도너를 이용하여 손상된 유전자 또는 핵산에 특정 핵산을 삽입할 수 있다.
상기 "도너(donor)"는 손상된 유전자 또는 핵산의 HDR을 통한 수복을 돕는 핵산서열을 의미하며, 이때, 도너는 특정 핵산을 포함할 수 있다.
상기 도너는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 도너는 선형 또는 원형일 수 있다.
상기 도너는 표적 유전자 또는 핵산에 상동성을 가지는 핵산서열을 포함할 수 있다.
예를 들어, 도너는 특정 핵산을 삽입하고자 하는 위치, 예를 들어, 손상된 핵산의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이때, 삽입하고자 하는 특정 핵산은 손상된 핵산의 오른쪽 염기서열과 상동성을 가지는 핵산서열과 손상된 핵산의 왼쪽 염기서열과 상동성을 가지는 핵산서열 사이에 위치할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
상기 도너는 선택적으로 부수적인 핵산서열을 포함할 수 있다. 이때, 부수적인 핵산서열은 도너의 안정성, 넉인 효율 또는 HDR 효율을 높이는 역할을 하는 것일 수 있다.
예를 들어, 상기 부수적인 핵산서열은 염기 A, T가 풍부한 핵산서열, 즉, A-T 풍부 도메인(A-T rich domain)일 수 있다. 또는 상기 부수적인 핵산서열은 SMAR(scaffold/matrix attachment region)일 수 있다.
본 발명의 유전자 조작 효과에 관한 일 구체예로서, gRNA-CRISPR효소 복합체를 이용하여 수득한 조작된 표적 유전자, 즉, 조작된 신생혈관형성 관련 인자는 하기와 같은 구성을 가질 수 있다.
일 구체예로서, 신생혈관형성 관련 인자가 유전자인 경우,
gRNA-CRISPR효소 복합체에 의해 인위적으로 조작된 신생혈관형성 관련 인자의 구성은,
상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 PAM 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
외부 유래의 하나 이상의 뉴클레오타이드 삽입
중 하나 이상의 핵산의 변형을 포함할 수 있다.
또한, 상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다.
이때, "외부 유래 뉴클레오타이드"는 신생혈관형성 관련 인자가 본래 가지고 있는 뉴클레오타이드가 아니라, 외부로부터 생성된, 예를 들어, 이종 생물 유래 또는 인위적으로 합성한 뉴클레오타이드를 모두 포함하는 개념이다. 50bp 이하의 작은 크기의 올리고뉴클레오타이드뿐만 아니라, 특정 기능을 가지는 단백질의 발현을 위한 큰 크기의 수백, 수천, 또는 수만 bp의 뉴클레오타이드도 포함한다. 이러한 외부 유래 뉴클레오타이드는 도너(donor)일 수 있다.
상기 화학적 변형은 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화 등을 포함하고, 예를 들어, 뉴클레오티드가 가지고 있는 작용기의 일부가 수소원자, 불소원자, -O-알킬기, -O-아실기, 및 아미노기 중 어느 하나로 치환되거나, 이에 제한되지 않는다. 또한, 핵산 분자의 전달능을 높이기 위해 -Br, -Cl, -R, -R'OR, -SH, -SR, -N3 및 -CN (R= alkyl, aryl, alkylene) 중 어느 하나로도 치환될 수 있다. 또한, 적어도 1개의 뉴클레오티드의 포스페이트 백본이 alkylphosphonate form, phosphoroamidate form 및 boranophosphate form 중 어느 하나로 치환될 수 있다. 또한, 상기 화학적 변형은 상기 핵산 분자에 포함되는 적어도 1종의 뉴클레오티드가 LNA (locked nucleic acid), UNA(unlocked nucleic acid), Morpholino, PNA (peptide nucleic acid) 중 어느 하나로 치환된 것임을 특징으로 할 수 있으며, 상기 화학적 변형은 상기 핵산 분자가 지질, 세포 투과성 펩타이드(cell penetrating peptide) 및 세포 표적 리간드로 구성된 군에서 선택되는 하나 이상과 결합 되는 것을 특징으로 할 수 있다.
목적하는 신생혈관형성 조절 시스템을 형성하기 위하여 gRNA-CRISPR 효소 복합체에 의해 인위적으로 신생혈관형성 관련 인자를 구성하는 핵산에 변형을 가할 수 있다.
신생혈관형성 관련 인자의 핵산 변형을 포함하는 부위는 표적 부위 또는 표적 서열일 수 있다.
이러한 표적 서열은 gRNA-CRISPR 효소 복합체의 타겟이 될 수 있고, 상기 표적 서열은 CRISPR 효소가 인식하는 PAM 서열을 포함하거나 또는 포함하지 않을 수 있다. 이러한 표적 서열은 실시자에게 gRNA 설계 단계에서 중요한 기준을 제공할 수 있다.
이러한 핵산 변형은 핵산의 "절단(cleavage)"를 포함한다.
표적 부위의 "절단(cleavage)"은 폴리뉴클레오타이드의 공유결합(covalent backbone)의 파손(breakage)을 의미한다. 절단은 포스포다이에스터(phosphodiester) 결합의 효소적 또는 화학적 가수분해를 포함하나, 이에 제한되지 않으며, 이외의 다양한 여러 가지 방법들에 의하여 수행될 수 있다. 단일가닥의 절단 및 이중가닥의 절단 모두 가능하며, 이중가닥의 절단은 두 개의 구별되는(distinct) 단일-가닥의 절단의 결과로서 발생할 수 있다. 이중 가닥의 절단은 blunt ends 또는 staggered end를 생성할 수 있다.
불활성화된 CRISPR 효소를 사용하는 경우, 상기 절단 프로세스 없이, 특정 기능을 보유하는 인자를 표적 부위 또는 신생혈관형성 관련 인자의 임의의 부위에 가깝게 위치할 수 있도록 유도할 수 있다. 이러한 특정 기능에 따라 신생혈관형성 관련 인자의 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형을 포함할 수 있다.
일 예로서, gRNA-CRISPR 효소 복합체에 의해 형성되는 핵산의 절단을 통해, 표적 및 비표적 활성에 의해 다양한 인델 (indel; insertion and deletion)이 발생할 수 있다.
"인델(indel)"은 DNA의 염기 배열에서 일부 염기가 중간에 삽입 (insertion)되거나 결실 (deletion) 된 변이를 총칭한다. 인델은 상술한 바와 같이 gRNA-CRISPR 효소 복합체가 신생혈관형성 관련 인자의 핵산(DNA, RNA)을 절단하는 경우, HDR 또는 NHEJ 기작에 의해 수선되는 과정에서 표적 서열에 도입되는 것일 수 있다.
본 발명의 인위적으로 조작된 신생혈관형성 관련 인자란, 이러한 핵산의 절단 및 인델, 도너를 이용한 삽입 등으로 본래 유전자의 핵산서열에 변형이 이루어진 것으로서, 목적하는 신생혈관형성 조절 시스템, 예를 들어 신생혈관형성 촉진 또는 억제 등의 효과를 발휘하는 데 기여한다.
예를 들어,
상기 인위적으로 조작된 신생혈관형성 관련 인자에 의해 특정 단백질의 발현 및 활성을 촉진시킬 수 있다.
상기 인위적으로 조작된 신생혈관형성 관련 인자에 의해 특정 단백질을 불활성화시킬 수 있다.
일 예로, 유전체(genome) 중 신생혈관형성 관련 인자들 예컨대, 역 조절 유전자들 예컨대, VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 특정 타겟 부위를 절단하여 상기 유전자를 넉다운 또는 넉아웃시킬 수 있다.
다른 예로, 표적화된 넉다운은 전사를 변경하기 위해, 예를 들어 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 전사를 차단하거나, 저감시키거나 또는 감소시키기 위해 전사 리프레서 도메인 또는 염색질 변형 단백질에 융합된 효소적으로 불활성인 CRISPR 효소를 이용함으로써 매개될 수 있다.
상기 인위적으로 조작된 신생혈관형성 관련 인자에 의해 신생혈관형성을 조절할 수 있다.
상기 인위적으로 조작된 신생혈관형성 관련 인자에 의해 신생혈관형성 관련 질환을 개선 또는 치료할 수 있다.
본 발명의 일 구체예로서, 인위적으로 조작된 신생혈관형성 관련 인자는 gRNA-CRISPR 효소 복합체의 구성적 특징(예를 들면, 신생혈관형성 관련 인자의 표적 부위에 포함 또는 근접한 주요 PAM 서열의 상이함)에 따라 다양한 인위적으로 조작된 신생혈관형성 관련 인자를 제공할 수 있다.
이하, 대표적인 CRISPR 효소 예들 및 신생혈관형성 조절 유전자를 중심으로 기술하지만, 이는 특정 예시에 지나지 않고 이러한 내용으로 본 발명이 제한되지는 않는다.
예를 들어, CRISPR 효소가 SpCas9 단백질인 경우, 상기 PAM 서열은 5'-NGG-3' (N은 A, T, G, 또는 C임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 표적 유전자 내의 5'-NGG-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
신생혈관형성 관련 인자의 핵산서열 내의
a) 5'-NGG-3' (N은 A, T, C 또는 G임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b) 5'-NGG-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c) 5'-NGG-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d) 상기 a) 내지 c) 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
예를 들어, CRISPR 효소가 CjCas9 단백질인 경우, 상기 PAM 서열은 5'-NNNNRYAC-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 타겟 유전자 내의 5'-NNNNRYAC-3' 서열의5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
신생혈관형성 관련 인자의 핵산서열 내의
a') 5'-NNNNRYAC-3' (N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C 또는 T임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b') 5'-NNNNRYAC-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형유전자와 상이한 뉴클레오타이드로의 치환,
c') 5'-NNNNRYAC-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d') 상기 a') 내지 c') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
예를 들어, CRISPR 효소가 StCas9 단백질인 경우, 상기 PAM 서열은 5'-NNAGAAW-3'(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 타겟 유전자 내의 5'-NNAGAAW-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
신생혈관형성 관련 인자의 핵산서열 내의
a'') 5'-NNAGAAW-3' (N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임)서열의 5' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b'') 5'-NNAGAAW-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c'') 5'-NNAGAAW-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d'') 상기 a'') 내지 c'') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
예를 들어, CRISPR 효소가 NmCas9 단백질인 경우, 상기 PAM 서열은 5'-NNNNGATT-3'(N은 각각 독립적으로 A, T, C 또는 G임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 타겟 유전자 내의 5'-NNNNGATT-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
신생혈관형성 관련 인자의 핵산서열 내의
a''') 5'-NNNNGATT-3' (N은 각각 독립적으로 A, T, C 또는 G임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b''') 5'-NNNNGATT-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c''') 5'-NNNNGATT-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d''') 상기 a''') 내지 c''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
예를 들어, CRISPR 효소가 SaCas9 단백질인 경우, 상기 PAM 서열은 5'-NNGRR(T)-3'(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, (T)는 임의로 포함가능한 서열을 의미함)이고, 상기 절단되는 염기서열 부위(표적 부위)는 타겟 유전자 내의 5'-NNGRR(T)-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.
신생혈관형성 관련 인자의 핵산서열 내의
a'''') 5'-NNGRR(T)-3' (N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b'''') 5'-NNGRR(T)-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로의 치환,
c'''') 5'-NNGRR(T)-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d'''') 상기 a'''') 내지 c'''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
예를 들어, CRISPR 효소가 Cpf1 단백질인 경우, 상기 PAM 서열은 5'-TTN-3'(N은 A, T, C 또는 G임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 타겟 유전자 내의 5'-TTN-3' 서열의 5' 말단 또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp, 17bp 내지 30bp, 또는 17bp 내지 26bp의 염기서열 부위일 수 있다.
상기 Cpf1 단백질은 Parcubacteria bacterium (GWC2011_GWC2_44_17), Lachnospiraceae bacterium (MC2017), Butyrivibrio proteoclasiicus, Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp . (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium (ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi(237), Smiihella sp . (SC_KO8D17), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, Eubacterium eligens 등의 미생물 유래의 것일 수 있으며, 예컨대, Parcubacteria bacterium (GWC2011_GWC2_44_17), Peregrinibacteria bacterium (GW2011_GWA_33_10), Acidaminococcus sp. (BV3L6), Porphyromonas macacae, Lachnospiraceae bacterium(ND2006), Porphyromonas crevioricanis, Prevotella disiens, Moraxella bovoculi(237), Leptospira inadai, Lachnospiraceae bacterium (MA2020), Francisella novicida (U112), Candidatus Methanoplasma termitum, 또는 Eubacterium eligens 유래의 것일 수 있으나, 이에 제한되는 것은 아니다.
신생혈관형성 관련 인자의 핵산서열 내의
a''''') 5'-TTN-3'(N은 A, T, C 또는 G임) 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 결실,
b''''') 5'-TTN-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 내의 하나 이상의 뉴클레오타이드의 야생형 유전자와 상이한 뉴클레오타이드로 의 치환,
c''''') 5'-TTN-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 10bp 내지 30bp, 예컨대, 15bp 내지 26bp의 염기 서열 부위 내로의 하나 이상의 뉴클레오타이드의 삽입, 또는
d''''') 상기 a''''') 내지 c''''') 중에서 선택된 2 가지 이상의 조합
에 의한 것인, 인위적으로 조작된 신생혈관형성 관련 인자, 예를 들어, 인위적으로 조작된 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 제공할 수 있다.
다른 구체예로서, 신생혈관형성 관련 인자가 단백질인 경우,
인위적으로 조작된 단백질은 gRNA-CRISPR 효소 복합체의 직간접 작용에 의해 형성되는 새로운 또는 변경된 혈관혈성에 관여하는 모든 단백질을 포함한다.
예를 들어, gRNA-CRISPR 효소 복합체에 의해 인위적으로 조작된 신생혈관형성 관련 인자(유잔자)에 의해 발현된 단백질 또는 이러한 단백질 활성에 의해 영향을 받아 증가되거나 감소된 타 단백질일 수 있지만, 이에 제한되지 않는다.
상기 인위적으로 조작된 신생혈관형성 관련 인자(단백질)는 상기 인위적으로 조작된 신생혈관형성 관련 인자(유잔자)의 구성과 상응하는 아미노산 구성 및 활성을 가질 수 있다, 일 구체예로서:
(i) 발현 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 신생혈관형성 관련 인자의 핵산서열 내 PAM 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 따른 발현량 감소 또는 증가;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 따른 발현량 감소 또는 증가;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 따른 발현량 감소 또는 증가, 또는 융합 단백질의 발현 또는 특정 단백질의 독립적인 발현;
상기 설명한 단백질들의 발현 특성에 영향을 받는 제3의 단백질의 발현량 감소 또는 증가;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
(ii) 구조 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 신생혈관형성 관련 인자의 핵산서열 내 PAM 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 따른 코돈 변경, 아미노산의 변경, 및 3차원 구조의 변경;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 따른 코돈 변경, 아미노산의 변경, 이에 따른 3차원 구조의 변경;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 따른 코돈 변경, 아미노산의 변경 및 3차원 구조의 변경, 또는 특정 단백질과의 융합 구조 또는 특정 단백질이 분리되는 독립적 구조;
상기 설명한 구조특성이 변화된 단백질의 영향을 받는 제3의 단백질의 코돈 변경, 아미노산의 변경, 및 3차원 구조의 변경;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
(iii) 기능 특성이 변화된, 인위적으로 조작된 단백질을 제공할 수 있다.
예를 들어, 신생혈관형성 관련 인자의 핵산서열 내 PAM 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp, 1bp 내지 40bp, 1bp 내지 30bp, 바람직하게는 3bp 내지 25bp의 염기 서열 부위 내의
하나 이상의 뉴클레오타이드의 결실 또는 삽입에 기인하는 단백질 변형에 의해 특정 기능의 활성화 또는 불활성화 또는 새로운 신생혈관형성 기능의 도입;
야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환에 기인하는 단백질 변형에 의해 특정 기능의 활성화 또는 불활성화 또는 새로운 기능의 도입;
외부 유래의 하나 이상의 뉴클레오타이드 삽입에 기인하는 단백질 변형에 의해 특정 기능의 활성화 또는 불활성화 또는 새로운 기능의 도입, 특히 특정 단백질의 융합 발현 또는 독립적 발현으로 기존 기능에 제3의 기능을 도입할 수 있음;
상기 설명한 기능 특성이 변화된 단백질의 영향을 받는 제3의 단백질의 기능 변경;
중 하나 이상의 특징을 가지는 단백질의 변형을 포함할 수 있다.
또한, 신생혈관형성 관련 인자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형에 의한 인위적으로 조작된 단백질을 포함할 수 있다.
예를 들어, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보실화, 미리스틸화, 및 글리코실화에 의한 단백질의 발현 특성, 구조 특성 및 기능 특성 중 1 이상의 특성이 변경될 수 있다.
예를 들어, 뉴클레오타이드의 화학적 변형에 의해 제3의 단백질이 유전자의 핵산 서열 내 결합함으로써 제3의 구조 및 기능을 부여할 수 있다.
5. 기타 추가 구성물
가이드핵산-에디터단백질 복합체의 효율을 증가 또는 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위해 선택적으로 추가 구성물을 포함할 수 있다.
추가 구성물은 가이드핵산-에디터단백질 복합체의 효율을 향상시키기 위해 선택적으로 이용될 수 있다.
액티베이터 (activator)
추가 구성물은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 높이기 위한 액티베이터(activator)로 이용될 수 있다.
상기 "액티베이터(activator)"는 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합을 안정화 시키거나, 또는 가이드핵산-에디터단백질 복합체를 표적 핵산, 유전자 또는 염색체에 더 잘 접근시킬 수 있도록 역할하는 핵산을 의미한다.
상기 액티베이터는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 액티베이터는 선형 또는 원형일 수 있다.
상기 액티베이터는 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합을 안정화시키는 "헬퍼(helper)"와 가이드핵산-에디터단백질 복합체를 표적 핵산, 유전자 또는 염색체에 더 잘 접근시킬 수 있도록 역할하는 "에스코터(escortor)"로 나눌 수 있다.
상기 헬퍼는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 증가시킬 수 있다.
예를 들어, 상기 헬퍼는 표적 핵산, 유전자 또는 염색체에 상동성을 가지는 핵산서열을 포함하여 가이드핵산-에디터단백질 복합체가 표적 핵산, 유전자 또는 염색체에 결합할 때, 상기 헬퍼에 포함된 상동성을 가지는 핵산서열이 표적 핵산, 유전자 또는 염색체와 추가적인 상보적인 결합을 이루어 가이드핵산-에디터단백질 복합체와 표적 핵산, 유전자 또는 염색체의 결합이 안정화될 수 있도록 할 수 있다.
상기 에스코터는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자 또는 염색체의 절단 효율을 증가시킬 수 있다.
예를 들어, 상기 에스코터는 표적 핵산, 유전자 또는 염색체에 상동성을 가지는 핵산서열을 포함하고, 이때, 상기 에스코터에 포함된 상동성을 가지는 핵산서열이 가이드핵산-에디터단백질 복합체의 가이드핵산과 일부 상보적 결합을 할 수 있다. 이를 통해, 가이드핵산-에디터단백질 복합체와 일부 상보적인 결합을 한 에스코터는 표적 핵산, 유전자 또는 염색체와 일부 상보적인 결합을 할 수 있고, 그 결과 에스코터는 가이드핵산-에디터단백질 복합체를 정확한 표적 핵산, 유전자 또는 염색체 위치에 접근하도록 할 수 있다.
상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
또한, 추가 구성물은 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위해 선택적으로 이용될 수 있다.
어시스터 ( Assistor )
추가 구성물은 손상된 유전자 또는 핵산의 수복 효율을 향상시키기 위한 어시스터(assistor)로 이용될 수 있다.
상기 "어시스터(assistor)"는 손상된 유전자 또는 핵산, 예를 들어, 가이드핵산-에디터단백질 복합체에 의해 절단된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 높이는 역할을 하는 핵산을 의미한다.
상기 어시스터는 이중가닥 핵산 또는 단일가닥 핵산일 수 있다.
상기 어시스터는 선형 또는 원형일 수 있다.
상기 어시스터는 수복 방법에 따라 NHEJ를 이용한 수복 과정에 참여하거나 수복 효율을 향상시키는 "NHEJ 어시스터"와 HDR을 이용한 수복 과정에 참여하거나 수복 효율을 향상시키는 "HDR 어시스터"로 나눌 수 있다.
상기 NHEJ 어시스터는 NHEJ를 이용한 손상된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 향상시킬 수 있다.
예를 들어, 상기 NHEJ 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열을 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 일 말단(예를 들어 3' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함하며, 또한 손상된 핵산서열의 다른 말단(예를 들어 5' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함할 수 있다. 또는 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이러한 상동성을 가지는 핵산서열은 손상된 핵산서열의 두 부분이 근접한 위치에 존재할 수 있도록 도와줌으로써 NHEJ에 의해 손상된 핵산의 수복 효율을 높일 수 있다.
상기 HDR 어시스터는 HDR을 이용한 손상된 유전자 또는 핵산의 수복 과정에 참여하거나 수복 효율을 향상시킬 수 있다.
예를 들어, 상기 HDR 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열을 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 일 말단(예를 들어 3' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함하며, 또한 손상된 핵산서열의 다른 말단(예를 들어 5' 말단) 핵산서열과 상동성을 가지는 핵산서열을 포함할 수 있다. 또는 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 이러한 상동성을 가지는 핵산서열은 손상된 핵산서열의 주형으로 역할하여 HDR에 의한 손상된 핵산의 수복 효율을 높일 수 있다.
다른 예로, 상기 HDR 어시스터는 손상된 핵산서열의 일부와 상동성을 가지는 핵산 서열 및 특정핵산, 예를 들면 삽입하고자 하는 핵산 또는 유전자를 포함할 수 있다. 이때, 상기 상동성을 가지는 핵산서열은 손상된 핵산서열의 왼쪽(upstream)및 오른쪽(downstream)의 염기서열과 각각 상동성을 가지는 핵산서열을 포함할 수 있다. 상기 특정 핵산은 손상된 핵산의 오른쪽 염기서열과 상동성을 가지는 핵산서열과 손상된 핵산의 왼쪽 염기서열과 상동성을 가지는 핵산서열 사이에 위치할 수 있다. 이러한 상동성을 가지는 핵산서열 및 특정 핵산은 손상된 핵산에 특정 핵산을 삽입할 수 있는 도너로 역할하여 넉인을 위한 HDR의 효율을 높일 수 있다.
상기 상동성을 가지는 핵산서열은 최소한 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90% 또는 95% 이상의 상동성을 갖거나 또는 완전하게 상동성을 가질 수 있다.
6. 대상
"대상"은 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되는 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 작동하는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체일 수 있다.
상기 유기체는 세포, 조직, 식물, 동물 또는 인간일 수 있다.
상기 세포는 원핵세포, 진핵세포일 수 있다.
상기 진핵세포는 식물세포, 동물세포, 인간세포일 수 있으나, 이에 제한하지 않는다.
상기 조직은 피부, 간, 신장, 심장, 폐, 뇌, 근육 등의 동물 또는 인간의 신체 조직일 수 있다.
상기 대상은 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 검체 또는 시료일 수 있다.
상기 검체 또는 시료는 침, 혈액, 피부조직, 암세포 또는 줄기세포 등 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체에서 획득한 것 일 수 있다.
본 발명에서 대상의 일 구체예로서, 대상은 가이드핵산-에디터단백질 복합체의 표적 유전자 또는 핵산을 포함하는 것일 수 있다.
이때, 표적 유전자는 신생혈관형성 관련 인자로, 예를 들어 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자일 수 있다.
상기 표적 유전자는 야생형이거나, 또는 야생형에서 변형된 형태일 수 있다.
본 발명의 일 구체예로서, 대상은 가이드핵산-에디터단백질 복합체로 인해 조작된 유전자 또는 핵산을 포함할 수 있다.
이때, 조작된 유전자는 신생혈관형성 관련 인자로, 예를 들어 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자일 수 있다.
이때, 가이드핵산은 신생혈관형성 관련 인자, 예를 들어 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자를 표적할 수 있다.
상기 가이드핵산은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자, 및/또는 ANGPTL4 유전자의 표적 서열에 상보성 핵산서열일 수 있다.
상기 가이드핵산은 하나 이상의 유전자를 표적할 수 있다.
상기 가이드핵산은 둘 이상의 유전자를 동시에 표적할 수 있다. 이때, 둘 이상의 유전자는 동종 유전자이거나 이종 유전자 일 수 있다.
상기 가이드핵산은 하나 이상의 표적 서열을 표적할 수 있다.
상기 가이드핵산은 표적 서열의 개수와 위치에 따라 다양하게 설계할 수 있다.
본 발명이 일 구현예로, 가이드핵산은 표 1, 표 2, 표 3, 표 4, 표 5에 기재된 서열 중 하나 이상의 표적 서열에 상보성 핵산서열일 수 있다.
임의의 구체예에서, 각 유전자의 인위적인 조작을 위해 상기 서열번호 1 내지 79번의 타겟서열에 상응하는 가이드 핵산 서열이 제공된다.
임의의 구체예에서, 각 유전자의 인위적인 조작을 위해 상기 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 타겟서열에 상응하는 가이드 핵산 서열과 상호작용하는, 예를 들어 복합체를 형성하는 에디터 단백질이 제공된다.
임의의 구체예에서, 상기 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 타겟서열 부위에서 인위적인 조작이 일어난 각 유전자의 핵산 변형 산물 및 이의 발현 산물이 제공된다.
7. 전달
가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체는 다양한 전달 방법과 다양한 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산은 DNA, RNA 또는 이의 혼합의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 에디터단백질은 에디터단백질을 암호화하는 DNA, RNA, DNA/RNA 혼합, 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 각 구성성분, 즉, 가이드핵산 및 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 가이드핵산-에디터단백질 복합체는 DNA, RNA 또는 이의 혼합의 형태를 가지는 가이드핵산과 펩타이드, 폴리펩타이드 또는 단백질의 형태를 가지는 에디터단백질의 복합체로 대상 내에 전달 또는 도입될 수 있다.
또한, 가이드핵산-에디터단백질 복합체의 효율을 증가 또는 저해할 수 있는 추가 구성물은 다양한 전달 방법과 다양한 형태로 대상 내에 전달 또는 도입될 수 있다.
상기 추가 구성물은 DNA, RNA, DNA/RNA 혼합, 펩타이드, 폴리펩타이드 또는 단백질의 형태로 대상 내에 전달 또는 도입될 수 있다.
i) DNA, RNA 또는 이의 혼합의 형태로 전달
가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
또는, 가이드핵산 및/또는 에디터단백질을 암호화하는 DNA, RNA 또는 이의 혼합의 형태는 벡터, 비벡터 또는 이들의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 벡터는 바이러스 또는 비바이러스 벡터(예를 들어, 플라스미드)일 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체 또는 mRNA일 수 있다.
벡터 기반 도입
가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 벡터는 가이드핵산과 에디터단백질을 암호화하는 핵산서열을 동시에 포함할 수 있다.
예를 들어, 상기 벡터는 가이드핵산 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 가이드핵산이 포함하는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
예를 들어, 상기 벡터는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 에디터단백질의 경우, 에디터단백질을 암호화하는 핵산서열을 하나의 벡터에 포함하거나 또는 에디터단백질을 암호화하는 핵산서열을 분할하여 여러 개의 벡터에 포함시킬 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, 가이드핵산 또는 에디터단백질을 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, 가이드핵산을 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, 에디터단백질을 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 가이드핵산 및/또는 에디터단백질을 도입시킬 수 있다. 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 가이드핵산 및/또는 에디터단백질은 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 가이드핵산 또는 에디터단백질을 단독으로 포함하는 바이러스 벡터를 설계하거나 가이드핵산 및 에디터단백질을 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 가이드핵산, 에디터단백질 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
비벡터 기반 도입
가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열은 비벡터로 대상 내로 전달 또는 도입될 수 있다.
비벡터는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함할 수 있다.
상기 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 비벡터는 전기천공법, 유전자총, 초음파천공법, 자기주입법(magnetofection), 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 덴드리머, 나노입자, 인산칼슘, 실리카, 실리케이트(오르모실) 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 세포와 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
다른 일 예로, 나노입자를 이용하여 비벡터를 전달할 수 있다. 상기 나노입자는 무기 나노입자(예를 들면, 자기 나노입자, 실리카 등) 또는 유기 나노입자(예를 들면, 폴리에틸렌 글리콜(PEG)로 코팅된 지질 등)일 수 있다. 상기 나노입자의 외면은 부착을 가능하게 하는 양 전하로 하전된 중합체(예를 들면, 폴리에틸렌이민, 폴리리신, 폴리세린 등)와 컨쥬케이팅될 수 있다.
임의의 구체예로, 지질 외피를 이용하여 전달할 수 있다.
임의의 구체예로, 엑소좀을 이용하여 전달할 수 있다. 엑소좀은 뇌 및 다른 표적 기관에 RNA를 전달할 수 있는, 단백질 및 RNA를 수송하는 내인성 나노-소낭이다.
임의의 구체예로, 리포좀을 이용하여 전달할 수 있다. 리포좀은 내부 수성 구획을 둘러싸는 단일 또는 다중 라멜라 지질 이중층 및 상대적으로 불투과성인 외측 친지성 인지질 이중층으로 구성된 구체 소낭 구조이다. 리포좀은 몇몇 상이한 유형의 지질로부터 만들어질 수 있지만; 약물 담체로서 리포좀을 생성하는데 인지질이 가장 통상적으로 사용된다.
기타 몇몇 다른 첨가제를 포함할 수 있다.
ii) 펩타이드 , 폴리펩타이드 또는 단백질의 형태로 전달
에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태는 당업계에 공지된 방법에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 형태는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
상기 펩타이드, 폴리펩타이드 또는 단백질의 전달은 가이드핵산을 암호화하는 핵산서열과 함께 전달될 수 있다.
일 예로, 전기천공법을 통한 전달은 카트리지, 챔버 또는 큐벳 내에서 가이드핵산와 함께 또는 가이드핵산 없이 에디터단백질을 도입시킬 세포와 혼합하고, 정해진 지속시간 및 진폭의 전기적 자극을 적용에 의해 수행될 수 있다.
iii) 핵산-단백질 혼합의 형태로 전달
가이드핵산 및 에디터단백질은 가이드핵산-에디터단백질 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 가이드핵산은 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 에디터단백질은 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, 가이드핵산 및 에디터단백질은 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
본 발명에서 가이드핵산 및/또는 에디터단백질을 대상으로 전달하는 방법의 일 구체예로서, gRNA, CRISPR 효소 또는 gRNA-CRISPR 효소 복합체의 전달에 대해 하단에 기재하였다.
본 발명의 일 구현예로서, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 벡터에 의해 대상 내로 전달 또는 도입될 수 있다.
벡터는 gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
예를 들어, 상기 벡터는 gRNA 및 CRISPR 효소를 암호화하는 핵산서열을 동시에 포함할 수 있다.
예를 들어, 상기 벡터는 gRNA 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 gRNA가 포함하는 도메인은 하나의 벡터에 모두 포함되거나 또는 각각의 도메인을 나누어 각각의 벡터에 포함시킬 수 있다.
예를 들어, 상기 벡터는 CRISPR 효소를 암호화하는 핵산서열을 포함할 수 있다.
일 예로, 상기 CRISPR 효소의 경우, CRISPR 효소를 암호화하는 핵산서열을 하나의 벡터에 포함하거나 또는 CRISPR 효소를 암호화하는 핵산서열을 분할하여 여러 개의 벡터에 포함시킬 수 있다.
상기 벡터는 하나 이상의 조절/제어 구성요소를 포함할 수 있다.
이때, 상기 조절/제어 구성요소는 포로모터, 인핸서, 인트론, 폴리아데닐화 신호, 코작 공통(Kozak consensus) 서열, 내부 리보솜 유입 부위(internal ribosome entry site, IRES), 스플라이스 억셉터 및/또는 2A 서열을 포함할 수 있다.
상기 프로모터는 RNA 중합효소 II에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 RNA 중합효소 III에 의해 인식되는 프로모터일 수 있다.
상기 프로모터는 유도성 프로모터일 수 있다.
상기 프로모터는 대상 특이적 프로모터일 수 있다.
상기 프로모터는 바이러스 또는 비바이러스 프로모터일 수 있다.
상기 프로모터는 제어 영역(즉, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열)에 따라 적합한 프로모터를 이용할 수 있다.
예를 들어, gRNA를 위해 유용한 프로모터는 H1, EF-1a, tRNA 또는 U6 프로모터일 수 있다. 예를 들어, CRISPR 효소를 위해 유용한 프로모터는 CMV, EF-1a, EFS, MSCV, PGK 또는 CAG 프로모터일 수 있다.
상기 벡터는 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
상기 바이러스는 DNA 바이러스 또는 RNA 바이러스일 수 있다.
이때, 상기 DNA 바이러스는 이중가닥 DNA(dsDNA) 바이러스 또는 단일가닥 DNA(ssDNA) 바이러스 일 수 있다.
이때, 상기 RNA 바이러스는 단일가닥 RNA(ssRNA) 바이러스일 수 있다.
상기 바이러스는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 또는 단순포진 바이러스일 수 있으나, 이에 제한되지 않는다.
일반적으로 바이러스는 숙주(예를 들면, 세포)를 감염시켜, 숙주 내에 바이러스의 유전정보를 암호화하는 핵산을 도입시키거나 숙주의 게놈 내로 유전정보를 암호화하는 핵산을 삽입시킬 수 있다. 이러한 특징을 가지는 바이러스를 이용하여 대상 내로 gRNA 및/또는 CRISPR 효소를 도입시킬 수 있다. 바이러스를 이용하여 도입된 gRNA 및/또는 CRISPR 효소는 대상(예를 들면, 세포)에서 일시적으로 발현될 수 있다. 또는 바이러스를 이용하여 도입된 gRNA 및/또는 CRISPR 효소는 대상(예를 들면, 세포)에서 장기간(예를 들면, 1주, 2주, 3주, 1개월, 2개월, 3개월, 6개월, 9개월, 1년, 2년 또는 영구적) 지속적으로 발현될 수 있다.
바이러스의 패키징 능력은 적어도 2kb 내지 50kb로 바이러스 종류에 따라 다를 수 있다. 이러한 패키징 능력에 따라 gRNA 또는 CRISPR 효소를 단독으로 포함하는 바이러스 벡터를 설계하거나 gRNA 및 CRISPR 효소를 모두 포함하는 바이러스 벡터를 설계할 수 있다. 또는 gRNA, CRISPR 효소 및 추가 구성요소를 포함하는 바이러스 벡터를 설계할 수 있다.
일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 렌티바이러스에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 아데노바이러스에 의해 전달 또는 도입될 수 있다.
또 다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 재조합 AAV에 의해 전달 또는 도입될 수 있다.
다른 일 예로, gRNA 및/또는 CRISPR 효소를 암호화하는 핵산서열은 혼성 바이러스, 예를 들어 본 명세서에 기재한 바이러스 중 하나 이상의 혼성체에 의해 전달 또는 도입될 수 있다.
본 발명의 일 구현예로서, gRNA-CRISPR 효소 복합체의 형태로 대상 내로 전달 또는 도입될 수 있다.
예를 들어, 상기 gRNA는 DNA, RNA 또는 이의 혼합 형태일 수 있다. 상기 CRISPR 효소는 펩타이드, 폴리펩타이드 또는 단백질의 형태일 수 있다.
일 예로, gRNA 및 CRISPR 효소는 RNA 형태의 gRNA와 단백질 형태의 CRISPR gRNA-CRISPR 효소 복합체, 즉 ribonucleoprotein(RNP)의 형태로 대상 내로 전달 또는 도입될 수 있다.
상기 CRISPR gRNA-CRISPR 효소 복합체는 전기천공법, 미량주사법, 일시적인 세포 압축 또는 스퀴징(예를 들어, 문헌[Lee, et al, (2012) Nano Lett., 12, 6322-6327]에 기재되어 있음), 지질-매개 형질감염, 나노파티클, 리포솜, 펩타이드-매개 전달 또는 이의 조합에 의해 대상 내로 전달 또는 도입될 수 있다.
8. 형질전환체
"형질전환체"는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입된 유기체, 또는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 발현되는 유기체 또는 유기체로부터 획득한 검체 또는 시료를 의미한다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 DNA, RNA 또는 이의 혼합의 형태로 도입된 유기체일 수 있다.
예를 들어, 상기 형질전환체는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열 포함하는 벡터가 도입된 유기체일 수 있다. 이때, 벡터는 비바이러스 벡터, 바이러스 벡터 또는 재조합 바이러스 벡터일 수 있다.
다른 예로, 상기 형질전환체는 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산서열을 포함하는 비벡터 형태로 도입된 유기체일 수 있다. 이때, 비벡터는 네이키드 DNA, DNA 복합체, mRNA 또는 이의 혼합일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 펩타이드, 폴리펩타이드 또는 단백질의 형태로 도입된 유기체일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 DNA, RNA, 펩타이드, 폴리펩타이드, 단백질 또는 이의 혼합의 형태로 도입된 유기체일 수 있다.
예를 들어, 상기 형질전환체는 RNA 형태의 가이드핵산과 단백질 형태의 에디터단백질이 가이드핵산-에디터단백질 복합체를 이루어 도입된 유기체일 수 있다.
상기 형질전환체는 가이드핵산-에디터단백질 복합체의 표적 핵산, 유전자, 염색체 또는 단백질을 포함하는 유기체일 수 있다.
상기 유기체는 세포, 조직, 식물, 동물 또는 인간일 수 있다.
상기 세포는 원핵세포, 진핵세포일 수 있다.
상기 진핵세포는 식물세포, 동물세포, 인간세포일 수 있으나, 이에 제한하지 않는다.
상기 조직은 피부, 간, 신장, 심장, 폐, 뇌, 근육 등의 동물 또는 인간의 신체 조직일 수 있다.
상기 형질전환체는 가이드핵산, 에디터단백질 또는 가이드핵산-에디터단백질 복합체가 도입되거나 발현되는 유기체 또는 유기체로부터 획득한 검체 또는 시료일 수 있다.
상기 검체 또는 시료는 침, 혈액, 피부조직, 암세포 또는 줄기세포 일 수 있다.
[ 용도 ]
본 발명의 일 구체예는 대상에 신생혈관형성 관련 인자를 인위적으로 조작하기 위한 조성물 또는 인위적으로 조작된 신생혈관형성 관련 인자의 투여를 포함하는 방법을 이용하는 신생혈관형성 관련 질환 치료 용도이다.
치료 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
치료 대상 질환
구현예에서, 치료 대상 질환은 신생혈관형성 관련 질환일 수 있다.
"신생혈관형성 관련 질환"은 과도한 및/또는 비정상적인 신생혈관형성을 포함하는 모든 상태를 의미한다. 종양발생 또는 신생물 형질전환, 즉 암을 수반하는 것 이외의 변화되거나 조절되지 않는 혈관형성을 특징으로 하는 장애를 의미한다. 신생혈관형성 관련 질환은 안구 신생혈관형성 질환을 포함한다.
신생혈관형성 질환으로는, 신생혈관형성 의존성 암, 예를 들면, 고형 종양, 백혈병과 같은 혈액성 종양 및 종양 전이; 양성 종양, 예를 들면, 혈관종(hemangiomas), 청신경종(acoustic neuromas), 신경섬유종, 트라코마스(trachomas) 및 화종성 육아종; 류마티스 관절염; 건선; 안구 신생혈관형성 질환, 예를 들면, 당뇨병성 망막증, 미숙아 망막병증(retinopathy of prematurity), 건식 노인성 황반 변성 및 습식 노인성 황반 변성을 포함한 황반 변성, 각막 이식 거부 반응, 신혈관 녹내장(neovascular glaucoma), 후수정체 섬유증식증(retrolental fibroplasia), 피부 조홍(rubeosis); 오슬러-베버 증후군(Osler-Webber Syndrome); 심근 신생혈관형성 실명(myocardial angiogenesis blindness); 경화반내 신생혈관증식(plaque neovascularization); 말초혈관 확장증(telangiectasia); 혈우병성 관절증(hemophiliac joint); 맥관섬유종; 및 상처 과립화(wound granulation)를 포함하나, 이로 제한되지 않는다.
임의의 구체예로, 신생혈관형성 관련 질환은 류마티스 관절염, 건선, 오슬러-베버 증후군(Osler-Webber Syndrome), 심근 신생혈관형성 실명(myocardial angiogenesis blindness), 경화반내 신생혈관증식(plaque neovascularization), 말초혈관 확장증(telangiectasia), 혈우병성 관절증(hemophiliac joint), 맥관섬유종, 및 상처 과립화(wound granulation)으로 구성된 군에서 선택된 하나 이상의 질환일 수 있다.
구현예에서, 신생혈관형성 관련 질환은 과도한 및/또는 비정상적인 신생혈관형성을 포함하는 질환일 수 있다.
구체예로, 신생혈관형성 관련 질환은 신생혈관형성 의존성 암일 수 있다.
이때, 신생혈관형성 의존성 암은 고형 종양, 백혈병과 같은 혈액성 종양 및 종양 전이 등을 포함한다.
신생혈관형성 의존성 암, 예를 들면, 고형 종양, 백혈병과 같은 혈액성 종양 및 종양 전이; 양성 종양, 예를 들면, 혈관종(hemangiomas), 청신경종(acoustic neuromas), 신경섬유종, 트라코마스(trachomas) 및 화종성 육아종일 수 있다.
임의의 구체예로, 신생혈관형성 관련 질환은 양성 종양일 수 있다.
양성 종양은 혈관종(hemangiomas), 청신경종(acoustic neuromas), 신경섬유종, 트라코마스(trachomas) 및 화종성 육아종 등을 포함한다.
임의의 구체예로, 신생혈관형성 관련 질환은 안구 신생혈관형성 질환일 수 있다.
"안구 신생혈관형성 질환"은 과도한 및/또는 비정상적인 신생혈관 형성을 포함하는 모든 안구질환을 의미한다. 눈에서 변화되거나 조절되지 않는 혈관형성을 특징으로 하는 장애를 포함한다.
구체예로서 안구 신생혈관형성 질환은 다음을 포함할 수 있다:
허혈성 망막병증, 시신경유두 혈관신생, 홍채 혈관신생, 망막 혈관신생, 맥락막 혈관신생, 각막 혈관신생, 유리체 혈관신생, 녹내장, 판누스, 익상편, 황반 부종, 당뇨병성 망막병증, 증식성 당뇨병성 망막병증, 당뇨병성 황반 부종, 혈관 망막병증, 망막 변성, 포도막염, 망막의 염증성 질환, 및 증식성 유리체망막병증을 들 수 있다.
일 실시예에서, 안구 신생혈관형성 질환은 당뇨병성 망막증 또는 황반 변성일 수 있다.
- 당뇨병성 망막증
당뇨병성 망막증은 1형 또는 2형 당뇨병 중 어느 하나로 진단받은 환자의 약 40 내지 45%에서 발생하는 당뇨병 합병증이다.
당뇨병성 망막증은 통상적으로 양쪽 눈에 영향을 주며, 일반적으로 4 단계로 진행된다. 제 1 단계인 경증 비증식성 망막증(mild nonproliferative retinopathy)은 눈의 미세동맥류가 특징이다. 망막의 모세관과 소혈관에서 소규모의 부종(swelling)이 이루어진다. 제 2 단계인 중간 수준의 비증식성 망막증에서는, 망막에 제공되는 혈관이 차단되기 시작한다. 중증 비증식성 망막증인 제 3 단계에서는, 혈관 폐색이 망막으로의 혈액 공급 감소로 이어져, 망막은 망막에 혈액 공급을 제공하기 위해 눈에 새로운 혈관을 만드는(신생혈관형성) 신호를 보내게 된다. 제 4 단계이고 가장 진전된 단계인 증식성 망막증에서는, 혈관 신생이 이루어지지만 신생 혈관은 비정상적이고, 허약하며, 망막과 눈에 채워진 유리질 젤 표면을 따라 생장한다.
당뇨병성 망막증은 인슐린 의존성 당뇨병, 인슐린 비의존성 당뇨병, 망막박리, 당뇨망막병증, 초자체 출혈을 포함한다.
- 황반 변성(Macular Degeneration)
황반 변성은 눈의 황반에 변성이 일어나 시력장애를 일으키는 질환으로, 노인성 황반 변성(Age-related Macular Degeneration, AMD)이라고도 불린다.
AMD는 초기, 중간, 및 진행된 AMD를 포함하며, 건성 AMD, 예를 들어, 지도모양 위축, 및 신생혈관 또는 삼출 AMD로도 공지된 습성 AMD 모두를 포함한다.
건성 황반 변성은 망막에 드루젠(노폐물들이 황반부에 축적되는 상태)이나 망막색소상피의 위축과 같은 병변이 생기는 경우, AMD의 약 90%를 차지하는 흔한 형태이다. 습성 황반 변성은 망막 아래에 맥락막 신생혈관이 생성되는 특징을 가진다.
면역조절성 보체 인자 H(CFH) 유전자 내에 존재하는 미스센스 돌연변이에 의한 황반변성을 포함한다.
다른 구현예에서, 본 발명은 인위적으로 기능을 변형시킨 특정 인자(예를 들어, 신생혈관형성 관련 인자로 알려져 있는 유전자 등)의 다양한 기능에 수반되는, 부가적인 제3의 체내 메커니즘의 조절 시스템의 용도를 제공할 수 있다.
예를 들어, 인위적으로 기능을 변형시킨 특정 인자는 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자 중 1이상의 유전자일 수 있다.
제3의 메커니즘은 상기 유전자들이 관여하는, 신생혈관형성 외의 체내 메커니즘일 수 있다.
약학적 조성물
본 발명의 일 구체예는 인위적으로 조작된 신생혈관형성 관련 인자를 이용하여 질환 치료에 이용하고자 하는 조성물이다.
인위적으로 조작된 신생혈관형성 관련 인자 또는 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 조작 조성물을 함유하는 조성물일 수 있다. 치료용 조성물 또는 약학적 조성물로 칭할 수 있다.
구현예에서, 조성물은 인위적으로 조작된 신생혈관형성 관련 인자, 즉, 유전자 및/또는 단백질을 포함할 수 있다.
구현예에서, 조성물은 신생혈관형성 관련 인자를 인위적으로 조작할 수 있는 조작 조성물을 포함할 수 있다.
상기 조작 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
상기 조작 조성물은 가이드핵산 및/또는 에디터단백질을 포함할 수 있다.
상기 조작 조성물은 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산을 포함할 수 있다.
상기 조작 조성물은 가이드핵산 및/또는 에디터단백질을 암호화하는 핵산을 포함하는 바이러스를 포함할 수 있다.
다른 구현예에서, 상기 조성물은 부가적 요소를 추가로 더 포함할 수 있다.
상기 부가적 요소는 대상의 체내에 전달하기 위한 적절한 담체를 포함할 수 있다.
구현예에서, 조성물은 혈관신생성 장애을 억제하는데 충분한 양으로 조작된 신생혈관형성 관련 인자의 발현산물을 포함할 수 있다.
"혈관신생성 장애을 억제하는데 충분한 양"은 혈관신생성 장애 또는 그의 증상을 치료하거나 또는 예방하는데 필요한 유효량을 의미한다.
일 구체예로서, 다음의 치료용 조성물을 제공할 수 있다.
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 내 1 이상의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
에디터단백질 또는 이를 암호화하는 핵산서열
을 포함하는 혈관신생성 장애 치료용 조성물;
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
에디터단백질 또는 이를 암호화하는 핵산서열
을 포함하는 혈관신생성 장애 치료용 조성물;
VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질로 형성된 복합체
를 포함하는 혈관신생성 장애 치료용 조성물.
이 때, 가이드핵산 또는 이를 암호화하는 핵산서열; 및 에디터단백질을 암호화하는 핵산서열은 1이상의 벡터의 형태로 존재할 수 있다. 동종 또는 이종의 벡터의 형태로 존재할 수 있다.
치료 방법
본 발명의 다른 구현예는, 상기 설명한 조성물의 생산 및 유효량의 상기 조성물을 이를 필요로 하는 환자에 투여를 포함하는 환자에서 질환의 치료 방법이다.
유전자 조작 치료
생체의 유전자를 조작하여 신생혈관형성을 조절하는 치료방법을 이용할 수 있다. 이러한 치료방법은 생체의 유전자를 조작하기 위한 유전자 조작용 조성물을 체내에 직접 주입하여 이루어질 수 있다.
유전자 조작용 조성물은 가이드핵산-에디터단백질 복합체를 포함할 수 있다.
유전자 조작용 조성물은 특정 신체 위치에 주입될 수 있다.
이때, 특정 신체 위치는 신생혈관형성이 과도한 및/또는 비정상적인 조직 또는 이와 근접한 위치일 수 있다. 예를 들어, 안구일 수 있다.
조성물의 투여 대상은 인간, 원숭이 등의 영장류, 마우스, 래트 등의 설치류 등을 포함하는 포유동물일 수 있다.
조성물의 투여는 주사(injection), 수혈(transfusion), 삽입(implantation) 또는 이식(transplantation)과 같은, 임의의 편리한 방식으로 수행될 수 있다. 투여 경로는 피하(subcutaneously), 피내(intradermaliy), 안구내(intraocularly), 유리체내(intravitreally) 종양내(intratumorally), 절내(intranodally), 골수내(intramedullary), 근육내(intramuscularly), 정맥내(intravenous), 림프액내(intralymphatic), 복막내(intraperitoneally) 등에서 선택될 수 있다.
조성물의 1회 투여량(소정의 소망하는 효과를 얻기 위한 약학적 유효량)은 투여 대상의 체중 kg 당 104-109 세포, 예컨대, 105 내지 106 세포/kg(체중) 정도로 상기 수치 범위들 내의 모든 정수값들 중에서 선택될 수 있으나, 이에 제한되는 것은 아니고, 투여 대상의 연령, 건강 및 체중, 동시에 받는 치료의 종류, 만약 있다면 치료의 빈도, 원하는 효과의 특성 등을 고려하여 적절히 처방될 수 있다.
일 양태에서, 본 발명은 진핵 세포에서 표적 폴리뉴클레오티드를 변형하는 방법을 제공하며, 이것은 생체내, 생체외 또는 시험관내에서 이루어질 수 있다.
일부 실시형태에서, 방법은 인간 또는 비인간 동물로부터 세포 또는 세포 집단을 시료추출하는 단계, 및 세포 또는 세포들을 변형하는 단계를 포함한다. 배양은 생체외에서 임의의 단계에서 일어날 수 있다. 세포 또는 세포들은 심지어 비인간 동물 또는 식물에 재도입될 수 있다. 재도입된 세포의 경우, 세포가 줄기 세포인 것이 특히 바람직하다.
또한, 다른 구현예에서, 본 발명은 세포에
(a) VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 1522번, 예를 들어, 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
(b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열
을 도입시키는 단계를 포함하는, 세포를 인위적으로 조작하는 방법을 제공할 수 있다.
상기 가이드 핵산 및 에디터 단백질은, 각각 핵산 서열의 형태로 1 이상의 벡터에 존재하거나, 또는 가이드 핵산과 에디터 단백질의 결합으로 복합체를 형성하여 존재할 수 있다.
상기 도입 단계는 생체 내 또는 생체 외에서 수행될 수 있다.
상기 도입 단계는 앞서 설명한 "7. 전달" 부분의 기술을 참조할 수 있다.
예를 들어, 도입 단계는 전기천공법 (electroporation), 리포좀, 플라스미드, 바이러스벡터, 나노파티클(nanoparticles) 및 PTD (Protein translocation domain) 융합 단백질 방법 중 선택되는 1이상의 방법으로 수행될 수 있다.
예를 들어, 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1이상일 수 있다.
본 발명 몇몇 구현예들의 방법, 조성물에 의해 신생혈관형성 관련 인자를 인위적으로 조작할 경우, 신생혈관형성의 저해, 억제, 촉진 및/또는 증가 등의 신생혈관형성의 조절이 가능하게 되고, 이를 통해 과도한 및/또는 비정상적인 신생혈관형성을 억제시키거나 개선시키는 등의 효과를 얻을 수 있다.
부가적 용도
임의의 구체예에서, 본 발명은 상기 조성물을 포함하는, 나이관련 황반변성 또는 당뇨망막병증 치료용 조성물의 제조를 위한 키트를 제공할 수 있다.
상기 키트는 당업계에 알려져 있는 통상의 제조방법에 의해 제조될 수 있다.
상기 키트는 검출가능한 표지를 더 포함할 수 있다. 용어 "검출가능한 표지"는 표지가 없는 동일한 종류의 분자들 중에서 표지를 포함하는 분자를 특이적으로 검출하도록 하는 원자 또는 분자를 의미한다. 상기 검출가능한 표지는 상기 단백질 또는 그의 단편에 특이적으로 결합하는 항체, 상호작용 단백질, 리간드, 나노입자, 또는 압타머에 부착된 것일 수 있다. 상기 검출가능한 표지는 방사종(radionuclide), 형광원(fluorophore), 효소(enzyme)를 포함할 수 있다.
임의의 구체예에서, 본 발명은 인위적으로 조작한 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자 중 1이상의 유전자의 발현 수준을 조절할 수 있는 물질의 스크리닝 방법을 제공할 수 있다.
임의의 구체예에서, 본 발명은 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자를 서열분석함으로써 대상체에서 인위적으로 조작 가능한 표적 위치의 서열에 대한 정보를 제공하는 방법을 제공할 수 있다.
또한, 이러한 방법으로 제공받은 정보를 이용하여 라이브러리를 구축하는 방법을 제공한다.
이 때, 공지의 데이터 베이스를 이용할 수 있다.
특정 구체예들에서, 본 발명의 방법을 이용하여 연구 용도에 이용할 수 있는 동물 또는 세포를 제공할 수 있다.
본 발명의 방법을 이용하여 질병과 연관된 하나 이상의 핵산 서열중 염색체 편집을 포함하는 동물 또는 세포를 제작할 수 있다. 이러한 핵산 서열은 질병 관련된 단백질 서열을 인코드할 수 있거나 또는 질병 관련된 기준 서열일 수 있다.
한 구체예에서, 본 발명의 방법에 의해 제작된 동물 또는 세포를 이용하여 질병 연구에 통상적으로 이용되는 측정을 이용하여 동물 또는 세포에서 돌연변이의 효과 및 질병의 발생 및/또는 진행을 연구할 수 있다. 대안으로, 이러한 동물 또는 세포을 이용하여 질병에서 활성 화합물의 약제학적 효과를 연구할 수 있다.
다른 구체예에서, 본 발명의 방법에 의해 제작된 동물 또는 세포를 이용하여 가능한 유전자 치료 전략의 효과를 평가할 수 있다. 즉, 질병과 관련된 단백질을 인코드하는 염색체 서열을 변형시켜, 해당 질병 발달 및/또는 진행을 억제하거나 감소시킬 수 있다. 특히, 이 방법은 질병과 관련된 단백질을 인코드하는 염색체 서열을 편집하여, 변경된 단백질이 만들어지는 것을 포함하고, 그 결과 동물 또는 세포는 변경된 반응을 한다. 따라서, 일부 구체예들에서, 유전학적으로 변형된 동물은 해당 질병의 발달에 취약한 동물과 비교하여, 유전자 치료 과정의 효과를 평가할 수 있다.
이러한 용도는 질병 모델, 약리학 모델, 발생 모델, 세포 기능 모델, 및 인간화된 모델을 포함할 수 있다. 예를 들어, 신생혈관형성 관련의 질병 모델, 약리학 모델, 발생 모델, 세포 기능 모델, 및 인간화된 모델을 포함할 수 있다.
인위적으로 조작한 신생혈관형성 관련 인자 및 이에 의해 인위적으로 기능을 변형시킨 신생혈관형성 시스템에 의해서, 효과적인 신생혈관 관련 질환, 예를 들어 신생혈관 관련 안구질환의 치료적 용도를 이용할 수 있다. 다양한 신생혈관형성 관련 인자들이 관여하는 다양한 체내 메커니즘을 조절을 통해 신생혈관형성 시스템의 효능을 개선시킬 수 있다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.
실험방법
1. sgRNA 설계
CRISPR RGEN Tools (Institute for Basic Science, Korea)을 사용하여 인간의 VEGFA 유전자(NCBI Accession No. NM_001025366.2), HIF1A 유전자(NCBI Accession No. NM_001243084.1), ANGPT2 유전자(NCBI Accession No. NM_001118887.1), EPAS1 유전자(NCBI Accession No. NM_001430.4) 및 ANGPTL4 유전자(NCBI Accession No. NM_001039667.2)의 CRISPR/Cas9 표적 부위 선별하였다. 각각의 유전자의 표적 부위는 CRISPR 효소의 종류에 따라 달라질 수 있으며, CjCas9를 위한 각각 유전자의 표적 서열은 앞서 기재한 표 1 - 5 및 표 6 - 9에 정리하였고, SpCas9을 위한 각각 유전자의 표적 서열은 표 10 - 14에 정리하였다.
[표 6]
VEGFA 유전자의 표적 서열(Target sequences of VEGFA gene)
Figure PCTKR2017009078-appb-I000001
[표 7]
HIF1A 유전자의 표적 서열(Target sequences of HIF1A gene)
Figure PCTKR2017009078-appb-I000002
[표 8]
EPAS1 유전자의 표적 서열(Target sequences of EPAS1 gene)
Figure PCTKR2017009078-appb-I000003
Figure PCTKR2017009078-appb-I000004
[표 9]
ANGPT2 유전자의 표적 서열(Target sequences of ANGPT2 gene)
Figure PCTKR2017009078-appb-I000005
[표 10]
SpCas9을 위한 VEGFA 유전자의 표적 서열(Target sequences of VEGFA gene for SpCas9)
Figure PCTKR2017009078-appb-I000006
Figure PCTKR2017009078-appb-I000007
Figure PCTKR2017009078-appb-I000008
Figure PCTKR2017009078-appb-I000009
Figure PCTKR2017009078-appb-I000010
Figure PCTKR2017009078-appb-I000011
Figure PCTKR2017009078-appb-I000012
[표 11]
SpCas9을 HIF1A 유전자의 표적 서열(Target sequences of HIF1A gene for SpCas9)
Figure PCTKR2017009078-appb-I000013
Figure PCTKR2017009078-appb-I000014
Figure PCTKR2017009078-appb-I000015
Figure PCTKR2017009078-appb-I000016
Figure PCTKR2017009078-appb-I000017
Figure PCTKR2017009078-appb-I000018
[표 12]
SpCas9을 EPAS1 유전자의 표적 서열(Target sequences of EPAS1 gene for SpCas9)
Figure PCTKR2017009078-appb-I000019
Figure PCTKR2017009078-appb-I000020
Figure PCTKR2017009078-appb-I000021
Figure PCTKR2017009078-appb-I000022
Figure PCTKR2017009078-appb-I000023
Figure PCTKR2017009078-appb-I000024
Figure PCTKR2017009078-appb-I000025
Figure PCTKR2017009078-appb-I000026
Figure PCTKR2017009078-appb-I000027
Figure PCTKR2017009078-appb-I000028
Figure PCTKR2017009078-appb-I000029
Figure PCTKR2017009078-appb-I000030
Figure PCTKR2017009078-appb-I000031
Figure PCTKR2017009078-appb-I000032
[표 13]
SpCas9을 ANGPT2 유전자의 표적 서열(Target sequences of ANGPT2 gene for SpCas9)
Figure PCTKR2017009078-appb-I000033
Figure PCTKR2017009078-appb-I000034
Figure PCTKR2017009078-appb-I000035
Figure PCTKR2017009078-appb-I000036
[표 14]
SpCas9을 ANGPTL4 유전자의 표적 서열(Target sequences of ANGPTL4 gene for SpCas9)
Figure PCTKR2017009078-appb-I000037
Figure PCTKR2017009078-appb-I000038
Figure PCTKR2017009078-appb-I000039
Figure PCTKR2017009078-appb-I000040
Figure PCTKR2017009078-appb-I000041
Figure PCTKR2017009078-appb-I000042
Figure PCTKR2017009078-appb-I000043
Figure PCTKR2017009078-appb-I000044
2. CjCas9 sgRNA 플라스미드 제작
인간 코돈 최적화된 CjCas9(Campylobacter jejuni subsp. Jejuni NCTC 11168 유래)을 암호하는 서열은 그 C-말단에 NLS(nuclear localization signal) 및 HA 에피토프를 가지도록 합성하였고(GeneArtTM Gene Synthesis, Thermo Fisher Scientific), 합성한 핵산서열을 이전 연구(Cho, S.W., Kim, S., Kim, J.M. & Kim, J.S. Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nature biotechnology 31, 230-232 (2013))에서 기재된 p3s 플라스미드로 복제하였다.
tracrRNA(transactivating crRNA) 서열과 pre-crRNA(precursor CRISPR RNA) 서열은 GAAA 또는 TGAA 링커를 이용하여 연결하여 sgRNA를 생성하였다. sgRNA는 U6 프로모터로 전사를 조절하였다.
3. 세포 기반 리포터 분석법을 이용한 PAM 특성화
X 위치에 무작위 서열을 포함하는 가변성 PAM 서열(5'-NNNNXCAC-3', 5'-NNNNAXAC-3', 5'-NNNNACXC-3', and 5'-NNNNACAX-3')을 가지는 AAVS1 타겟 위치(AAVS1-TS1)를 합성하고(Macrogen, Inc.), 합성한 핵산서열을 RFP와 GFP가 암호화되어있는 서로게이트 리포터 플라스미드(surrogate reporter plasmid)로 복제하였다.
적합한 PAM 서열을 결정하기 위해, 상기 제작한 리포터 플라스미드(100 ng), CjCas9을 암호화하는 플라스미드(225 ng) 및 sgRNA(675 ng)를 리포펙타민 2000(lipofectamine 2000, Invitrogen)을 이용하여 HEK293 세포(1x105)로 공동-형질감염시켰다. 형질감염 2일 후, GFP와 RFP가 모두 양성인 세포의 분획물을 flow cytometry (BD AccuriTM C6, BD)으로 측정하였다.
4. 세포 배양 및 돌연변이 분석
HEK293 (ATCC, CRL-1573) 세포 및 마우스 NIH 3T3 (ATCC, CRL-1658) 세포는 100 units/mL 페니실린, 100 mg/mL 스트렙토마이신, 및 10% 태아 소 혈청(FBS)이 추가된 (Dulbecco's modified Eagle's medium (DMEM)에서 배양하였다.
sgRNA 플라스미드(750 ng) 및 CjCas9 플라스미드(250 ng)을 리포펙타민 2000(lipofectamine 2000, Invitrogen)을 이용하여 세포(0.5~1x105)로 형질감염시켰다. 형질감염 48시간 후, 게놈 DNA를 DNeasy Blood & Tissue kit (Qiagen)를 이용하여 분리하였고, 타겟 딥 시퀀싱(targeted deep sequencing)을 위해 온-타겟 또는 오프-타겟 위치를 증폭하였다. 딥 시퀀싱 라이브러리는 PCR에 의해 생성되었다. TruSeq HT 이중 지표 프라이머(TruSeq HT Dual Index primers)를 각각의 샘플에 라벨링하기 위해 사용하였다. 혼합 라이브러리를 페어드 엔드 시퀀싱(paired-end sequencing, LAS, Inc.) 하였고, 인델 빈도를 계산하였다.
5. CjCas9 sgRNA 서열을 암호화하는 AAV 벡터 제작
sgRNA 서열과 C-말단에 NLS와 HA 태그를 가지는 CjCas9 유전자를 포함하는 AAV 역위 말단 반복(inverted terminal repeat, ITR)-기반 벡터 플라스미드를 제작하였다. sgRNA 전사는 U6 프로모터에 의해 유도되고, CjCas9 발현은 C2C12 근육아세포에서는 EFS 프로모터에 의해, 또는 C57BL/6 마우스의 TA 근육에서는 Spc512 프로모터에 의해 조절된다.
망막 전달을 위해, Vegfa 유전자와 Hif1a 유전자에 특이적인 U6 프로모터-유도 sgRNA 및 EFS 프로모터 제어하에 CjCas9을 암호화하는 AAV 벡터를 제작하였고, 이때, CjCas9은 C-말단에 자가절단하는 T2A 펩타이드를 이용해 eGFP가 연결되어 있다.
6. AAV 벡터의 생산, 정제 및 특성 규명
AAV 벡터를 생산하기 위하여, AAVDJ 또는 AAV9 capsids의 위형(pseudotype)을 이용하였다. HEK293T 세포에 pAAV-ITR-CjCas9-sgRNA, pAAVED2/9, 및 헬퍼(helper) 플라스미드를 형질감염하였다. HEK293T 세포는 2% FBS가 포함된 DMEM에서 배양하였다. HEK293T 세포에서 PEIpro (Polyplus-transfection), triple-transfection 및 플라스미드를 1:1:1의 몰농도로 섞어 PEI coprecipitation을 이용하여 재조합 AAV 벡터 스톡(stocks) 생산하였다. 배양 72시간 후, 세포를 용해하고 파티클들은 iodixanol (Sigma-Aldrich)을 이용해 단계-기울기 초원분리기(step-gradient ultracentrifugation)로 분리정제하였다. 벡터 게놈의 수는 정량적 PCR로 정량하였다.
7. 마우스 근아세포(myoblast)에 AAV 형질 도입
마우스 근아세포에 다양한 바이러스의 양(multiplicity of infection (MOI): 1, 5, 10, 50, 및 100 (정량 PCR에 의해 결정))의 AAVDJ-CjCas9를 감염시키고 2% FBS를 포함하는 DMEM에서 배양하였다. 표적 딥 시퀀싱을 위해 다른 시간 포인트에서 세포를 수득하였다. MOI 1은 정량 PCR에 의해 결정된 전체 100개의 바이러스 파티클 중에 한 개의 바이러스 파티클이 감염되는 것으로 추정된다.
8. 동물
본 연구에서 사용되는 모든 동물의 관리, 사용 및 치료는 서울대학교 동물 관리 및 사용 위원회에 의해 마련된 지침과 안과 및 안보 연구 및 수의대에서 동물 사용을 관한 ARVO 선언문에 엄격한 동의하에 수행하였다. 본 연구는 성인 남성의 특정 항원이 없는(specific pathogen free, SPF) 6주령 된 C57BL/6J 마우스를 사용하였다. 마우스는 12시간 주기의 암명주기하에서 유지시켰다.
당뇨병 모델 마우스는 streptozotocin (STZ, Sigma-Aldrich, St. Louis, MO, USA)을 단일 복강 내 주입하여 유도하였다. 대조군으로 구연산염(citrate) 버퍼를 주입하였다. STZ 주입 4일 후, 마우스의 혈액 내 글루코스 레벨이 300 mg/dl 이상인 경우 당뇨병이 유도되었다고 간주하였다.
9. AAV의 유리체내 주입
6주령 마우스를 1:1(각 2.25 mg/kg 체중) 비율의 틸레타민(tiletamine)과 졸라제팜(zolazepam) 및 자일라진 하이드로클로라이드(xylazine hydrochloride) 0.7 mg/kg 체중를 혼합한 혼합물을 유리체내 주입하여 마취시켰다. 수술용 현미경(Leica Microsystems Ltd.) 하에서 33G 블런트 니들을 가지는 Nanofil 주사기(World Precision Instruments Inc.)를 사용하여 AAV9-CjCas9 2 ㎕(2 x 1010 바이러스 게놈)를 유리체내 주입하였다.
당뇨병 마우스 모델의 경우, STZ로 당뇨병을 유도하고 1 또는 7 주 후에 마우스를 마취하고, CjCas9: Vegfa 또는 Rosa26을 0.8x108 vg/㎕ 또는 1.5x109 vg/㎕ 포함하는 2 ㎕를 유리체내 주입하였다.
10. 망막 조직의 면역 형광 염색 및 이미징
주입 후 42일째, 샘플을 포르말린으로 고정하고 파라핀에 내장시켰다(n=4). 샘플이 내장된 파라핀을 크로스 섹션(cross-section)하여 얻은 샘플을 anti-HA 항체 (Roche, 3F10, 1:1000), anti-opsin 항체 (Millipore, AB5405, 1:1000), 및 Alexa Fluor 488 또는 594 항체 (Thermo Fisher Scientific, 1:500)로 면역 염색하였다. HA 태그된 CjCas9을 발현하는 RPE 세포에서 opsin 양성 부위를 Image J software (1.47v, NIH)를 이용하여 측정하였다. RPE flat-mounts에서 CjCas9 및 eGFP의 분포는 confocal microscope (LSM 710, Carl Zeiss)을 이용하여 이미지를 얻었다.
11. 게놈 DNA 추출
RPE 및 retina으로부터 DNA를 추출하기 위하여, RPE와 retina flat-mounts의 이미징 획득 후, 조직 샘플을 PBS로 세척하였다. RPE 세포는 용해 버퍼(NucleoSpin Tissue, Macherey-Nagel)에서 30초간 볼텍싱하여 choroid/sclera로부터 분리하였다. 잔여 choroid/sclera 조직으로부터 게놈 DNA를 분석하여 RPE 세포의 완전한 단리를 확인하였다. 게놈 DNA는 표적 딥 시퀀싱에 의해 분석되었다.
12. 마우스 Vegfa ELISA
주입 후 42일째에, 전체 RPE 혼합물을 neural retina 조직으로부터 분리하였고, 두 조직은 차후 분석을 위해 냉동시켰다. 샘플조직은 120 ㎕ 세포 용해 버퍼(CST #9803)에서 용해시켰고, Vegfa 단백질의 양은 마우스 VEGF Quantikine ELISA kit(MMV00, R&D systems)를 이용하여 측정하였다.
13. 레이저 유도 CNV 모델
마우스를 마취한 후, 눈동자에 0.5% phenylephrine 및 0.5% tropicamide를 포함하는 점안액을 넣어주어 동공을 확장시켰다. 레이제 광응고화(Laser photocoagulation)는 간접 헤드 세트 전달 시스템(indirect head set delivery system, Iridex) 및 레이저 시스템(Ilooda)을 이용하여 수행되었다. 레이저 매개 변수는 532 nm 파장, 200 ㎛ 스팟 크기, 800 mW 출력 및 70 ms 노출 시간이다. 레이저 화상을 시신경 주변에서 3 ~ 4번 유도하였다. 유리체의 출혈없이 버블을 생성하는 화상만이 연구에 이용되었다. 7일 후, 안구는 한 시간동안 실온에서 4% paraformaldehyde로 고정시켰다. RPE 혼합물(RPE/choroid/sclera)은 isolectin-B4 (Thermo Fisher Scientific, cat. no. I21413, 1:100) 및 anti-GFP 항체(Abcam, ab6556, 1:100)를 이용해 4 ℃에서 밤새도록 면역 염색시켰다. RPE 혼합물은 flat-mount 시켰고, fluorescent microscope (Eclipse 90i, Nikon) 또는 confocal microscope (LSM 710, Carl Zeiss)을 이용하여 100배의 배율에서 이미지를 얻었다. CNV 부위는 Image J software (1.47v, NIH)를 사용하여 측정하였다. 안구 당 3 ~ 4개 CNV 부위의 평균을 분석하였다. 각 그룹은 17 ~ 18개의 안구로 구성된다.
14. 망막 혈관 파열의 정량 및 정성 분석
혈관 파열을 측정하기 위해, STZ-유도 당뇨병 마우스 모델을 사용하였다. 마취한 마우스에 PBS에 녹인 Evans blue dye (20 mg/ml) 200 ㎕를 정맥주사하였다. 관류 2시간 후, 안구를 적출하여 4% 파라포름알데히드(paraformaldehyde)에 1시간 동안 고정하였다. 망막은 2X PBS에서 절개하여 flat-mount 시켰고, fluorescent microscope (Eclipse 90i, Nikon)을 이용한 40배 및 100배의 배율로 이미지를 얻었다.
혈관 파열을 정량적으로 분석하기 위해, 각 마우스의 중간-주변 망막(mid-peripheral retina, 0.5 ㎛ × 0.5 ㎛) 에 혈관 파열의 대표적인 4 부위를 선택하였다. 중간-주변 망막은 시신경 유두(optic nerve head)부터 모양체(ciliary body)까지 망막의 중간 1/3로 지정하였고, Image J software (1.47v, NIH)를 사용하여 자동 아이소데이터 알고리즘(automatic isodata algorithm)를 기반으로 색상 임계값에 맞게 이미지를 조정하고, Evans blue dye를 포함하는 관심 영역을 빨간색으로 표시하였다. 그 후, 빨간색으로 표시한 영역을 측정하였다. 상기 데이터는 대조군 마우스의 데이터로 표준화하여 혈관 파열(%)로 나타내었다.
15. 데이터 분석
In vitro 또는 in vivo에서 샘플의 크기를 미리 결정을 위해 통계적 방법은 사용하지 않았다. 통계 분석을 위하여, one-way ANOVA 및 Tukey post-hoc tests를 사용하였다.
실시예 1. 마우스 망막 조직에서 AAV를 통한 CjCas9 발현 확인
984 아미노산으로 구성된 CjCas9은 SpCas9에 비해 상당히 작은 크기(2.95kbp)로, CjCas9 유전자와 sgRNA가 함께 하나의 AAV 벡터에 패키징이 가능하다. 이에 본 실시예에서 노인성 황반변성(AMD)의 치료를 위한 CjCas9을 이용한 유전자 조작의 치료법의 가능성을 확인하고자 CjCas9을 발현하는 AAV를 이용하였다.
마우스에서 망막과 같은 조직에서 AAV를 통해 CjCas9이 발현하는지를 확인하기위해, 맥락막 신생혈관 형성(choroidal neovascularization, CNV)과 관련있는 Vegfa 유전자와 Hif1a 유전자에 특이적인 U6 프로모터-유도 sgRNA 및 EFS 프로모터 제어하에 CjCas9을 암호화하는 AAV9 벡터를 제작하였고, 이때, CjCas9은 C-말단에 자가절단하는 T2A 펩타이드를 이용해 eGFP가 연결되어 있도록 제작하였다(도 1A, 1B). 제작한 바이러스를 유리체내 주입을 통해 안구로 주입하고 6주 후, 안구에서 CjCas9의 발현을 확인하였고, 표적 딥 시퀀싱을 이용하여 인델 빈도를 측정하였으며, Vegfa 단백질의 양도 ELISA를 이용해 측정하였다(도 1D).
CjCas9에 연결된 eGFP는 망막 색소 상피세포(retinal pigment epithelial(RPE) cells)에서 발현이 확인되었다(도 2).
또한, CjCas9에 의해 유도된 인델은 RPE 세포의 Rosa26, Vegfa, 및 Hif1a 타겟 위치에서 관찰되었고, 각각 14 ± 5%, 22 ± 3%, 및 31 ± 2%의 인델 빈도를 확인하였다(도 1C). 또한, 상기 세포에서 Vegfa 또는 Hif1a 특이적 sgRNA에 의해 주목할 정도로 오프-타겟 인델이 유도되지 않았다(도 1E).
예상대로, Vegfa 단백질의 발현양은 Vegfa-특이적 CjCas9 (AAV-CjCas9: Vegfa)을 암호화하는 AAV를 처리한 RPE 세포에서 감소하였으나, Hif1a- 또는 Rosa26-특이적 CjCas9 (AAV-CjCas9: Hif1a 또는 Rosa26)을 암호화하는 AAV를 처리한 경우에는 그렇지 않았다(도 1D). 특히 Hif1a 단백질의 경우, 산소 정상 상태(normoxia condition)에서 분해되기 때문에 단백질의 발현양을 측정할 수 없었다.
실시예 2. 맥락막 신생혈관 형성( CNV ) 유도 마우스를 이용한 Vegfa 또는 Hif1a 특이적 AAV-CjCas9의 효과
CNV를 유도하기 위하여, 안구에 AAV를 주입한 후 6주째에 안구에 레이저를 처리하였고, 레이저 처리 일주일 후 CNV의 부위를 측정하였다(도 1F). AAV-CjCas9: Vegfa 및 AAV-CjCas9: Hif1a를 각각 주입한 경우, AAV를 주입하지 않은 음성 대조군에 비해 CNV 부위가 각각 24 ± 4% 및 20 ± 4% 감소하는 것을 확인하였다(도 1F, 1G). 또 다른 음성 대조군인 Rosa26-특이적 CjCas9의 경우 어떠한 치료적 효과도 확인하지 못했다.
실시예 3. 노인성 황반변성( AMD ) 치료를 위한 AAV - CjCas9의 효과
마우스 RPE 세포에서 Vegfa 유전자의 조건적 넉아웃이 원뿔세포 기능장애(cone dysfunction)를 야기하기 때문에, RPE 세포에서 AAV를 이용한 유전자 넉아웃이 부작용을 야기하는지 조사하였다. 이를 위해 망막에서 원뿔세포(cone) 기능관련된 opsin 양성 부위의 크기를 측정하였다. 그 결과, Vegfa-특이적 CjCas9은 AAV를 주입하지 않은 대조군에 비해 30 ± 10% 정도 크기가 감소하였다(도 3). 그러나, 예상대로, Hif1a- 또는 Rosa26-특이적 CjCas9은 원뿔세포 기능장애(cone dysfunction)를 유발하지 않았다. 이러한 결과는 신생신생혈관형성을 저해하면서 원뿔세포 기능장애(cone dysfunction)를 야기하지 않는 Hif1a의 불활성화를 AMD의 치료를 위하여 제시할 수 있다.
HIF1A는 hypoxia-inducible transcription factor로, VEGFA의 전사를 활성화시키는 역할을 한다. AMD 치료를 위한 1차 치료 표적이며, 분비 단백질인 VEGFA와 달리, HIF1A는 약물 타겟으로 고려되지 않으며, 또한 HIF1A 같은 전사인자는 일반적으로 항체나 앱타머 또는 작은 분자들에 의해 직접적으로 표적할 수 없다. 본 연구에서, 마우스의 안구에서 Hif1a 유전자를 표적하는 CjCas9을 이용해 RPE 세포에서 Hif1a 유전자를 효과적으로 불활성시켰고, 그 결과 AMD 마우스 모델에서 CNV의 부위가 감소하는 것을 확인하였다(도 3).
실시예 4. 망막 질환 치료를 위한 AAV - CjCas9의 효과
당뇨병성 망막증(diabetic retinopathy, DR), 미숙아 망막병증(retinopathy of prematurity) 등과 같은 망막 질환으로 확장 적용하기 위해, 제작한 바이러스를 유리체내 주입을 통해 안구로 주입하고 6주 후, 망막 조직에서 인델 빈도에 의한 in vivo 게놈 교정의 효과를 표적 딥 시퀀싱으로 관찰하였고, Vegfa 단백질의 발현양을 ELISA로 확인하였다(도 1B). 망막 조직에서, CjCas9에 의해 유도된 인델은 망막 세포에 Rosa26, Vegfa, 및 Hif1a 타겟 위치에서 관찰되었고, 각각 44 ± 8%, 20 ± 2%, 및 58 ± 5%의 인델 빈도를 확인하였다(도 4A, 4B, 4C). 예상대로, Vegfa 단백질의 발현양은 Vegfa- 또는 Hif1a-특이적 CjCas9 (AAV-CjCas9: Vegfa 또는 Hif1a)을 암호화하는 AAV를 처리한 망막 세포에서 감소하였으나, Rosa26-특이적 CjCas9 (AAV-CjCas9: Rosa26)을 암호화하는 AAV를 처리한 경우에는 그렇지 않았다(도 4D).
실시예 5. 당뇨병성 망막증 치료를 위한 AAV - CjCas9의 효과
당뇨병성 망막증은 혈관 파열 및 혈액 누출 증상을 보이는 것이 특징이다. 이에 본 실시예에서 STZ를 이용하여 당뇨병을 유도한 마우스를 이용하여 혈관 파열 또는 혈액 누출 증상을 확인하였고, CjCas9에 의한 개선 또는 치료 효과를 확인하였다. 그 결과, Vegfa 특이적 CjCas9(AAV-CjCas9: Vegfa)을 주입한 망막에서 혈관 파열 및 파열로 인한 혈액 누출이 감소하는 것을 확인할 수 있었다. Rosa26 특이적 CjCas9(AAV-CjCas9: Rosa26)를 주입한 마우스에 비교했을 때, Vegfa 특이적 CjCas9(AAV-CjCas9: Vegfa)을 주입한 경우 동일한 나이의 정상 마우스와 유사한 정도로 혈관 파열 및 혈액 누출이 감소하며 회복되는 것을 확인하였다. 이러한 결과는 STZ를 주입하고 7 주 후에 AAV-CjCas9을 주입하고 6 주 후에 관찰한 실험(도 5)과, STZ를 주입하고 14 주 후에 AAV-CjCas9을 주입하고 7 주 후에 관찰한 실험(도 6) 모두에서 유사하게 나타났다. 상기 결과를 통해, Vegfa 특이적 CjCas9(AAV-CjCas9: Vegfa)이 혈관 파열 및 혈액 누출을 감소시키는 효과를 가지는 것을 확인하였고, 이를 이용하여 당뇨병성 망막증을 효과적으로 치료할 수 있을 것으로 예측할 수 있다.
실시예 6. 인간 신생혈관형성 관련 인자의 표적 위치 스크리닝
앞선 실시예의 적용을 확장하고자, 인간 VEGFA(도 7), 인간 HIF1A(도 8A)와 더불어 AMD 및 DR 치료를 위한 게놈 교정의 잠재적 표적으로서 인간 ANGPT2(도 9), 인간 EPAS1(도 10) 및 인간 ANGPTL4(도 11)를 선택하여, 인간세포에서 CjCas9 시스템을 이용해 효과적으로 교정할 수 있는 각 유전자의 표적 위치를 스크리닝하였다. 특히, 마우스 Hif1a 유전자의 CjCas9 표적 위치는 인간 및 다른 포유동물에서 완벽하게 보존된다(도 8B). 추가적으로, 보존된 표적 위치의 높은 교정 효율은 인간세포에서 관찰되었다(도 8A, sgRNA #7). 따라서, 본 연구에서 제시한 Hif1a를 위한 AAV 또는 그의 변이체는 향후 인간 환자의 치료를 위해 사용될 수 있을 것으로 기대된다.
인위적으로 조작한 신생혈관형성 관련 인자 및 이에 의해 인위적으로 기능을 변형시킨 신생혈관형성 시스템에 의해서, 효과적인 신생혈관 관련 질환, 예를 들어 신생혈관 관련 안구질환의 치료적 용도를 이용할 수 있다.
다양한 신생혈관형성 관련 인자들의 생존(survival), 증식(proliferation), 지속(persistency), 세포독성(cytotoxicity), 사이토카인 분비(cytokine-release) 등의 특성을 조절함으로써 신생혈관형성 시스템의 효능을 개선시킬 수 있다.

Claims (26)

  1. 핵산서열 내 변형이 일어난 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 인위적으로 조작된 신생혈관형성 관련 인자.
  2. 제1항에 있어서,
    상기 핵산서열 내 변형은 가이드핵산-에디터단백질 복합체에 의해 인위적으로 일어난 것을 특징으로 하는, 인위적으로 조작된 신생혈관형성 관련 인자.
  3. 제1항에 있어서,
    상기 신생혈관형성 관련 인자는 VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택되는 1이상의 유전자인 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  4. 제1항에 있어서,
    상기 유전자는 가이드핵산-에디터단백질 복합체에 의해 인위적으로 조작된 신생혈관형성 관련 인자로서,
    상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
    하나 이상의 뉴클레오타이드의 결실 또는 삽입;
    야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
    외부 유래의 하나 이상의 뉴클레오타이드 삽입
    중 하나 이상의 핵산의 변형, 또는
    상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
    을 포함하는 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  5. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 프로모터 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  6. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 엑손 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  7. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 인트론 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  8. 제1항에 있어서,
    상기 핵산의 변형은 유전자의 인핸서 영역에서 일어난 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  9. 제4항에 있어서,
    상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상인 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자(5'에서 3'방향으로 기재함).
    NGG(N은 A, T, C 또는 G임);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
    TTN(N은 A, T, C 또는 G임).
  10. 제2항에 있어서,
    상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상을 포함하는 것을 특징으로 하는 인위적으로 조작된 신생혈관형성 관련 인자.
  11. VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산.
  12. 제11항에 있어서,
    이하의 군으로부터 선택되는 1 이상의 가이드 핵산:
    VEGFA 유전자 핵산 서열 중 서열번호 3, 4, 7, 9, 10 및 11의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
    HIF1A 유전자 핵산 서열 중 서열번호 14, 18, 19, 20, 26, 29 및 31의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
    ANGPT2 유전자 핵산 서열 중 서열번호 33, 34, 37, 38, 39 및 43의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산;
    EPAS1 유전자 핵산 서열 중 서열번호 47, 48, 49, 50, 53, 54 및 55의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산; 및
    ANGPTL4 유전자 핵산 서열 중 서열번호 64, 66, 67, 73, 76 및 79의 표적 서열에 각각 상보적인 결합을 할 수 있는 가이드핵산.
  13. 제11항에 있어서,
    상기 가이드 핵산은 18 내지 23 bp의 뉴클레오타이드인, gRNA 분자.
  14. VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
    에디터단백질 또는 이를 암호화하는 핵산서열
    을 포함하는 유전자 조작용 조성물.
  15. 제14항에 있어서,
    상기 에디터단백질은 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상을 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  16. 제14항에 있어서, 상기 유전자 조작은
    신생혈관형성 관련 인자를 구성하는 핵산서열 내 PAM(proto-spacer-adjacent Motif) 서열 중 또는 이의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 50bp의 염기 서열 부위 내의
    하나 이상의 뉴클레오타이드의 결실 또는 삽입;
    야생형 유전자와 상이한 하나 이상의 뉴클레오타이드로의 치환;
    외부 유래의 하나 이상의 뉴클레오타이드 삽입
    중 하나 이상의 핵산의 변형, 또는
    상기 신생혈관형성 관련 인자를 구성하는 핵산서열 내 하나 이상의 뉴클레오타이드의 화학적 변형
    을 포함하는 것을 특징으로 하는 유전자 조작용 조성물.
  17. 제16항에 있어서,
    상기 PAM 서열은 예를 들어, 하기의 서열 중 1 이상인 것을 특징으로 하는 유전자 조작용 조성물(5'에서 3'방향으로 기재함).
    NGG(N은 A, T, C 또는 G임);
    NNNNRYAC(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A또는 G이고, Y는 C또는 T임);
    NNAGAAW(N은 각각 독립적으로 A, T, C 또는 G이고, W는 A 또는 T임);
    NNNNGATT(N은 각각 독립적으로 A, T, C 또는 G임);
    NNGRR(T)(N은 각각 독립적으로 A, T, C 또는 G이고, R은 A 또는 G이고, Y는 C 또는 T임); 및
    TTN(N은 A, T, C 또는 G임).
  18. 제14항에 있어서,
    상기 유전자 조작용 조성물은 바이러스 벡터 시스템으로 형성되어 있는 것을 특징으로 하는 유전자 조작용 조성물.
  19. 제18항에 있어서,
    상기 바이러스 벡터는 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 백시니아바이러스, 폭스바이러스 및 단순포진 바이러스로 구성된 군에서 선택되는 1 이상인 것을 특징으로 하는 유전자 조작용 조성물.
  20. VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자를 서열분석함으로써 대상체에서 인위적으로 조작 가능한 표적 위치의 서열에 대한 정보를 제공하는 방법.
  21. 제20항의 방법을 통해 제공받은 정보를 이용하여 라이브러리를 구축하는 방법.
  22. (a) VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 중 서열번호 1 내지 79번의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
    (b) 스트렙토코커스 피요게네스(Streptococcus pyogenes) 유래의 Cas9 단백질, 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질, 스트렙토코커스 써모필러스 (Streptococcus thermophilus) 유래의 Cas9 단백질, 스트렙토코커스 아우레우스 (Streptocuccus aureus) 유래의 Cas9 단백질, 네이세리아 메닝기디티스 (Neisseria meningitidis)유래의 Cas9 단백질, 및 Cpf1 단백질로 이루어진 군에서 선택된 하나 이상의 단백질을 포함하는 에디터단백질 또는 이를 암호화하는 핵산서열
    을 포함하는 유전자 조작용 키트.
  23. VEGFA 유전자, HIF1A 유전자, ANGPT2 유전자, EPAS1 유전자 및 ANGPTL4 유전자로 구성된 군에서 선택된 하나 이상의 유전자의 핵산 서열 내 1 이상의 표적 서열에 각각 상보적인 결합을 형성할 수 있는 가이드핵산 또는 이를 암호화하는 핵산서열; 및
    에디터단백질 또는 이를 암호화하는 핵산서열
    을 포함하는 혈관신생성 장애 치료용 조성물.
  24. 제23항에 있어서, 상기 표적 서열은 서열번호 1 내지 79번의 표적 서열 중 1 이상인 것을 특징으로 하는 치료용 조성물.
  25. 제23항에 있어서, 상기 에디터단백질은 캄필로박터 제주니 (Campylobacter jejuni) 유래의 Cas9 단백질인 것을 특징으로 하는 치료용 조성물.
  26. 제23항에 있어서, 상기 혈관신생성 장애는 허혈성 망막병증 또는 미숙아 망막병증(retinopathy of prematurity)인 것을 특징으로 하는 치료용 조성물.
PCT/KR2017/009078 2016-08-19 2017-08-21 인위적으로 조작된 신생혈관형성 조절 시스템 Ceased WO2018034554A1 (ko)

Priority Applications (13)

Application Number Priority Date Filing Date Title
EP21210792.4A EP4012032A1 (en) 2016-08-19 2017-08-21 Artificially engineered angiogenesis regulatory system
JP2019510289A JP7050215B2 (ja) 2016-08-19 2017-08-21 人工的に操作された血管新生調節系
BR112019003124A BR112019003124A2 (pt) 2016-08-19 2017-08-21 sistema regulador de angiogênse artificialmente engendrado
RU2019103691A RU2019103691A (ru) 2016-08-19 2017-08-21 Искусственно сконструированная система регуляции ангиогенеза
AU2017313616A AU2017313616B2 (en) 2016-08-19 2017-08-21 Artificially engineered angiogenesis regulatory system
CN201780064951.7A CN109844123A (zh) 2016-08-19 2017-08-21 经人工操纵的血管生成调控系统
EP17841736.6A EP3502261B1 (en) 2016-08-19 2017-08-21 Artificially engineered angiogenesis regulatory system
SG11201901306XA SG11201901306XA (en) 2016-08-19 2017-08-21 Artificially engineered angiogenesis regulatory system
CA3033939A CA3033939A1 (en) 2016-08-19 2017-08-21 Artificially engineered angiogenesis regulatory system
US15/953,141 US20180237771A1 (en) 2016-08-19 2018-04-13 Artificially-Manipulated Neovascularization Regulatory System
US17/236,660 US11999952B2 (en) 2016-08-19 2021-04-21 Artificially-manipulated neovascularization regulatory system
JP2021212083A JP7276422B2 (ja) 2016-08-19 2021-12-27 人工的に操作された血管新生調節系
AU2022204172A AU2022204172B2 (en) 2016-08-19 2022-06-15 Artificially engineered angiogenesis regulatory system

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662376998P 2016-08-19 2016-08-19
US62/376,998 2016-08-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/953,141 Continuation US20180237771A1 (en) 2016-08-19 2018-04-13 Artificially-Manipulated Neovascularization Regulatory System

Publications (1)

Publication Number Publication Date
WO2018034554A1 true WO2018034554A1 (ko) 2018-02-22

Family

ID=61196886

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/009078 Ceased WO2018034554A1 (ko) 2016-08-19 2017-08-21 인위적으로 조작된 신생혈관형성 조절 시스템

Country Status (11)

Country Link
US (2) US20180237771A1 (ko)
EP (2) EP4012032A1 (ko)
JP (2) JP7050215B2 (ko)
KR (2) KR102145092B1 (ko)
CN (1) CN109844123A (ko)
AU (2) AU2017313616B2 (ko)
BR (1) BR112019003124A2 (ko)
CA (1) CA3033939A1 (ko)
RU (1) RU2019103691A (ko)
SG (1) SG11201901306XA (ko)
WO (1) WO2018034554A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019009682A3 (ko) * 2017-07-07 2019-03-28 주식회사 툴젠 표적 특이적 crispr 변이체
US11491208B2 (en) 2018-03-27 2022-11-08 Gflas Life Sciences, Inc. Sequence-specific in vivo cell targeting

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9828582B2 (en) 2013-03-19 2017-11-28 Duke University Compositions and methods for the induction and tuning of gene expression
EP3256487A4 (en) 2015-02-09 2018-07-18 Duke University Compositions and methods for epigenome editing
MX2018005377A (es) 2015-11-30 2018-11-09 Univ Duke Dianas terapeuticas para la correccion del gen de la distrofina humana por edicion genica y metodos de uso.
WO2017180915A2 (en) 2016-04-13 2017-10-19 Duke University Crispr/cas9-based repressors for silencing gene targets in vivo and methods of use
EP3487523B1 (en) 2016-07-19 2023-09-06 Duke University Therapeutic applications of cpf1-based genome editing
CN111989113B (zh) * 2018-03-27 2024-07-12 G+Flas生命科学有限公司 用于治疗癌症的包含向导rna和核酸内切酶作活性成分的药物组合物
CN113195746B (zh) 2018-12-17 2023-10-20 日本制铁株式会社 炉内残留熔渣量的估计方法和估计装置
AU2020210630B2 (en) * 2019-01-23 2025-10-23 Regeneron Pharmaceuticals, Inc. Treatment of ophthalmic conditions with angiopoietin-like 7 (ANGPTL7) inhibitors
US11845989B2 (en) 2019-01-23 2023-12-19 Regeneron Pharmaceuticals, Inc. Treatment of ophthalmic conditions with angiopoietin-like 7 (ANGPTL7) inhibitors
CN112143701A (zh) * 2019-06-26 2020-12-29 中国科学院脑科学与智能技术卓越创新中心 基于rna定点编辑的抑制脉络膜新生血管形成的方法及试剂
WO2021243105A1 (en) * 2020-05-28 2021-12-02 University Of Southern California Composition and method for treating retinal vascular disease with vegf gene disruption
CN112662674B (zh) * 2021-01-12 2023-04-11 广州瑞风生物科技有限公司 靶向编辑VEGFA基因外显子区域的gRNA及其应用
EP4298219A1 (en) 2021-02-26 2024-01-03 Regeneron Pharmaceuticals, Inc. Treatment of inflammation with glucocorticoids and angiopoietin-like 7 (angptl7) inhibitors
CN114540325B (zh) * 2022-01-17 2022-12-09 广州医科大学 靶向dna去甲基化的方法、融合蛋白及其应用
CN119662652B (zh) * 2024-12-24 2025-09-02 中国人民解放军总医院 一种启动子及其应用
CN119876268B (zh) * 2025-03-28 2025-08-29 吉林大学 一种提高家兔生长速度的方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014204729A1 (en) * 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
WO2015048577A2 (en) * 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
US20150232881A1 (en) * 2013-11-07 2015-08-20 Editas Medicine, Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS
JP2016521555A (ja) * 2013-06-05 2016-07-25 デューク ユニバーシティ Rnaガイド遺伝子編集及び遺伝子調節
JP2016523564A (ja) * 2013-07-11 2016-08-12 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7795422B2 (en) * 2002-02-20 2010-09-14 Sirna Therapeutics, Inc. RNA interference mediated inhibition of hypoxia inducible factor 1 (HIF1) gene expression using short interfering nucleic acid (siNA)
AU2005222902B2 (en) 2004-03-12 2010-06-10 Alnylam Pharmaceuticals, Inc. iRNA agents targeting VEGF
JP2010519908A (ja) * 2007-03-02 2010-06-10 エムディーアールエヌエー,インコーポレイテッド Hif1a遺伝子の発現を抑制するための核酸化合物およびその使用
WO2008154482A2 (en) * 2007-06-08 2008-12-18 Sirnaomics, Inc. Sirna compositions and methods of use in treatment of ocular diseases
US9012622B2 (en) * 2008-12-31 2015-04-21 Patrick Y. Lu Compositions and methods using siRNA molecules and siRNA cocktails for the treatment of breast cancer
WO2012100172A2 (en) * 2011-01-22 2012-07-26 Dicerna Pharmaceuticals, Inc. Methods and compositions for the specific inhibition of hif-1a by double stranded rna
ES2576126T3 (es) * 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones enzimáticas mejorados para la manipulación de secuencias
US8697359B1 (en) * 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
KR102874079B1 (ko) * 2013-03-15 2025-10-22 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집을 위해 특이성을 증가시키기 위한 절단된 안내 rna(tru-grnas)의 이용
BR112016013201B1 (pt) * 2013-12-12 2023-01-31 The Broad Institute, Inc. Uso de uma composição compreendendo um sistema crispr-cas no tratamento de uma doença genética ocular
WO2016021973A1 (ko) * 2014-08-06 2016-02-11 주식회사 툴젠 캄필로박터 제주니 crispr/cas 시스템 유래 rgen을 이용한 유전체 교정
RU2713328C2 (ru) * 2015-01-28 2020-02-04 Пайонир Хай-Бред Интернэшнл, Инк. Гибридные днк/рнк-полинуклеотиды crispr и способы применения
GB2557123B (en) * 2015-07-31 2021-11-03 Univ Minnesota Modified cells and methods of therapy
WO2017083368A1 (en) 2015-11-12 2017-05-18 Pfizer Inc. Tissue-specific genome engineering using crispr-cas9
WO2017099494A1 (ko) 2015-12-08 2017-06-15 기초과학연구원 Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도
JP6875500B2 (ja) * 2016-07-28 2021-05-26 インスティテュート フォー ベーシック サイエンスInstitute For Basic Science Cas9タンパク質およびガイドRNAを含む眼疾患治療用薬学組成物
WO2018191750A2 (en) * 2017-04-14 2018-10-18 The Broad Institute Inc. Novel delivery of large payloads

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521555A (ja) * 2013-06-05 2016-07-25 デューク ユニバーシティ Rnaガイド遺伝子編集及び遺伝子調節
WO2014204729A1 (en) * 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
JP2016523564A (ja) * 2013-07-11 2016-08-12 モデルナ セラピューティクス インコーポレイテッドModerna Therapeutics,Inc. CRISPR関連タンパク質をコードする合成ポリヌクレオチドおよび合成sgRNAを含む組成物ならびに使用方法
WO2015048577A2 (en) * 2013-09-27 2015-04-02 Editas Medicine, Inc. Crispr-related methods and compositions
US20150232881A1 (en) * 2013-11-07 2015-08-20 Editas Medicine, Inc. CRISPR-RELATED METHODS AND COMPOSITIONS WITH GOVERNING gRNAS

Non-Patent Citations (37)

* Cited by examiner, † Cited by third party
Title
"NCBI", Database accession no. NG 012169.1
"NCBI", Database accession no. NG 029606.1
"NCBI", Database accession no. NG_008732.1
"NCBI", Database accession no. NG_016000.1
"NCBI", Database accession no. NG_029483.1
"NCBI", Database accession no. NM _001147.2
"NCBI", Database accession no. NM 001039667.2
"NCBI", Database accession no. NM 001430.4
"NCBI", Database accession no. NM_001025366.2
"NCBI", Database accession no. NM_001025367.2
"NCBI", Database accession no. NM_001039667.2
"NCBI", Database accession no. NM_001118887.1
"NCBI", Database accession no. NM_001118888.1
"NCBI", Database accession no. NM_001243084.1
"NCBI", Database accession no. NM_001430.4
"NCBI", Database accession no. NM_001530.3
"NCBI", Database accession no. NM_003376
"NCBI", Database accession no. NM_139314.2
"NCBI", Database accession no. NM_181054.2
"NCBI", Database accession no. NP _001020537.2
"NCBI", Database accession no. NP _001112360.1
"NCBI", Database accession no. NP 001020538.2
"NCBI", Database accession no. NP 001112359.1
"NCBI", Database accession no. NP 001138.1
"NCBI", Database accession no. NP 001230013.1
"NCBI", Database accession no. NP 001521.1
"NCBI", Database accession no. NP_001034756.1
"NCBI", Database accession no. NP_001421.2
"NCBI", Database accession no. NP_647475.1
ANDERS ET AL., NATURE, 2014
CHO, S.W.; KIM, S.; KIM, J.M.; KIM, J.S.: "Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease", NATURE BIOTECHNOLOGY, vol. 31, 2013, pages 230 - 232
HIROSHI NISHIMASU ET AL., CELL, vol. 156, 2014, pages 935 - 949
JINEK ET AL., SCIENCE, vol. 343, no. 6176, 2014, pages 1247997
LEE ET AL., NANO LETT., vol. 12, 2012, pages 6322 - 6327
NISHIMASU ET AL., CELL, vol. 156, 2014, pages 935 - 949
TAKASHI YAMANO ET AL., CELL, vol. 165, 2016, pages 949 - 962
YIU, GLENN ET AL.: "Genomic Disruption ofVEGF-A Expression in Human Retinal Pigment Epithelial Cells Using CRISPR.Cas9 Endonuclease", INVESTIGATIVE OPHTHALMOLOGY & VISUAL SCIENCE, vol. 57, no. 13, October 2016 (2016-10-01), pages 5490 - 5497, XP055576195 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019009682A3 (ko) * 2017-07-07 2019-03-28 주식회사 툴젠 표적 특이적 crispr 변이체
US11441135B2 (en) 2017-07-07 2022-09-13 Toolgen Incorporated Target-specific CRISPR mutant
US11491208B2 (en) 2018-03-27 2022-11-08 Gflas Life Sciences, Inc. Sequence-specific in vivo cell targeting

Also Published As

Publication number Publication date
EP4012032A1 (en) 2022-06-15
KR102259006B1 (ko) 2021-05-31
AU2017313616B2 (en) 2022-12-08
CN109844123A (zh) 2019-06-04
SG11201901306XA (en) 2019-03-28
AU2022204172B2 (en) 2024-08-15
AU2017313616A1 (en) 2019-02-07
BR112019003124A2 (pt) 2019-10-01
EP3502261A4 (en) 2020-07-15
JP7276422B2 (ja) 2023-05-18
AU2022204172A1 (en) 2022-07-07
KR20180020929A (ko) 2018-02-28
JP7050215B2 (ja) 2022-04-08
EP3502261C0 (en) 2025-01-15
CA3033939A1 (en) 2018-02-22
KR102145092B1 (ko) 2020-08-14
US20210254054A1 (en) 2021-08-19
US20180237771A1 (en) 2018-08-23
EP3502261A1 (en) 2019-06-26
JP2019524847A (ja) 2019-09-05
JP2022058425A (ja) 2022-04-12
EP3502261B1 (en) 2025-01-15
US11999952B2 (en) 2024-06-04
RU2019103691A (ru) 2020-09-22
KR20200098441A (ko) 2020-08-20

Similar Documents

Publication Publication Date Title
WO2018034554A1 (ko) 인위적으로 조작된 신생혈관형성 조절 시스템
WO2018088694A2 (ko) 인위적으로 조작된 sc 기능 조절 시스템
WO2018231018A2 (ko) 간에서 목적하는 단백질 발현하기 위한 플랫폼
WO2019066490A2 (ko) 유전자 발현 조절을 위한 인위적인 게놈 조작
CN116209770A (zh) 用于调控基因组的改善的方法和组合物
CN116209756A (zh) 调控基因组的方法和组合物
WO2018208067A1 (ko) 인위적으로 조작된 조작면역세포
TW202323522A (zh) 用於調節基因體的方法及組合物
WO2019066549A2 (ko) 망막 기능장애 질환 치료를 위한 유전자 조작
CN105658805A (zh) Rna指导的基因编辑和基因调节
WO2018030874A1 (ko) 조작된 면역조절요소 및 이에 의해 변형된 면역 활성
WO2022075816A1 (ko) Crispr/cas12f1(cas14a1) 시스템 효율화를 위한 엔지니어링 된 가이드 rna 및 이의 용도
WO2020022802A1 (ko) 인위적인 유전자 조작을 통한 자가면역질환 치료
WO2018230976A1 (ko) 반복 확장 돌연변이에 대한 게놈 편집 시스템
WO2020022803A1 (ko) 항응고 인자들의 유전자 에디팅
US12416001B2 (en) Nucleobase editors and methods of use thereof
WO2023191570A1 (ko) 어셔 증후군 치료를 위한 유전자 편집 시스템
WO2020197242A1 (ko) 혈우병b 질환 모델 랫드
WO2023172115A1 (ko) Nhej 복구 경로 조절을 통해 핵산 세그먼트의 결실 효율을 증가시키기 위한 조성물 및 방법
WO2024253421A1 (ko) 혈액 적합성을 갖는 중간엽 줄기세포, 이의 제조방법 및 용도
WO2023075154A1 (ko) 돼지 내인성 레트로바이러스의 유전자를 불활성화하는 방법 및 이의 조성물

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17841736

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017313616

Country of ref document: AU

Date of ref document: 20170821

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 3033939

Country of ref document: CA

ENP Entry into the national phase

Ref document number: 2019510289

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

REG Reference to national code

Ref country code: BR

Ref legal event code: B01A

Ref document number: 112019003124

Country of ref document: BR

ENP Entry into the national phase

Ref document number: 2017841736

Country of ref document: EP

Effective date: 20190319

REG Reference to national code

Ref country code: BR

Ref legal event code: B01E

Ref document number: 112019003124

Country of ref document: BR

Free format text: COM BASE NA RESOLUCAO 187 DE 27/04/2017, SOLICITA-SE QUE SEJA APRESENTADO, EM ATE 60 (SESSENTA) DIAS, NOVO CONTEUDO DE LISTAGEM DE SEQUENCIA POIS O CONTEUDO APRESENTADO NAS PETICOES NO 870190015527 DE 15/05/2019 NAO ESTA EM LINGUA VERNACULA.

ENP Entry into the national phase

Ref document number: 112019003124

Country of ref document: BR

Kind code of ref document: A2

Effective date: 20190215