TW202120688A - Rna導引之核酸酶及其活性片段及變體以及使用方法 - Google Patents
Rna導引之核酸酶及其活性片段及變體以及使用方法 Download PDFInfo
- Publication number
- TW202120688A TW202120688A TW109127218A TW109127218A TW202120688A TW 202120688 A TW202120688 A TW 202120688A TW 109127218 A TW109127218 A TW 109127218A TW 109127218 A TW109127218 A TW 109127218A TW 202120688 A TW202120688 A TW 202120688A
- Authority
- TW
- Taiwan
- Prior art keywords
- sequence
- rgn
- rna
- polypeptide
- seq
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 225
- 101710163270 Nuclease Proteins 0.000 title claims abstract description 164
- 239000012634 fragment Substances 0.000 title description 54
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 334
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 259
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 256
- 229920001184 polypeptide Polymers 0.000 claims abstract description 254
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 167
- 108091079001 CRISPR RNA Proteins 0.000 claims abstract description 141
- 239000013598 vector Substances 0.000 claims abstract description 106
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 99
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 92
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 92
- 230000027455 binding Effects 0.000 claims abstract description 30
- 238000009739 binding Methods 0.000 claims abstract description 30
- 239000000203 mixture Substances 0.000 claims abstract description 21
- 108091033409 CRISPR Proteins 0.000 claims abstract description 19
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract 14
- 239000002773 nucleotide Substances 0.000 claims description 219
- 125000003729 nucleotide group Chemical group 0.000 claims description 216
- 102000040430 polynucleotide Human genes 0.000 claims description 212
- 108091033319 polynucleotide Proteins 0.000 claims description 212
- 239000002157 polynucleotide Substances 0.000 claims description 212
- 108020004414 DNA Proteins 0.000 claims description 171
- 230000008685 targeting Effects 0.000 claims description 147
- 102000053602 DNA Human genes 0.000 claims description 102
- 125000006850 spacer group Chemical group 0.000 claims description 58
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 54
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 53
- 230000035772 mutation Effects 0.000 claims description 46
- 238000012217 deletion Methods 0.000 claims description 38
- 230000037430 deletion Effects 0.000 claims description 38
- 230000037431 insertion Effects 0.000 claims description 33
- 238000003780 insertion Methods 0.000 claims description 32
- 238000012360 testing method Methods 0.000 claims description 23
- 230000004048 modification Effects 0.000 claims description 19
- 238000012986 modification Methods 0.000 claims description 19
- 150000001413 amino acids Chemical class 0.000 claims description 18
- 230000015572 biosynthetic process Effects 0.000 claims description 16
- 230000006870 function Effects 0.000 claims description 15
- 238000013467 fragmentation Methods 0.000 claims description 12
- 238000006062 fragmentation reaction Methods 0.000 claims description 12
- 238000002866 fluorescence resonance energy transfer Methods 0.000 claims description 10
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 9
- 108091028664 Ribonucleotide Proteins 0.000 claims description 8
- 239000002336 ribonucleotide Substances 0.000 claims description 8
- 239000002253 acid Substances 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims 4
- 102000004882 Lipase Human genes 0.000 claims 2
- 108090001060 Lipase Proteins 0.000 claims 2
- 239000004367 Lipase Substances 0.000 claims 2
- 235000019421 lipase Nutrition 0.000 claims 2
- 108010044467 Isoenzymes Proteins 0.000 claims 1
- 125000003277 amino group Chemical group 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 60
- 238000012800 visualization Methods 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 244
- 108090000623 proteins and genes Proteins 0.000 description 163
- 241000196324 Embryophyta Species 0.000 description 78
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 72
- 102100024640 Low-density lipoprotein receptor Human genes 0.000 description 58
- 102000004169 proteins and genes Human genes 0.000 description 57
- 206010033128 Ovarian cancer Diseases 0.000 description 53
- 206010061535 Ovarian neoplasm Diseases 0.000 description 53
- 235000018102 proteins Nutrition 0.000 description 52
- 201000010099 disease Diseases 0.000 description 47
- 230000000694 effects Effects 0.000 description 47
- 102000052609 BRCA2 Human genes 0.000 description 44
- 108700020462 BRCA2 Proteins 0.000 description 44
- 101150008921 Brca2 gene Proteins 0.000 description 44
- 238000006243 chemical reaction Methods 0.000 description 39
- 102000004389 Ribonucleoproteins Human genes 0.000 description 35
- 108010081734 Ribonucleoproteins Proteins 0.000 description 35
- 239000000047 product Substances 0.000 description 34
- 238000013518 transcription Methods 0.000 description 34
- 230000035897 transcription Effects 0.000 description 34
- 101000903703 Homo sapiens B-cell lymphoma/leukemia 11A Proteins 0.000 description 30
- 206010028980 Neoplasm Diseases 0.000 description 30
- 201000011510 cancer Diseases 0.000 description 30
- 108020001507 fusion proteins Proteins 0.000 description 30
- 102000037865 fusion proteins Human genes 0.000 description 30
- 102100022976 B-cell lymphoma/leukemia 11A Human genes 0.000 description 29
- 101001051093 Homo sapiens Low-density lipoprotein receptor Proteins 0.000 description 29
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 29
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 29
- 208000000563 Hyperlipoproteinemia Type II Diseases 0.000 description 29
- 102100029450 M1-specific T cell receptor alpha chain Human genes 0.000 description 29
- 206010045261 Type IIa hyperlipidaemia Diseases 0.000 description 29
- 201000001386 familial hypercholesterolemia Diseases 0.000 description 29
- 210000002706 plastid Anatomy 0.000 description 28
- 238000003752 polymerase chain reaction Methods 0.000 description 28
- 210000001519 tissue Anatomy 0.000 description 27
- 238000003776 cleavage reaction Methods 0.000 description 25
- 238000000338 in vitro Methods 0.000 description 25
- 239000000523 sample Substances 0.000 description 25
- 208000011580 syndromic disease Diseases 0.000 description 25
- 208000035475 disorder Diseases 0.000 description 24
- 239000003623 enhancer Substances 0.000 description 24
- 230000007017 scission Effects 0.000 description 24
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 23
- 241000282414 Homo sapiens Species 0.000 description 23
- 108091026890 Coding region Proteins 0.000 description 22
- 210000003527 eukaryotic cell Anatomy 0.000 description 22
- 210000003463 organelle Anatomy 0.000 description 22
- 102000004190 Enzymes Human genes 0.000 description 20
- 108090000790 Enzymes Proteins 0.000 description 20
- 101000982032 Homo sapiens Myosin-binding protein C, cardiac-type Proteins 0.000 description 20
- 102100026771 Myosin-binding protein C, cardiac-type Human genes 0.000 description 20
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 20
- 238000001514 detection method Methods 0.000 description 19
- 101150034941 AURKB gene Proteins 0.000 description 17
- 125000000539 amino acid group Chemical group 0.000 description 17
- 230000009977 dual effect Effects 0.000 description 17
- 239000000499 gel Substances 0.000 description 17
- 238000009396 hybridization Methods 0.000 description 17
- 210000001161 mammalian embryo Anatomy 0.000 description 17
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 16
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 16
- 238000003556 assay Methods 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 16
- 102100026846 Cytidine deaminase Human genes 0.000 description 15
- 108010031325 Cytidine deaminase Proteins 0.000 description 15
- 210000004962 mammalian cell Anatomy 0.000 description 15
- 230000006780 non-homologous end joining Effects 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 210000004899 c-terminal region Anatomy 0.000 description 14
- 230000001364 causal effect Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 230000009466 transformation Effects 0.000 description 14
- 108010079245 Cystic Fibrosis Transmembrane Conductance Regulator Proteins 0.000 description 13
- 201000011252 Phenylketonuria Diseases 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 102000008371 intracellularly ATP-gated chloride channel activity proteins Human genes 0.000 description 13
- 238000006467 substitution reaction Methods 0.000 description 13
- 241000701161 unidentified adenovirus Species 0.000 description 13
- 230000003612 virological effect Effects 0.000 description 13
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 12
- 102000055025 Adenosine deaminases Human genes 0.000 description 12
- 108010054147 Hemoglobins Proteins 0.000 description 12
- 102000001554 Hemoglobins Human genes 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 230000008859 change Effects 0.000 description 12
- 230000000295 complement effect Effects 0.000 description 12
- 210000003743 erythrocyte Anatomy 0.000 description 12
- 238000010362 genome editing Methods 0.000 description 12
- 238000011282 treatment Methods 0.000 description 12
- 201000003883 Cystic fibrosis Diseases 0.000 description 11
- 208000026350 Inborn Genetic disease Diseases 0.000 description 11
- 241000700605 Viruses Species 0.000 description 11
- 230000002759 chromosomal effect Effects 0.000 description 11
- 230000005782 double-strand break Effects 0.000 description 11
- 230000004927 fusion Effects 0.000 description 11
- 238000004806 packaging method and process Methods 0.000 description 11
- 239000013603 viral vector Substances 0.000 description 11
- 102100034157 DNA mismatch repair protein Msh2 Human genes 0.000 description 10
- 208000008051 Hereditary Nonpolyposis Colorectal Neoplasms Diseases 0.000 description 10
- 206010051922 Hereditary non-polyposis colorectal cancer syndrome Diseases 0.000 description 10
- 101001134036 Homo sapiens DNA mismatch repair protein Msh2 Proteins 0.000 description 10
- 201000005027 Lynch syndrome Diseases 0.000 description 10
- 229910015837 MSH2 Inorganic materials 0.000 description 10
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 10
- 108010074605 gamma-Globulins Proteins 0.000 description 10
- 230000002068 genetic effect Effects 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 230000001965 increasing effect Effects 0.000 description 10
- -1 nucleopasmin Proteins 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 208000031229 Cardiomyopathies Diseases 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 9
- 101001087416 Homo sapiens Tyrosine-protein phosphatase non-receptor type 11 Proteins 0.000 description 9
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 9
- 102100033019 Tyrosine-protein phosphatase non-receptor type 11 Human genes 0.000 description 9
- 210000000746 body region Anatomy 0.000 description 9
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 9
- 230000003252 repetitive effect Effects 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- 239000013607 AAV vector Substances 0.000 description 8
- 206010006187 Breast cancer Diseases 0.000 description 8
- 208000026310 Breast neoplasm Diseases 0.000 description 8
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 8
- 102000004913 RYR1 Human genes 0.000 description 8
- 108060007240 RYR1 Proteins 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 210000002257 embryonic structure Anatomy 0.000 description 8
- 238000001415 gene therapy Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 230000009261 transgenic effect Effects 0.000 description 8
- 108700020463 BRCA1 Proteins 0.000 description 7
- 102000036365 BRCA1 Human genes 0.000 description 7
- 101150072950 BRCA1 gene Proteins 0.000 description 7
- 241000711573 Coronaviridae Species 0.000 description 7
- 241000238631 Hexapoda Species 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 230000003321 amplification Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 210000004369 blood Anatomy 0.000 description 7
- 239000008280 blood Substances 0.000 description 7
- 208000016361 genetic disease Diseases 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 238000005259 measurement Methods 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000011017 operating method Methods 0.000 description 7
- 230000005783 single-strand break Effects 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000013519 translation Methods 0.000 description 7
- 102100035028 Alpha-L-iduronidase Human genes 0.000 description 6
- 241000193830 Bacillus <bacterium> Species 0.000 description 6
- 102100021147 DNA mismatch repair protein Msh6 Human genes 0.000 description 6
- 241000702421 Dependoparvovirus Species 0.000 description 6
- 102100031690 Erythroid transcription factor Human genes 0.000 description 6
- 108010044495 Fetal Hemoglobin Proteins 0.000 description 6
- 101000968658 Homo sapiens DNA mismatch repair protein Msh6 Proteins 0.000 description 6
- 101001066268 Homo sapiens Erythroid transcription factor Proteins 0.000 description 6
- 241001465754 Metazoa Species 0.000 description 6
- 206010056886 Mucopolysaccharidosis I Diseases 0.000 description 6
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 230000008901 benefit Effects 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 239000002131 composite material Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 230000009615 deamination Effects 0.000 description 6
- 238000006481 deamination reaction Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 230000000149 penetrating effect Effects 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 210000001236 prokaryotic cell Anatomy 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 208000007056 sickle cell anemia Diseases 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 5
- 108010087504 Beta-Globulins Proteins 0.000 description 5
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 5
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 208000012661 Dyskinesia Diseases 0.000 description 5
- 102100031780 Endonuclease Human genes 0.000 description 5
- 102100031509 Fibrillin-1 Human genes 0.000 description 5
- 101150103820 Fxn gene Proteins 0.000 description 5
- 102000006395 Globulins Human genes 0.000 description 5
- 108010044091 Globulins Proteins 0.000 description 5
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 5
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 5
- 101000896557 Homo sapiens Eukaryotic translation initiation factor 3 subunit B Proteins 0.000 description 5
- 101000846893 Homo sapiens Fibrillin-1 Proteins 0.000 description 5
- 101000899111 Homo sapiens Hemoglobin subunit beta Proteins 0.000 description 5
- 101000988834 Homo sapiens Hypoxanthine-guanine phosphoribosyltransferase Proteins 0.000 description 5
- 101001030243 Homo sapiens Myosin-7 Proteins 0.000 description 5
- 101000777277 Homo sapiens Serine/threonine-protein kinase Chk2 Proteins 0.000 description 5
- 208000015178 Hurler syndrome Diseases 0.000 description 5
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 5
- 241000699666 Mus <mouse, genus> Species 0.000 description 5
- 241000699670 Mus sp. Species 0.000 description 5
- 102100038934 Myosin-7 Human genes 0.000 description 5
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 5
- 206010029748 Noonan syndrome Diseases 0.000 description 5
- 102100031075 Serine/threonine-protein kinase Chk2 Human genes 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 5
- 239000013592 cell lysate Substances 0.000 description 5
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000004049 epigenetic modification Effects 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 238000010363 gene targeting Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 231100000350 mutagenesis Toxicity 0.000 description 5
- 239000002245 particle Substances 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 238000001890 transfection Methods 0.000 description 5
- 230000001052 transient effect Effects 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- 108091093088 Amplicon Proteins 0.000 description 4
- 102000006734 Beta-Globulins Human genes 0.000 description 4
- 241000283690 Bos taurus Species 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 206010011878 Deafness Diseases 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- 101001019502 Homo sapiens Alpha-L-iduronidase Proteins 0.000 description 4
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 4
- 101150083522 MECP2 gene Proteins 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 102100039124 Methyl-CpG-binding protein 2 Human genes 0.000 description 4
- 208000037538 Myelomonocytic Juvenile Leukemia Diseases 0.000 description 4
- 240000007594 Oryza sativa Species 0.000 description 4
- 235000007164 Oryza sativa Nutrition 0.000 description 4
- 102000014450 RNA Polymerase III Human genes 0.000 description 4
- 108010078067 RNA Polymerase III Proteins 0.000 description 4
- 102000015098 Tumor Suppressor Protein p53 Human genes 0.000 description 4
- 108010078814 Tumor Suppressor Protein p53 Proteins 0.000 description 4
- 102100039037 Vascular endothelial growth factor A Human genes 0.000 description 4
- 240000008042 Zea mays Species 0.000 description 4
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 4
- 230000009418 agronomic effect Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000003115 biocidal effect Effects 0.000 description 4
- 239000003153 chemical reaction reagent Substances 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 241001493065 dsRNA viruses Species 0.000 description 4
- 238000002474 experimental method Methods 0.000 description 4
- 239000005090 green fluorescent protein Substances 0.000 description 4
- 230000003394 haemopoietic effect Effects 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 201000005992 juvenile myelomonocytic leukemia Diseases 0.000 description 4
- 208000032839 leukemia Diseases 0.000 description 4
- 238000001638 lipofection Methods 0.000 description 4
- 239000002502 liposome Substances 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 238000002703 mutagenesis Methods 0.000 description 4
- 210000004940 nucleus Anatomy 0.000 description 4
- 229920002401 polyacrylamide Polymers 0.000 description 4
- 230000001177 retroviral effect Effects 0.000 description 4
- 235000009566 rice Nutrition 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 230000009870 specific binding Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 4
- 102100035886 Adenine DNA glycosylase Human genes 0.000 description 3
- 241000589158 Agrobacterium Species 0.000 description 3
- 208000009575 Angelman syndrome Diseases 0.000 description 3
- 101700002522 BARD1 Proteins 0.000 description 3
- 102100028048 BRCA1-associated RING domain protein 1 Human genes 0.000 description 3
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 206010008025 Cerebellar ataxia Diseases 0.000 description 3
- 241000611330 Chryseobacterium Species 0.000 description 3
- 206010053138 Congenital aplastic anaemia Diseases 0.000 description 3
- 208000012609 Cowden disease Diseases 0.000 description 3
- 201000002847 Cowden syndrome Diseases 0.000 description 3
- 102000016911 Deoxyribonucleases Human genes 0.000 description 3
- 108010053770 Deoxyribonucleases Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 201000004939 Fanconi anemia Diseases 0.000 description 3
- 102100036291 Galactose-1-phosphate uridylyltransferase Human genes 0.000 description 3
- 102100037156 Gap junction beta-2 protein Human genes 0.000 description 3
- 102000007513 Hemoglobin A Human genes 0.000 description 3
- 108010085682 Hemoglobin A Proteins 0.000 description 3
- 108091005904 Hemoglobin subunit beta Proteins 0.000 description 3
- 101001000351 Homo sapiens Adenine DNA glycosylase Proteins 0.000 description 3
- 101000954092 Homo sapiens Gap junction beta-2 protein Proteins 0.000 description 3
- 101000595746 Homo sapiens Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Proteins 0.000 description 3
- 101000801643 Homo sapiens Retinal-specific phospholipid-transporting ATPase ABCA4 Proteins 0.000 description 3
- 101000951145 Homo sapiens Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Proteins 0.000 description 3
- 208000023105 Huntington disease Diseases 0.000 description 3
- 101150022680 IDUA gene Proteins 0.000 description 3
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 208000008770 Multiple Hamartoma Syndrome Diseases 0.000 description 3
- 208000021642 Muscular disease Diseases 0.000 description 3
- 201000009623 Myopathy Diseases 0.000 description 3
- 208000009905 Neurofibromatoses Diseases 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 102100036056 Phosphatidylinositol 4,5-bisphosphate 3-kinase catalytic subunit delta isoform Human genes 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 102100033617 Retinal-specific phospholipid-transporting ATPase ABCA4 Human genes 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 244000062793 Sorghum vulgare Species 0.000 description 3
- 241000191940 Staphylococcus Species 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 108091027544 Subgenomic mRNA Proteins 0.000 description 3
- 102100038014 Succinate dehydrogenase [ubiquinone] cytochrome b small subunit, mitochondrial Human genes 0.000 description 3
- 208000002903 Thalassemia Diseases 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000008238 biochemical pathway Effects 0.000 description 3
- 210000003995 blood forming stem cell Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- VMGAPWLDMVPYIA-HIDZBRGKSA-N n'-amino-n-iminomethanimidamide Chemical compound N\N=C\N=N VMGAPWLDMVPYIA-HIDZBRGKSA-N 0.000 description 3
- 201000004931 neurofibromatosis Diseases 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000020520 nucleotide-excision repair Effects 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 208000007312 paraganglioma Diseases 0.000 description 3
- BOLDJAUMGUJJKM-LSDHHAIUSA-N renifolin D Natural products CC(=C)[C@@H]1Cc2c(O)c(O)ccc2[C@H]1CC(=O)c3ccc(O)cc3O BOLDJAUMGUJJKM-LSDHHAIUSA-N 0.000 description 3
- 230000008521 reorganization Effects 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010839 reverse transcription Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 230000033587 transcription-coupled nucleotide-excision repair Effects 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 241000972773 Aulopiformes Species 0.000 description 2
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 241001678559 COVID-19 virus Species 0.000 description 2
- 101100468275 Caenorhabditis elegans rep-1 gene Proteins 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 201000002927 Cardiofaciocutaneous syndrome Diseases 0.000 description 2
- 201000002929 Carnitine palmitoyltransferase II deficiency Diseases 0.000 description 2
- 208000010693 Charcot-Marie-Tooth Disease Diseases 0.000 description 2
- 206010008723 Chondrodystrophy Diseases 0.000 description 2
- 241000056141 Chryseobacterium sp. Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 229920000742 Cotton Polymers 0.000 description 2
- 244000241257 Cucumis melo Species 0.000 description 2
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 2
- 108010025464 Cyclin-Dependent Kinase 4 Proteins 0.000 description 2
- 102100036252 Cyclin-dependent kinase 4 Human genes 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102100034483 DNA repair protein RAD51 homolog 4 Human genes 0.000 description 2
- 208000002251 Dissecting Aneurysm Diseases 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 241000283074 Equus asinus Species 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 208000013135 GNE myopathy Diseases 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 102100029880 Glycodelin Human genes 0.000 description 2
- 229940113491 Glycosylase inhibitor Drugs 0.000 description 2
- 244000299507 Gossypium hirsutum Species 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 108091027305 Heteroduplex Proteins 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 2
- 101100493741 Homo sapiens BCL11A gene Proteins 0.000 description 2
- 101001132266 Homo sapiens DNA repair protein RAD51 homolog 4 Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 2
- 101000703761 Homo sapiens Leucine-rich repeat protein SHOC-2 Proteins 0.000 description 2
- 101001047090 Homo sapiens Potassium voltage-gated channel subfamily H member 2 Proteins 0.000 description 2
- 101001003584 Homo sapiens Prelamin-A/C Proteins 0.000 description 2
- 101001062129 Homo sapiens RNA-binding protein 20 Proteins 0.000 description 2
- 101000582767 Homo sapiens Regucalcin Proteins 0.000 description 2
- 101000874160 Homo sapiens Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Proteins 0.000 description 2
- 101000851334 Homo sapiens Troponin I, cardiac muscle Proteins 0.000 description 2
- 240000005979 Hordeum vulgare Species 0.000 description 2
- 235000007340 Hordeum vulgare Nutrition 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- VSNHCAURESNICA-UHFFFAOYSA-N Hydroxyurea Chemical compound NC(=O)NO VSNHCAURESNICA-UHFFFAOYSA-N 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 108010003381 Iduronidase Proteins 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 108010025815 Kanamycin Kinase Proteins 0.000 description 2
- 102100031956 Leucine-rich repeat protein SHOC-2 Human genes 0.000 description 2
- 201000005978 Loeys-Dietz syndrome Diseases 0.000 description 2
- 206010025323 Lymphomas Diseases 0.000 description 2
- 201000011442 Metachromatic leukodystrophy Diseases 0.000 description 2
- 108010074346 Mismatch Repair Endonuclease PMS2 Proteins 0.000 description 2
- 102000008071 Mismatch Repair Endonuclease PMS2 Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000282339 Mustela Species 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 101150048484 Nrgn gene Proteins 0.000 description 2
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 241001494479 Pecora Species 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 235000016761 Piper aduncum Nutrition 0.000 description 2
- 240000003889 Piper guineense Species 0.000 description 2
- 235000017804 Piper guineense Nutrition 0.000 description 2
- 235000008184 Piper nigrum Nutrition 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 102100022807 Potassium voltage-gated channel subfamily H member 2 Human genes 0.000 description 2
- 208000006664 Precursor Cell Lymphoblastic Leukemia-Lymphoma Diseases 0.000 description 2
- 102100026531 Prelamin-A/C Human genes 0.000 description 2
- 208000004777 Primary Hyperoxaluria Diseases 0.000 description 2
- 102100039233 Pyrin Human genes 0.000 description 2
- 108010059278 Pyrin Proteins 0.000 description 2
- 102100029248 RNA-binding protein 20 Human genes 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 102100030262 Regucalcin Human genes 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 241000589180 Rhizobium Species 0.000 description 2
- 241000589187 Rhizobium sp. Species 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000315672 SARS coronavirus Species 0.000 description 2
- 240000000111 Saccharum officinarum Species 0.000 description 2
- 235000007201 Saccharum officinarum Nutrition 0.000 description 2
- 201000004224 Schnyder corneal dystrophy Diseases 0.000 description 2
- 241000270295 Serpentes Species 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 235000002595 Solanum tuberosum Nutrition 0.000 description 2
- 244000061456 Solanum tuberosum Species 0.000 description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 2
- 208000027073 Stargardt disease Diseases 0.000 description 2
- 102100035726 Succinate dehydrogenase [ubiquinone] iron-sulfur subunit, mitochondrial Human genes 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 201000008982 Thoracic Aortic Aneurysm Diseases 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 244000098338 Triticum aestivum Species 0.000 description 2
- 102100036859 Troponin I, cardiac muscle Human genes 0.000 description 2
- 108010082433 UDP-glucose-hexose-1-phosphate uridylyltransferase Proteins 0.000 description 2
- 108090000848 Ubiquitin Proteins 0.000 description 2
- 102000044159 Ubiquitin Human genes 0.000 description 2
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 208000002517 adenoid cystic carcinoma Diseases 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 208000005980 beta thalassemia Diseases 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 238000010322 bone marrow transplantation Methods 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 239000006143 cell culture medium Substances 0.000 description 2
- 239000012707 chemical precursor Substances 0.000 description 2
- 235000013330 chicken meat Nutrition 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 235000005822 corn Nutrition 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 231100000895 deafness Toxicity 0.000 description 2
- 239000007857 degradation product Substances 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 238000002224 dissection Methods 0.000 description 2
- WBZKQQHYRPRKNJ-UHFFFAOYSA-L disulfite Chemical compound [O-]S(=O)S([O-])(=O)=O WBZKQQHYRPRKNJ-UHFFFAOYSA-L 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000002641 enzyme replacement therapy Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 230000001605 fetal effect Effects 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 238000003197 gene knockdown Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 238000012268 genome sequencing Methods 0.000 description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 208000016354 hearing loss disease Diseases 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 208000025581 hereditary breast carcinoma Diseases 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 229960001330 hydroxycarbamide Drugs 0.000 description 2
- 108010002685 hygromycin-B kinase Proteins 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000001597 immobilized metal affinity chromatography Methods 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 208000014135 immunodeficiency 14 Diseases 0.000 description 2
- 238000001114 immunoprecipitation Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 208000003747 lymphoid leukemia Diseases 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 210000003712 lysosome Anatomy 0.000 description 2
- 230000001868 lysosomic effect Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 230000025608 mitochondrion localization Effects 0.000 description 2
- 238000010172 mouse model Methods 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 231100000707 mutagenic chemical Toxicity 0.000 description 2
- 201000000050 myeloid neoplasm Diseases 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000008188 pellet Substances 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 230000025540 plastid localization Effects 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 230000004850 protein–protein interaction Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 201000007416 salivary gland adenoid cystic carcinoma Diseases 0.000 description 2
- 235000019515 salmon Nutrition 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 208000002491 severe combined immunodeficiency Diseases 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 210000004158 stalk cell Anatomy 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000010361 transduction Methods 0.000 description 2
- 230000026683 transduction Effects 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 229910021642 ultra pure water Inorganic materials 0.000 description 2
- 239000012498 ultrapure water Substances 0.000 description 2
- 210000005167 vascular cell Anatomy 0.000 description 2
- 235000013311 vegetables Nutrition 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- FQVLRGLGWNWPSS-BXBUPLCLSA-N (4r,7s,10s,13s,16r)-16-acetamido-13-(1h-imidazol-5-ylmethyl)-10-methyl-6,9,12,15-tetraoxo-7-propan-2-yl-1,2-dithia-5,8,11,14-tetrazacycloheptadecane-4-carboxamide Chemical compound N1C(=O)[C@@H](NC(C)=O)CSSC[C@@H](C(N)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](C)NC(=O)[C@@H]1CC1=CN=CN1 FQVLRGLGWNWPSS-BXBUPLCLSA-N 0.000 description 1
- VSNHCAURESNICA-NJFSPNSNSA-N 1-oxidanylurea Chemical compound N[14C](=O)NO VSNHCAURESNICA-NJFSPNSNSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-SHYZEUOFSA-N 2'‐deoxycytidine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-SHYZEUOFSA-N 0.000 description 1
- NHBKXEKEPDILRR-UHFFFAOYSA-N 2,3-bis(butanoylsulfanyl)propyl butanoate Chemical compound CCCC(=O)OCC(SC(=O)CCC)CSC(=O)CCC NHBKXEKEPDILRR-UHFFFAOYSA-N 0.000 description 1
- OVSKIKFHRZPJSS-UHFFFAOYSA-N 2,4-D Chemical compound OC(=O)COC1=CC=C(Cl)C=C1Cl OVSKIKFHRZPJSS-UHFFFAOYSA-N 0.000 description 1
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 1
- 229940087195 2,4-dichlorophenoxyacetate Drugs 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- BFSVOASYOCHEOV-UHFFFAOYSA-N 2-diethylaminoethanol Chemical compound CCN(CC)CCO BFSVOASYOCHEOV-UHFFFAOYSA-N 0.000 description 1
- KQPKMEYBZUPZGK-UHFFFAOYSA-N 4-[(4-azido-2-nitroanilino)methyl]-5-(hydroxymethyl)-2-methylpyridin-3-ol Chemical compound CC1=NC=C(CO)C(CNC=2C(=CC(=CC=2)N=[N+]=[N-])[N+]([O-])=O)=C1O KQPKMEYBZUPZGK-UHFFFAOYSA-N 0.000 description 1
- 102100022681 40S ribosomal protein S27 Human genes 0.000 description 1
- 102100024626 5'-AMP-activated protein kinase subunit gamma-2 Human genes 0.000 description 1
- 102100036512 7-dehydrocholesterol reductase Human genes 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102100032157 Adenylate cyclase type 10 Human genes 0.000 description 1
- 101150021974 Adh1 gene Proteins 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 208000005748 Aggressive Fibromatosis Diseases 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- 239000012099 Alexa Fluor family Substances 0.000 description 1
- 102100022712 Alpha-1-antitrypsin Human genes 0.000 description 1
- 108010068307 Alpha-Globulins Proteins 0.000 description 1
- 102000002572 Alpha-Globulins Human genes 0.000 description 1
- 241000143060 Americamysis bahia Species 0.000 description 1
- 241000224489 Amoeba Species 0.000 description 1
- 244000144725 Amygdalus communis Species 0.000 description 1
- 102000009091 Amyloidogenic Proteins Human genes 0.000 description 1
- 108010048112 Amyloidogenic Proteins Proteins 0.000 description 1
- 244000226021 Anacardium occidentale Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 206010003594 Ataxia telangiectasia Diseases 0.000 description 1
- 235000002147 Australian walnut Nutrition 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 241000458359 Brevibacillus sp. Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 241000589562 Brucella Species 0.000 description 1
- 241000508772 Brucella sp. Species 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 229920000049 Carbon (fiber) Polymers 0.000 description 1
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- 241000722731 Carex Species 0.000 description 1
- 235000009467 Carica papaya Nutrition 0.000 description 1
- 240000006432 Carica papaya Species 0.000 description 1
- 102100024853 Carnitine O-palmitoyltransferase 2, mitochondrial Human genes 0.000 description 1
- 108700005858 Carnitine palmitoyl transferase 2 deficiency Proteins 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241000701459 Caulimovirus Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091006146 Channels Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 240000007154 Coffea arabica Species 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 208000017454 Cowden syndrome 3 Diseases 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 102100023381 Cyanocobalamin reductase / alkylcobalamin dealkylase Human genes 0.000 description 1
- 101710164985 Cyanocobalamin reductase / alkylcobalamin dealkylase Proteins 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- CKTSBUTUHBMZGZ-UHFFFAOYSA-N Deoxycytidine Natural products O=C1N=C(N)C=CN1C1OC(CO)C(O)C1 CKTSBUTUHBMZGZ-UHFFFAOYSA-N 0.000 description 1
- 229920000045 Dermatan sulfate Polymers 0.000 description 1
- 206010059352 Desmoid tumour Diseases 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 1
- 240000006497 Dianthus caryophyllus Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 102100039246 Elongator complex protein 1 Human genes 0.000 description 1
- 101710167754 Elongator complex protein 1 Proteins 0.000 description 1
- 241000194032 Enterococcus faecalis Species 0.000 description 1
- 241001495410 Enterococcus sp. Species 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 241000488157 Escherichia sp. Species 0.000 description 1
- 240000002395 Euphorbia pulcherrima Species 0.000 description 1
- 206010016207 Familial Mediterranean fever Diseases 0.000 description 1
- 208000001730 Familial dysautonomia Diseases 0.000 description 1
- 108010067741 Fanconi Anemia Complementation Group N protein Proteins 0.000 description 1
- 208000024412 Friedreich ataxia Diseases 0.000 description 1
- 241000702463 Geminiviridae Species 0.000 description 1
- 208000031448 Genomic Instability Diseases 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- 102100036264 Glucose-6-phosphatase catalytic subunit 1 Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 101150013707 HBB gene Proteins 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 1
- 102100027685 Hemoglobin subunit alpha Human genes 0.000 description 1
- 108091005902 Hemoglobin subunit alpha Proteins 0.000 description 1
- 108091005886 Hemoglobin subunit gamma Proteins 0.000 description 1
- 102100038617 Hemoglobin subunit gamma-2 Human genes 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000043851 Histone deacetylase domains Human genes 0.000 description 1
- 108700038236 Histone deacetylase domains Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000678466 Homo sapiens 40S ribosomal protein S27 Proteins 0.000 description 1
- 101000760987 Homo sapiens 5'-AMP-activated protein kinase subunit gamma-2 Proteins 0.000 description 1
- 101000928720 Homo sapiens 7-dehydrocholesterol reductase Proteins 0.000 description 1
- 101000775498 Homo sapiens Adenylate cyclase type 10 Proteins 0.000 description 1
- 101000823116 Homo sapiens Alpha-1-antitrypsin Proteins 0.000 description 1
- 101000930910 Homo sapiens Glucose-6-phosphatase catalytic subunit 1 Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000843809 Homo sapiens Hydroxycarboxylic acid receptor 2 Proteins 0.000 description 1
- 101000760730 Homo sapiens Medium-chain specific acyl-CoA dehydrogenase, mitochondrial Proteins 0.000 description 1
- 101001057159 Homo sapiens Melanoma-associated antigen C3 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000629029 Homo sapiens Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Proteins 0.000 description 1
- 101001111984 Homo sapiens N-acylneuraminate-9-phosphatase Proteins 0.000 description 1
- 101000651201 Homo sapiens N-sulphoglucosamine sulphohydrolase Proteins 0.000 description 1
- 101001133640 Homo sapiens Phosphofurin acidic cluster sorting protein 1 Proteins 0.000 description 1
- 101000600434 Homo sapiens Putative uncharacterized protein encoded by MIR7-3HG Proteins 0.000 description 1
- 101001062093 Homo sapiens RNA-binding protein 15 Proteins 0.000 description 1
- 101000631899 Homo sapiens Ribosome maturation protein SBDS Proteins 0.000 description 1
- 101000629622 Homo sapiens Serine-pyruvate aminotransferase Proteins 0.000 description 1
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 1
- 101001074035 Homo sapiens Zinc finger protein GLI2 Proteins 0.000 description 1
- 241001135569 Human adenovirus 5 Species 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 244000267823 Hydrangea macrophylla Species 0.000 description 1
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 206010022971 Iron Deficiencies Diseases 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- 241000588754 Klebsiella sp. Species 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- 241000186610 Lactobacillus sp. Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 101710128836 Large T antigen Proteins 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- 241000209510 Liliopsida Species 0.000 description 1
- 239000012097 Lipofectamine 2000 Substances 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 208000015439 Lysosomal storage disease Diseases 0.000 description 1
- 239000007993 MOPS buffer Substances 0.000 description 1
- 235000014826 Mangifera indica Nutrition 0.000 description 1
- 240000007228 Mangifera indica Species 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 101710132031 Mantle protein Proteins 0.000 description 1
- 208000001826 Marfan syndrome Diseases 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 108700000232 Medium chain acyl CoA dehydrogenase deficiency Proteins 0.000 description 1
- 206010072654 Medium-chain acyl-coenzyme A dehydrogenase deficiency Diseases 0.000 description 1
- 102100024590 Medium-chain specific acyl-CoA dehydrogenase, mitochondrial Human genes 0.000 description 1
- 101100409013 Mesembryanthemum crystallinum PPD gene Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 208000028781 Mucopolysaccharidosis type 1 Diseases 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 241000202944 Mycoplasma sp. Species 0.000 description 1
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 1
- 241000118696 Myroides sp. Species 0.000 description 1
- 102100023906 N-acylneuraminate-9-phosphatase Human genes 0.000 description 1
- 102100027661 N-sulphoglucosamine sulphohydrolase Human genes 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241000234479 Narcissus Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 241000207746 Nicotiana benthamiana Species 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101150108119 PDS gene Proteins 0.000 description 1
- 108010011536 PTEN Phosphohydrolase Proteins 0.000 description 1
- 102000014160 PTEN Phosphohydrolase Human genes 0.000 description 1
- 102000005327 Palmitoyl protein thioesterase Human genes 0.000 description 1
- 108020002591 Palmitoyl protein thioesterase Proteins 0.000 description 1
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 description 1
- 102000005891 Pancreatic ribonuclease Human genes 0.000 description 1
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 1
- 102100040884 Partner and localizer of BRCA2 Human genes 0.000 description 1
- 244000025272 Persea americana Species 0.000 description 1
- 235000008673 Persea americana Nutrition 0.000 description 1
- 240000007377 Petunia x hybrida Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 102100034078 Phosphofurin acidic cluster sorting protein 1 Human genes 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 102100037401 Putative uncharacterized protein encoded by MIR7-3HG Human genes 0.000 description 1
- 101150111251 RGN gene Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102100029244 RNA-binding protein 15 Human genes 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 241000245165 Rhododendron ponticum Species 0.000 description 1
- 102100028750 Ribosome maturation protein SBDS Human genes 0.000 description 1
- 201000001638 Riley-Day syndrome Diseases 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241001452558 SARS bat coronavirus Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100170553 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DLD2 gene Proteins 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000607149 Salmonella sp. Species 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102100026842 Serine-pyruvate aminotransferase Human genes 0.000 description 1
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000607758 Shigella sp. Species 0.000 description 1
- 201000004283 Shwachman-Diamond syndrome Diseases 0.000 description 1
- 108010016797 Sickle Hemoglobin Proteins 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 201000007410 Smith-Lemli-Opitz syndrome Diseases 0.000 description 1
- 235000019764 Soybean Meal Nutrition 0.000 description 1
- 241000685602 Sphingobacterium sp. Species 0.000 description 1
- 241000736131 Sphingomonas Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 241001147693 Staphylococcus sp. Species 0.000 description 1
- 244000057717 Streptococcus lactis Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187180 Streptomyces sp. Species 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical compound OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 238000010459 TALEN Methods 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- 244000269722 Thea sinensis Species 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 108010039203 Tripeptidyl-Peptidase 1 Proteins 0.000 description 1
- 102100034197 Tripeptidyl-peptidase 1 Human genes 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 241000607598 Vibrio Species 0.000 description 1
- 241000607284 Vibrio sp. Species 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 208000027276 Von Willebrand disease Diseases 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000131891 Yersinia sp. Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 208000005065 achondrogenesis Diseases 0.000 description 1
- 208000008919 achondroplasia Diseases 0.000 description 1
- 210000005221 acidic domain Anatomy 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000001154 acute effect Effects 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 208000006682 alpha 1-Antitrypsin Deficiency Diseases 0.000 description 1
- 201000006288 alpha thalassemia Diseases 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- 230000006229 amino acid addition Effects 0.000 description 1
- 101150073130 ampR gene Proteins 0.000 description 1
- 230000003942 amyloidogenic effect Effects 0.000 description 1
- 208000007502 anemia Diseases 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 230000006217 arginine-methylation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 208000025341 autosomal recessive disease Diseases 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 201000000053 blastoma Diseases 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000007975 buffered saline Substances 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 239000004917 carbon fiber Substances 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000030833 cell death Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000002655 chelation therapy Methods 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 230000001684 chronic effect Effects 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 235000016213 coffee Nutrition 0.000 description 1
- 235000013353 coffee beverage Nutrition 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000013329 compounding Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- AVJBPWGFOQAPRH-FWMKGIEWSA-L dermatan sulfate Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@H](OS([O-])(=O)=O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](C([O-])=O)O1 AVJBPWGFOQAPRH-FWMKGIEWSA-L 0.000 description 1
- 229940051593 dermatan sulfate Drugs 0.000 description 1
- 201000006827 desmoid tumor Diseases 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 1
- 208000016097 disease of metabolism Diseases 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 201000008184 embryoma Diseases 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 229940032049 enterococcus faecalis Drugs 0.000 description 1
- 230000007608 epigenetic mechanism Effects 0.000 description 1
- 210000000267 erythroid cell Anatomy 0.000 description 1
- 229940011871 estrogen Drugs 0.000 description 1
- 239000000262 estrogen Substances 0.000 description 1
- 241001233957 eudicotyledons Species 0.000 description 1
- 238000000695 excitation spectrum Methods 0.000 description 1
- 230000005281 excited state Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 150000004665 fatty acids Chemical class 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 125000003055 glycidyl group Chemical group C(C1CO1)* 0.000 description 1
- 208000011460 glycogen storage disease due to glucose-6-phosphatase deficiency type IA Diseases 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 150000003278 haem Chemical group 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000035876 healing Effects 0.000 description 1
- 208000034737 hemoglobinopathy Diseases 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 208000012681 hereditary desmoid disease Diseases 0.000 description 1
- 102000052096 human BCL11A Human genes 0.000 description 1
- 210000005119 human aortic smooth muscle cell Anatomy 0.000 description 1
- 238000011577 humanized mouse model Methods 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000014726 immortalization of host cell Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 210000001985 kidney epithelial cell Anatomy 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 208000004731 long QT syndrome Diseases 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 208000005548 medium chain acyl-CoA dehydrogenase deficiency Diseases 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- MGJXBDMLVWIYOQ-UHFFFAOYSA-N methylazanide Chemical compound [NH-]C MGJXBDMLVWIYOQ-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 210000000944 nerve tissue Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 201000007642 neuronal ceroid lipofuscinosis 1 Diseases 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000000414 obstructive effect Effects 0.000 description 1
- 230000004792 oxidative damage Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000013610 patient sample Substances 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 239000002953 phosphate buffered saline Substances 0.000 description 1
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 101150063097 ppdK gene Proteins 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000000159 protein binding assay Methods 0.000 description 1
- 235000004252 protein component Nutrition 0.000 description 1
- 238000010379 pull-down assay Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 239000013074 reference sample Substances 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 230000008263 repair mechanism Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000004366 reverse phase liquid chromatography Methods 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 102220010922 rs397507457 Human genes 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 238000012868 site-directed mutagenesis technique Methods 0.000 description 1
- 238000001542 size-exclusion chromatography Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 239000004455 soybean meal Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 210000000278 spinal cord Anatomy 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 235000013616 tea Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 230000008646 thermal stress Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 201000007905 transthyretin amyloidosis Diseases 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 238000001419 two-dimensional polyacrylamide gel electrophoresis Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000003501 vero cell Anatomy 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 208000012137 von Willebrand disease (hereditary or acquired) Diseases 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 230000036266 weeks of gestation Effects 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/6818—Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
提供了一種用於結合至所關注的靶向序列的組成物及方法。該組成物可用於割裂或修飾所關注的靶向序列、所關注的靶向序列的視覺化、以及修飾所關注的序列的表現。組成物包括RNA導引的核酸酶多肽、CRISPR RNA、反式活化的CRISPR RNA、導引RNA以及編碼此物的核酸分子。還提供了包括該核酸分子的載體和宿主細胞。進一步提供了用於結合所關注的靶向序列的CRISPR系統,其中CRISPR系統包括RNA導引的核酸酶多肽以及一個或複數導引RNA。還提供了用於偵測靶向DNA序列的方法和套組。
Description
本發明係關於分子生物學及基因編輯領域。
靶向基因體編輯或修飾正迅速成為基礎及應用研究的重要工具。最初的方法涉及諸如大範圍核酸酶(meganuclease)、鋅指融合蛋白或TALEN之類的工程核酸酶,需要生成具有特定於每一種特殊靶向序列的工程化、可程式化、序列特定的DNA結合域的嵌合核酸酶。RNA導引的核酸酶(諸如成簇規律間隔的短迴文重複(Clustered Regularly Interspaced Short Palindromic Repeats)(CRISPR)相關聯(Cas)細菌系統的CRISPR-Cas蛋白)藉由將核酸酶與導引RNA(導引RNA與特殊靶向序列特定地雜交)複合而允許特定序列的靶向(targeting)。相較於為每個靶向序列生成嵌合核酸酶,製造靶向特定的導引RNA的成本更低且更有效。這種RNA導引的核酸酶可視情況選擇地用於通過序列特定的、雙股斷裂(其經由易錯的非同源末端連接(NHEJ)被修復)的引入來編輯基因體,以在特定的基因體位置引入突變。替換地,可以經由同源定向修復(homology-directed repair)將異源DNA引入基因體位點。
提供了用於結合所關注的靶向序列的組成物及方法。該組成物可用於剪切割裂或修飾所關注的靶向序列、偵測所關注的靶向序列、以及修飾所關注的序列的表現。組成物包括RNA導引的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、反式活化的CRISPR RNA(tracrRNA)、導引RNA(gRNA)、編碼此物的核酸分子、以及包括核酸分子的載體及宿主細胞。還提供了用於結合所關注的靶向序列的CRISPR系統,其中CRISPR系統包括RNA導引的核酸酶多肽以及一個或複數導引RNA。因此,本文揭露的方法用於結合所關注的靶向序列,並且在一些實施方式中,用於剪切割裂或修飾所關注的靶向序列。所關注的靶向序列可舉例而言由於與引入的供體序列的非同源末端連接或同源定向修復而被修飾。進一步提供了使用偵測器單股DNA用於偵測DNA分子的靶向DNA序列的方法和套組。
受益於前述描述及相關聯圖式中呈現的教導,本發明所屬領域中具有通常知識者將想到本文中闡述的本發明的許多修改及其他實施方式。因此,應該明白,本發明不限於所揭露的特定實施方式,且修改以及其他實施方式旨在包含於所附實施方式的範圍內。儘管本文採用了特定的術語,但這些術語僅以一般性及描述性意義使用,而非出於限制性目的。I .概述
RNA導引的核酸酶(RGN)允許在基因體內的單一位點的靶向的操縱,並且在基因靶向的背景下用於治療及研究應用為有用的。在各種生物體(包含哺乳動物)中,舉例而言,藉由刺激非同源末端連接和同源重組,RNA導引的核酸酶已被使用於基因體工程。本文所述的組成物及方法有用於在多核苷酸中造成單股或雙股的斷裂、修飾多核苷酸、偵測多核苷酸內的特殊位點、或修飾特殊基因的表現。
本文揭露的RNA導引的核酸酶可藉由修飾靶向序列來改變基因表現。在特定實施方式中,RNA導引的核酸酶是藉由導引RNA(gRNA)作為成簇規律間隔的短迴文重複(CRISPR)RNA導引的核酸酶系統的部分而被定向至靶向序列。RGN被理解為「RNA導引」是因爲導引RNA與RNA導引的核酸酶形成複合物,以將RNA導引的核酸酶導向與靶向序列結合,並且在一些實施方式中,在靶向序列處引入單股或雙股的斷裂。在靶向序列已被割裂後,斷裂可以被修復,使得靶向序列的DNA序列在修復過程期間被修飾。因此,本文提供了用於使用RNA導引的核酸酶來修飾宿主細胞的DNA中的靶向序列的方法。舉例而言,RNA導引的核酸酶可被使用於修飾真核細胞或原核細胞的基因體的基因座位(locus)的靶向序列。II. RNA 導引的核酸酶
本文提供了RNA導引的核酸酶。術語「RNA導引的核酸酶(RGN)」是指以序列特定方式結合至特殊靶向核苷酸序列,並且藉由與多肽複合並與靶向序列雜交的導引RNA分子而被導向該靶向核苷酸序列的多肽。儘管RNA導引的核酸酶能夠在結合時割裂靶向序列,但術語「RNA導引的核酸酶」還涵蓋能夠結合至靶向序列但不割裂靶向序列的失效核酸酶的RNA導引的核酸酶。藉由RNA導引的核酸酶割裂靶向序列可導致單股或雙股斷裂。僅能割裂雙股核酸分子的單股的RNA導引的核酸酶在本文中稱為切口酶(nickase)。
本文揭露的RNA導引的核酸酶包含APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748以及APG07433.1 RNA導引的核酸酶(這些核酸酶的胺基酸序列為分別列為如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235)、以及保持了以RNA導引的序列特定的方式結合至靶向核苷酸序列的能力的活性片段或其變體。在這些實施方式中的一些實施方式中,APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748、或APG07433.1 RGN的活性片段或變體能夠剪切割裂單股或雙股靶向序列。在一些實施方式中,APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748、或APG07433.1 RGN的活性變體包括具有與列為如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的胺基酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列一致性的胺基酸序列。在某些實施方式中, APG05733.1、 APG06207.1、 APG01647.1、 APG08032.1、 APG05712.1、 APG01658.1、 APG06498.1、 APG09106.1、 APG09882.1、 APG02675.1、 APG01405.1、 APG06250.1、 APG06877.1、 APG09053.1、 APG04293.1、 APG01308.1、 APG06646.1、 APG09748、 or APG07433.1 RGN 的活性片段包括列為如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137、or 235的胺基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050個或更多個鄰接的胺基酸殘基。本文提供的RNA導引的核酸酶可以包括至少一個核酸酶域(例如,脫氧核糖核酸酶(DNase)域、核醣核酸酶(DNase)域)以及至少一個RNA 辨識域及/或RNA 結合域,以與導引RNA相互作用。可在本文提供的RNA導引的核酸酶中發現的另外域包含但不限於:DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域以及二聚化域。在特定實施方式中,本文提供的RNA導引的核酸酶可包括對於DNA結合域、解旋酶域、蛋白質-蛋白質相互作用域以及二聚化域中的一個或複數至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。
靶向核苷酸序列由本文提供的RNA導引的核酸酶結合,並與關聯於RNA導引的核酸酶的導引RNA雜交。如果多肽擁有核酸酶活性,則可以由RNA導引的核酸酶隨後割裂靶向序列。術語「割裂(cleave)」或「割裂(cleavage)」是指靶向核苷酸序列的主鏈內的至少一個磷酸二酯鍵的水解,其可導致靶向序列內的單股或雙股斷裂。本發明揭露的RGN可以割裂在多核苷酸內的核苷酸、起核酸內切酶的作用;或者可以是核酸外切酶、從多核苷酸端(5'及/或3'端)移除連續的核苷酸。在其他實施方式中,所揭露的RGN可在多核苷酸的任何位置內割裂靶向序列的核苷酸、且因此起核酸內切酶和核酸外切酶兩者的作用。藉由本發明揭露的RGN割裂靶向多核苷酸可導致交錯的斷裂或鈍末端。
本發明揭露的RNA導引的核酸酶可以是從細菌物種或古生菌物種衍生的野生型序列。作為另一種選擇,RNA導引的核酸酶可以是野生型多肽的變體或片段。舉例而言,可以修飾野生型RGN以改變核酸酶活性或改變PAM特定。在一些實施方式中,RNA導引的核酸酶不是天然存在的。
在某些實施方式中,RNA導引的核酸酶起切口酶的作用,僅割裂靶向核苷酸序列的單股。這種RNA導引的核酸酶具有單一作用的核酸酶域。在這些實施方式的一些實施方式中,額外的核酸酶域已經突變,使得核酸酶活性降低或消除。
在其他實施方式中,RNA導引的核酸酶完全缺少核酸酶活性或體現降低的核酸酶活性、並且在本文中被稱為無核酸酶反應或無核酸酶活性。本領域中用於將突變引入胺基酸序列的任何已知方法(諸如PCR媒介的誘變以及定點誘變)可用於產生無切口酶或無核酸酶反應的RGN。例如參見第2014/0068797號美國公開以及第9,790,490號美國專利;這些美國公開和美國專利中的每一者的全部內容藉由引用而被併入本文。
缺少核酸酶活性的RNA導引的核酸酶可用於將融合的多肽、多核苷酸或小分子有效負載遞送至特殊基因體部位。在這些實施方式的一些實施方式中,RGN多肽或導引RNA可與可偵測標記融合,以允許特殊序列的偵測。作為非限制性範例,無核酸酶反應的RGN可與可偵測標記(例如,螢光蛋白)融合並且靶向與疾病關聯的特殊序列,以允許疾病關聯序列的偵測。
作為另一種選擇,無核酸酶反應的RGN可以靶向特殊的基因體位置,以改變期望序列的表現。在一些實施方式中,無核酸酶反應的RNA導引的核酸酶與靶向序列的結合藉由干擾所靶向的基因體區域內的轉錄因子或RNA聚合酶的結合而導致靶向序列的表現的抑制或受靶向序列的轉錄控制下的基因的表現的抑制。在其他實施方式中,RGN(例如,無核酸酶反應的RGN)或其複合的導引RNA進一步包括表現調節子,其在與靶向序列結合時充當抑制或活化靶向序列的表現或受靶向序列的轉錄控制下的基因的表現。在這些實施方式的一些中,表現調節子通過表觀遺傳機制調節靶向序列或被調整基因的表現。
在其他實施方式中,無核酸酶反應的RGN或僅具有切口酶活性的RGN可以靶向特殊基因體部位,以通過與鹼基編輯多肽(舉例而言,去胺酶多肽)或其活性變體或片段的融合(這使核苷酸鹼基脫去胺基)來修飾靶向多核苷酸的序列,導致從一種核苷酸鹼基轉變為另一種核苷酸鹼基。鹼基編輯多肽可在其N末端或C末端與RGN融合。另外,鹼基編輯多肽可以經由胜肽鏈接子而與RGN融合。有用於此類組成物以及方法的去胺酶多肽的非限制性範例包含胞苷去胺酶或腺苷去胺酶(諸如,Gaudlli等人(2017)Nature
551:464-471、第2017/0121693號和第2018/0073012號美國專利公開、以及第WO/2018/027078號國際專利公開中描述的腺苷去胺酶鹼基編輯器,或者第PCT/US2019/068079號國際專利申請中揭露的去胺酶中的任一者,這些專利的每一者的全部內容藉由引用而被併入本文)。此外,本領域中已知在RGN與鹼基編輯酵素之間的某些融合蛋白也可包括至少一個尿嘧啶穩定多肽,其藉由去胺酶提高胞苷、脫氧胞苷或胞嘧啶對於核酸分子中的胸苷、脫氧胸苷或胸腺嘧啶的突變率。尿嘧啶穩定多肽的非限制性範例包含在2020年7月15日提交申請的第63/052,175號美國臨時專利申請中揭露的尿嘧啶穩定多肽和尿嘧啶糖基化酶抑制劑(UGI)域(SEQ ID NO:261),尿嘧啶糖基化酶抑制劑(UGI)域可提高鹼基編輯效率(第10,167,547號美國專利,其藉由引用併入本文)。因此,融合蛋白可包括本文描述的RGN或其變體、去胺酶以及視情況而定的至少一個尿嘧啶穩定多肽,諸如,UGI。
與多肽或域融合的RNA導引的核酸酶可藉由鏈接子而被分開或連接。如本文所使用的,術語「鏈接子」是指鏈接兩個分子或部分(例如核酸酶的結合域和割裂域)的化學基團或分子。在一些實施方式中,鏈接子連接RNA導引的核酸酶的gRNA結合域與諸如去胺酶的鹼基編輯多肽。在一些實施方式中,鏈接子連接無核酸酶反應的RGN與去胺酶。通常情況下,鏈接子位於兩個基團、分子或其他部分之間或兩邊,並經由共價鍵而被連接到每一者,因此連接該兩者。在一些實施方式中,鏈接子是胺基酸或複數胺基酸(例如胜肽或蛋白質)。在一些實施方式中,鏈接子是有機分子、基團、聚合物或化學部分。在一些實施方式中,鏈接子的長度是5-100個胺基酸,舉例而言,長度是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150、或150-200個胺基酸。更長或更短的鏈接子也被設想。
本發明揭露的RNA導引的核酸酶可包括至少一個核定位訊號(NLS),以增強RGN向細胞核的運輸。核定位訊號是本領域中已知的且一般而言包括一段鹼性胺基酸(參見,例如,Lange等人,J. Biol. Chem .
(2007
)282:5101-5105)。在特殊實施方式中,RGN包括2、3、4、5、6或多核定位訊號。(數個)核定位訊號可以是異源NLS。有用於本發明揭露的RGN的核定位訊號的非限制性範例是SV40大T抗原、核質素(nucleopasmin)以及c-Myc的核定位訊號(參見,例如,Ray等人(2015)Bioconjug Chem
26(6):1004-7)。在特殊實施方式中,RGN包括如SEQ ID NO:125或127所列的NLS序列。RGN可在其N-端、C-端、或N-端及C-端兩者處都包括一個或複數NLS序列。舉例而言,RGN可在N端區域包括兩個NLS序列,而在C端區域包括四個NLS序列。
本領域中已知的將多肽定位於特殊亞細胞位置的其他定位訊號序列也可用於靶向RGN,包含但不限於質體定位序列、粒線體定位序列、以及既靶向質體又靶向粒線體的雙靶向訊號序列(參見,例如,Nassoury和Morse (2005)Biochim Biophys Acta
1743:5-19;Kunze和Berger (2015)Front Physiol
dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert (2003)IUBMB Life
55:219-225;Soll (2002)Curr Opin Plant Biol
5:529-535;Carrie和Small (2013)Biochim Biophys Acta
1833:253-259;Carrie等人(2009)FEBS J
276:1187-1195;Silva-Filho (2003)Curr Opin Plant Biol
6:589-595;Peeters和Small (2001)Biochim Biophys Acta
1541:54-63;Murcha等人(2014)J Exp Bot
65:6301-6335;Mackenzie (2005)Trends Cell Biol
15:548-554;Glase等人(1998)Plant Mol Biol
38:311-338)。
在某些實施方式中,本發明揭露的RNA導引的核酸酶包括促進RGN的細胞攝取的至少一個細胞穿透域。細胞穿透域是本領域中已知的並且一般包括數段帶正電荷的胺基酸殘基(即,聚陽離子細胞穿透域)、交替極性的胺基酸殘基以及非極性胺基酸殘基(即,兩親性細胞穿透域)、或疏水性胺基酸殘基(即,疏水性細胞穿透域)(參見,例如,Milletti F.(2012)Drug Discov Today
17:850-860)。細胞穿透域的非限制性範例是來自人免疫缺陷病毒1的反式活化轉錄活化子(TAT)。
核定位訊號、質體定位訊號、粒線體定位訊號、雙靶向定位訊號及/或細胞穿透域可安置於胺基端(N-端)、羧基端(C-端)、或在RNA導引的核酸酶的內部位置處。
本發明揭露的RGN可經由鏈接子胜肽而直接或間接地與諸如割裂域、去胺酶域或表現調節域的效應子域(effector domain)融合。這種域可安置於RNA導引的核酸酶的N端、C端或內部位置處。在這些實施方式中的一些中,融合蛋白的RGN成分是無核酸酶反應的RGN。
在一些實施方式中,RGN融合蛋白包括割裂域,割裂域是能夠割裂多核苷酸(即,RNA、DNA或RNA/DNA雜交體)的任何域,並且包含但不限於限制性核酸內切酶和歸巢核酸內切酶(homing endonuclease),諸如IIS型核酸內切酶(例如,Fok
I)(參見,例如,Belfort等人(1997)Nucleic Acids Res.
25:3379-3388;Linn等人(eds.)Nucleases, Cold Spring Harbor Laboratory Press,1993)。
在其他實施方式中,RGN融合蛋白包括去胺酶域,去胺酶域將核苷酸鹼基脫去胺基,導致從一種核苷酸鹼基轉化為另一種,並且包含但不限於胞苷去胺酶或腺苷去胺酶鹼基編輯器, (參見,例如,Gaudelli等人(2017)Nature
551:464-471、第2017/0121693號和第2018/0073012號美國專利公開、第9,840,699號美國專利以及第WO/2018/027078號國際公開)。
在一些實施方式中,RGN融合蛋白的效應子域可以是表現調節域,表現調節域是用來協助向上調整或向下調整轉錄的域。表現調節域可以是表觀遺傳修飾域、轉錄抑制子域或轉錄活化域。
在這些實施方式的一些中,RGN融合蛋白的表現調節子包括表觀遺傳修飾域,表觀遺傳修飾域共價修飾DNA或組蛋白(histone protein)以改變組蛋白(histone)結構及/或染色體結構,而不改變DNA序列,導致基因表現中的變化(即,向上調整或向下調整)。表觀遺傳修飾的非限制性範例包含離胺酸殘基的乙醯化或甲基化、精胺酸甲基化、絲胺酸及蘇胺酸磷酸化、以及組蛋白的離胺酸泛素化(ubiquitination)及類小泛素化(sumoylation)、和DNA中胞嘧啶殘基的甲基化和羥甲基化。表觀遺傳修飾域的非限制性範例包含組蛋白乙醯基轉移酶域、組蛋白去乙醯基酶域、組蛋白甲基轉移酶域、組蛋白去甲基酶域、DNA甲基轉移酶域以及DNA去甲基酶域。
在其他實施方式中,融合蛋白的表現調節子包括轉錄抑制子域,其與諸如RNA聚合酶和轉錄因子的轉錄控制元素及/或轉錄調整蛋白相互作用,以減少或終止至少一個基因的轉錄。轉錄抑制子域是本領域中已知的且包含但不限於類Sp1抑制子、IκB以及Krüppel關聯盒(KRAB)域。
在再一其他實施方式中,融合蛋白的表現調節子包括轉錄活化域,轉錄活化域與諸如RNA聚合酶和轉錄因子的轉錄控制元素及/或轉錄調整蛋白相互作用,以增加或活化至少一個基因的轉錄。轉錄活化域是本領域中已知的且包含但不限於單純皰疹病毒VP16活化域和NFAT活化域。
本發明揭露的RGN多肽可包括可偵測標記或純化標記(purification tag)。可偵測標記或純化標記可直接地或間接地經由鏈接子胜肽被安置在RNA導引的核酸酶的N-端、C-端或內部位置處。在這些實施方式的一些中,融合蛋白的RGN成分是無核酸酶反應的RGN。在其他實施方式中,融合蛋白的RGN成分是具有切口酶活性的RGN。
可偵測標記是可目視的或可以其他方式觀察的分子。可偵測標記可作為融合蛋白(例如,螢光蛋白)而與RGN融合、也可以是綴合至RGN多肽的、可目視或藉由其他手段偵測的小分子。可作為融合蛋白與本發明揭露的RGN融合的可偵測標記包含任何可偵測蛋白域,其包含但不限於可用特定抗體偵測的螢光蛋白或蛋白域。螢光蛋白的非限制性範例包含綠色螢光蛋白(例如,GFP、EGFP、ZsGreen1)和黃色螢光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可偵測標記的非限制性範例包含放射性標記,例如3
H以及35
S。
RGN多肽還可包括純化標記,純化標記是可用於從混合物(例如,生物樣本、培養基)中分離蛋白質或融合蛋白的任何分子。純化標記的非限制性範例包含生物素、myc、麥芽糖結合蛋白(MBP)以及麩胺基硫-S-轉移酶(GST)。II. 導引 RNA
本揭露內容提供導引RNA和編碼該導引RNA的多核苷酸。術語「導引RNA」是指與靶向核苷酸序列具有與靶向序列雜交的足夠互補性、並將關聯RNA導引的核酸酶導向至與靶向核苷酸序列的直接序列特定的結合的核苷酸序列。因此,RGN的分別的導引RNA是可與RGN結合並導引RGN來與特殊靶向核苷酸序列結合的一個或複數RNA分子(一般為,一個或兩個),並且在其中RGN具有切口酶或核酸酶活性的那些例子中,還割裂靶向核苷酸序列。一般來說,導引RNA包括CRISPR RNA(crRNA)且在一些實施方式中還包括反式活化CRISPR RNA(tracrRNA)。包括crRNA與tracrRNA兩者的原生導引RNA一般包括兩個分開的RNA分子,這兩個分開的RNA分子通過crRNA的重複序列和tracrRNA的抗重複序列彼此雜交。
CRISPR陣列內的原生直接重複序列的長度一般在28至37個鹼基對的範圍內,而長度可在約23 bp至約55 bp之間變化。CRISPR陣列內的間隔體序列的長度一般在約32至約38bp的範圍內,而長度可以在約21 bp至約72 bp之間。每一個CRISPR陣列一般包括少於50個單位的CRISPR重複間隔體序列。CRISPR被轉錄為稱為初級CRISPR轉錄本的長轉錄本的部分,其包含許多CRISPR陣列。初級CRISPR轉錄本被Cas蛋白割裂,以生成crRNA,或者在一些情況下,以生成前驅crRNA(pre-crRNA),前驅crRNA被額外的Cas蛋白進一步處理為成熟的crRNA。成熟的crRNA包括間隔體序列和CRISPR重複序列。在將前驅crRNA處理為成熟(或經處理)的crRNA的其中一些實施方式中,成熟涉及移除約1至約6個或更多個5'、3'或5'及3'核苷酸。出於基因體編輯或靶向所關注的特定靶向核苷酸序列的目的,在前驅crRNA分子成熟期間移除的這些核苷酸對於生成或設計導引RNA不是必需的。
CRISPR RNA(crRNA)包括間隔體序列和CRISPR重複序列。「間隔體序列」是與所關注的靶向核苷酸序列直接雜交的核苷酸序列。間隔體序列被工程化為與所關注的靶向序列完全或部分互補。在各種實施方式中,間隔體序列可包括從約8個核苷酸至約30個核苷酸或更多個核苷酸。舉例而言,間隔體序列的長度可以為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在一些實施方式中,間隔體序列的長度為約10至約26個核苷酸,或長度為約12至約30個核苷酸。在特定實施方式中,間隔體序列的長度是約30個核苷酸。在一些實施方式中,當使用適合的比對演算法進行最佳對齊時,間隔體序列與其對應的靶向序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更大。在特定實施方式中,間隔體序列不含使用本領域中已知的任何適合的多核苷酸折疊演算法可預測的次級結構,多核苷酸折疊演算法包含但不限於mFold(參見,例如,Zuker和Stiegler(1981)Nucleic Acids Res
. 9:133-148)和RNAfold(參見,例如,Gruber等人(2008)Cell
106(1):23-24)。
CRISPR RNA重複序列包括核苷酸序列,該核苷酸序列包括具有與tracrRNA雜交的足夠互補性的區域。在各種實施方式中,CRISPR RNA重複序列可包括從約8個核苷酸至約30個核苷酸或更多核苷酸。舉例而言,CRISPR重複序列的長度可以為約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在一些實施方式中,CRISPR重複序列的長度為約21個核苷酸。在一些實施方式中,當使用適合的對齊演算法進行最佳對齊時,CRISPR重複序列與其對應的tracrRNA序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更多。在特定實施方式中,CRISPR重複序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性變體或片段,當該核苷酸序列或其活性變體或片段被包括在導引RNA內時,該核苷酸序列或其活性變體或片段能夠導向本文提供的關聯的RNA導引的核酸酶至所關注的靶向序列的序列特定結合。在某些實施方式中,野生型序列的活性CRISPR重複序列變體包括具有與如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列一致性的核苷酸序列。在某些實施方式中,野生型序列的活性CRISPR重複序列片段包括如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20個連續核苷酸。
在某些實施方式中,crRNA不是天然存在的。在這些實施方式的一些中,特定CRISPR重複序列不天然地與工程化間隔體序列鏈接,並且CRISPR重複序列被認為與間隔體序列是異源的。在某些實施方式中,間隔體序列是非天然存在的工程化序列。
反式活化的CRISPR RNA或tracrRNA分子包括核苷酸序列,該核苷酸序列包括具有與crRNA的CRISPR重複序列雜交的足夠互補性的區域,其在本文中稱為抗重複區域。在一些實施方式中,tracrRNA分子更包括具有次級結構(例如,莖-環)的區域、或在與其對應的crRNA雜交時形成次級結構。在特殊實施方式中, 完全或部分互補於CRISPR重複序列的tracrRNA的區域是在分子的5'端,並且tracrRNA的3'端包括次級結構。此次級結構的區域一般包括與抗重複序列相鄰、包含融合膜(nexus)髮夾的幾個髮夾結構。融合膜髮夾常常在髮夾莖的基部具有保留的核苷酸序列,在tracrRNA中的很多融合膜髮夾中發現了模體UNANNA、CNANNG、CNANNU, UNANNG、UNANNC、或CNANNU(分別為SEQ ID NO:8、37、45、53、68以及102)。在tracrRNA的3'端處常常存在末端髮夾,其結構以和數量可變,但常常包括富含GC的Rho非相依性轉錄終止子髮夾,其後在3'端具有一串U'。參見,舉例而言,Briner等人(2014)Molecular Cell
56:333-339、Briner和Barrangou(2016)Cold Spring Harb Protoc
; doi:10.1101/pdb.top090902以及第2017/0275648號美國專利公開,每一個的全部內容藉由引用併入本文。
在各種實施方式中,與CRISPR重複序列完全或部分互補的tracrRNA的抗重複區域包括約8個核苷酸至約30個核苷酸或更多個。舉例而言,tracrRNA抗重複序列與CRISPR重複序列之間的鹼基配對區域的長度可以是約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25、約26、約27、約28、約29、約30或更多個核苷酸。在特定實施方式中,與CRISPR重複序列完全或部分互補的tracrRNA的抗重複區域的長度為約20個核苷酸。在一些實施方式中,當使用適合的對齊演算法進行最佳對齊時,CRISPR重複序列與其對應的tracrRNA抗重複序列之間的互補性程度為約或大於約50%、約60%、約70%、約75%、約80%、約81%、約82%、約83%、約84%、約85%、約86%、約87%、約88%、約89%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、約99%或更大。
在各種實施方式中,整個tracrRNA可包括約60個核苷酸至多於約140個核苷酸。舉例而言,tracrRNA的長度可以是約60、約65、約70、約75、約80、約85、約90、約95、約100、約105、約110、約115、約120、約125、約130、約135、約140或更多個核苷酸。在特定實施方式中,tracrRNA的長度為約80至約90個核苷酸,長度為包含約80、約81、約82、約83、約84、約85、約86、約87、約88、約89以及約90個核苷酸。在某些實施方式中,tracrRNA的長度為約85個核苷酸。
在特定實施方式中,tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119的核苷酸序列或其活性變體或片段,該核苷酸序列或其活性變體或片段當被包括在導引RNA內時能夠將本文提供的關聯RNA導引的核酸酶導向至與所關注的靶向序列序列特定結合。在某些實施方式中,野生型序列的活性tracrRNA序列變體包括具有與如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列一致性的核苷酸序列。在某些實施方式中,野生型序列的活性tracrRNA序列片段包括如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸。
當兩個多核苷酸序列在嚴格條件下彼此雜交時,可以認為該兩個多核苷酸序列基本上互補。同樣地,如果與RGN結合的導引RNA在嚴格條件下與靶向序列結合,則認為該RGN以序列特定方式結合至特定靶向序列。「嚴格條件」或「嚴格雜交條件」旨在指兩個多核苷酸序列彼此雜交至可偵測程度高於其他序列(例如,至少比背景高2倍)的條件。嚴格條件是序列相依的,並且在不同環境下將會不同。通常情況下,嚴格條件將是這樣的條件,其中:在pH 7.0至8.3下,鹽類濃度小於約1.5 M Na離子,通常情況下約0.01至1.0 M Na離子濃度(或其它鹽類),並且針對短序列(例如,10至50個核苷酸),溫度為至少約30 ℃,而針對長序列(例如,大於50個核苷酸),溫度為至少約60 ℃。藉由添加諸如甲醯胺的去穩定劑也可以達到嚴格條件。範例性的低嚴格條件包含在37℃下與30至35%甲醯胺、1 M NaCl、1%SDS(十二烷基硫酸鈉)的緩衝溶液中雜交和在50至55℃下以1X至2X SSC洗滌(20X SSC = 3.0 M NaCl/0.3 M檸檬酸三鈉)。範例性的中等嚴格條件包含在37℃下於40至45%甲醯胺、1.0 M NaCl、1% SDS中雜交和在55至60℃下以0.5X至1X SSC洗滌。範例性的高嚴格條件包含在37℃下於50%甲醯胺、1 M NaCl、1% SDS中雜交和在60至65℃下以0.1X SSC洗滌。視情況,洗滌緩衝液可包括約0.1%至約1%的SDS。雜交持續時間一般小於約24小時,通常約4至約12小時。洗滌時間的持續時間至少是足以達到平衡的時間長度。
Tm是50%的互補靶向序列與完全匹配的序列雜交的溫度(在規定的離子強度和pH下)。對於DNA-DNA雜交體,Tm可以由Meinkoth和Wahl(1984)Anal. Biochem. 138:267-284中的等式:Tm = 81.5℃ + 16.6 (log M) + 0.41 (%GC) - 0.61 (% form) - 500/L大致估計;其中M是單價陽離子的體積莫耳濃度,%GC是鳥苷和胞嘧啶核苷酸在DNA中的百分比,%form是雜交溶液中甲醯胺的百分比,以及L是鹼基對中的雜交體的長度。一般而言,嚴格條件被選擇為比在規定的離子強度和pH下的特定序列及其補體的熱熔點(Tm)低約5℃。然而,極度嚴格條件可利用在比熱熔點(Tm)低1、2、3或4℃下的雜交及/或洗滌;中等嚴格條件可利用在比熱熔點(Tm)低6、7、8、9或10℃的溫度下的雜交及/或洗滌;低嚴格條件可利用在比熱熔點(Tm)低11、12、13、14、15或20℃的溫度下的雜交及/或洗滌。本領域具有通常知識者將明白,使用該等式、雜交及洗滌組成物以及要求的Tm本身描述了雜交及/或洗滌溶液的嚴格性的變化。核酸雜交的廣泛指南可在Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization with Nucleic Acid Probes, Part I, Chapter 2(Elsevier,New York);以及Ausubel等人編輯的(1995) Current Protocols in Molecular Biology,Chapter 2(Greene Publishing and Wiley-Interscience,New York)中得到。參見Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(2d ed., Cold Spring Harbor Laboratory Press, Plainview, New York)。
導引RNA可以是單導引RNA或雙導引RNA系統。單導引RNA包括單一RNA分子上的crRNA和tracrRNA,而雙導引RNA系統包括存在於兩個不同RNA分子上的crRNA和tracrRNA,crRNA和tracrRNA通過crRNA的CRISPR重複序列的至少一部分和tracrRNA的可與crRNA的CRISPR重複序列完全或部分互補的至少一部分而彼此雜交。在其中導引RNA是單導引RNA的那些實施方式的一些實施方式中,crRNA和tracrRNA被鏈接子核苷酸序列分開。一般來說,鏈接子核苷酸序列是不包含互補鹼基的核苷酸序列,以避免在該鏈接子核苷酸序列的核苷酸內形成次級結構或包括該鏈接子核苷酸序列的核苷酸。在一些實施方式中,crRNA與tracrRNA之間的鏈接子核苷酸序列的長度是至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12個或更多個核苷酸。在特定實施方式中,單導引RNA的鏈接子核苷酸序列的長度是至少4個核苷酸。在某些實施方式中,鏈接子核苷酸序列是如SEQ ID NO:123所列的核苷酸序列。
單導引RNA或雙導引RNA可被化學合成或經由試管內(in vitro
)轉錄合成。用於確定RGN與導引RNA之間的序列特定結合的測定法是本領域中已知的、並且包含但不限於所表現的RGN與導引RNA之間的試管內結合測定法,其可以用可偵測標記(例如,生物素)來示跡並被用於下拉偵測測定法中,在下拉偵測測定法中導引RNA:RGN複合物是經由該可偵測標記(例如,利用鏈黴親和素珠)捕獲的。具有與導引RNA無關的序列或結構的對照物導引RNA可用作RGN與RNA的非特定結合的陰性對照物。在某些實施方式中,導引RNA是SEQ ID NO:4、12、19、26、33、41、49、57、64、72、78、85、92、98、106、113或120,其中間隔體序列可以是任何序列並且被表示為poly-N序列。
在某些實施方式中,導引RNA可作為RNA分子而被引入靶向細胞、胞器或胚胎中。該導引RNA可以在試管內被轉錄或被化學合成。在其他實施方式中,將編碼該導引RNA的核苷酸序列引入細胞、胞器或胚胎中。在這些實施方式的一些實施方式中,編碼該導引RNA的核苷酸序列可操作地被鏈接至啟動子(例如,RNA聚合酶III啟動子)。啟動子可以是原生啟動子或與導引RNA編碼的核苷酸序列異源。
在各種實施方式中,如本文所述,導引RNA可作為核糖核蛋白複合物而被引入靶向細胞、胞器或胚胎中,其中導引RNA與RNA導引的核酸酶多肽結合。
導引RNA通過該導引RNA與靶向核苷酸序列的雜交將關聯RNA導引的核酸酶導向至所關注的特定靶向核苷酸序列。靶向核苷酸序列可包括DNA、RNA或兩者的組合,並且可以是單股或雙股的。靶向核苷酸序列可以是基因體DNA(即,染色體DNA)、質體DNA或RNA分子(例如,信使RNA、核醣體RNA、轉移RNA、微RNA、小干擾RNA)。靶向核苷酸序列可在試管內或在細胞中被RNA導引的核酸酶結合(而在一些實施方式中,被割裂)。RGN所靶向的染色體序列可以是核、質體或粒線體染色體序列。在一些實施方式中,靶向核苷酸序列在靶向基因體中是獨特的。
靶向核苷酸序列與原型間隔體相鄰模體(protospacer adjacent motif,PAM)相鄰。原型間隔體相鄰模體一般在距靶向核苷酸序列約1至約10個核苷酸內,包含距靶向核苷酸序列約1、約2、約3、約4、約5、約6、約7、約8、約9、或約10個核苷酸。PAM可以是靶向序列的5'或3'。在一些實施方式中,PAM是本發明揭露的RGN的靶向序列的3'。一般而言,PAM是約3-4個核苷酸的共有序列(consensus sequence),但在特定實施方式中,PAM的長度可以是2、3、4、5、6、7、8、9或更多個核苷酸。在各種實施方式中,由本發明揭露的RGN辨識的PAM序列包括如SEQ ID NO:7、15、22、29、36、44、52、60、67、81、88、101、109或116所列的共有序列。
在特定實施方式中,具有SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117的RNA導引的核酸酶或其活性變體或片段分別結合與如SEQ ID NO:7、15、22、29、36、44、52、60、67、81、88、101、109或116所列的PAM序列相鄰的靶向核苷酸序列。在一些實施方式中,具有SEQ ID NO:54或137的RNA導引的核酸酶或其活性變體或片段結合與如SEQ ID NO:147所列的PAM序列相鄰的靶向核苷酸序列。在這些實施方式的一些實施方式中,RGN結合至包括:分別在SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118中所列的CRISPR重複序列或其活性變體或片段;和分別在SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119中所列的tracrRNA序列或其活性變體或片段的導引序列。在本說明書的範例1和表1及2中進一步描述RGN系統。
本領域中眾所周知,PAM序列對給定核酸酶酵素的特定受酵素濃度的影響(參見,例如,Karvelis等人(2015)Genome Biol
16:253),其可以藉由改變用於表現該RGN的啟動子或被遞送至細胞、胞器或胚胎的核糖核蛋白複合物的量來修飾。
在辨識其對應的PAM序列時,RGN可在特定割裂位點割裂靶向核苷酸序列。如本文所使用的,割裂位點是由靶向核苷酸序列內的兩個特定核苷酸組成,該兩個特定核苷酸之間的核苷酸序列被RGN割裂。割裂位點可以包括在5'或3'方向上離開PAM的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9個核苷酸。在一些實施方式中,割裂位點可以在5'或3'方向上離開PAM 10、11、12、13、14、15、16、17、18、19或20個以上的核苷酸。在一些實施方式中,割裂位點距離PAM 4個核苷酸。在其他實施方式中,割裂位點距離PAM至少15個核苷酸。因RGN可割裂導致交錯的末端的靶向核苷酸序列,在一些實施方式中,基於多核苷酸的正(+)股上的兩個核苷酸離開PAM的距離和多核苷酸的負(-)的股上的兩個核苷酸離開PAM的距離來定義割裂位點。
PAM被看做II型CRISPR系統的RNA導引核酸酶的標記(Szczelkun等人,PNAS, 111:9798-9803, 2014;Sternberg等人, Nature 507:62-67, 2014)。令人關注的是,雖然APG06646.1和APG04293.1起RNA導引的核酸酶的作用並且擁有與II型CRISPR CAS9核酸酶很多相同的域,但是它們每一個都缺少典型的PAM相互作用域(PID;Interpro:IPR032237;Pfam:PF16595)。於是,APG06646.1和APG04293.1沒有典型PAM的要求,如上所述,典型PAM是2-5個核苷酸的模體。相反,這些蛋白在其C端(APG06646.1的殘基821-1092(全長序列是SEQ ID NO:117);APG04293.1的殘基1064-1401(全長序列是SEQ ID NO:103))處具有獨特的DNA辨識域。這些獨特的DNA辨識域使得該核酸酶能夠基於基因體靶向序列(SEQ ID NO:109;參見表2)附近的單核苷酸模體而在基因體靶向位點割裂。
APG04293.1還具有靠近其N-端的133個胺基酸殘基(殘基144-276)的獨特簽名域。此域的功能在II型CRISPR Cas9核酸酶中或本領域中一般而言不為所知。
III.編碼 RNA 導引的核酸酶、 CRISPR RNA 及 / 或 tracrRNA 的核苷酸
本揭露內容提供了包括本發明揭露的CRISPR RNA、tracrRNA及/或sgRNA的多核苷酸和包括編碼本發明揭露的RNA導引的核酸酶、CRISPR RNA、tracrRNA及/或sgRNA的核苷酸序列的多核苷酸。本發明揭露的多核苷酸包含包括或編碼CRISPR重複序列的那些多核苷酸,該CRISPR重複序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性變體或片段,該核苷酸序列或其活性變體或片段當被包括在導引RNA內時能夠將關聯RNA導引的核酸酶導向至與所關注的靶向序列序列特定結合。還揭露了包括或編碼tracrRNA的多核苷酸,該tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性變體或片段,該核苷酸序列或其活性變體或片段當被包括在導引RNA內時能夠將關聯RNA導引的核酸酶導向至與所關注的靶向序列序列特定結合。還提供了編碼RNA導引的核酸酶的多核苷酸,該RNA導引的核酸酶包括如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所列的胺基酸序列及其活性片段或變體,該胺基酸序列及其活性片段或變體保持了以RNA導引的序列特定方式結合至靶向核苷酸序列的能力。
術語「多核苷酸」的使用不旨在將本揭露內容局限於包括DNA的多核苷酸。本領域中具有通常知識者將認可多核苷酸可包括核糖核苷酸(RNA)以及核糖核苷酸與去氧核糖核苷酸的組合。這種去氧核糖核苷酸和核糖核苷酸既包含天然存在的分子又包含合成類似物。這些包含胜肽核酸(PNA)、PNA-DNA嵌合體、鎖核酸(LNA)以及硫代磷酸酯(phosphothiorate)鏈接序列。本文揭露的多核苷酸還涵蓋所有形式的序列,包含但不限於單股形式、雙股形式、DNA-RNA雜交體、三重結構(triplex structure)、莖環結構等。
編碼RGN的核酸分子可以針對所關注的生物體中的表現而被密碼子最佳化。「密碼子最佳化的」編碼序列是使其密碼子使用頻率設計成模擬較佳密碼子使用頻率或特定宿主細胞的轉錄條件的多核苷酸編碼序列。由於核酸層次上的一個或複數密碼子的改變使得轉譯的胺基酸序列未改變,所以特定宿主細胞或生物體中的表現被增強。核酸分子可以全部或部分地被密碼子最佳化。密碼子表和提供大範圍生物體的偏好資訊的其他參考文獻在本領域中是可得的(參見,例如,Campbell和Gowri(1990)Plant Physiol
. 92:1-11,有關植物較佳密碼子使用的討論)。本領域中用於合成植物較佳基因的方法是可得的。參見,例如,第5,380,831號和第5,436,391號美國專利以及Murray等人(1989)Nucleic Acids Res
. 17:477-498,它們藉由引用併入本文。
編碼本文中提供的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可在表現卡匣中提供,以用於在試管內表現或在所關注的細胞、胞器、胚胎或生物體中表現。該卡匣包含5'和3'調整序列,該5'和3'調節序列可操作地鏈接至編碼本文中提供的允許多核苷酸表現的RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸。該卡匣可額外含有將被轉化至生物體中的至少一種額外基因或基因元素。如果包含額外基因或元素,則成分被可操作地鏈接。術語「可操作地鏈接」旨在表達兩個或更多個元素之間的功能性鏈接。舉例而言,啟動子與所關注的編碼區域(例如,編碼RGN、crRNA、tracrRNA及/或sgRNA的區域)之間的可操作地鏈接是允許所關注的編碼區域表現的功能性鏈接。可操作地鏈接的元素可以是連續的,也可以是非連續的。當用於指兩個蛋白質編碼區域的連接時,藉由可操作地鏈接意指編碼區域在相同的閱讀框中。作為另一種選擇,可在複數表現卡匣上提供(數個)額外基因或元素。舉例而言,編碼本發明揭露的RGN的核苷酸序列可存在於一個表現卡匣上,而編碼crRNA、tracrRNA或完整導引RNA的核苷酸序列可在單獨表現卡匣上。這種表現卡匣被提供有複數限制性位點及/或重組位點,以使多核苷酸的插入受調節區域的轉錄調整。該表現卡匣可額外含有選擇性標記基因。
表現卡匣在5'-3'轉錄方向將包含轉錄(以及在一些實施方式中,轉譯)啓動區域(即,啟動子)、本發明的RGN-、crRNA-、tracrRNA-及/或sgRNA-編碼多核苷酸、以及在所關注的生物體中起作用的轉錄(以及在一些實施方式中,轉譯)終止區域(即,終止區域)。本發明的啟動子能夠在宿主細胞中導向或驅動編碼序列的表現。調整區域(例如,啟動子、轉錄調整區域以及轉譯終止區域)對宿主細胞或彼此可以是內源的或異源的。如本文所使用的關於序列的「異源」是源自外來物種的序列,或者,如果來自相同物種,則是藉由蓄意的人為干預從其在組成物及/或基因體基因座位中的天然形式基本上被修飾的序列。如本文中所使用的嵌合基因包括與轉錄起始區域可操作地鏈接的編碼序列,該轉錄起始區與編碼序列是異源的。
合宜的終止區域可從腫瘤農桿菌(A. tumefaciens
)的Ti質體獲得,諸如,章魚鹼(octopine)合成酶和胭脂鹼(nopaline)合成酶終止區域。還參見Guerineau等人(1991)Mol. Gen. Genet.
262:141-144;Proudfoot(1991)Cell
64:671-674;Sanfacon等人(1991)Genes Dev.
5:141-149;Mogen等人(1990)Plant Cell
2:1261-1272;Munroe等人(1990)Gene
91:151-158;Ballas等人(1989)Nucleic Acids Res
. 17:7891-7903;以及Joshi等人(1987)Nucleic Acids Res.
15:9627-9639。
額外調整訊號包含但不限於轉錄起始初始位點、操作子、活化子、增強子、其他調整元素、核醣體結合位點、啓動密碼子、終止訊號等。參見,舉例而言,第5,039,523號和第4,853,331號美國專利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:A Laboratory Manual, Maniatis等人編輯(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.),後稱「Sambrook 11」;Davis等人編輯(1980)Advanced Bacterial Genetics(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.)以及其中引用的參考文獻。
在製備表現卡匣時,可以操縱各種DNA片段,以便在適宜的取向上和恰當的情況下於適宜閱讀框中提供DNA序列。為此,可以使用轉接子或鏈接子來連接DNA片段,或者可涉及其他操縱來提供合宜的限制位點、除去多餘的DNA、除去限制位點等。為此目的,可涉及試管內誘變、引子修復、限制、黏合(annealing)、重新置換,例如轉換和顛換。
許多啟動子可用於本發明的實施。可基於期望結果來選擇啟動子。核酸可以與構成型、誘導型、生長階段特定、細胞類型特定、組織較佳、組織特定的啟動子或其他啟動子結合,用於所關注的生物體中的表現。參見,舉例而言, WO 99/43838中和第8,575,425號;第7,790,846號;第8,147,856號;第8,586832號;第7,772,369號;第7,534,939號;第6,072,050號;第5,659,026號;第5,608,149號;第5,608,144號;第5,604,121號;第5,569,597號;第5,466,785號;第5,399,680號;第5,268,463號;第5,608,142號;以及第6,177,611號美國專利中所列的啟動子;它們藉由引用併入本文。
對於在植物中的表現,構成型啟動子還包含CaMV 35S啟動子(Odell等人(1985)Nature
313:810-812);稻穀肌動蛋白(McElroy等人(1990)Plant Cell
2:163-171);泛素(Christensen等人(1989)Plant Mol. Biol.
12:619-632以及Christensen等人(1992)Plant Mol. Biol.
18:675-689);pEMU(Last等人(1991)Theor. Appl. Genet.
81:581-588);以及MAS(Velten等人(1984)EMBO J.
3:2723-2730)。
誘導型啟動子的範例是可藉由缺氧或冷壓(cold press)誘導的Adh1啟動子、可藉由熱逆境誘導的Hsp70啟動子、可由光誘導的PPDK啟動子和磷酸烯醇丙酮酸羧化酶(pepcarboxylase)啟動子。同樣有用的是化學誘導的啟動子,諸如,安全劑誘導的In2-2啟動子(第5,364,780號美國專利)、生長素誘導的且是絨氈層特定的但在癒合組織中還有活性的Axig1啟動子(PCT US01/22169)、類固醇反應性啟動子(參見,舉例而言,Schena等人(1991)Proc. Natl. Acad. Sci.
USA 88:10421-10425和McNellis等人(1998)Plant J
. 14(2):247-257中的雌激素誘導的ERE啟動子和糖皮質激素誘導型啟動子)、以及四環素誘導型和四環素抑制型啟動子(參見,舉例而言,Gatz等人(1991)Mol. Gen. Genet
. 227:229-237以及第5,814,618號和第5,789,156號美國專利),它們藉由引用併入本文。
組織特定或組織較佳的啟動子可用於靶向特定組織內的表現構築體的表現。在某些實施方式中,組織特定或組織較佳的啟動子在植物組織中是有活性的。在植物中受發育控制的啟動子的範例包含在諸如葉、根、果實、種子或花的某些組織中較佳地啟動轉錄的啟動子。「組織特定的」啟動子是僅在某些組織中啟動轉錄的啟動子。與基因的構成型表現不同,組織特定表現是幾種位準的基因調整相互作用的結果。就其本身而言,來自同源或密切相關的植物物種的啟動子可較佳地用於在特定組織中實現轉殖基因的有效且可靠的表現。在一些實施方式中,表現包括組織較佳的啟動子。「組織較佳的」啟動子是較佳地在,但不一定完全在或僅在某些組織中啟動轉錄的啟動子。
在一些實施方式中,編碼RGN、crRNA及/或tracrRNA的核酸分子包括細胞類型特定啟動子。「細胞類型特定」啟動子是主要在一個或複數器官的某些細胞類型中驅動表現的啟動子。舉例而言,其中在植物中起作用的細胞類型特定啟動子可主要是活性的植物細胞的一些範例包含BETL細胞、根、葉中的維管細胞、柄細胞以及莖細胞(stem cell)。核酸分子還可包含細胞類型較佳的啟動子。「細胞類型較佳的」啟動子是主要驅動大部分在,但不一定完全在或僅在一個或複數器官中的某些細胞類型中的表現的啟動子。舉例而言,其中在植物中起作用的細胞類型較佳的啟動子可具較佳活性的植物細胞的一些範例包含BETL細胞、根、葉中的維管細胞、柄細胞以及莖細胞。
編碼RGN、crRNA、tracrRNA及/或sgRNA的核酸序列可與舉例而言用於試管內mRNA合成的噬菌體RNA聚合酶辨識的啟動子序列可操作地鏈接。在此類實施方式中,可純化試管內轉錄的RNA,以用於本文所述的方法。舉例而言,啟動子序列可以是T7、T3或SP6啟動子序列,或T7、T3或SP6啟動子序列的變體。在此類實施方式中,可純化表現蛋白及/或RNA,以用於本文所述的基因體修飾方法。
在某些實施方式中,編碼RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸還可與多腺苷酸化訊號(例如,SV40 polyA訊號及植物中起作用的其他訊號)及/或至少一個轉錄終止序列鏈接。另外,編碼RGN的序列還可與編碼至少一個核定位訊號、至少一個細胞穿透域及/或能夠將蛋白質運輸到特殊亞細胞位置的至少一個訊號胜肽的序列鏈接,如本文中別處所述。
編碼RGN、crRNA、tracrRNA及/或sgRNA的多核苷酸可存在於載體或複數載體中。「載體」是指用於將核酸轉移、遞送或引入宿主細胞內的多核苷酸組成物。適合的載體包含質體載體、噬菌粒、黏接質體(cosmid)、人工/微型染色體、轉位子以及病毒載體(例如,慢病毒載體、腺關聯性病毒載體、桿狀病毒載體)。載體可包括額外的表現控制序列(例如,增強子序列、Kozak序列、多腺苷酸化序列、轉錄終止序列)、選擇性記號序列(例如,抗生素抗性基因)、複製起點等。額外資訊可在「Current Protocols in Molecular Biology」Ausubel等人、John Wiley & Sons,紐約,2003;或 「Molecular Cloning:A Laboratory Manual」Sambrook & Russell,Cold Spring Harbor Press, Cold Spring Harbor, N.Y., 3rd edition, 2001中找到。
載體還可包括用於選擇轉化細胞的選擇性記號基因。選擇性記號基因用於轉化的細胞或組織的選擇。記號基因包含:編碼抗生素抗性的基因,諸如,編碼新黴素磷酸轉移酶II(NEO)和潮黴素磷酸轉移酶(HPT)的基因);以及對諸如草銨膦、溴苯腈、咪唑啉酮以及2,4-二氯苯氧乙酸酯(2,4-D)的除草性化合物賦予抗性的基因。
在一些實施方式中,包括編碼RGN多肽的序列的表現卡匣或載體可進一步包括編碼crRNA及/或tracrRNA或者被組合以形成導引RNA的crRNA和tracrRNA的序列。編碼crRNA及/或tracrRNA的(數個)序列可與至少一轉錄控制序列可操作地鏈接,用於所關注的生物體或宿主細胞中的crRNA及/或tracrRNA的表現。舉例而言,編碼crRNA及/或tracrRNA的多核苷酸可與由RNA聚合酶III(Pol III)辨識的啟動子序列可操作地鏈接。適合的Pol III啟動子的範例包含但不限於哺乳動物U6、U3、H1及7SL RNA啟動子以及稻穀U6及U3啟動子。
如所指示的,包括編碼RGN、crRNA、tracrRNA及/或sgRNA的核苷酸序列的表現構築體可用於轉化所關注的生物體。用於轉化的方法涉及將核苷酸構築體引入所關注的生物體內。「引入」旨在以使得該構築體獲得進入宿主細胞內部的此等方式將核苷酸構築體引入宿主細胞。本發明的方法不需要用於將核苷酸構築體引入宿主生物體的特定方法,僅需要該核苷酸構築體獲得進入宿主生物體的至少一個細胞的內部。宿主細胞可以是真核細胞或原核細胞。在特定實施方式中,真核宿主細胞是植物細胞、哺乳動物細胞或昆蟲細胞。用於將核苷酸構築體引入植物以及其他宿主細胞內的方法是本領域中已知的,其包含但不限於穩定轉化方法、瞬時轉化方法以及病毒媒介方法。
該些方法導致轉化的生物體(諸如植物),其包含:整株植物和植物器官(例如,葉、莖、根等)、種子、植物細胞、繁殖體、胚胎及其後代。植物細胞可被分化,也可不被分化(例如,癒合組織、懸浮培養細胞、原生質體、葉細胞、根細胞、韌皮部細胞、花粉)。
「基因轉殖生物體」或「轉化生物體」或「穩定轉化的」生物體或細胞或組織是指已併入或整合了編碼本發明的RGN、crRNA及/或tracrRNA的多核苷酸的生物體。辨識出其他外源或內源核酸序列或DNA片段也可被併入宿主細胞內。農桿菌
和基因槍媒介的轉化仍然是用於植物細胞轉化的兩種盛行採用的方法。然而,宿主細胞的轉化可藉由感染、轉染、顯微注射、電穿孔、顯微投影(microprojection)、基因槍或粒子轟擊、電穿孔、二氧化矽/碳纖維、超音波媒介的、PEG媒介的、磷酸鈣共沉澱、聚陽離子DMSO技術、DEAE葡聚醣程序、以及病毒媒介的、脂質體媒介的等進行。編碼RGN、crRNA及/或tracrRNA的多核苷酸的病毒媒介的引入包含反轉錄病毒、慢病毒、腺病毒以及腺關聯病毒媒介的引入和表現,以及花椰菜嵌紋病毒(Caulimovirus)、雙生病毒(Geminivirus)以及RNA植物病毒的使用。
轉化協定和用於將多肽或多核苷酸序列引入植物內的協定可隨針對轉化所靶向的宿主細胞的類型(例如,單子葉植物或雙子葉植物細胞)而不同。用於轉化的方法是本領域中已知的,且包含第8,575,425號、第7,692,068號、第8,802,934號、第7,541,517號美國專利中闡述的那些方法,這些專利中的每一個都藉由引用併入本文。還參見Rakoczy-Trojanowska, M.(2002)Cell Mol Biol Lett.
7:849-858;Jones等人(2005)Plant Methods
1:5;Rivera等人(2012)Physics of Life Reviews
9:308-345;Bartlett等人(2008)Plant Methods
4:1-12;Bates, G.W.(1999)Methods in Molecular Biology
111:359-366;Binns和Thomashow(1988),Microbiology
42:575-606中的Annual Reviews
;Christou, P.(1992)The Plant Journal
2:275-281;Christou, P.(1995)Euphytica
85:13-27;Tzfira等人(2004)TRENDS in Genetics
20:375-383;Yao等人(2006)Journal of Experimental Botany
57:3737-3746;Zupan和Zambryski(1995)Plant Physiology
107:1041-1047;Jones等人(2005)Plant Methods
1:5。
轉化可導致核酸穩定或瞬時併入細胞內。「穩定轉化」旨在指引入宿主細胞內的核苷酸構築體整合到宿主細胞的基因體內,且能夠被其後代遺傳。「瞬時轉化」旨在指多核苷酸被引入宿主細胞內且不整合到宿主細胞的基因體內。
用於葉綠體轉化的方法是本領域中已知的。參見,舉例而言,Svab等人(1990)Proc. Nail. Acad. Sci. USA
87:8526-8530;Svab和Maliga (1993)Proc. Natl. Acad. Sci. USA
90:913-917;Svab和Maliga(1993)EMBO J.
12:601-606。該方法依賴於含有選擇性標記的DNA的粒子槍遞送和通過同源重組將該DNA靶向質體基因體。另外,質體轉化可藉由核編碼的和質體導向的RNA聚合酶的組織較佳的表現來轉錄活化(transactivation)緘默的質體攜帶的轉殖基因來實現。McBride等人(1994)在Proc. Natl. Acad. Sci. USA
91:7301-7305已報導了這種系統。
已經被轉化的細胞可以按照傳統方法生長成基因轉殖生物體,諸如植物。參見,例如McCormick等人(1986)Plant Cell Reports
5:81-84。然後,可以使這些植物生長,並用相同轉化品系或不同品系授粉,並且辨別出具有期望表型(phenotypic)特徵的構成型表現的所得雜交體。可生長兩代或更多代,以確保穩定維持並遺傳期望表型特徵的表現,然後,收穫種子以確保已經實現期望表型特徵的表現。以此方式,本發明提供具有穩定地併入其基因體內的本發明的核苷酸構築體(舉例而言,本發明的表現卡匣)的轉化種子(也稱為「基因轉殖種子」)。
作為另一種選擇,可以將已經被轉化的細胞引入生物體內。這些細胞可以源自該生物體,其中細胞以體外方法被轉化。
本文提供的序列可用於轉化任何植物物種,包含但不限於:單子葉植物和雙子葉植物。所關注的植物的範例包含但不限於:玉蜀黍(玉米)、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥及油菜、蕓苔屬物種、苜蓿、黑麥、小米、紅花、花生、甘藷、木薯、咖啡、椰子、鳳梨、柑橘樹、可可、茶、香蕉、鱷梨、無花果、番石榴、芒果、橄欖、木瓜、腰果、澳洲胡桃、杏仁、燕麥、蔬菜、觀賞植物以及針葉樹。
蔬菜包含但不限於番茄、萵苣、綠豆、皇帝豆、豌豆、以及諸如黃瓜(cucumber)、網紋甜瓜(cantaloupe)以及洋香瓜(musk melon)的黃瓜(Curcumis)屬的成員。觀賞植物包含但不限於杜鵑花、繡球花、芙蓉、玫瑰、鬱金香、水仙、矮牽牛、康乃馨、猩猩木以及菊花。較佳地,本發明的植物是農作物(舉例而言、玉米、高粱、小麥、向日葵、番茄、十字花科植物、胡椒、馬鈴薯、棉花、稻穀、大豆、甜菜、甘蔗、煙草、大麥、油菜等)。
如本文所使用的,術語「植物」包含植物細胞、植物原生質體、可以從其再生植物的植物細胞組織培養物、植物癒傷組織、植物塊、以及在植物或植物的諸如胚胎、花粉、胚珠、種子、葉子、花、枝、果實、仁、穗、玉米穗軸、殼、莖、根、根尖、花藥等的部分中是完整的植物細胞。穀物意指出於種植或繁殖物種之外的目的而由商業種植者生產的成熟種子。再生植物的子代、變體以及突變體也包含在本發明的範圍內,前提條件是這些部分包括引入的多核苷酸。還提供了保持了本文中揭露的序列的經加工的植物產品或副產物,舉例而言,包含豆粕。
編碼RGN、crRNA及/或tracrRNA的多核苷酸也可用於轉化任何原核物種,包含但不限於古生菌和細菌(例如,芽孢桿菌屬
(Bacillus sp.
)、克雷伯氏菌屬
(Klebsiella sp.
)、鏈黴菌屬
(Streptomyces sp.
)、根瘤菌屬
(Rhizobium sp.
)、埃希氏菌屬
(Escherichia sp.
)、假單胞菌屬
(Pseudomonas sp.
)、沙門氏菌屬
(Salmonella sp.
)、志賀氏桿菌屬
(Shigella sp.
)、弧菌屬
(Vibrio sp.
)、耶爾森菌屬
(Yersinia sp.
)、支原體菌屬
(Mycoplasma sp.
)、農桿菌屬
(Agrobacterium
)、乳酸乳桿菌屬
(Lactobacillus sp.
)。
編碼RGN、crRNA及/或tracrRNA的多核苷酸可用於轉化任何真核物種,包含但不限於動物(例如,哺乳動物、昆蟲、魚類、鳥類以及爬蟲類物)、真菌、變形蟲、藻類以及酵母。
傳統的基於病毒和非病毒的基因轉移方法可用於將核酸引入哺乳動物細胞或靶向組織中。這些方法可用於將編碼CRISPR系統成分的核酸提供給培養中的細胞、或宿主生物體中的細胞。非病毒載體遞送系統包含DNA質體、RNA(例如,本文描述的載體的轉錄本)、裸核酸以及與諸如脂質體的遞送載劑複合的核酸。病毒載體遞送系統包含DNA和RNA病毒,其在遞送至細胞後具有附加型或整合的基因體。有關基因治療程序的綜述,參見Anderson,Science 256:808- 813 (1992);Nabel & Feigner,TIBTECH 11:211-217 (1993);Mitani & Caskey,TIBTECH 11:162-166 (1993);Dillon,TIBTECH 11:167-175 (1993);Miller,Nature 357:455-460 (1992);Van Brunt,Biotechnology 6(10):1149-1154 (1988);Vigne,Restorative Neurology and Neuroscience 8:35-36 (1995);Kremer & Perricaudet,British Medical Bulletin 51(1):31-44 (1995);Haddada等人,in Current Topics in Microbiology and Immunology, Doerfler和Bohm(編者)(1995);以及Yu等人,Gene Therapy 1:13-26 (1994)。
核酸的非病毒遞送方法包含脂質體轉染、核轉染、顯微注射、基因槍(biolistics)、病毒體、脂質體、免疫脂質體、聚陽離子或脂質:核酸共軛物、裸DNA、人工病毒粒子以及DNA的藥劑增強攝取。例如第5,049,386號、第4,946,787號以及第4,897,355號美國專利中描述了脂質體轉染,並且脂質體轉染試劑是市售的(例如,Transfectam ™和Lipofectin™)。適合用於多核苷酸的有效受體辨識脂質體轉染的陽離子和中性脂質包含Feigner的WO 91/17424;WO 91/16024中的那些陽離子和中性脂質。遞送可以是至細胞(例如,在試管內或體外地給予)或標的靶向組織(例如,體內給予)。包含靶向的脂質體諸如免疫脂質複合物的脂質:核酸複合物的製備是本領域中具有通常知識者熟知的(參見,例如Crystal,Science 270:404-410(1995);Blaese等人,Cancer Gene Ther. 2:291- 297(1995);Behr等人,Bioconjugate Chem. 5:382-389(1994);Remy等人,Bioconjugate Chem. 5:647-654(1994);Gao等人,Gene Therapy 2:710-722(1995);Ahmad等人,Cancer Res. 52:4817-4820(1992);第4,186,183號、第4,217,344號、第4,235,871號、第4,261,975號、第4,485,054號、第4,501,728號、第4,774,085號、第4,837,028號以及第4,946,787號美國專利)。
用於核酸的遞送的RNA或DNA病毒為基底的系統的使用利用了高度進化的過程,以用於將病毒靶向體內的特定細胞並將病毒載荷運輸至細胞核。病毒載體可以直接被投予患者(體內),或者該病毒載體可以用於試管內處置細胞,並且可視情況將修飾後的細胞投予患者(體外)。傳統的病毒為基底的系統可包含用於基因轉移的反轉錄病毒、慢病毒、腺病毒、腺關聯以及單純皰疹病毒載體。使用反轉錄病毒、慢病毒以及腺關聯病毒基因轉移方法,在宿主基因體中的整合是可能的,常常導致插入的轉殖基因的長期表現。另外,在很多不同細胞類型和靶向組織中已經觀察到高轉導功效。
反轉錄病毒的向性可藉由併入外來套膜蛋白而被改變,從而擴展靶向細胞的潛在靶向族群。慢病毒載體是能夠轉導或感染非分裂細胞並且通常情況下生成高病毒力價的反轉錄病毒載體。因此,反轉錄病毒基因轉移系統的選擇將取決於靶向組織。反轉錄病毒載體由順式作用長末端重複構成,具有達到6-10 kb外源序列的包裝能力。最小順式作用LTR足夠用於載體的複製和包裝,然後,將其用於將治療基因整合到靶向細胞中,以提供永久轉殖基因表現。廣泛使用的反轉錄病毒載體包含基於鼠白血病病毒(MuLV)、長臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其組合的載體。(參見,例如,Buchscher等人,J. Viral. 66:2731-2739(1992);Johann等人,J. Viral. 66:1635-1640(1992);Sommnerfelt等人,Viral. 176:58-59(1990);Wilson等人,J. Viral. 63:2374-2378(1989);Miller 等人,1
. Viral. 65:2220-2224(1991);PCT/US94/05700)。
在瞬時表現較佳的應用中,可以使用腺病毒為基底的系統。腺病毒為基底的載體在許多細胞類型中為能夠非常高的轉導效率,並且不需要細胞分裂。使用這樣的載體,已經獲得了高力價和表現位準。此載體可在相對簡單的系統中大量生產。腺關聯病毒(“AAV”)載體也可例如在核酸和胜肽的試管內生成中用於轉導具有靶向核酸的細胞,並且用於活體內和體外基因治療程序(參見,例如,West 等人,Virology 160:38-47(1987); 第4,797,368號美國專利;WO 93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1
. Clin. Invest. 94:1351(1994))。重組AAV載體的構築描述於許多出版物中,包含第5,173,414號美國專利;Tratschin等人,Mol. Cell. Biol. 5:3251-3260(1985);Tratschin等人,Mol. Cell. Biol. 4:2072-2081(1984);Hermonat & Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,1
. Viral. 63:03822-3828(1989)。包裝細胞通常情況下用於形成能夠感染宿主細胞的病毒顆粒。這種細胞包含包裝腺病毒的293細胞和包裝反轉錄病毒的ψJ2細胞或PA317細胞。
用於基因治療的病毒載體通常藉由生成將核酸載體包裝於病毒顆粒內的細胞系(cell line)而被產生。載體通常情況下含有用於包裝且隨後整合至宿主內所需的最小病毒序列,其他病毒序列由用於要表現的(數個)多核苷酸的表現卡匣置換。遺失的病毒功能通常情況下由包裝細胞系反式提供。舉例而言,基因治療中使用的AAV載體通常情況下僅具有來自用於包裝及整合至宿主基因體內所需的AAV基因體的ITR序列。病毒DNA被包裝在細胞系中,該細胞系含有編碼其他AAV基因的輔助質體,即,rep和cap,但缺少ITR序列。
也可以用腺病毒作為輔助者來感染細胞系。輔助病毒促進AAV載體的複製和來自輔助質體的AAV基因的表現。因於缺少ITR序列,未以顯著量包裝輔助質體。腺病毒的污染可藉由例如對腺病毒比AAV更敏感的熱治療(heat treatment)來降低。將核酸遞送至細胞的額外方法是本領域中具有通常知識者已知的。舉例而言,參見US20030087817,其藉由引用併入本文。
在一些實施方式中,用本文描述的一個或複數載體暫時地或非暫時地轉染宿主細胞。在一些實施方式中,細胞在其天然存在於個體中時被轉染。在一些實施方式中,被轉染的細胞取自個體。在一些實施方式中,細胞衍生自取自個體的細胞,諸如細胞系。用於組織培養的多種細胞系是本領域中已知的。細胞系的範例包含但不限於C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01
、 LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4. COS、COS-1、COS-6、COS-M6A、BS-C-1猴腎上皮細胞、BALB/3T3小鼠胚胎纖維母細胞、3T3 Swiss、3T3-Ll、132-d5人胎兒纖維母細胞;10.1小鼠纖維母細胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I 細胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/ R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY
細胞、K562細胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT細胞系、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2細胞、Sf-9、SkBr3、T2、T-47D、T84、THPl細胞系、U373、U87、U937、VCaP、Vero細胞、WM39、WT-49、X63、YAC-1、YAR、及其基因轉殖品種。細胞系可從本領域中具有通常知識者已知的多種來源獲得(參見,例如American Type Culture Collection(ATCC)(馬納薩斯,弗吉尼亞州))。
在一些實施方式中,用本文描述的一個或複數載體轉染的細胞被用於建立包括一個或複數載體衍生序列的新細胞系。在一些實施方式中,用如本文描述的CRISPR系統的成分暫時轉染(諸如藉由一個或複數載體的暫時轉染,或用RNA轉染)並通過CRISPR複合物的活性修飾後細胞用於建立包括含有修飾但缺少任何其他外源序列的細胞的新細胞系。在一些實施方式中,用本文描述的一個或複數載體暫時或非暫時轉染的細胞或從此類細胞衍生的細胞系用於評估一個或複數測試化合物。
在一些實施方式中,本文描述的一個或複數載體用於生成非人的基因轉殖動物或基因轉殖植物。在一些實施方式中,基因轉殖動物是哺乳動物,諸如,小鼠、大鼠或兔子。IV. 多肽及多核苷酸的變體和片段
本揭露內容提供了:天然存在的(即,野生型)RNA導引的核酸酶的活性變體和片段,該活性變體和片段的胺基酸序列如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所列;以及天然存在的CRISPR重複的活性變體和片段,諸如,SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列序列;和天然存在的tracrRNA的活性變體和片段,諸如,SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列序列);及編碼這些活性變體和片段的多核苷酸。
雖然與所關注的多核苷酸或多肽相較下可以改變變體或片段的活性,但變體和片段應保持所關注的多核苷酸或多肽的功能性。舉例而言,當與所關注的多核苷酸或多肽相較時,變體或片段可具有增加的活性、降低的活性、不同的活性光譜或任何其他活性改變。
諸如本文揭露的天然存在的RGN多肽的片段和變體將保持序列特定的RNA導引的DNA結合活性。在特定實施方式中,諸如本文揭露的天然存在的RGN多肽的片段和變體將保持核酸酶活性(單股或雙股)。
當導引RNA(包括tracrRNA)的部分以序列特定方式結合至RNA導引的核酸酶(與導引RNA複合的)並且將RNA導引的核酸酶(與導引RNA複合的)導引至靶向核苷酸序列時,諸如本文揭露的天然存在的CRISPR重複的片段和變體將保持該能力。
當導引RNA(包括CRISPR RNA)的部分以序列特定方式將RNA導引的核酸酶(與導引RNA複合的)導引至靶向核苷酸序列時,諸如本文揭露的天然存在的tracrRNA的片段和變體將保持該能力。
術語「片段」是指本發明的多核苷酸或多肽序列的一部分。「片段」或「生物活性部分」包含多核苷酸,該多核苷酸包括足夠數量的連續核苷酸,以保持生物活性(即,當被包括在導引RNA內時,以序列特定方式與RGN結合並將RGN導向至靶向核苷酸序列)。「片段」或「生物活性部分」包含多肽,該多肽包括足夠數量的連續胺基酸殘基,以保持生物活性(即,當與導引RNA複合時,以序列特定方式與靶向核苷酸序列結合)。RGN蛋白的片段包含由於使用替代的下游初始位點而比全長序列短的那些。RGN蛋白的生物活性部分可以是包括舉例而言SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050或更多個連續胺基酸殘基的多肽。這些生物活性部分可藉由重組技術而被製備並且針對序列特定的RNA導引的DNA結合活性而被評價。CRISPR重複序列的生物活性片段可包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的至少8個連續胺基酸。CRISR重複序列的生物活性部分可以是包括舉例而言SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的8、9、10、11、12、13、14、15、16、17、18、19或20個連續核苷酸的多核苷酸。tracrRNA的生物活性部分可以是包括舉例而言SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80或更多個連續核苷酸的多核苷酸。
一般來說,「變體」旨在表達基本上相似的序列。對於多核苷酸,變體包括在天然多核苷酸內的一個或複數內位置點處的一個或複數核苷酸的刪除及/或添加及/或天然多核苷酸中一個或複數位點處的一個或複數核苷酸的置換。如本文所使用的,「原生」或「野生型」多核苷酸或多肽分別包括天然存在的核苷酸序列或胺基酸序列。對於多核苷酸,保守變體包含因為基因密碼的退化性而編碼所關注基因的原生胺基酸序列的那些序列。與舉例而言利用下面闡述的聚合酶連鎖反應(PCR)和雜交技術一樣,可使用眾所周知的分子生物學技術鑑定諸如這些對偶基因變體的天然存在的對偶基因變體。變體多核苷酸還包含合成衍生的多核苷酸,諸如藉由使用定點誘變產生的但其仍然編碼所關注的多肽或多核苷酸的多核苷酸。一般而言,如藉由本文他處描述的序列對齊程式及參數所確定的,本文揭露的特定多核苷酸的變體具有與該特定多核苷酸至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列一致性。
本文揭露的特定多核苷酸的變體(即,參考多核苷酸)也可以藉由比較由變體多核苷酸所編碼的多肽與該參考多核苷酸所編碼的多肽之間的序列一致性百分比來評價。可使用本文別處描述的序列對齊程式和參數來計算任何兩個多肽之間的序列一致性百分比。當藉由比較本文揭露的任何給定的多核苷酸與它們編碼的兩個多肽共有的序列一致性百分比來評價該給定的多核苷酸對時,該兩個經編碼的多肽之間的序列一致性百分比為至少約40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列一致性。
在特定實施方式中,本發明揭露的多核苷酸編碼RNA導引的核酸酶多肽,該RNA導引的核酸酶多肽包括的胺基酸序列具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的胺基酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性。
本發明的RGN多肽的生物活性變體可以相差少至約1-15個胺基酸殘基、少至約1-10個(諸如,約6-10個)、少至5個、少至4個、少至3個、少至2個、或少至1個胺基酸殘基。在特定實施方式中,多肽可包括N端或C端截短,該截短可包括從該多肽的N端或C端刪除至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050個或更多個胺基酸。
在某些實施方式中,本發明揭露的多核苷酸包括或編碼CRISPR重複,該CRISPR重複包括具有與如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明揭露的多核苷酸可包括或編碼tracrRNA,該tracrRNA包括具有與如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的一致性的核苷酸序列。
本發明的CRISPR重複或tracrRNA的生物活性變體可以相差少至約1-15個核苷酸、少至約1-10個核苷酸(諸如,約6-10個)、少至5個核苷酸、少至4個核苷酸、少至3個核苷酸、少至2個核苷酸、或少至1個核苷酸。在特定實施方式中,多核苷酸可包括5'或3'截短,該5'或3'截短可包括從該多核苷酸的5'或3'末端刪除至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80個核苷酸或更多個核苷酸。
認定可對本文提供的RGN多肽、CRISPR重複以及tracrRNA進行修飾,從而建立變體蛋白質和多核苷酸。人類設計的變化可通過位點導向的誘變技術的應用來引入。作為另一種選擇,在結構上及/或功能上與本文揭露的序列有關的原生的、尚不知的或尚不明的多核苷酸及/或多肽也可被認為落入本發明範圍內的。可以在不改變RGN蛋白功能的非保留區域中進行保守式胺基酸置換。作為另一種選擇,可以進行改進RGN活性的修飾。
變體多核苷酸和蛋白質還涵蓋從諸如DNA混排(shuffling)的誘變和引起重組程序衍生的序列和蛋白質。利用這種程序,操縱本文揭露的一個或複數不同的RGN蛋白質(例如,SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235),以建立具有期望特性的新RGN蛋白質。以這種方式,重組多核苷酸庫是從包括序列區域的有關序列多核苷酸族群產生的,該序列區域具有基本的序列一致性並且可以在試管內或體內同源重組。舉例而言,使用這種措施,編碼所關注域的序列模體可在本文提供的RGN序列與其他已知的RGN基因之間混排,以獲得為了具有改善的關注性質(諸如在酵素的情況下增加的Km )而寫碼的蛋白質的新基因。這種DNA混排的策略在本領域中是已知的。舉例而言,參見Stemmer(1994)Proc. Natl. Acad. Sci. USA
91:10747-10751;Stemmer(1994)Nature
370:389-391;Crameri 等人(1997)Nature Biotech.
15:436-438;Moore等人(1997)J. Mol. Biol.
272:336-347;Zhang等人( 1997 ) Proc. Natl. Acad. Sci. USA
94:4504-4509;Crameri等人(1998)Nature
391:288-291;以及第5,605,793號和第5,837,458號美國專利。「混排的」核酸是藉由混排程序(諸如本文闡述的任何混排程序)生成的核酸。混排的核酸是藉由舉例而言以人工方式和視情況而定的遞歸方式(實際或虛擬地)重組兩種或更多種核酸(或字符串)生成的。一般而言,在混排過程中使用一個或複數篩選步驟來識別所關注的核酸;此篩選步驟可在任何重組步驟之前或之後進行。在一些(但不是全部)混排實施方式中,期望在選擇之前進行多輪重組,以增加要篩選的池的多樣性。重組和選擇的整個過程可視情況遞歸地重複。取決於上下文,混排可以指重組和選擇的整個過程,或者,作為另一種選擇,可僅指整個過程的重組部分。
如前後文在兩個多核苷酸或多肽序列的背景中所使用的「序列一致性」或「一致性」涉及當在指定的比較窗上對齊最大對應性時為相同的兩個序列中的殘基。當使用與蛋白質有關的序列一致性百分比時,辨識出不一致的殘基位置(其常常藉由保留式胺基酸置換而不同),其中胺基酸殘基置換具有類似化學性質(例如,電荷或疏水性)的其他胺基酸殘基,且因此不改變分子的功能性質。當序列在保留式置換中不同時,可以向上調整序列一致性百分比,以修正置換的保留性質。藉由這種保留式置換而不同的序列被稱為具有「序列相似性」或「相似性」。用於進行這種調整的手段是本領域中具有通常知識者熟知的。通常情況下,這涉及將保留式置換作為部分失配(mismatch)而非完全失配進行評分,從而增加序列一致性百分比。由此,舉例而言,當對一致胺基酸給予1分,而對非保留式置換給予零分時,對保留式置換給予零與1之間的得分。計算保留式置換的得分,例如,如在程式PC/GENE(Intelligenetics,Mountain View,California)中所實施的。
如本文所使用的,「序列一致性的百分比」表達藉由在比較窗上比較兩個最佳對齊序列所確定的值,其中多核苷酸序列在比較窗中的部分可包括相較於用於該兩個序列的最佳對齊的參考序列(不包括添加或刪除)的添加或刪除(即,缺口)。藉由確定在兩個序列中出現一致的核酸鹼基或胺基酸殘基的位置的數目來求得匹配位置的數目;將匹配位置的數目除以比較窗中的位置總數;並將該結果乘以100,求得序列一致性百分比,來計算該百分比。
除非另外說明,否則本文提供的序列一致性/相似性值是指使用GAP版本10採用以下參數獲得的值:使用GAP權重50和長度權重3的核苷酸序列的%一致性和%相似性,以及nwsgapdna.cmp評分矩陣;使用GAP權重8和長度權重2的胺基酸序列的%一致性和%相似性,以及BLOSUM62評分矩陣;或其任何等同程式。「等同程式」是指對於有問題的任何兩個序列,當與GAP版本10產生的對應對齊相比較時,產生具有一致的核苷酸或胺基酸殘基匹配及一致的序列一致性百分比的對齊的任何序列比較程式。
當為了進行相似性評分而使用所界定的胺基酸置換矩陣(例如,BLOSUM62)、缺口存在罰分(gap existence penalty)以及缺口延伸罰分(gap extension penalty)對齊兩個序列,以達到該對序列可能的最高分數時,該兩個序列被「最佳對齊」。胺基酸置換矩陣及其在量化該兩個序列之間的相似性中的用途在本領域中是已知的,並且被描述於例如Dayhoff等人「A model of evolutionary change in proteins(蛋白質中的進化改變模型)」;「Atlas of Protein Sequence and Structure(蛋白質序列及結構的圖譜)」,Vol. 5, Suppl. 3(M. O. Dayhoff編輯),pp. 345-352;Natl. Biomed. Res. Found.,Washington, D.C.;以及Henikoff等人(1992)Proc. Natl. Acad. Sci. USA 89:10915-10919。BLOSUM62矩陣常常用作序列對齊操作流程中的預設評分置換矩陣。缺口存在罰分是針對單一胺基酸缺口在其中一個對齊序列中的引入而施加的,而缺口延伸罰分是針對被插入已經打開的缺口內的每一個額外空的胺基酸位置而施加的。對齊是由在對齊開始和結束處的每一個序列的胺基酸位置界定,並且可視情況藉由一個缺口或複數缺口在一個或兩個序列中的插入來界定,以便達到最高可能分數。儘管可以手動完成最佳對齊和評分,但是該過程可以藉由電腦實施的對齊演算法(例如Altschul等人(1997)Nucleic Acids Res
. 25:3389-3402中描述的有缺口BLAST 2.0)的使用而被促進,並且在National Center for Biotechnology Information網站(www.ncbi.nlm.nih.gov)向大眾開放。可以使用例如可通過www.ncbi.nlm.nih.gov獲得的和Altschul等人在(1997)Nucleic Acids Res.
25:3389-3402中描述的PSI-BLAST來準備包含多重對齊的最佳對齊。
關於與參考序列最佳對齊的胺基酸序列,胺基酸殘基「對應於」參考序列中在該對齊中與該殘基成對的位置。「位置」由數字標示,該數字基於其相對於N-端的位置依序識別該參考序列中的每一個胺基酸。歸因於在確定最佳對齊時必須考慮的刪除、插入、截短、融合等,所以,一般來說,藉由簡單地從N端計數所確定的測試序列中的胺基酸殘基數目不一定與其在該參考序列中的對應位置的數目相同。舉例而言,在對齊的測試序列中存在刪除的情況中,將不存在與刪除位點處的參考序列中的位置對應的胺基酸。當在對齊的參考序列中存在插入時,該插入將不對應於該參考序列中的任何胺基酸位置。在截短或融合的情況中,參考序列或對齊序列中可存在不對應於相應序列中的任何胺基酸的胺基酸拉伸段(stretch)。V. 抗體
還涵蓋針對本發明的RGN多肽的抗體或包括該RGN多肽的核糖核蛋白的抗體,該RGN多肽或核糖核蛋白包含具有如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117所列的胺基酸序列或其活性變體或片段的那些RGN多肽或核糖核蛋白。生成抗體的方法是在本領域中熟知的(參見,舉例而言,Harlow和Lane(1988)Antibodies: A Laboratory Manual,Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y.;以及第4,196,265號美國專利)。這些抗體可用於套組中,用於RGN多肽或核糖核蛋白的偵測和分離。由此,本揭露內容提供了包括特定結合至本文描述的多肽或核糖核蛋白的抗體的套組,該多肽或核糖核蛋白包含舉例而言具有SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117的序列的多肽。VI. 用於結合所關注的靶向序列的系統和核糖核蛋白複合物及其製造方法
本揭露內容提供了一種用於結合所關注的靶向序列的系統,其中該系統包括至少一導引RNA或編碼該至少一導引RNA的核苷酸序列以及至少一RNA導引的核酸酶或編碼該至少一RNA導引的核酸酶的核苷酸序列。導引RNA與所關注的靶向序列雜交,並且還與RGN多肽形成複合物,從而將該RGN多肽導向至與該靶向序列結合。在這些實施方式的一些實施方式中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的胺基酸序列或其活性變體或片段。在各種實施方式中,導引RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性變體或片段。在特定實施方式中,導引RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性變體或片段。該系統的導引RNA可以是單導引RNA或雙導引RNA。在特定實施方式中,該系統包括與導引RNA異源的RNA導引的核酸酶,其中RGN與導引RNA在本質上不是天然複合的。
本文提供的用於結合所關注的靶向序列的系統可以是核糖核蛋白複合物,其是與至少一蛋白質結合的RNA的至少一個分子。本文提供的核糖核蛋白複合物包括作為RNA成分的至少一導引RNA和作為蛋白質成分的RNA導引的核酸酶。此種核糖核蛋白複合物可從天然表現RGN多肽的細胞或生物體中純化,並且已經被工程化,以表現對所關注的靶向序列專一的特定導引RNA。作為另一種選擇,該核糖核蛋白複合物可從已經用編碼RGN多肽和導引RNA的多核苷酸轉化且在允許RGN多肽和導引RNA表現的條件下培養的細胞或生物體中純化。由此,提供了用於製造RGN多肽或RGN核糖核蛋白複合物的方法。此種方法包括在表現了RGN多肽(而在一些實施方式中,表現了導引RNA)的條件下,培養包括編碼RGN多肽的核苷酸序列的細胞,而在一些實施方式中,培養包括編碼導引RNA的核苷酸序列的細胞。然後,可從所培養的細胞的溶胞產物(lysate)中純化RGN多肽或RGN核糖核蛋白。
用於從生物樣本的溶胞產物中純化RGN多肽或RGN核糖核蛋白複合物的方法是本領域中已知的(例如,尺寸排阻層析法及/或親和性層析法、2D-PAGE、HPLC、逆相層析法、免疫沉澱法)。在特定方法中,RGN多肽是重組生成的並且包括純化標記以幫助其純化,其包括但不限於:穀胱甘肽-S-轉移酶(GST)、幾丁質結合蛋白(CBP)、麥芽糖結合蛋白、硫氧還蛋白(TRX)、聚(NANP)、串連親和純化(TAP)示跡物、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu- Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基載物蛋白(BCCP)以及鈣調蛋白。一般而言,使用固定化金屬親和性層析法純化所標記的RGN多肽或RGN核糖核蛋白複合物。應當理解,可單獨地或組合地使用本領域中已知的其他類似方法,包含其他形式的層析法或舉例而言免疫沉澱法。
「分離的」或「純化的」多肽或其生物活性部分基本上或實質上不含在其天然存在的環境中發現的、正常情況下與該多肽相伴或相互作用的成分。因此,分離的或純化的多肽當藉由重組技術被生成時基本上不含其他細胞物質或培養基,或當被化學合成時基本上不含化學前驅物或其他化學物質。基本上不含細胞物質的蛋白質包含具有少於約30%、20%、10%、5%或1%(以乾重計)的污染蛋白質的蛋白質製劑。當重組生成本發明的蛋白質或其生物活性部分時,最佳培養基呈現少於約30%、20%、10%、5%或1%(以乾重計)的化學前驅物或所關注的非蛋白質化學物質。
本文提供的用於結合及/或割裂所關注的靶向序列的特殊方法涉及使用試管內組裝的RGN核糖核蛋白複合物。RGN核糖核蛋白複合物的試管內組裝可以使用本領域中已知的、在允許RGN多肽與導引RNA結合的條件下使RGN多肽與導引RNA接觸的任何方法進行。如本文中使用的,「接觸(contact)」、「接觸(contacting)」、「接觸(contacted)」是指在適合進行期望反應的條件下將期望反應的成分放在一起。RGN多肽可從生物樣本、細胞溶胞產物或培養基中純化,經由試管內轉譯生成,或被化學合成。導引RNA可從生物樣本、細胞溶胞產物或培養基中純化,在試管內被轉譯,或被化學合成。可使RGN多肽和導引RNA在溶液(例如,緩衝食鹽水溶液)中產生接觸以允許RGN核糖核蛋白複合物的試管內組裝。VII. 結合、割裂或修飾靶向序列的方法
本揭露內容提供用於結合、割裂及/或修飾所關注的靶向核苷酸序列的方法。該方法包含向該靶向序列或包括該靶向序列的細胞、胞器或胚胎遞送包括至少一導引RNA或編碼該至少一導引RNA的多核苷酸以及至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸的系統。在這些實施方式的一些實施方式中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的胺基酸序列或其活性變體或片段。在各種實施方式中,導引RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性變體或片段。在特定實施方式中,導引RNA包括tracrRNA,該tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性變體或片段。該系統的導引RNA可以是單導引RNA或雙導引RNA。該系統的RGN可以是無核酸酶反應的RGN,其具有切口酶活性,也可以是融合多肽。在一些實施方式中,融合多肽包括鹼基編輯多肽,舉例而言,胞苷去胺酶或腺苷去胺酶。在其他實施方式中,RGN融合蛋白包括逆轉錄酶。在其他實施方式中,RGN融合蛋白包括多肽,該多肽募集功能性核酸修復複合物的成員,諸如,核苷酸切除修復(NER)或轉錄耦合-核苷酸切除修復(TC-NER)路徑的成員(Wei 等人,2015, PNAS USA 112(27):E3495-504;Troelstra等人,1992, Cell 71:939-953;Marnef等人,2017, J Mol Biol 429(9):1277-1288),如2020年1月27日提交申請的第62/966,203號美國臨時專利申請中所描述的,該美國臨時專利申請的全部內容藉由引用併入本文。在一些實施方式中,RGN融合蛋白包括CSB(van den Boom等人,2004,J Cell Biol 166(1):27-36;van Gool等人,1997,EMBO J 16(19):5955-65;SEQ ID NO:268列出其範例),CSB是TC-NER(核苷酸切除修復)路徑的成員並且在其他成員的募集中起作用。在另外實施方式中,RGNABP融合蛋白包括CSB的活性域,諸如,包括SEQ ID NO:268的胺基酸殘基356-394的CSB的酸性域(Teng等人,2018,Nat Commun 9(1):4115)。
在特定實施方式中,RGN及/或導引RNA對於RGN及/或導引RNA(或編碼RGN及導引RNA中的至少其中之一的(數個)多核苷酸)被引入到的細胞、胞器或胚胎是異源的。
在其中該方法包括遞送編碼導引RNA及/或RGN多肽的多核苷酸的那些實施方式中,細胞或胚胎然後可在導引RNA及/或RGN多肽被表現的條件下培養。在各種實施方式中,該方法包括使靶向序列與RGN核糖核蛋白複合物接觸。RGN核糖核蛋白複合物可包括無核酸酶反應或具有切口酶活性的RGN。在一些實施方式中,核糖核蛋白複合物的RGN是包括鹼基編輯多肽的融合多肽。在某些實施方式中,該方法包括將RGN核糖核蛋白複合物引入包括靶向序列的細胞、胞器或胚胎內。RGN核糖核蛋白複合物可以是從生物樣本中已被純化、重組生成並隨後純化、或如本文所描述的試管內組裝的複合物。在其中與靶向序列或胞器或胚胎接觸的RGN核糖核蛋白複合物已經在試管內被組裝的那些實施方式中,該方法可進一步包括該複合物在與靶向序列、細胞、胞器或胚胎接觸之前的試管內組裝。
可使用本領域中已知的、包含但不限於電穿孔的任何方法將純化的或試管內組裝的RGN核糖核蛋白複合物引入細胞、胞器或胚胎內。作為另一種選擇,可使用本領域中已知的任何方法(例如,電穿孔)將編碼或包括導引RNA的RGN多肽及/或多核苷酸引入細胞、胞器或胚胎內。
在遞送至靶向序列或包括該靶向序列的細胞、胞器或胚胎,或與靶向序列或包括該靶向序列的細胞、胞器或胚胎接觸時,導引RNA以序列特定方式將該RGN導向至與靶向序列結合。在其中RGN具有核酸酶活性的那些實施方式中,RGN多肽在結合後割裂所關注的靶向序列。靶向序列隨後可經由諸如非同源末端連接或用所提供的供體多核苷酸的同源定向修復的內源修復機制而被修飾。
測量RGN多肽與靶向序列的結合的方法是本領域中已知的,且包含:染色質免疫沉澱測定法、凝膠遷移率移位測定法、DNA下拉測定法、報導子測定法(reporter assay)、微量盤捕獲及偵測測定法。同樣地,測量靶向序列的割裂或修飾的方法是本領域中已知的,並且包含試管內或活體內割裂測定法,其中在為了促進降解產物的偵測而將適當標記(例如,放射性同位素、螢光物質)附著至靶向序列的情況下或在未為了促進降解產物的偵測而將適當標記(例如,放射性同位素、螢光物質)附著至靶向序列的情況下,使用PCR、定序或凝膠電泳來確認割裂。作為另一種選擇,可使用切口觸發的指數擴增反應(nicking triggered exponential amplification reaction)(NTEXPAR)測定法(參見,例如,Zhang等人(2016)Chem. Sci.
7:4951-4957)。可以使用Surveyor測定法評價活體內割裂(Guschin等人(2010)Methods Mol Biol
649:247-256)。
在一些實施方式中,該方法涉及與一個以上的導引RNA複合的單一類型的RGN的使用。該一個以上的導引RNA可靶向單一基因的不同區域,也可靶向複數基因。
在其中未提供供體多核苷酸的那些實施方式中,由RGN多肽引入的雙股斷裂可藉由非同源末端連接(NHEJ)修復過程修復。由於NHEJ的易錯性質,雙股斷裂的修復可導致對靶向序列的修飾。如本文所使用的,關於核酸分子的「修飾」是指核酸分子的核苷酸序列的變化,其可以是一個或複數核苷酸的刪除、插入或置換或它們的組合。靶向序列的修飾可導致改變的蛋白質產物的表現或編碼序列的失活。
在其中存在供體多核苷酸的那些實施方式中,供體多核苷酸中的供體序列可在引入的雙股斷裂的修復過程期間被整合至靶向核苷酸序列內或與靶向核苷酸序列交換,導致外源供體序列的引入。因此,供體多核苷酸包括期望被引入所關注的靶向序列內的供體序列。在一些實施方式中,供體序列改變原始靶向核苷酸序列,使得新整合的供體序列將不被RGN辨識和割裂。供體序列的整合可藉由在供體多核苷酸內包含與靶向核苷酸序列側翼的序列具有基本序列一致性的側翼序列來增強,以允許同源導向的修復過程。在其中RGN多肽引入雙股交錯斷裂的那些實施方式中,供體多核苷酸可包括側翼為相容突出部的供體序列,以允許在雙股斷裂的修復期間藉由非同源修復過程將供體序列直接聯接(ligation)至包括突出部的經割裂的靶向核苷酸序列。
在其中該方法涉及使用為切口酶(即,僅能夠割裂雙股多核苷酸的單股)的RGN的那些實施方式中,該方法可包括引入靶向一致的或重疊的靶向序列並割裂多核苷酸的不同股的兩個RGN切口酶。舉例而言,可以將僅割裂雙股多核苷酸的正(+)股的RGN切口酶與僅割裂雙股多核苷酸的負(-)股的第二RGN切口酶一起引入。
在各種實施方式中,提供了用於結合靶向核苷酸序列並偵測靶向序列的方法,其中該方法包括將至少一導引RNA或編碼該至少一導引RNA的多核苷酸和至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎中;表現該導引RNA及/或RGN多肽(如果編碼序列被引入),其中RGN多肽是無核酸酶反應的RGN並且更包括可偵測標記,並且該方法更包括偵測該可偵測標記。該可偵測標記可以與RGN融合為融合蛋白(例如,螢光蛋白),也可以是與RGN多肽綴合或被引入RGN多肽內、可藉由視覺或藉由其他方式偵測的小分子。
本文還提供了用於在靶向序列的調整下調節所關注的靶向序列或基因的表現的方法。該方法包括至少一導引RNA或編碼該至少一導引RNA的多核苷酸和至少一RGN多肽或編碼該至少一RGN多肽的多核苷酸引入細胞、胞器或胚胎內;表現該導引RNA及/或RGN多肽(如果編碼序列被引入),其中該RGN多肽是無核酸酶反應的RGN。在這些實施方式的一些實施方式中,該無核酸酶反應的 RGN是包括如本文所描述的表現調節域(即,表觀遺傳修飾域、轉錄活化域、或轉錄抑制子域)的融合蛋白。
本揭露內容還提供了用於結合及/或修飾所關注的靶向核苷酸序列的方法。該方法包含遞送一系統至該靶向序列或包括該靶向序列的細胞、胞器或胚胎,該系統包括至少一導引RNA或編碼該至少一導引RNA的多核苷酸以及至少一融合多肽或編碼該融合多肽的多核苷酸,該至少一融合多肽包括本發明的RGN和鹼基編輯多肽(舉例而言,胞苷去胺酶或腺苷去胺酶)。
本領域中具有通常知識者將理解,本發明揭露的任一方法可用於靶向單一靶向序列或複數靶向序列。由此,方法包括使用單一RGN多肽與複數相異的導引RNA組合,其可靶向單一基因及/或複數基因內的複數相異序列。本文還涵蓋其中將複數相異的導引RNA與複數相異的RGN多肽組合引入的方法。這些導引RNA和導引RNA/RGN多肽系統可靶向單一基因及/或複數基因內的複數相異序列。
在一個態樣中,本發明提供了含有上述方法和組成物中揭露的任何一個或複數元素的套組。在一些實施方式中,該套組包括載體系統和使用該套組的說明。在一些實施方式中,載體系統包括(a)第一調整元素,該第一調整元素與編碼crRNA序列的DNA和用於在導引序列的上游插入經編碼的crRNA序列的一個或複數插入位點可操作地鏈接,其中當表現時,該導引序列在真核細胞中將CRISPR複合物導向與靶向序列序列特定結合,其中該CRISPR複合物包括與導引RNA多核苷酸複合的CRISPR酵素;及/或(b)第二調整元素,該第二調整元素與酵素寫碼序列可操作地鏈接,該酵素寫碼序列編碼包括核定位序列的該CRISPR酵素。元素可以單獨或組合地被提供,並且可以被提供在諸如小瓶、瓶子或管子的任何適合的容器中。
在一些實施方式中,套組包含一種或多種語言的說明。在一些實施方式中,套組包括一種或多種試劑,其於利用本文描述的一個或複數元素的過程中使用。試劑可以被提供在任何適合的容器中。舉例而言,套組可提供一個或複數反應或儲存緩衝液。試劑可以是以可用於特定測定的形式、或者以在使用前需要添加一個或複數其他成分的形式(例如,以濃縮物或冷凍乾燥形式)被提供。緩衝液可以是任何緩衝液,包含但不限於碳酸鈉緩衝液、碳酸氫鈉緩衝液、硼酸鹽緩衝液、Tris緩衝液、MOPS緩衝液、HEPES緩衝液及它們的組合。在一些實施方式中,緩衝液是鹼性的。在一些實施方式中,緩衝液具有約7至約10的pH。
在一些實施方式中,套組包括與用於插入載體的導引序列對應的一個或複數寡核苷酸,以便可操作地鏈接該導引序列與調整元素。在一些實施方式中,套組包含同源重組模板多核苷酸。在一個態樣中,本發明提供了用於使用CRISPR系統的一個或複數元素的方法。本發明的CRISPR複合物提供了用於修飾靶向多核苷酸的有效手段。本發明的CRISPR複合物具有種類繁多的功用,包含在多種細胞類型中修飾(例如,刪除、插入、易位、滅活、活化、鹼基編輯)靶向多核苷酸。就其本身而言,本發明的CRISPR複合物在例如基因治療、藥物篩選、疾病診斷以及預後中具有廣泛的應用。範例性的CRISPR複合物包括與導引序列複合的CRISPR酵素,該導引序列與靶向多核苷酸內的靶向序列雜交。VIII. 靶向多核苷酸
在一個態樣中,本發明提供了修飾真核細胞中的靶向多核苷酸的方法,其可以是在體內、體外地或在試管內。在一些實施方式中,該方法包括:從人或非人動物或植物(包含微藻類)取樣細胞或細胞群;以及修飾該細胞或該些細胞。培養可以在任何階段體外地發生。甚至可以將該細胞或該些細胞重新引入該非人動物或植物(包含微藻類)中。
使用自然變異性,植物育種者將關於諸如產量、品質、均勻性、耐寒性以及抗害蟲性的期望品質的大多數有用基因組合起來。這些期望品質還包含生長、日長度偏好、溫度要求、花卉或生殖發育的起始日期、脂肪酸含量、抗蟲性、抗病性、線蟲抗性、真菌抗性、除草劑抗性、對各種環境因素(包含乾旱、熱、濕、冷、風以及包含高鹽度的不利土壤條件)的耐受性。這些有用基因的來源包含天然或外來品種、原種(heirloom variety)、野生植物近源種以及例如以誘變劑處置植物材料的誘導突變。使用本發明,向植物育種者提供誘導突變的新工具。據此,本領域中具有通常知識者可以為有用基因來源分析基因體,並且在具有期望特徵或性狀的品種中採用本發明以誘導有用基因的增加,同時比先前的誘變劑更精確,且依此加速並改善植物育種計劃。
RGN系統的靶向多核苷酸可以是對真核細胞是內源或外源的任何多核苷酸。舉例而言,靶向多核苷酸可以是駐留於真核細胞的細胞核中的多核苷酸。靶向多核苷酸可以是編碼基因產物(例如,蛋白質)的序列或非編碼序列(例如,調整多核苷酸或垃圾DNA(junk DNA))。不希望受理論約束,相信靶向序列應與PAM(原型間隔體相鄰模體)相關聯;亦即,CRISPR複合物辨識的短序列。PAM的精確序列和長度要求隨所使用的CRISPR酵素而不同,但PAM通常情況下是與原型間隔體(即,靶向序列)相鄰的2-5個鹼基對序列。
CRISPR複合物的靶向多核苷酸可包含若干疾病關聯基因和多核苷酸以及傳訊生化途徑關聯基因和多核苷酸。靶向多核苷酸的範例包含與傳訊生化途徑關聯的序列,例如,傳訊生化途徑關聯基因或多核苷酸。靶向多核苷酸的範例包含疾病關聯基因或多核苷酸。「疾病關聯」基因或多核苷酸是指:與非疾病控制的組織或細胞相較下,在從感染疾病的組織獲得的細胞中以異常位準或以異常形式產出轉錄或轉譯產物的任何基因或多核苷酸。其可以是一種變得異常高位準表現的基因;其可以是變得異常低位準表現的基因,其中改變的表現與疾病的發生及/或進展相關。疾病關聯基因還指具有(數個)突變或基因變異的基因,該突變或遺傳變異是疾病病因的直接原因或與是疾病病因的基因(例如,因果突變)連鎖不平衡。轉錄或轉譯產物可以是已知的或未知的,並且還可以處於正常或異常位準。疾病關聯基因和多核苷酸的範例可從在全球資訊網上找到的約翰•霍普金斯大學(麻省巴爾的摩)麥庫席克–內森斯遺傳醫學研究所(McKusick-Nathans Institute of Genetic Medicine)和美國國家醫學圖書館(麻省貝西達)(National Library of Medicine(Bethesda, Md.))的國家生物技術資訊中心(National Center for Biotechnology Information)找到。
儘管CRISPR系統在對於其相對容易靶向所關注的基因體序列方面特別有用,但仍然存在RGN可以做什麼來解決因果突變的問題。一種措施是在RGN(較佳是RGN的無活性或切口酶變體)與鹼基編輯酵素或鹼基編輯酵素(諸如,胞苷去胺酶或腺苷去胺酶基編輯器)的活性域之間生成融合蛋白(第9,840,699號美國專利,該美國專利藉由引用併入本文)。在一些實施方式中,該些方法包括使DNA分子與:(a)包括本發明的RGN和諸如去胺酶的鹼基編輯多肽的融合蛋白;及(b)將(a)的融合蛋白靶向DNA股的靶向核苷酸序列的gRNA接觸;其中該DNA分子與融合蛋白及gRNA以有效量並且在適於核苷酸鹼基的脫胺化的條件下接觸。在一些實施方式中,靶向DNA序列包括與疾病或病症關聯的序列,並且其中核苷酸鹼基的脫胺化得到與疾病或病症無關的序列。在一些實施方式中,靶向DNA序列駐留於農作物的對偶基因中,其中所關注的性狀的特定對偶基因導致具有較低農藝價值的植物。核苷酸鹼基的脫胺化導致改善了性狀並增加了植物的農藝價值的對偶基因。
在一些實施方式中,DNA序列包括與疾病或病症關聯的T→C或A→G點突變,並且其中突變體C或G鹼基的脫胺化導致與疾病或病症不關聯的序列。在一些實施方式中,脫胺化修正與疾病或病症關聯的序列中的點突變。
在一些實施方式中,與疾病或病症關聯的序列編碼了蛋白質,並且其中脫胺化將終止密碼子引入與疾病或病症關聯的序列中,導致編碼蛋白質的截短。在一些實施方式中,該接觸在易患有、患有或診斷患有該疾病或病症的受治療者體內進行。在一些實施方式中,該疾病或病症是與基因體中的點突變或單鹼基突變關聯的疾病。在一些實施方式中,該疾病是基因疾病、癌症、代謝疾病或溶酶體貯積病。使用鹼基編輯修飾因果突變
可以使用依賴於本發明的RGN-鹼基編輯器融合蛋白的措施修正的基因遺傳性疾病的範例是Hurler症候群。Hurler症候群也稱為MPS-1,是α-L-艾杜糖醛酸酶(IDUA)缺乏而導致在分子層次上由溶酶體中硫酸乙醯肝素和硫酸皮膚素的累積表徵的溶酶體貯積病的結果。此疾病一般而言是由編碼α-L-艾杜糖醛酸酶的IDUA基因突變引起的遺傳性基因病症。常見的IDUA突變是W402X和Q70X,兩者都是無義突變,導致轉譯過早終止。藉由精確的基因體編輯(PGE)措施很好地解決了這種突變,因為單核苷酸的反轉(舉例而言,藉由鹼基編輯措施)將恢復野生型編碼序列並導致由基因座位內源調節機制控制的蛋白質表現。另外,因為已知異型合子是無症狀的,所以靶向這些突變中的一個突變的PGE療法對於大部分患有此疾病的患者是有用的,因只有突變的對偶基因中的一個需被修正(Bunge等人1994)Hum. Mol. Genet. 3(6):861-866,藉由引用併入本文)。
目前對Hurler症候群的治療包含酵素替代療法以及骨髓移植(Vellodi等人(1997)Arch. Dis. Child. 76(2):92-99;Peters等人(1998)Blood 91(7):2601-2608,藉由引用併入本文)。儘管酵素替代療法對Hurler症候群患者的生存和生活品質具有顯著影響,但這種手段需要昂貴且耗時的每週灌注。額外措施包含在表現載體上遞送IDUA基因或將該基因插入高度表現的基因座位內,諸如,血清白蛋白基因座位內(第9,956,247號美國專利,藉由引用併入本文)。然而,這些措施不能將原始IDUA基因座位恢復到正確的編碼序列。基因體編輯策略具有許多優點,最顯著的是基因表現的調整將受健康個體中存在的天然機制的控制。另外,使用鹼基編輯不一定引起雙股DNA斷裂,這可能藉由破壞腫瘤抑制機制來導致大規模染色體重排、細胞死亡或致癌性。一般策略的目標可以是使用本發明的RGN鹼基編輯器融合蛋白來靶向並修正人基因體中的某些引起疾病的突變。應理解,也可以進行類似措施來靶向藉由鹼基編輯可修正的疾病。還還應理解,也可以使用本發明的RGN來部署用於靶向其他物種(特別是一般家庭寵物或家畜)中引起疾病的突變的類似措施。常見家庭寵物和家畜包含狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、以及包含鮭魚的魚和蝦。藉由靶向刪除修飾因果突變
本發明的RGN在因果突變更複雜的人醫療措施中也有用。舉例而言,諸如弗裡德賴希(Friedreich)氏運動失調症和亨汀頓氏(Huntington)舞蹈症的一些疾病是基因特定區域處的三個核苷酸模體的重複顯著增加的結果,這會影響表現蛋白起作用或被表現的能力。弗裡德賴希(Friedreich)氏運動失調症(FRDA)是一種導致脊髓神經組織進行性退化的體染色體隱性疾病。粒線體中共濟(frataxin,FXN)蛋白質的降低位準導致細胞層次的氧化損傷和鐵缺乏。降低的FXN表現與體細胞和種系FXN基因的內含子1內的GAA三聯體擴增有關。在FRDA患者中,GAA重複往往由超過70個,有時甚至超過1000個(最常見的是600-900個)三聯體組成,而未受影響的個體具有約40個或更少的重複(Pandolfo等人(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人(1996)Science 271:1423-1427;Pandolfo(2002)Adv. Exp. Med. Biol. 516:99-118;全部藉由引用併入本文)。
引起弗裡德賴希(Friedreich)氏運動失調症(FRDA)的三核苷酸重複序列的擴增發生在FXN基因內的限定的基因座位中,所限定的基因座位被稱為FRDA不穩定區域。RNA導引的核酸酶(RGN)可用於切除FRDA患者細胞中的不穩定區域。此措施需要1)RGN和導引RNA序列,該RGN和導引RNA序列可以被程式化,以靶向人基因體中的對偶基因;以及2)RGN和導引序列的遞送措施。特別是當除了功能表現卡匣所需的其他基因元素之外,還要考慮到SpCas9基因和導引RNA的長度時,用於基因體編輯的許多核酸酶(諸如,來自化膿性葡萄球菌(SpyCas9)的常用Cas9核酸酶)太大而無法包裝到腺相關病毒(AAV)載體中。這使得使用SpCas9的措施更加困難。
本發明的某些RNA導引核酸酶可與導引RNA一起被包裝到AAV載體內。包裝兩個導引RNA可能需要第二個載體,但這種措施與諸如SpCas9的較大核酸酶所需要的相較仍然是有利的,這可能需要在兩個載體之間分裂蛋白質序列。本發明涵蓋使用本發明的RGN的策略,其中移除了基因體不穩定區域。這種策略適用於具有類似基因基礎的其他疾病和病症,諸如亨汀頓氏舞蹈症。使用本發明的RGN的類似策略還可適用於具有農藝或經濟重要性的非人動物(包含:狗、貓、馬、豬、牛、羊、雞、驢、蛇、雪貂、以及包含鮭魚的魚和蝦)中的類似疾病和病症。藉由靶向誘變修飾因果突變
本發明的RGN也可以引入可以得到有益結果的破壞性突變。編碼血紅蛋白(特別是β球蛋白鏈(HBB基因))的基因中的基因缺陷可能是許多稱為血紅蛋白病變的疾病(包含鐮狀細胞貧血症和地中海貧血症)的原因。
在成年人中,血紅蛋白是包括兩個α樣球蛋白鍊和兩個β樣球蛋白鏈以及4個血紅素(heme)基團的異四聚體。在成人中,α2β2四聚體被稱為血紅蛋白A(HbA)或成人血紅蛋白。通常情況下,α和β球蛋白鏈以約1:1的比例合成,並且此比例就血紅蛋白和紅血球(RBC)穩定而言似乎是關鍵的。在發育中的胎兒中,生成了不同形式的血紅蛋白(胎兒血紅蛋白(HbF)),其對氧的結合親和力高於血紅蛋白A,使得氧可經由母親的血流遞送到嬰兒的系統。胎兒血紅蛋白也含有兩個α球蛋白鏈,但是代替成人β-球蛋白鏈,其具有兩個胎兒γ-球蛋白鏈(即,胎兒血紅蛋白是α2γ2)。從γ-球蛋白的生成轉換到β-球蛋白的生成的調整相當複雜,且主要涉及γ球蛋白轉錄的向下調整和β球蛋白轉錄的同時向上調整。在妊娠約30週時,胎兒中γ球蛋白的合成開始下降,而β球蛋白的生成增加。到大約10個月齡時,新生兒的血紅蛋白幾乎都是α2β2,但是一些HbF持續到成年期(約為總血紅蛋白的1-3%)。在大多數具有血紅蛋白病變的患者中,編碼γ球蛋白的基因仍然存在,但因於如上所述在靠近分娩時發生正常的基因抑制,表現相對較低。
鐮狀細胞疾病是由β球蛋白基因(HBB)中的V6E突變(DNA層次的GAG至GTG)引起的,其中所得的血紅蛋白被稱為「血紅蛋白S」或「HbS」。在低氧條件下,HbS分子聚集並形成纖維狀沉澱物。這些聚集物使得紅血球異常或「鐮狀化」,導致細胞的靈活性喪失。鐮狀化紅血球不再能夠擠入微血管床,並且可能導致鐮狀細胞患者的血管阻塞性危症。除此之外,鐮狀化紅血球比正常紅血球更脆弱,並傾向於溶血,最終導致患者貧血。
鐮狀細胞患者的治療和管理是終生的課題,涉及抗生素治療、疼痛管理以及急性發作期間的輸血。一種措施是使用羥基脲,其部分地藉由增加γ球蛋白的生成來發揮其效用。然而,慢性羥基脲療法的長期副作用仍然是未知的,並且治療給予了不想要的副作用並且可能在患者之間具有不同的療效。儘管鐮狀細胞治療的療效有所提高,但患者的預期壽命仍然只在50年代中後期,並且關聯的疾病發病率對患者的生活品質具有深遠的影響。
地中海貧血症(α地中海貧血症和β地中海貧血症)也是與血紅蛋白有關的疾病,並且通常情況下涉及減少的球蛋白鏈表現。這可以通過基因調整區域的突變或從導致表現降低或降低位準的球蛋白編碼序列中的或功能性球蛋白中的突變發生。地中海貧血症的治療通常涉及輸血和鐵螯合療法。如果適當的供體可被鑒別,則骨髓移植也用於治療有嚴重地中海貧血症的人,但這種做法可能具有重大風險。
已經提出用於治療SCD和β地中海貧血症的一種措施是增加γ球蛋白的表現,使得HbF在功能上取代異常的成人血紅蛋白。如上所提及,用羥基脲治療SCD患者由於其對增加γ球蛋白表現上的影響而被認為是部分成功的。(DeSimone(1982)Proc Nat'l Acad Sci USA 79(14):4428-31;Ley等人(1982)N. Engl. J. Medicine,307:1469-1475;Ley等人(1983)Blood 62:370-380;Constantoulakis等人(1988)Blood 72(6):1961-1967,均藉由引用併入本文)。增加HbF的表現涉及鑑定其產物在γ球蛋白表現的調整中起功用的基因。一種這樣的基因是BCL11A。BCL11A編碼在成體紅血球前驅細胞中表現的鋅指蛋白,並且其表現的向下調整導致γ球蛋白表現增加(Sankaran等人(2008)Science 322:1839,藉由引用併入本文)。已經提出使用靶向BCL11A基因的抑制性RNA(例如,第2011/0182867號美國專利公開,藉由引用併入本文),但是此技術具有幾個潛在的缺點,包含可能無法實現完全減弱(knock down),這種RNA的遞送可能是有問題的,並且RNA必須連續存在且終生需要多次治療。
本發明的RGN可用於靶向BCL11A增強子區域,以破壞BCL11A的表現,從而增加γ球蛋白表現。這種靶向破壞可藉由非同源末端連接(NHEJ)來實現,因此本發明的RGN靶向BCL11A增強子區域內的特定序列,造成雙股斷裂,並且細胞的機械修復該斷裂,通常情況下同時引入有害突變。類似於針對其他疾病靶向所描述的,本發明的RGN因於其相對小的尺寸使得能夠將RGN及其導引RNA的表現卡匣包裝至用於體內遞送的單一AAV載體中從而具有優於其他已知RGN的優點。使用本發明的RGN的類似策略也可適用於人和具有農藝或經濟重要性的非人動物中的類似疾病和病症。IX. 包括多核苷酸基因修飾後細胞
本文提供了包括已經使用藉由如本文所描述的RGN、crRNA及/或tracrRNA介導媒介的過程修飾的所關注靶向序列的細胞和生物體。在這些實施方式的一些實施方式中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的胺基酸序列或其活性變體或片段。在各種實施方式中,導引RNA包括CRISPR重複序列,該CRISPR重複序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性變體或片段。在特定實施方式中,導引RNA包括tracrRNA,tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性變體或片段。系統的導引RNA可以是單導引RNA或雙導引RNA。
修飾後細胞可以是真核細胞(例如,哺乳動物、植物、昆蟲細胞)或原核細胞。還提供了包括至少一種核苷酸序列的胞器和胚胎,該核苷酸序列已經藉由利用如本文所描述的RGN、crRNA及/或tracrRNA的過程進行了修飾。基因修飾後細胞、生物體、胞器以及胚胎對於經修飾後核苷酸序列可以是異型組合的或同型組合的。
細胞、生物體、胞器或胚胎的染色體修飾可導致改變的表現(向上調整或向下調整)、失活、或改變的蛋白質產物或整合的序列的表現。在其中染色體修飾導致基因不活化或非功能性蛋白質產物表現的那些情形中,基因修飾後細胞、生物體、胞器或胚胎被稱為「剔除(knock out)」。剔除表現型可以是刪除突變(即,至少一個核苷酸的刪除)、插入突變(即,至少一個核苷酸的插入)或無義突變(即,至少一個核苷酸的置換,使得終止密碼子被引入)的結果。
作為另一種選擇,細胞、生物體、胞器或胚胎的染色體修飾可生成「嵌入(knock in)」,「嵌入」由編碼蛋白質的核苷酸序列的染色體整合導致。在這些實施方式的一些實施方式中,編碼序列被整合到染色體內,藉以使得編碼野生型蛋白質的染色體序列被失活,但表現出外源引入的蛋白質。
在其他實施方式中,染色體修飾導致變體蛋白質產物的生成。表現的變體蛋白質產物可具有至少一個胺基酸置換及/或至少一個胺基酸的添加或刪除。當與野生型蛋白質相較時,由改變的染色體序列編碼的變體蛋白質產物可呈現出修飾後的特徵或活性,包含但不限於改變的酶活性或基質(substrate)特定性。
在又一些其他實施方式中,染色體修飾可導致改變的蛋白質表現模式。作為非限制性範例,控制蛋白質產物表現的調整區域中的染色體改變可導致蛋白質產物或改變的組織或時間表現模式的過度表現或向下調整。X. 用於偵測靶向 DNA 或單股 DNA 的套組和方法
一些RGN(例如,如SEQ ID NO:54和137所列的APG09106.1和APG09748)一旦藉由靶向DNA的刪除而被活化則可混雜地割裂靶向單股DNA(ssDNA)。由此,本文提供了用於在樣本中偵測靶向DNA(雙股或單股)的組成物和方法。在一些實施方式中,期望靶向可作為RNA(諸如,舉例而言諸如冠狀病毒的RNA病毒的基因體或基因體的部分)存在。在一些實施方式中,冠狀病毒可以是SARS類冠狀病毒。在進一步的實施方式中,冠狀病毒可以是SARS-CoV-2、SARS-CoV或諸如bat-SL-CoVZC45(寄存編號:MG772933)的bat SARS類冠狀病毒。在靶向作為RNA存在的實施方式中,靶向可被反轉錄為可藉由RGN有效靶向的DNA分子。反轉錄後面可以是諸如本領域中已知的涉及熱循環的RT-PCR方法的擴增反應步驟,後面也可以是諸如RT-AMP(反轉錄-環介導媒介等溫擴增反應)的等溫方法(Notomi等人 Nucleic Acids Res 28: E63, (2000))。
這些組成物和方法涉及不與導引RNA雜交且是非標的靶向ssDNA的偵測器ssDNA的使用。在一些實施方式中,偵測器ssDNA包括可偵測標記,該可偵測標記在割裂偵測器ssDNA後提供可偵測訊號。非限制性範例是包括螢光團/淬滅體(quencher)對的偵測器ssDNA,其中螢光團當偵測器ssDNA是白色(即,未被割裂)時因其訊號藉由緊密相鄰的淬滅體的存在被遏抑而不發熒光。偵測器ssDNA的割裂導致淬滅體的移除,且然後熒光標記被偵測。熒光標記或熒光染劑的非限制性範例包含Cy5、熒光素(例如,FAM、6 FAM、5(6)FAM、FITC)、Cy3、Alexa Fluor®染劑以及德克薩斯紅(Texas Red)。淬滅體的非限制性範例包含Iowa Black®FQ、Iowa Black®RQ、Qx1淬滅體, ATT0淬滅體以及QSY染劑。在一些實施方式中,偵測器ssDNA包括第二淬滅體,諸如,比如ZEN™、TAO™以及黑洞淬滅體(Black Hole Quencher®)的內部淬滅體,其可降低背景而增加訊號偵測。
在其他實施方式中,偵測器ssDNA包括可偵測標記,該可偵測標記在割裂偵測器ssDNA之前提供可偵測訊號,而ssDNA的割裂阻礙或防止該訊號的偵測。這種境況的非限制性範例是包括螢光共振能量轉移(FRET)對的偵測器ssDNA。FRET是能量從第一(供體)熒光團的激發態到緊密相鄰的第二(受體)熒光團發生的無輻射轉移。供體熒光團的發射光譜與受體熒光團的激發光譜重疊。由此,當偵測器ssDNA是白色(即,被割裂)時,受體熒光團將發熒光,而當偵測器ssDNA被割裂時,因為供體熒光團和受體熒光團不再彼此緊密相鄰,所以受體熒光團不再發熒光。FRET供體熒光團和受體熒光團在本領域中是已知的,且包含但不限於青色螢光蛋白(CFP)/綠色熒光蛋白(GFP)、Cy3/Cy5以及GFP/黃色熒光蛋白(YFP)。
在一些實施方式中,偵測器ssDNA具有的長度為約2個核苷酸至約30個核苷酸,包含但不限於:約2、約3、約4、約5、約6、約7、約8、約9、約10、約11、約12、約13、約14、約15、約16、約17、約18、約19、約20、約21、約22、約23、約24、約25個核苷酸、約26個核苷酸、約27個核苷酸、約28個核苷酸、約29個核苷酸以及約30個核苷酸。
偵測DNA分子的靶向DNA的方法包括使樣本與RGN、能夠與RGN和DNA分子中的靶向DNA序列雜交的導引RNA以及不與導引RNA雜交的偵測器單股DNA(ssDNA)接觸,然後,測量由RGN割裂ssDNA的生成的可偵測訊號,從而偵測DNA分子的靶向DNA序列。在一些實施方式中,在RGN和導引RNA的接觸之前或接觸的同時,該方法可包括樣本中的核酸分子的擴增反應步驟。在這些實施方式的一些實施方式中,可使導引RNA將與其雜交的特定序列擴增反應,以增加偵測方法的靈敏度。
其中使用包括偵測器ssDNA這些組成物和方法可偵測靶向DNA的樣本包含了包括或相信包括核酸的任何樣本(例如,DNR或RNA分子)。樣本可從包含純化核酸的合成組合或諸如呼吸拭子(例如,鼻咽拭子)萃取物、細胞溶胞產物、患者樣本、細胞、組織、唾液、血液、血清、血漿、尿液、抽吸物、生檢樣本、腦脊液或生物體(例如,細菌、病毒)的生物樣本的任何來源衍生。
使樣本與RGN、導引RNA和偵測ss器DNA接觸可包含在試管內、體外或體內接觸。在一些實施方式中,偵測器ssDNA及/或RGN及/或導引RNA被固定於(舉例而言)橫向流動裝置上,其中樣本接觸固定化偵測器ssDNA及/或RGN及/或導引RNA。在一些實施方式中,針對偵測器ssDNA上的抗原部分的抗體以從完整偵測器ssDNA分化經割裂的偵測器ssDNA的方式被固定於舉例而言橫向流動裝置上。
在一些實施方式中,該方法更可包括決定樣本中存在的靶向DNA的量。可將測試樣本中的可偵測訊號的測量值與參考測量值(例如,參考樣本的或其包括已知量的靶向DNA的系列參考樣本的測量值)進行比較。
組成物和方法的應用的非限制性範例包含單核苷酸多型性(single-nucleotide polymorphism,SNP)偵測、癌症篩查、細菌感染的偵測、抗生素抗性的偵測以及病毒感染的偵測。
使用本領域已知的任何適合方法可測量藉由RGN割裂ssDNA生成的可偵測訊號,該方法包含但不限於測量熒光訊號、凝膠上的帶的視覺分析、比色變化以及電訊號的存在或不存在。
本發明提供了用於偵測樣本中的DNA分子的靶向DNA的套組,其中該套組包括:RGN多肽、能夠與RGN和DNA分子中的靶向DNA序列雜交的導引RNA以及不與導引RNA雜交的偵測器ssDNA。
本發明還提供了藉由接觸核酸族群割裂單股DNA的方法,其中該族群包括DNA分子的靶向DNA序列和複數個非靶向ssDNA,該非靶向ssDNA具有RGN和能夠與該RGN和靶向DNA序列雜交的導引RNA。
冠詞「一(a)」和「一個(an)」在本文中用於指該冠詞的一或一個以上(即,至少一個)的語法對象。舉例來說,「一多肽」表達一個或複數多肽。
說明書中提及的所有出版物和專利申請案表示本揭露內容所屬領域中具有通常知識者的層次。所有出版物和專利申請案藉由引用併入本文,如同每個單獨的出版物或專利申請案被特定且單獨地表示以藉由引用而被併入。
儘管為了清楚理解的目的已經由說明和範例詳細地描述了前述發明,但顯然可以在所附實施方式的範圍內實行某些改變和修改。
非限制性實施方式包括:
1. 一種核酸分子,包括編碼RNA導引的核酸酶(RGN)多肽的多核苷酸,其中該多核苷酸包括編碼RGN多肽的核苷酸序列,該RGN多肽包括具與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117有至少95%序列一致性的胺基酸序列;
其中,當與能夠與該靶向DNA序列雜交的導引RNA(gRNA)結合時,該RGN多肽能夠以RNA導引的序列特定方式結合DNA分子的靶向DNA序列,以及
其中編碼RGN多肽的該多核苷酸可操作地鏈接至與該多核苷酸異源的啟動子。
2. 如實施方式1的核酸分子,其中該RGN多肽在結合時能夠割裂該靶向DNA序列。
3. 如實施方式2的核酸分子,其中該RGN多肽能夠產生雙股斷裂。
4. 如實施方式2的核酸分子,其中該RGN多肽能夠產生單股斷裂。
5. 如實施方式2的核酸分子,其中該RGN多肽是無核酸酶活性的。
6. 如實施方式1-5中任一實施方式的核酸分子,其中該RGN多肽與鹼基編輯多肽可操作地融合。
7. 如實施方式6的核酸分子,其中該鹼基編輯多肽是去胺酶。
8. 如實施方式7的核酸分子,其中該去胺酶是胞苷去胺酶或腺苷去胺酶。
9. 如實施方式1-8中任一實施方式的核酸分子,其中該RGN多肽包括一個或複數核定位訊號。
10. 如實施方式1-9中任一實施方式的核酸分子,其中該RGN多肽被密碼子最佳化以用於在真核細胞中的表現。
11. 如實施方式1-10中任一實施方式的核酸分子,其中該靶向DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
12. 一種包括實施方式1-11中任一實施方式的核酸分子的載體。
13. 如實施方式12的載體,更包括編碼能夠與該靶向DNA序列雜交的該gRNA的至少一個核苷酸序列。
14. 如實施方式13的載體,其中該導引RNA包括CRISPR RNA,該CRISPR RNA包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的CRISPR重複序列。
15. 如實施方式13或14的載體,其中該gRNA包括tracrRNA。
16. 如實施方式15的載體,其中該tracrRNA具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性。
17. 如實施方式15或16的載體,其中該gRNA是單導引RNA。
18. 如實施方式15或16的載體,其中該gRNA是雙導引RNA。
19. 一種細胞,包括實施方式1-11中任一實施方式的該核酸分子或實施方式12-18中任一實施方式的該載體。
20. 一種用於製造RGN多肽的方法,該方法包括在其中該RGN多肽被表現的條件下培養實施方式18的該細胞。
21. 一種用於製造RGN多肽的方法,該方法包括將異源核酸分子引入細胞內,該異源核酸分子包括編碼RNA導引的核酸酶(RGN)多肽的核苷酸序列,該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列;
其中,當與能夠與靶向DNA序列雜交的導引RNA(gRNA)結合時,該RGN多肽能夠以RNA導引的序列特定方式結合DNA分子的該靶向DNA序列,
並且在其中該RGN多肽被表現的條件下,培養該細胞。
22. 如實施方式20或21的方法,更包括純化該RGN多肽。
23. 如實施方式20或21的方法,其中該細胞進一步表現一個或複數導引RNA,該一個或複數導引RNA結合至該RGN多肽,以形成RGN核糖核蛋白複合物。
24. 如實施方式23的方法,更包括純化該RGN核糖核蛋白複合物。
25. 一種包括編碼CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中該crRNA包括間隔體序列和CRISPR重複序列,其中該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列;
其中,導引RNA包括:
a)該crRNA;以及視情況而定
b)能夠與該crRNA的該CRISPR重複序列雜交的反式活化的CRISPR RNA(tracrRNA);
當該導引RNA與RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的間隔體序列以序列特定方式與DNA分子的靶向DNA序列雜交,並且
其中編碼crRNA的該多核苷酸可操作地鏈接至與該多核苷酸異源的啟動子。
26. 一種包括實施方式25的核酸分子的載體。
27. 如實施方式26的載體,其中該載體更包括編碼該tracrRNA的多核苷酸。
28. 如實施方式27的載體,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性的核苷酸序列。
29. 如實施方式27或28的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與相同啟動子可操作地鏈接,並且被編碼為單導引RNA。
30. 如實施方式27或28的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與獨立啟動子可操作地鏈接。
31. 如實施方式26-30中任一實施方式的載體,其中該載體更包括編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列。
32. 一種包括編碼反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性的核苷酸序列;
其中導引RNA包括:
a)該tracrRNA;以及
b)包括間隔體序列和CRISPR重複序列的crRNA,其中該tracrRNA能夠與該crRNA的該CRISPR重複序列雜交;
當該導引RNA與RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的間隔體序列以序列特定方式與DNA分子的靶向DNA序列雜交;並且
其中編碼tracrRNA的該多核苷酸可操作地鏈接至與該多核苷酸異源的啟動子。
33. 一種包括實施方式32的核酸分子的載體。
34. 如實施方式33的載體,其中該載體更包括編碼該crRNA的多核苷酸。
35. 如實施方式34的載體,其中該crRNA的CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列。
36. 如實施方式34或35的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與相同啟動子可操作地鏈接,並被編碼為單導引RNA。
37. 如實施方式34或35的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與獨立啟動子可操作地鏈接。
38. 如實施方式33-37中任一實施方式的載體,其中該載體更包括編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列。
39. 一種用於結合DNA分子的靶向DNA序列的系統,該系統包括:
a)能夠與該靶向DNA序列雜交的一個或複數導引RNA或包括編碼該該一個或複數導引RNA(gRNA)的核苷酸序列的一個或複數多核苷酸;以及
b)RNA導引的核酸酶(RGN)多肽或包括編碼該RGN多肽的核苷酸序列的多核苷酸,該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列;
其中編碼該一個或複數導引RNA及編碼該RGN多肽的該核苷酸序列中的每一個可操作地鏈接至與該核苷酸序列異源的啟動子;以及
其中該一個或複數導引RNA能夠與該RGN多肽形成複合物,從而將該RGN多肽導向至與該DNA分子的該靶向DNA序列結合。
40. 如實施方式39的系統,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列。
41. 如實施方式39-40中任一實施方式的系統,其中該gRNA包括tracrRNA。
42. 如實施方式41的系統,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性的核苷酸序列。
43. 如實施方式41或42的系統,其中該gRNA是單導引RNA(sgRNA)。
44. 如實施方式41或42的系統,其中該gRNA是雙導引RNA。
45. 如實施方式39-44中任一實施方式的系統,其中該靶向DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
46. 如實施方式39-45中任一實施方式的系統,其中該靶向DNA序列是在細胞內。
47. 如實施方式46的系統,其中該細胞是真核細胞。
48. 如實施方式47的系統,其中該真核細胞是植物細胞。
49. 如實施方式47的系統,其中該真核細胞是哺乳動物細胞。
50. 如實施方式47的系統,其中該真核細胞是昆蟲細胞。
51. 如實施方式47的系統,其中該細胞是原核細胞。
52. 如實施方式39-51中任一實施方式所述的系統,其中,當被轉錄時,該一個或複數導引RNA能夠與該靶向DNA序列雜交,並且該導引RNA能夠與該RGN多肽形成複合物,從而導向該靶向DNA序列的割裂。
53. 如實施方式52的系統,其中該RGN多肽能夠產生雙股斷裂。
54. 如實施方式52的系統,其中該RGN多肽能夠產生單股斷裂。
55. 如實施方式52的系統,其中該RGN多肽是無核酸酶反應的。
56. 如實施方式39-55中任一實施方式的系統,其中該RGN多肽可操作地鏈接至鹼基編輯多肽。
57. 如實施方式56的系統,其中該鹼基編輯多肽是去胺酶。
58. 如實施方式57的系統,其中該去胺酶是胞苷去胺酶或腺苷去胺酶。
59. 如實施方式39-58中任一實施方式的系統,其中該RGN多肽包括一個或複數核定位訊號。
60. 如實施方式39-59中任一實施方式的系統,其中該RGN多肽被密碼子最佳化以用於在真核細胞中的表現。
61. 如實施方式39-60中任一實施方式的系統,其中包括編碼該一個或複數導引RNA的核苷酸序列的多核苷酸和包括編碼RGN多肽的該核苷酸序列的多核苷酸被安置於一個載體上。
62. 如實施方式39-61中任一實施方式的系統,其中該系統更包括一個或複數供體多核苷酸或編碼該一個或複數供體多核苷酸的一個或複數核苷酸序列。
63. 一種用於結合DNA分子的靶向DNA序列的方法,包括將如實施方式39-62中任一實施方式的系統遞送至該靶向DNA序列或包括該靶向DNA序列的細胞。
64. 如實施方式63的方法,其中該RGN多肽或該導引RNA更包括可偵測標記,從而允許該靶向DNA序列的偵測。
65. 如實施方式63的方法,其中該導引RNA或該RGN多肽更包括表現調節子,從而調節該靶向DNA序列的表現或在該靶向DNA序列的轉錄控制下的基因的表現。
66. 一種用於割裂或修飾DNA分子的靶向DNA序列的方法,包括將如實施方式39-62中任一實施方式的系統遞送至該靶向DNA序列或包括該DNA分子的細胞,並且發生該靶向DNA序列的割裂或修飾。
67. 如實施方式66的方法,其中該修飾後靶向DNA序列包括異源DNA插入該靶向DNA序列內。
68. 如實施方式66的方法,其中該修飾後靶向DNA序列包括從該靶向DNA序列刪除至少一核苷酸。
69. 如實施方式66的方法,其中該修飾後靶向DNA序列包括該靶向DNA序列中至少一核苷酸的突變。
70. 一種用於結合DNA分子的靶向DNA序列的方法,該方法包括:
a)在適於形成RGN核糖核苷酸複合物的條件下,藉由組合下列,以在試管內組裝該RNA導引的核酸酶(RGN)核糖核苷酸複合物:
i)能夠與該靶向DNA序列雜交的一個或複數導引RNA;以及
ii)RGN多肽,包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列;以及
b)使該靶向DNA序列或包括該靶向DNA序列的細胞與該在試管內組裝的RGN核糖核苷酸複合物接觸;
其中該一個或複數導引RNA與該靶向DNA序列雜交,從而將該RGN多肽導向至與該靶向DNA序列結合。
71. 如實施方式70的方法,其中該RGN多肽或該導引RNA更包括可偵測標記,從而允許該靶向DNA序列的偵測。
72. 如實施方式70的方法,其中該導引RNA或該RGN多肽更包括表現調節子,從而允許該靶向DNA序列的表現的調節。
73. 一種用於割裂及/或修飾DNA分子的靶向DNA序列的方法,包括使該DNA分子與下列接觸:
a)RNA導引的核酸酶(RGN)多肽,其中該RGN包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸;以及
b)能夠將(a)的RGN靶向該靶向DNA序列的一個或複數導引RNA;
其中該一個或複數導引RNA與該靶向DNA序列雜交,從而將該RGN多肽導向至與該靶向DNA序列結合,並且發生該靶向DNA序列的割裂及/或修飾。
74. 如實施方式73的方法,其中由該RGN多肽進行的割裂產生了雙股斷裂。
75. 如實施方式73的方法,其中由該RGN多肽進行的割裂產生了單股斷裂。
76. 如實施方式73的方法,其中該RGN多肽是無核酸酶反應的。
77. 如實施方式73-76中任一實施方式的方法,其中該RGN多肽可操作地鏈接至鹼基編輯多肽。
78. 如實施方式77的方法,其中該鹼基編輯多肽包括脫氨酶。
79. 如實施方式78的方法,其中該去胺酶是胞苷去胺酶或腺苷去胺酶。
80. 如實施方式73-79中任一實施方式的方法,其中該修飾後靶向DNA序列包括異源DNA插入該靶向DNA序列內。
81. 如實施方式73-79中任一實施方式的方法,其中該修飾後靶向DNA序列包括從該靶向DNA序列中刪除至少一核苷酸。
82. 如實施方式73-79中任一實施方式的方法,其中該修飾後靶向DNA序列包括該靶向DNA序列中至少一核苷酸的突變。
83. 如實施方式70-82中任一實施方式的方法,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列。
84. 如實施方式70-83中任一實施方式的方法,其中該gRNA包括tracrRNA。
85. 如實施方式84的方法,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性的核苷酸序列。
86. 如實施方式84或85的方法,其中該gRNA是單導引RNA(sgRNA)。
87. 如實施方式84或85的方法,其中該gRNA是雙導引RNA。
88. 如實施方式63-87中任一實施方式的方法,其中該靶向DNA序列與原型間隔體相鄰模體(PAM)相鄰地被安置。
89. 如實施方式63-88中任一實施方式的方法,其中該靶向DNA序列是在細胞內。
90. 如實施方式89的方法,其中該細胞是真核細胞。
91. 如實施方式90的方法,其中該真核細胞是植物細胞。
92. 如實施方式90的方法,其中該真核細胞是哺乳動物細胞。
93. 如實施方式90的方法,其中該真核細胞是昆蟲細胞。
94. 如實施方式89的方法,其中該細胞是原核細胞。
95. 如實施方式89-94中任一實施方式的方法,更包括在其中該RGN多肽被表現且割裂該靶向DNA序列以生成包括修飾後DNA序列的DNA分子的條件下培養該細胞;以及選擇包括該修飾後靶向DNA序列的細胞。
96. 一種細胞,包括如實施方式95的方法的修飾後靶向DNA序列。
97. 如實施方式96的細胞,其中該細胞是真核細胞。
98. 如實施方式97的方法,其中該真核細胞是植物細胞。
99. 一種植物,包括如實施方式98的細胞。
100. 一種種子,包括實施方式98的細胞。
101. 如實施方式97的細胞,其中該真核細胞是哺乳動物細胞。
102. 如實施方式98的細胞,其中該真核細胞是昆蟲細胞。
103. 如實施方式96的細胞,其中該細胞是原核細胞。
104. 一種利用針對基因遺傳性疾病的因果突變的修正來生成基因修飾細胞的方法,該方法包括將下列引入該細胞內:
a)RNA導引的核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸與啟動子可操作地鏈接,以賦能該RGN多肽在該細胞中的表現;以及
b)導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸與啟動子可操作地鏈接,以賦能該gRNA在該細胞中的表現,
藉以,該RGN和gRNA靶向該因果突變的該基因體位置並修飾該基因體序列以除去該因果突變。
105. 如實施方式104的方法,其中該RGN與鹼基編輯多肽可操作地鏈接。
106. 如實施方式105的方法,其中該鹼基編輯多肽是脫氨酶。
107. 如實施方式106的方法,其中該脫氨酶是是胞苷去胺酶或腺苷去胺酶。
108. 如實施方式104-107中任一實施方式的方法,其中該細胞是動物細胞。
109. 如實施方式104-107中任一實施方式的方法,其中該細胞是哺乳動物細胞。
110. 如實施方式108的方法,其中該細胞是從狗、貓、小鼠、大鼠、兔、馬、牛、豬或人取得的。
111. 如實施方式108的方法,其中該基因遺傳性疾病是單核苷酸多型性引起的。
112. 如實施方式111的方法,其中該基因遺傳性疾病是賀勒氏(Hurler)症候群。
113. 如實施方式112的方法,其中該gRNA更包括靶向靠近該因果單核苷酸多型性的區域的間隔體序列。
114. 一種利用針對引起疾病的不穩定基因體區域中的刪除來生成基因修飾細胞的方法,該方法包括將下列引入該細胞內:
a)RNA導引的核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸與啟動子可操作地鏈接,以賦能該RGN多肽在該細胞中的表現;以及
b)導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸與啟動子可操作地鏈接,以賦能該gRNA在該細胞中的表現,並且進一步地其中該gRNA包括靶向該不穩定基因體區域的5'側翼的間隔體序列;以及
c)第二導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸與啟動子可操作地鏈接,以賦能該第二gRNA在該細胞中的表現,並且進一步地其中該第二gRNA包括靶向該不穩定基因體區域的3'側翼的間隔體序列;
藉以,該RGN和該兩個gRNA靶向該不穩定基因體區域,並且該不穩定基因體區域的至少一部分被除去。
115. 如實施方式114的方法,其中該細胞是動物細胞。
116. 如實施方式114的方法,其中該細胞是哺乳動物細胞。
117. 如實施方式115的方法,其中該細胞是從狗、貓、小鼠、大鼠、兔、馬、牛、豬或人取得的。
118. 如實施方式115的方法,其中該基因遺傳性疾病是弗裡德賴希氏運動失調症(Friedreich's ataxia)或亨汀頓氏舞蹈症(Huntington’s Disease)。
119. 如實施方式118的方法,其中該第一gRNA更包括靶向該不穩定基因體區域內的或靠近該不穩定基因體區域的區域的間隔體序列。
120. 如實施方式118的方法,其中該第二gRNA更包括靶向該不穩定基因體區域內的或靠近該不穩定基因體區域的區域的間隔體序列。
121. 一種用於生成具有降低的BCL11A mRNA和蛋白質表現的基因修飾後哺乳動物造血祖細胞的方法,該方法包括將下列引入分離的人造血先驅細胞內:
a)RNA導引的核酸酶(RGN)多肽或編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列,其中編碼該RGN多肽的該多核苷酸與啟動子可操作地鏈接,以賦能該RGN多肽在該細胞中的表現;以及
b)導引RNA(gRNA)或編碼該gRNA的多核苷酸,其中該gRNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列一致性的核苷酸序列,其中編碼該gRNA的該多核苷酸與啟動子可操作地鏈接,以賦能該gRNA在該細胞中的表現,
藉以,該RGN和該gRNA在細胞中表現並在BCL11A增強子區域處割裂,導致該人造血先驅細胞的基因修飾並降低BCL11A的mRNA及/或蛋白質表現。
122. 如實施方式121的方法,其中該gRNA更包括靶向位於該BCL11A增強子區域內的或靠近該BCL11A增強子區域的區域的間隔體序列。
123. 如實施方式104-122中任一實施方式的方法,其中該導引RNA包括tracrRNA,該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列一致性的核苷酸序列。
124. 一種用於結合DNA分子的靶向DNA序列的系統,該系統包括:
a)能夠與該靶向DNA序列雜交的一個或複數導引RNA,或包括編碼該一個或複數導引RNA(gRNA)的一個或複數核苷酸序列的一個或複數多核苷酸;以及
b)RNA導引的核酸酶(RGN)多肽,包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列一致性的胺基酸序列;
其中該一個或複數導引RNA能夠與該靶向DNA序列雜交,並且
其中該一個或複數導引RNA與該RGN多肽形成複合物,從而將該RGN多肽導向至與該DNA分子的該靶向DNA序列結合。
125. 如實施方式124的系統,其中該RGN多肽是無核酸酶反應的或能夠作為切口酶。
126. 如實施方式124或125的系統,其中該RGN多肽與鹼基編輯多肽可操作地融合。
127. 如實施方式126的系統,其中該鹼基編輯多肽是去胺酶。
128. 如實施方式127的系統,其中該去胺酶是胞苷去胺酶或腺苷去胺酶。
129. 一種用於偵測樣本中的DNA分子的靶向DNA序列的方法,該方法包括:
a)使該樣本與下列接觸:
i)RNA導引的核酸酶(RGN)多肽,包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列一致性的胺基酸序列,其中當與能夠與該靶向DNA序列雜交的導引RNA(gRNA)結合時,該RGN多肽以RNA導引的序列特定方式結合DNA分子的該靶向DNA序列;
ii)該導引RNA;以及
iii)不與該導引RNA雜交的偵測器單股DNA(ssDNA);以及
b)測量藉由該RGN割裂該偵測器ssDNA生成的可偵測訊號,從而偵測該靶向DNA序列。
130. 如實施方式129的方法,其中該樣本包括來自細胞溶胞產物的DNA分子。
131. 如實施方式129的方法,其中該樣本包括細胞。
132. 如實施方式131的方法,其中該細胞是真核細胞。
133. 如實施方式129的方法,其中包括該靶向DNA的DNA分子藉由存在於包括RNA的樣本中的RNA模板分子的反轉錄生成。
134. 如實施方式133的方法,其中該RNA模板分子是RNA病毒。
135. 如實施方式134的方法,其中該RNA病毒是冠狀病毒。
136. 如實施方式135的方法,其中該冠狀病毒是bat SARS類冠狀病毒、SARS-CoV或SARS-CoV-2。
137. 如實施方式133-136中任一實施方式的方法,其中包括RNA的該樣本是從包括細胞的樣本取得的。
138. 如實施方式129-137中任一實施方式的方法,其中該偵測器ssDNA包括螢光團/淬滅體對。
139. 如實施方式129-137中任一實施方式的方法,其中該偵測器ssDNA包括螢光共振能量轉移(FRET)對。
140. 如實施方式129-139中任一實施方式的方法,其中該導引RNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列一致性的核苷酸序列。
141. 如實施方式129-140中任一實施方式的方法,其中該導引RNA包括tracrRNA。
142. 如實施方式141的方法,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列一致性的核苷酸序列。
143. 如實施方式141或142的方法,其中該導引RNA是單導引RNA。
144. 如實施方式141或142的方法,其中該導引RNA是雙導引RNA。
145. 如實施方式129-144中任一實施方式的方法,其中該方法更包括在步驟a)的接觸之前或同時使樣本中的核酸擴增反應。
146. 如實施方式145的方法,其中該擴增反應是藉由RNA分子的反轉錄生成的DNA分子的擴增反應。
147. 一種用於偵測樣本中的DNA分子的靶向DNA序列的套組,該套組包括:
a)RNA導引的核酸酶(RGN)多肽,包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列一致性的胺基酸序列,其中當與能夠與該靶向DNA序列雜交的導引RNA結合時,該RGN多肽能夠以RNA導引的序列特定方式結合DNA分子的該靶向DNA序列;
b)該導引RNA;以及
c)不與導引RNA雜交的偵測器單股DNA(ssDNA)。
148. 如實施方式147的套組,其中該偵測ssDNA包括螢光團/淬滅體對。
149. 如實施方式147的套組,其中該偵測ssDNA包括螢光共振能量轉移(FRET)對。
150. 如實施方式147-149中任一實施方式的套組,其中該導引RNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列一致性的核苷酸序列。
151. 如實施方式147-150中任一實施方式的套組,其中該導引RNA包括tracrRNA。
152. 如實施方式151的套組,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列一致性的核苷酸序列。
153. 如實施方式151或152的套組,其中該導引RNA是單導引RNA。
154. 如實施方式151或152的方法,其中該導引RNA是雙導引RNA。
155. 一種割裂單股DNA的方法,該方法包括使核酸族群與下列接觸,其中該族群包括DNA分子和複數個非靶向ssDNA,該DNA分子包括靶向DNA序列:
a)RNA導引的核酸酶(RGN)多肽,包括具有與SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列一致性的胺基酸序列,其中當與能夠與該靶向DNA序列雜交的導引RNA結合時,該RGN多肽能夠以RNA導引的序列特定方式結合該靶向DNA序列;以及
b)該導引RNA
其中該RGN多肽割裂該複數非靶向ssDNA。
156. 如實施方式155的方法,其中該核酸族群在細胞溶胞產物內。
157. 如實施方式155或156的方法,其中該導引RNA包括CRISPR重複序列,該CRISPR重複序列包括具有與SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列一致性的核苷酸序列。
158. 如實施方式155-157中任一實施方式的方法,其中該導引RNA包括tracrRNA。
159. 如實施方式158的方法,其中該tracrRNA包括具有與SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列一致性的核苷酸序列。
160. 如實施方式158或159的方法,其中該導引RNA是單導引RNA。
161. 如實施方式158或159的方法,其中該導引RNA是雙導引RNA。
162. 一種包括編碼CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中該crRNA包括間隔體序列和CRISPR重複序列,其中該CRISPR重複序列包括具有與SEQ ID NO:240至少95%序列一致性的核苷酸序列;
其中,導引RNA包括:
a)該crRNA;以及視情況而定
b)能夠與該crRNA的該CRISPR重複序列雜交的反式活化的CRISPR RNA(tracrRNA);
當該導引RNA與RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的間隔體序列以序列特定方式與DNA分子的靶向DNA序列雜交,並且
其中編碼crRNA的該多核苷酸可操作地鏈接至與該多核苷酸異源的啟動子。
163. 一種包括實施方式162的核酸分子的載體。
164. 如實施方式163的載體,其中該載體更包括編碼該tracrRNA的多核苷酸。
165. 如實施方式164的載體,其中該tracrRNA包括具有與SEQ ID NO:241至少95%序列一致性的核苷酸序列。
166. 如實施方式164或165的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與相同啟動子可操作地鏈接,並且被編碼為單導引RNA。
167. 如實施方式164或165的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與獨立啟動子可操作地鏈接。
168. 如實施方式163-167中任一實施方式的載體,其中該載體更包括編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:235至少95%序列一致性的胺基酸序列。
169. 一種包括編碼反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,該tracrRNA包括具有與SEQ ID NO:241至少95%序列一致性的核苷酸序列;
其中導引RNA包括:
a)該tracrRNA;以及
b)包括間隔體序列和CRISPR重複序列的crRNA,其中該tracrRNA能夠與該crRNA的該CRISPR重複序列雜交;
當該導引RNA與RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的間隔體序列以序列特定方式與DNA分子的靶向DNA序列雜交;並且
其中編碼tracrRNA的該多核苷酸可操作地鏈接至與該多核苷酸異源的啟動子。
170. 一種包括實施方式169的核酸分子的載體。
171. 如實施方式170的載體,其中該載體更包括編碼該crRNA的多核苷酸。
172. 如實施方式171的載體,其中該crRNA的CRISPR重複序列包括具有與SEQ ID NO:240至少95%序列一致性的核苷酸序列。
173. 如實施方式171或172的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與相同啟動子可操作地鏈接,並被編碼為單導引RNA。
174. 如實施方式171或172的載體,其中編碼該crRNA的該多核苷酸和編碼該tracrRNA的該多核苷酸與獨立啟動子可操作地鏈接。
175. 如實施方式170-174中任一實施方式的載體,其中該載體更包括編碼該RGN多肽的多核苷酸,其中該RGN多肽包括具有與SEQ ID NO:235至少95%序列一致性的胺基酸序列。
提供以下範例是為了說明而不是為了限制。
範例範例 1. RNA 導引的核酸酶的鑒別
鑒別了十七種相異CRISPR關聯的RNA導引的核酸酶(RGN’s)並描述於下表1中。表1提供了每一個RGN的名稱、其胺基酸序列、其衍生自的來源、以及經處理的crRNA及tracrRNA序列(參見鑒別方法的範例2)。表1進一步提供了通用的單導引RNA(sgRNA)序列,其中poly-N表示確定sgRNA的核酸靶向序列的間隔體序列的位置。RGN系統APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG02675.1、APG01405.1、APG06250.1、APG04293.1以及APG01308.1)在UNANNA的tracrRNA的髮夾莖的基部具有保留序列(SEQ ID NO:8)。對於APG05712.1,相同位置的序列是CNANNG (SEQ ID NO:37)。對於APG01658.1,相同位置的序列是CNANNU (SEQ ID NO:45)。對於RGN系統APG06498.1和APG06877.1,在tracrRNA的髮夾莖的基部的保留序列為UNANNG(SEQ ID NO:53)。對於APG09882.1和APG06646.1,相同位置的序列是UNANNC(SEQ ID NO:68)。 對於APG09053.1,相同位置的序列是CNANNU(SEQ ID NO:102)。表 1 : SEQ ID 和 CRISPR 關聯系統的概述
範例 2 :導引 RNA 鑒別和 sgRNA 構築體
| RGN ID | SEQ ID NO | 來源 | crRNA 重複序列 (SEQ ID NO) | tracrRNA (SEQ ID NO) | sgRNA (SEQ ID NO) |
| APG05733.1 | 1 | 芽孢桿菌屬 (Bacillus sp.) | 2 | 3 | 4 |
| APG06207.1 | 9 | 金黃桿菌屬 (Chryseobacterium sp.) | 10 | 11 | 12 |
| APG01647.1 | 16 | 鞘氨醇桿菌屬 (Sphingobacterium sp.) | 17 | 18 | 19 |
| APG08032.1 | 23 | 金黃桿菌屬 | 24 | 25 | 26 |
| APG05712.1 | 30 | 布魯氏桿菌屬 (Brucella sp.) | 31 | 32 | 33 |
| APG01658.1 | 38 | 金黃色葡萄球菌屬 (Staphylococcus sp.) | 39 | 40 | 41 |
| APG06498.1 | 46 | 芽孢桿菌屬 | 47 | 48 | 49 |
| APG09106.1 | 54 | 短芽孢桿菌 屬 ( Brevibacillus sp.) | 55 | 56 | 57 |
| APG09882.1 | 61 | 糞腸球菌屬 (Enterococcus sp.) | 62 | 63 | 64 |
| APG02675.1 | 69 | 鞘氨醇桿菌屬 | 70 | 71 | 72 |
| APG01405.1 | 75 | 金黃桿菌屬 | 76 | 77 | 78 |
| APG06250.1 | 82 | 金黃桿菌屬 | 83 | 84 | 85 |
| APG06877.1 | 89 | 芽孢桿菌屬 (Bacillus sp.) | 90 | 91 | 92 |
| APG09053.1 | 95 | 根瘤菌屬 (Rhizobium sp.) | 96 | 97 | 98 |
| APG04293.1 | 103 | 香味菌 屬 ( Myroides sp.) | 104 | 105 | 106 |
| APG01308.1 | 110 | 金黃桿菌屬 (Chryseobacterium sp.) | 111 | 112 | 113 |
| APG06646.1 | 117 | 芽孢桿菌屬 | 118 | 119 | 120 |
使天然表現了研究中的RNA導引的核酸酶系統的細菌培養物生長至對數中期(OD600為~0.600)、製成丸狀物並快速冷凍。使用mirVANA miRNA分離套組(Life Technologies,Carlsbad,CA)從丸狀物中分離RNA,並使用NEBNext Small RNA Library Prep套組(NEB,Beverly,MA)從分離的RNA製備定序庫。將庫製備物(library prep)在6%聚丙烯醯胺凝膠上分級(fractionated),以捕獲小於200nt的RNA物種,從而分別偵測crRNA和tracrRNA。深度定序(75 bp配對末端)由服務提供者(MoGene,St.Louis,MO)在Next Seq 500(高輸出套組)上進行。使用Cutadapt對讀數進行品質修整,並使用Bowtie2將讀數映射到參考基因體。用python編寫定製RNAseq管線來偵測crRNA和tracrRNA轉錄本。藉由天然重複間隔體陣列的序列覆蓋來確定經處理的crRNA邊界。使用許可的BLASTn參數鑒別tracrRNA的抗重複部分。藉由鑒別含有抗重複的轉錄本,RNA定序深度確認經處理的tracrRNA的邊界。使用NUPACK(RNA摺疊軟體)進行二次結構預測來進行RNA的手動施治(curation)。sgRNA卡匣是藉由DNA合成而被製備的,並且一般而言被如下設計(5'->3'):20-30 bp間隔體序列,在其3’末端可操作地鏈接至crRNA的經處理的重複部分,可操作地鏈接至4 bp非互補鏈接子(AAAG;SEQ ID NO:123),在其3’末端可操作地鏈接至經處理的tracrRNA。也可以使用其他4 bp非互補鏈接子。
對於試管內測定,藉由用GeneArt™ Precision gRNA合成套組(ThermoFisher)試管內轉錄sgRNA卡匣來合成sgRNA。每一個RGN多肽的經處理的crRNA和tracrRNA序列被鑒別並被列於表1中。參見下文針對PAM庫1和2構築的sgRNA。範例 3 :每一個 RGN 的 PAM 需要的確定
使用基本上改寫自Kleinstiver等人(2015)Nature
523:481-485和Zetsche等人(2015)Cell
163:759-771的PAM消耗測定法確定每一個RGN的PAM需要。簡言之,在pUC18主鏈(ampR)中產生兩個質體庫(L1和L2),每個質體庫含有側翼為8個隨機核苷酸(即,PAM區域)的相異的30 bp原型間隔體(靶向)序列。每一個RGN的庫1和庫2的靶向序列和側翼PAM區域列於表2中。
將庫各別電穿孔到帶有pRSF-1b表現之載體的大腸桿菌(E. coli )BL21(DE3)細胞內,該載體含有本發明的RGN(針對大腸桿菌而被密碼子最佳化)以及含有與L1或L2中的原型間隔體對應的間隔體序列的同族(cognate)sgRNA。在轉化反應中使用足夠的庫質體以獲得>106 CFU。pRSF-1b主鏈中的RGN和sgRNA兩者都在T7啟動子的控制下。使轉化反應恢復1小時,此後,將其稀釋到含有卡本西林和康黴素的LB培養基內並隔夜生長。第二天,將混合物稀釋到自誘導的Overnight Express™ Instant TB培養基(Millipore Sigma)內以允許RGN和sgRNA的表現,並額外生長4小時或20小時,此後,將細胞旋轉沉降(spun down)並以Mini-prep套組(Qiagen,Germantown,MD)分離質體DNA。在適當的sgRNA存在下,含有可被RGN辨識的PAM的質體將被割裂,導致從族群中他們的除去。含有不可被RGN辨識、或被轉化至不含適當sgRNA的細菌內的PAM的質體將存活並複製。未切割的質體的PAM和原型間隔體區域被PCR擴增並按照公開的操作流程(16s-環境基因體(Metagenomic)庫製備物指南15044223B,Illumina,San Diego,CA)被製備以用於定序。由服務提供者(MoGene,St. Louis,MO)在MiSeq(Illumina)上進行深度定序(75bp單端讀數)。通常情況下,每擴增子獲得1-4M讀數。PAM區域被取出、計數並被正規化為每一個樣本的總讀數。當與對照物相較時(即,當庫被轉化到含有RGN但缺少適合的sgRNA的大腸桿菌內時),導致質體割裂的PAM是由呈現性不足來辨識。為了呈現新型RGN的PAM需要,將所討論區域中所有序列的消耗率(樣本中的頻率/對照物中的頻率)用-log鹼基2轉化轉換為富集值。足夠的PAM被限定為富集值> 2.3(對應於消耗率>~0.2)的那些PAM。收集兩個庫中高於此臨界值的PAM並將其用於生成網站(web)徽標,舉例而言可以使用稱為「weblogo」的網際網路上的基於網站的服務生成web徽標。當頂部富集的PAM中存在一致模式時,PAM序列被辨識並且被報告。表2中提供了每一個RGN的共有PAM(具有富集因子(EF)> 2.3)。表2中還表示了PAM取向。如此申請的別處所指出的,APG06646.1和APG04293.1核酸酶不擁有PAM相互作用域。表2中的結果顯示它們不擁有典型PAM需要,典型PAM需要為2-5個核苷酸。APG06646.1和APG04293.1被顯示具有割裂的單核苷酸需要。表 2 : PAM 或 PAM 類的確定
範例 4 :工程化導引 RNA 以增加核酸酶活性 4.1 RGN APG09748 和 APG09106.1
| RGN ID | sgRNA L1 (SEQ ID NO) | sgRNA L2 (SEQ ID NO) | PAM (SEQ ID NO) | PAM 取向 |
| APG05733.1 | 5 | 6 | 7 | 5’-靶向-PAM-3’ |
| APG06207.1 | 13 | 14 | 15 | 5’-靶向-PAM-3’ |
| APG01647.1 | 20 | 21 | 22 | 5’-靶向-PAM-3’ |
| APG08032.1 | 27 | 28 | 29 | 5’-靶向-PAM-3’ |
| APG05712.1 | 34 | 35 | 36 | 5’-靶向-PAM-3’ |
| APG01658.1 | 42 | 43 | 44 | 5’-靶向-PAM-3’ |
| APG06498.1 | 50 | 51 | 52 | 5’-靶向-PAM-3’ |
| APG09106.1 | 58 | 59 | 60 | 5’-PAM-靶向-3’ |
| APG09882.1 | 65 | 66 | 67 | 5’-靶向-PAM-3’ |
| APG02675.1 | 73 | 74 | 15 | 5’-靶向-PAM-3’ |
| APG01405.1 | 79 | 80 | 81 | 5’-靶向-PAM-3’ |
| APG06250.1 | 86 | 87 | 88 | 5’-靶向-PAM-3’ |
| APG06877.1 | 93 | 94 | 7 | 5’-靶向-PAM-3’ |
| APG09053.1 | 99 | 100 | 101 | 5’-靶向-PAM-3’ |
| APG04293.1 | 107 | 108 | 109 | 5’-靶向-PAM-3’ |
| APG01308.1 | 114 | 115 | 116 | 5’-靶向-PAM-3’ |
| APG06646.1 | 121 | 122 | 109 | 5’-靶向-PAM-3’ |
對於RGN APG09748(SEQ ID NO:137所列的,並且APG09748 crRNA重複序列、tracrRNA序列以及通用sgRNA被分別列為SEQ ID NO:273、274以及275,所有序列都描述於第PCT/US2019/068079號國際專利申請中,該國際專利申請藉由引用整體併入本文)和APG09106.1,它們具有非常高的序列一致性,且具有相同的PAM,使用RNA折疊預測來確定導引RNA中可為最佳化核酸酶活性而改變的區域。藉由縮短重複:抗重複區域、添加G-C鹼基對以及移除G-U擺動對,增加重複:抗重複區域中的crRNA:tracrRNA鹼基配對的穩定性。在試管內割裂測定法中,使用RGN APG09748測試“最佳化的”導引變體並將其與野生型gRNA相較。
為生成用於RNP形成的RGN,含有與C端His6(SEQ ID NO:276)或His10(SEQ ID NO:277)標記融合的RGN的表現質體被構築並轉化到大腸桿菌的BL21(DE3)菌株中。使用補加了50 µg/mL康黴素的魔培養基(Magic Media)(賽默飛世爾(Thermo Fisher))進行表現。裂解以及澄清後,藉由固定化金屬親和層析法純化蛋白質,並且使用Qubit蛋白定量套組(賽默飛世爾)或使用所計算的消光係數藉由UV-vis將蛋白質定量。
藉由將~2:1的比例的經純化的RGN與sgRNA於室溫下溫育20分鐘製備核糖核蛋白(RNP)。對於試管內割裂反應,將RNP與質體或含有側翼為較佳的PAM序列的靶向原型間隔體的線性dsDNA於室溫下溫育>30分鐘。測試TRAC基因座位內的兩個靶向核酸序列(TRAC11(SEQ ID NO:278)和TRAC14 (SEQ ID NO:279))。在具有正確靶向核酸序列的情況下(舉例而言,gRNA具有TRAC11間隔體序列,且測定的靶向為TRAC11),在沒有正確靶向核酸序列的情況下(舉例而言,gRNA具有TRAC11間隔體序列,而測定的靶向為TRAC14),測定gRNA是否有靶向活性。藉由瓊脂糖凝膠電泳評估藉由質體割裂確定的活性。結果顯示於表3。如SEQ ID NO:280-283列出導引變體,並且對該導引變體提供間隔體序列。這些導引序列使用非互補核苷酸鏈接子AAAA (SEQ ID NO:284)。具有增加的重複:抗重複結合的最佳化的gRNA(SEQ ID NO:285;poly-N表示間隔體序列的位置)具有最佳化的tracrRNA(SEQ ID NO:286)和最佳化的crRNA(SEQ ID NO:287)成分。最佳化的導引變體能夠割裂之前使用野生型導引RNA沒有偵測到割裂的兩個基因座位。通過重複:抗重複區域中的雜交的最佳化,對於TRAC基因座位中的複數靶向,APG09748的試管內割裂從0%的割裂增加到100%的割裂。表 3 :具有工程化導引變體的 APG09748 的編輯效率
| gRNA 變體 ( SEQ ID NO. ) | 導引 設計 | 測定的 靶向 | 凝膠 1 - 2 µL 負載 | 凝膠 2 - 1 µL 負載 | ||
| 完整 % | 割裂 % | 完整 % | 割裂 % | |||
| 280 | 最佳化的 | TRAC11 | 68 | 32 | 57 | 43 |
| 280 | 最佳化的 | TRAC14 | 100 | 0 | 100 | 0 |
| 281 | 最佳化的 | TRAC11 | 100 | 0 | 100 | 0 |
| 281 | 最佳化的 | TRAC14 | 70 | 30 | 69 | 31 |
| 282 | WT | TRAC11 | 100 | 0 | 100 | 0 |
| 282 | WT | TRAC14 | 100 | 0 | 100 | 0 |
| 283 | WT | TRAC11 | 100 | 0 | 100 | 0 |
| 283 | WT | TRAC14 | 100 | 0 | 100 | 0 |
| 無 | TRAC11 | 100 | 0 | 100 | 0 | |
| 無 | TRAC14 | 100 | 0 | 100 | 0 |
設計並測定額外最佳化gRNA變體。此外,還測試不同長度的間隔體序列,以確定間隔體多長將如何影響割裂效率。在此測定法中,間隔體序列外的sgRNA被稱為“主鏈”。在表4中,這些被標示為“WT”(SEQ ID NO:288,野生型序列)、和三個最佳化的sgRNA:V1(SEQ ID NO:289)、V2(SEQ ID NO:290)以及V3(SEQ ID NO:291)。 所有這些序列都具有表示間隔體序列的位置的poly-N。藉由試管內轉錄(IVT),導引被表現為sgRNA。相較於野生型sgRNA主鏈,V1具有87.8%的一致性,V2具有92.4%的一致性,並且V3具有85.5%的一致性。還生成並測試呈現雙導引RNA但在其他方面與上述野生型的和最佳化的sgRNA類似的合成tracrRNA:crRNA雙鏈體(duplex)(“合成物”)。
關於此組測定,使用RGN APG09106.1;在其他方面,用於試管內割裂反應的方法與上面描述的類似。靶向的核酸序列是靶向1(SEQ ID NO: 292)和靶向2(SEQ ID NO: 293)。結果示於表4中。表 4 :具有工程化導引變體的 APG09106.1 的編輯效率
4.2 RGN APG07433.1
| RNA 來源 | 靶向 | 間隔體 長度 | 主鏈 | 間隔體 SEQ ID NO. | 割裂 % |
| 合成物 | 2 | 18 | WT | 294 | 12.3 |
| 合成物 | 1 | 20 | WT | 295 | 0 |
| 合成物 | 2 | 20 | WT | 296 | 55.0 |
| 合成物 | 1 | 25 | WT | 297 | 0 |
| 合成物 | 2 | 25 | WT | 298 | 61.4 |
| IVT | 2 | 25 | V1 | 299 | 1.1 |
| IVT | 2 | 25 | V2 | 300 | 0.9 |
| IVT | 2 | 25 | V3 | 301 | 0.7 |
| IVT | 2 | 20 | V3 | 302 | 21.0 |
| IVT | 1 | 25 | V3 | 303 | 2.0 |
使用RNA折疊預測來確定APG07433.1的導引RNA中可以為最佳化核酸酶活性並縮短導引RNA從而包裝於病毒載體內而被改變的的區域(SEQ ID NO:235所列的並且在第2019/0367949號美國專利申請公佈和第WO 2019/236566號國際專利申請公佈所描述的,此每一個專利申請公佈藉由引用整體併入本文)。鑒別出兩個區作為實行改變的潛在位置:crRNA和tracrRNA區域之間的重複:抗重複配對和tracrRNA中的末端髮夾。重複:抗重複區域的長度被截短至7個(APG07433.1-7bp,SEQ ID NO:238和239)、13個(APG07433.1-13bp,SEQ ID NO:250和251)、以及15個鹼基對(APG07433.1-15bp,SEQ ID NO:242和243)。另外,測試在相較於野生型導引引入較小RNA凸起物的情況下改變重複:抗重複區域的序列並將該配對的長度減小至11個鹼基對(APG07433.1-11bp-syn,SEQ ID NO:240和241)的第四變體。還對tracrRNA中的末端髮夾實行截短,包含使天然序列的長度減小至40個(APG07433.1-40ntTHP,SEQ ID NO:254和255)和42個(APG07433.1-42ntTHP,SEQ ID NO:244和245)核苷酸。亦將改變的莖-環設計成將這些縮短至35個(APG07433.1-35ntTHP-syn,SEQ ID NO:248和249)和39個(APG07433.1-39ntTHP-syn,SEQ ID NO:246和247)核苷酸。一個導引使13鹼基對的縮短重複:抗重複區域與42核苷酸的縮短末端髮夾組合(APG07433.1-13bp42ntTH,SEQ ID NO:252和253)。還可測試間隔體長度對割裂的影響。還測試野生型導引RNA主鏈上的25個(APG07433.1-native[25],SEQ ID NO:236和237;間隔體序列如SEQ ID NO: 271所列)和18個(APG07433.1-native[18],SEQ ID NO:256和257;間隔體序列如SEQ ID NO:272所列)核苷酸的間隔體長度。
藉由在黏合緩衝液(Synthego)中製備含有20 µM的crRNA和10 µM的tracrRNA的溶液,然後,將其加熱至78℃10分鐘,且然後在37o
C30分鐘,藉由使crRNA和tracrRNA黏合來製備下面的雙導引RNA。藉由在磷酸緩衝食鹽水溶液中與0.5 µM的純化APG07433.1蛋白和1 µM的雙導引RNA溫育20分鐘,形成RNP。此實驗中使用的導引RNA顯示於表5中。表 5 :雙導引 RNA
| 雙 gRNA 名稱 | crRNA SEQ ID NO | tracrRNA SEQ ID NO |
| APG07433.1-native[25] | 236 | 237 |
| APG07433.1-7bp | 238 | 239 |
| APG07433.1-11bp-syn | 240 | 241 |
| APG07433.1-15bp | 242 | 243 |
| APG07433.1-42ntTHP | 244 | 245 |
| APG07433.1-39ntTHP-syn | 246 | 247 |
| APG07433.1-35ntTHP-syn | 248 | 249 |
| APG07433.1-13bp | 250 | 251 |
| APG07433.1-13bp42ntTH | 252 | 253 |
| APG07433.1-40ntTHP | 254 | 255 |
| APG07433.1-native[18] | 256 | 257 |
| APG07433.1cr-13bp tr-35ntTHP | 258 | 259 |
這些RNP與使用FAM和Cy3示蹤的引子擴增生成的含有適當靶向序列(SEQ ID NO: 260)的PCR產物一起溫育,以促進割裂產物的準確且敏感定量。在1X Cutsmart緩衝液(New England Biolabs)中,反應物含有如上生成的250 nM的RNP,和150 nM的FAM和Cy3示蹤的PCR產物。使該反應在37 ℃進行15分鐘,並且藉由將RNase A添加至0.1 mg/mL且將EDTA添加至45 mM,該反應被終止。淬滅反應物(quenched reaction)在50 ℃被加熱30分鐘並在95o
C加熱5分鐘。然後,在5%的TBE凝膠上使用天然丙烯醯胺凝膠電泳分析該樣本。這些成像於ChemiDoc MP成像器上。兩種染劑中的每一個可用於定量,且每一個樣本都是一式兩份進行。此實驗的結果顯示於表6中。表 6 :割裂結果
| RNP | 割裂 % | ||||
| Cy3 通道 | FAM 通道 | 總平均值 | |||
| Rep 1 | Rep 2 | Rep 1 | Rep 2 | ||
| 僅核酸酶(無導引) | 0 | 0 | 0 | 0 | 0 |
| APG07433.1-native[25] | 66.41 | 61.16 | 68.81 | 56.85 | 63.3 |
| APG07433.1-7bp | 0 | 3.38 | 2.83 | 0 | 1.6 |
| APG07433.1-11bp-syn | 66.33 | 76.38 | 66.73 | 68 | 69.4 |
| APG07433.1-15bp | 50.7 | 65.61 | 54.62 | 59.95 | 57.7 |
| APG07433.1-42ntTHP | 44.81 | 50.59 | 48.84 | 51.77 | 49.0 |
| APG07433.1-39ntTHP-syn | 19.16 | 32.88 | 24.91 | 33.43 | 27.6 |
| APG07433.1-35ntTHP-syn | 26.77 | 38.61 | 32.09 | 40.2 | 34.4 |
| APG07433.1-13bp | 44.36 | 33.03 | 42.93 | 35.22 | 38.9 |
| APG07433.1-13bp42ntTHP | 35.91 | 36.74 | 33.84 | 39.2 | 36.4 |
| APG07433.1-40ntTHP | 44.52 | 57.14 | 48.34 | 57.84 | 52.0 |
| APG07433.1-native[18] | 11.1 | 9.76 | 12.93 | 13.24 | 11.8 |
| APG07433.1cr-13bp tr-35ntTHP | 10.66 | 12.25 | 12.65 | 13.54 | 12.3 |
此分析表明天然主鏈優於大多數經縮短的變體及含有經縮短的靶向序列(APG07433.1-native[18],SEQ ID NO:256和257)的變體。經縮短的主鏈序列中具有最高割裂位準的主鏈序列是被命名為APG07433.1-11bp-syn的序列,其包括25 nt的靶向序列(間隔體;SEQ ID NO: 271)、crRNA的SEQ ID NO:240以及SEQ ID NO: 241作為tracrRNA。此導引變體包含改變的重複:抗重複莖環及莖中的工程化凸起物。範例 5 :哺乳動物細胞中的基因編輯活性的證明
生成RGN表現卡匣並將其引入用於哺乳動物表現的載體中。RGN APG09748、APG09106.1、APG05712.1、APG01658.1、APG05733.1、APG06498.1、APG06646.1、APG09882.1、APG01405.1以及APG01308.1的每一個針對哺乳動物表現被密碼子最佳化(分別地,SEQ ID NO:304、305以及411-418),並且表現蛋白在N端側可操作地融合至SV40核定位序列(NLS;SEQ ID NO 125)和3xFLAG標記(SEQ ID NO:126),而在C端側可操作地融合至核質素NLS序列(SEQ ID NO:127)。NLS序列的兩個副本被使用,被串聯地融合。每一個表現卡匣都在巨細胞病毒(cytomegalovirus,CMV)啟動子(SEQ ID NO:306)的控制下。本領域中已知CMV轉錄增強子(SEQ ID NO:307)也可被包括在包括CMV啟動子的構築體中。編碼單一gRNA的導引RNA表現構築體的每一個都在人類RNA聚合酶III U6啟動子(SEQ ID NO:308)的控制下被生成並被引入表現載體內。導引已選基因的靶向區域,包含RelA、AurkB、GAPDH、LINC01509、HBB、CFTR、HPRT1、TRA、EMX1和VEGFA,如表7所示。關於RNA導引核酸酶APG09106.1,特定殘基突變,以增加蛋白質的核酸酶活性,特定地說,APG09106的T849殘基突變至精胺酸(SEQ ID NO: 309)。此點突變增加哺乳動物細胞的編輯率。
將上面描述的構築體引入哺乳動物細胞內。轉染前一天,將1x105
個HEK293T細胞(Sigma)接種(plated)於Dulbecco的改良Eagle培養基(DMEM)加10%(vol/vol)胎牛血清(Gibco)和1%青黴素-鏈黴素(Gibco)的24孔培養皿中。當細胞達到50-60%匯合率(confluency)時的第二天,按照製造商的說明,使用每孔1.5 μL的Lipofectamine 3000(Thermo Scientific)共轉染500 ng的RGN表現質體加500 ng的單一gRNA表現質體。生長48小時後,根據製造商的說明,使用基因體DNA分離套組(Machery-Nagel)來收穫總基因體DNA。
然後,分析總基因體DNA,以確定所靶向的基因中的編輯率。生成寡核苷酸,以用於PCR擴增和隨後對擴增的基因體靶向位點(SEQ ID NO:310和311)的分析。在包含0.5 μM的每一種引子的20 μL反應物中使用10 μL的2X Master Mix Phusion High-Fidelity DNA聚合酶(Thermo Scientific)進行所有PCR反應。首先,使用PCR#1引子(SEQ ID NO:310及311),使用以下程式:98℃,1分鐘; [98℃,10秒;62℃,15秒;72℃,5分鐘] 的30個循環;72 ℃,5分鐘;12 ℃,永遠,來擴增涵蓋每一個靶向基因的大基因體區域。
然後,使用對每一個導引特定的引子(PCR#2引子;SEQ ID NO:365-370),使用以下程式:98 ℃,1分鐘; [98 ℃,10秒;67 ℃,15秒;72 ℃,30秒] 的35個循環;72 ℃,5分鐘;12 ℃,永遠,來進一步擴增1微升的此PCR反應物。PCR#2的引子包含用於Illumina定序的Nextera Read 1和Read 2 轉位酶轉接子(transpose adapter)突出部序列。
在第二次PCR擴增後,根據製造商的說明,使用PCR淨化(cleanup)套組(Zymo)洗滌DNA,並在水中洗提。將200-500ng純化的PCR#2產物在20 μL反應物中與2 μL的10X NEB緩衝液2和水組合,並使用程式:95 ℃,5分鐘;95-85 ℃,以2 ℃/秒的速率冷卻;85-25℃,以0.1 ℃/秒的速率冷卻;12 ℃,永遠,進行黏合,以形成異源雙鏈DNA。黏合後,移除5 μL的DNA,以作為無酵素對照物,並且加入1 μL的T7核酸內切酶I(NEB),並使反應物在37 ℃下溫育1小時。溫育後,加入5x FlashGel加樣染料(loading dye)(Lonza),並使用凝膠電泳,藉由2.2%瓊脂糖FlashGel(Lonza)分析5 μL的每一個反應物和對照物。在凝膠可視化之後,使用以下等式來確定非同源末端連接(NHEJ)的百分比:%NHEJ事件= 100 x [1-(1-所割裂的分部)(½)],其中(所割裂的分部(fraction))被定義為:(消化產物的密度)/(消化產物的密度+未消化的親本條帶)。
對於一些樣本,使用SURVEYOR®分析哺乳動物細胞中表現後的結果。在基因體DNA萃取之前,將細胞在37℃下溫育,以進行72小時的後轉染(post-transfection)。按照製造商的操作流程,使用QuickExtract DNA萃取溶液(Epicentre)來萃取基因體DNA。RGN靶向位點側翼的基因體區域被PCR擴增,並按照製造商的操作流程,使用QiaQuick Spin Column(Qiagen)來純化產物。總計200-500 ng的純化PCR產物與1 μl的10×Taq DNA聚合酶PCR緩衝液(Enzymatics)和超純水混合至10 μl的最終體積,並經受重黏合過程,以賦能異源雙鏈的形成:95 ℃ 10分鐘;95 ℃至85 ℃,以-2 ℃/s斜變,85 ℃至25 ℃,以-0.25 ℃/s斜變,以及25 ℃保持1分鐘。
於再黏合後,按照製造商建議的操作流程,用SURVEYOR®核酸酶和SURVEYOR®增強子S(Integrated DNA Technologies)處置產物,並在4-20%的Novex TBE聚丙烯醯胺凝膠(Life Technologies)上分析產物。用SYBR Gold DNA染色劑(Life Technologies)對凝膠染色10分鐘,並用Gel Doc凝膠成像系統(Bio-rad)對凝膠成像。定量是基於相對條帶強度。插入或缺失(Indel)百分比由公式100×(1−(1−(b+c)/(a+b+c))½) 確定,其中a是未消化的PCR產物的累積強度(integrated intensity),b和c是每一個割裂產物的累積強度。
另外,按照Illumina 16S環境基因體定序庫操作流程,來自含有Illumina突出部序列的PCR#2的產物經受庫製備。藉由服務提供者(MOGene)在Illumina Mi-Seq平臺上進行深度定序。通常情況下,每擴增子產生200,000個250bp的配對末端讀數(2 x 100,000個讀數)。使用CRISPResso(Pinello等人,2016,Nature Biotech
34:695-697)分析讀數,以計算編輯率。手動策劃輸出對齊,以確認插入和刪除位點並鑒別重組位點處的微同源位點。每一個樣本中的總編輯率以及刪除率和插入率顯示於表7中。所有實驗均在人類細胞中進行。「靶向」是基因靶向內所靶向的序列。對於每一個靶向序列,依據所使用的RGN,導引RNA包括互補RNA間隔體序列和適當sgRNA。藉由導引RNA進行的實驗的所選細節顯示於表8.1和8.2中。表 7 :基因靶向的總編輯率
| RGN | 基因 靶向 | 導引 RNA (SEQ ID NO.) | 靶向 (SEQ ID NO.) | 總編輯率 | 刪除率 | 插入率 |
| APG09106.1 | AurkB | 316 | 314 | 0.55% | 100% | |
| APG09106.1 | AurkB | 312 | 315 | 0.60% | 54% | 46% |
| APG09106.1 T849R | AurkB | 316 | 314 | 2.97% | 98% | 2.00% |
| APG09106.1 T849R | AurkB | 312 | 315 | 2.36% | 100% | |
| APG05712.1 | RelA | 419 | 482 | 0.36% | 72.33% | 27.67% |
| APG05712.1 | AurkB | 420 | 483 | 1.39% | 25.94% | 75.12% |
| APG05712.1 | RelA | 421 | 484 | 1.04% | 32.10% | 70.33% |
| APG05712.1 | RelA | 422 | 485 | 0.28% | 64.13% | 35.87% |
| APG01658.1 | RelA | 423 | 486 | 10.03% | 70.66% | 29.33% |
| APG01658.1 | GAPDH | 424 | 487 | 5.60% | 76.96% | 25.97% |
| APG01658.1 | LINC01509 | 425 | 488 | 9.87% | 75.10% | 26.61% |
| APG01658.1 | HBB | 426 | 489 | 0.42% | 63.86% | 36.13% |
| APG01658.1 | CFTR | 427 | 490 | 6.06% | 75.42% | 27.86% |
| APG01658.1 | AurkB | 428 | 491 | 13.07% | 88.02% | 13.14% |
| APG05733.1 | HPRT1 | 429 | 492 | 0.36% | 100% | |
| APG05733.1 | AurkB | 430 | 493 | 5.01% | 86.40% | 13.60% |
| APG05733.1 | RelA | 431 | 494 | 0.76% | 100% | |
| APG05733.1 | HPRT1 | 432 | 495 | 0.17% | 38.42% | 61.58% |
| APG05733.1 | RelA | 433 | 496 | 0.96% | 77.52% | 22.48% |
| APG06498.1 | TRA | 434 | 497 | 35.35% | 92.25% | 8.29% |
| APG06498.1 | TRA | 435 | 498 | 21.04% | 84.87% | 16.34% |
| APG06498.1 | TRA | 436 | 499 | 10.16% | 89.44% | 10.69% |
| APG06498.1 | TRA | 437 | 500 | 13.21% | 87.24% | 15.00% |
| APG06498.1 | TRA | 438 | 501 | 13.56% | 86.73% | 13.66% |
| APG06498.1 | TRA | 439 | 502 | 9.62% | 95.85% | 19.90% |
| APG06498.1 | TRA | 440 | 503 | 1.51% | 75.89% | 24% |
| APG06498.1 | TRA | 441 | 504 | 2.63% | 88.81% | 11.76% |
| APG06498.1 | TRA | 442 | 505 | 4.27% | 52.09% | 47.90% |
| APG06646.1 | TRA | 443 | 497 | 0.33% | 0% | 100% |
| APG06646.1 | VEGFA | 444 | 506 | 4.52% | 40.83% | 63.79% |
| APG06646.1 | AurkB | 445 | 507 | 0.66% | 69.38% | 30.62% |
| APG06646.1 | AurkB | 446 | 508 | 6.55% | 79.97% | 20.37% |
| APG06646.1 | TRA | 447 | 509 | 2.47% | 73.40% | 40.81% |
| APG06646.1 | TRA | 448 | 510 | 0.14% | 34.46% | 65.55% |
| APG06646.1 | TRA | 449 | 511 | 0.61% | 0% | 100% |
| APG06646.1 | AurkB | 450 | 493 | 7.94% | 67.95% | 32.40% |
| APG06646.1 | TRA | 451 | 512 | 7.03% | 86.95% | 14.03% |
| APG06646.1 | TRA | 452 | 513 | 0.50% | 21.80% | 78.10% |
| APG06646.1 | TRA | 453 | 514 | 3.53% | 86.42% | 16.28% |
| APG06646.1 | RelA | 454 | 515 | 6.22% | 80.39% | 45.34% |
| APG06646.1 | TRA | 455 | 516 | 0.38% | 0% | 100% |
| APG06646.1 | TRA | 456 | 517 | 0.34% | 66.76% | 48.22% |
| APG06646.1 | RelA | 457 | 518 | 3.78% | 75.25% | 67.90% |
| APG06646.1 | TRA | 458 | 519 | 0.42% | 69.61% | 30.39% |
| APG06646.1 | TRA | 459 | 520 | 0.08% | 100.00% | 0.00% |
| APG06646.1 | AurkB | 460 | 521 | 1.09% | 30.18% | 69.81% |
| APG06646.1 | AurkB | 461 | 522 | 0.28% | 86.60% | 21.78% |
| APG06646.1 | AurkB | 462 | 523 | 10.92% | 78.87% | 22.05% |
| APG06646.1 | TRA | 463 | 504 | 0.08% | 0% | 100% |
| APG06646.1 | TRA | 464 | 505 | 2.84% | 38.26% | 61.47% |
| APG06646.1 | TRA | 465 | 524 | 0.43% | 71.67% | 28.33% |
| APG06646.1 | TRA | 466 | 525 | 0.03% | 0.00% | 100.00% |
| APG06646.1 | TRA | 467 | 526 | 0.08% | 100% | 0% |
| APG09882.1 | RelA | 468 | 482 | 0.32% | 100.00% | 0.00% |
| APG09882.1 | EMX1 | 469 | 527 | 12.84% | 82.46% | 17.79% |
| APG09882.1 | VEGFA | 470 | 528 | 14.76% | 92.56% | 7.77% |
| APG09882.1 | TRA | 471 | 529 | 14.66% | 94.19% | 7.33% |
| APG09882.1 | TRA | 472 | 530 | 7.84% | 95.07% | 5.75% |
| APG09882.1 | VEGFA | 473 | 531 | 24.45% | 88.96% | 11.57% |
| APG09882.1 | TRA | 474 | 532 | 14.43% | 90.24% | 10.96% |
| APG01405.1 | RelA | 475 | 482 | 0.06% | 0% | 100% |
| APG01405.1 | AurkB | 476 | 533 | 6.81% | 80.58% | 20.27% |
| APG01405.1 | AurkB | 477 | 534 | 0.54% | 33.83% | 66.16% |
| APG01405.1 | HPRT1 | 478 | 535 | 1.07% | 42.14% | 57.87% |
| APG01405.1 | RelA | 479 | 484 | 0.55% | 2.07% | 97.93% |
| APG01308.1 | HPRT1 | 480 | 536 | 1.19% | 80.57% | 19.43% |
| APG01308.1 | AurkB | 481 | 537 | 0.90% | 94.97% | 6.46% |
分別的導引的特定插入和刪除顯示於表8.1和8.2中。在這些表中,靶向序列由粗體大寫字母標識。8mer PAM區域劃雙底線,主要辨識的核苷酸以粗體顯示。插入由小寫字母標識。刪除用虛線(---)指示。插入或缺失(INDEL)位置是從靶向序列的PAM近端邊緣計算的,邊緣是位置0。如果位置在邊緣的靶向側,則該位置為正(+);如果位置在邊緣的PAM側,則該位置為負(-)。表 8.1 :使用 RGN APG09106.1 對導引 831 的特定插入和刪除
表 8.2 :使用 APG09106.1 T849R 對導引 831 的特定插入和刪除
範例 6 :植物細胞中的基因編輯活性的證明
| 經編輯的靶向序列 | 讀數# | 讀數% | 插入或缺失% | 類型 | 插入或缺失位置 | 大小 |
| GTCTGATT G CCTGTCGTTGCCCCTCCCAGATCAT GGAGGAGTTGGCAGA (wild type; SEQ ID NO: 316) | 92294 | 99.40 | ||||
| GTCTGATT G CCTGTCGTTGCCCCTCCCA------ --AGGAGTTGGCAGA (SEQ ID NO: 317) | 263 | 0.28 | 54.22 | 刪除 | +19 | 8 |
| GTCTGATT G CCTGTCGTTGCCC ctaagtgtattaagcattgtctcagagattttGGAGGAGTTGGCAGA (SEQ ID NO: 318) | 222 | 0.24 | 45.77 | 插入 | +13 | 20 |
| 經編輯的靶向序列 | 讀數# | 讀數% | 插入或缺失% | 類型 | 插入或缺失的位置 | 大小 |
| GTCTGATT GCCTGTCGTTGCCCCTCCCAGATCAT GGAGGAGTTGGCAGA (wild type; SEQ ID NO: 316) | 189881 | 97.64 | ||||
| GTCTGATT G CCTGTCGTTGCCCC----------T GGAGGAGTTGGCAGA (SEQ ID NO: 319) | 602 | 0.309 | 13.129 | 刪除 | +14 | 10 |
| GTCTGATT G CCTGTCGTTGCCCCTCCCAGATC— GGAGGAGTTGGCAGA (SEQ ID NO: 320) | 394 | 0.202 | 8.593 | 刪除 | +23 | 2 |
| GTCTGATT G CCTGTCGTTGCCCCTCCCAGAT--- --AGGAGTTGGCAGA(SEQ ID NO: 321) | 399 | 0.205 | 8.702 | 刪除 | +22 | 5 |
| GTCTGATT G CCTGTCGTTGCCCaTC--------T G--GGAGTTGGCAGA(SEQ ID NO: 322) | 379 | 0.194 | 8.266 | 刪除和 突變 | +16 | 10 |
| GTCTGATT G CCTGTCGTTGCCCCTC--------T GGAGGAGTTGGCAGA (SEQ ID NO: 323) | 350 | 0.179 | 7.633 | 刪除 | +16 | 8 |
| GTCTGAT- - ------------------------T GGAGGAGTTGGCAGA (SEQ ID NO: 324) | 309 | 0.158 | 6.739 | 刪除 | -1 | 26 |
| GTCTGATT G CCTGTCGTTGCCCCTC--------- GGAGGAGTTGGCAGA (SEQ ID NO: 325) | 280 | 0.143 | 6.106 | 刪除 | +16 | 9 |
| GTCTGATT G CCTGTCGTTGCCCCTCC-------a GGAGGAGTTGGCAGA (SEQ ID NO: 326) | 274 | 0.140 | 5.976 | 刪除和 突變 | +17 | 7 |
| GTCTGATT G CCTGTCGTTGCCC------------ ---GGAGTTGGCAGA (SEQ ID NO: 327) | 251 | 0.129 | 5.474 | 刪除 | +13 | 15 |
| GTCTGATT G CCTGTCGTTGCCC-------ATCAT GGAGGAGTTGGCAGA (SEQ ID NO: 328) | 250 | 0.128 | 5.452 | 刪除 | +13 | 7 |
| GTCTGATT G CCTGTCGTTGCCCCTC------CAT GGAGGAGTTGGCAGA (SEQ ID NO: 329) | 231 | 0.118 | 5.038 | 刪除 | +16 | 6 |
| GTCTGATT G CCTGTCGTTGCCCCTCCCA------ ------------------------GTACT (SEQ ID NO: 330) | 218 | 0.112 | 4.754 | 刪除 | +19 | 30 |
| GTCTGATT G CCTGTCGTTGCCCC-----aATCtT GGAGGAGTTGGCAGA (SEQ ID NO: 331) | 206 | 0.105 | 4.492 | 刪除和 突變 | +14 | 5 |
| GTCTGATT G CCTGTCGTTGCCC--------T gggAT GGAGGAGTTGGCAGA (SEQ ID NO: 332) | 162 | 0.083 | 3.533 | 刪除和 突變 | +13 | 8 |
| GTCTGATT G CCTGTCGTTGCCCCTC--------- -----AGTTGGCAGA (SEQ ID NO: 333) | 158 | 0.081 | 3.446 | 刪除 | +16 | 14 |
| GTCTGATT G CCTGTCGTTGCCCC-------TCAT GGAGGAGTTGGCAGA (SEQ ID NO: 334) | 122 | 0.062 | 2.660 | 刪除 | +14 | 7 |
使用改編自Li等人2013(Nat. Biotech . 31:688-691)的操作流程,在植物細胞中證明本發明的RGN的RNA導引的核酸酶活性。簡而言之,可操作地鏈接至用於對N端SV40核定位訊號編碼的核酸序列的本發明的RGN的植物密碼子最佳化版本(SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117)被選殖於瞬時轉化載體中的強構成型35S啟動子的後面。靶向適當PAM序列側翼的植物PDS基因中的一個或複數位點的sgRNA被選殖於第二瞬時表現載體中的植物U6啟動子的後面。使用PEG媒介的轉化將表現載體引入圓葉菸草(Nicotiana benthamiana )葉肉原生質體內。將轉化的原生質體在黑暗中溫育達36小時。使用DNeasy Plant Mini Kit(Qiagen)從原生質體中分離基因體DNA。RGN靶向位點側翼的基因體區域被PCR擴增,並按照製造商的操作流程,使用QiaQuick Spin Column(Qiagen)純化產物。使總共200-500 ng的純化PCR產物與1 μl的10× Taq DNA聚合酶PCR緩衝液(Enzymatics)及超純水混合至10 μl的最終體積,並經受重黏合過程,以賦能異源雙鏈的形成:95 °C,10分鐘;95 °C至85 °C,以-2 °C/s斜變,85 °C至25 °C,以-0.25 °C/s斜變,以及25°C保持1分鐘。
黏合後,按照製造商推薦的操作流程,利用SURVEYOR核酸酶和SURVEYOR增強子S(Integrated DNA Technologies)處置產物,並在4-20 % 的Novex TBE聚丙烯醯胺凝膠(Life Technologies)上進行分析。用SYBR Gold DNA染色劑(Life Technologies)對凝膠染色10分鐘,並用Gel Doc凝膠成像系統(Bio-rad)對凝膠成像。定量基於相對條帶強度。插入或缺失百分比藉由公式100×(1−(1−(b+c)/(a+b+c))½)確定,其中a是未消化的PCR產物的累積強度(integrated intensity),而b和c是每一個割裂產物的累積強度。範例 7 :疾病靶向的鑒別
從通過全球資訊網在NCBI ClinVar網站找到的NCBI ClinVar資料庫獲得臨床變體的資料庫。從此清單鑒別出致病性單核苷酸多型性(SNP)。使用基因體基因座位資訊,鑒別出在與每一個SNP重疊並圍繞每一個SNP的區域中的CRISPR靶向。表9.1中列出了為靶向因果突變(“Casl Mut.”)可結合包括APG09748或APG09106.1的RGN系統使用鹼基編輯修正的SNP的選擇。表9.2中列出了為靶向因果突變(“Casl Mut.”)可結合包括APG06646.1或APG01658.1的RGN系統使用鹼基編輯修正的SNP的選擇。在表9.1和9.2中,僅列出了每一種疾病的一個別名。「RS#」對應於在NCBI網站上通過SNP資料庫的RS登錄號。染色體登錄號提供通過NCBI網站發現的登錄參考資訊。表9.1和9.2還提供了適合於針對每一種疾病的RGN系統APG09748或APG09106.1(表9.1中)或APG06646.1或APG01658.1(表9.2中)的基因體靶向序列資訊。靶向序列資訊還提供原型間隔體序列,用於對本發明的對應RGN生成必要sgRNA。表 9.1 : APG09748 和 APG09106.1 的疾病靶向
表 9.2 : APG6646.1 或 APG01658.1 的疾病靶向
範例 8 :靶向造成弗裡德賴希氏運動失調症的突變
| 疾病 | RS# | 因果突變 | 染色體登錄號 | 基因符號 | 靶向 (SEQ ID NO.) |
| 斯特格疾病1型(Stargardt disease 1) | 1800728 | A>G | NC_000001.10,NC_000001.11 | ABCA4 | 313 |
| 糖原儲疾病1A型(Glycogen storage disease type 1A) | 1801175 | C>T | NC_000017.10,NC_000017.11 | G6PC | 335 |
| 嚴重合併性免疫缺乏疾病(Severe combined immunodeficiency disease) | 3218716 | C>T | NC_000014.8,NC_000014.9 | MYH7 | 336 |
| 苯丙酮尿症(Phenylketonuria) | 5030858 | G>A | NC_000012.11,NC_000012.12 | PAH | 337 |
| 嚴重合併性免疫缺乏(Hyperphenylalaninemia) | 5030860 | T>C | NC_000012.11,NC_000012.12 | PAH | 338 |
| α1-抗胰蛋白酶缺乏症(Alpha-1-antitrypsin deficiency) | 28929474 | C>T | NC_000014.8,NC_000014.9 | SERPINA1 | 339 |
| 與MECP2有關的病症(MECP2-Related Disorders) | 28934906 | G>A | NC_000023.10,NC_000023.11 | MECP2 | 340 |
| 包涵體肌病2型(Inclusion body myopathy 2) | 28937594 | A>G | NC_000009.11,NC_000009.12 | GNE | 341 |
| 馮威裡氏疾病(Von Willebrand disease) | 41276738 | C>T | NC_000012.11,NC_000012.12 | VWF | 342 |
| 乳癌及/或卵巢癌(Breast and/or ovarian cancer) | 41293455 | G>A | NC_000017.10,NC_000017.11 | BRCA1 | 343 |
| 與MECP2有關的病症(MECP2-Related Disorders) | 61750240 | G>A | NC_000023.10,NC_000023.11 | MECP2 | 344 |
| 與MEFV有關的病症(MEFV-Related Disorder) | 61752717 | T>C | NC_000016.9,NC_000016.10 | MEFV | 345 |
| 乳癌及/或卵巢癌 | 62625307 | G>A | NC_000017.10,NC_000017.11 | BRCA1 | 346 |
| 乳癌及/或卵巢癌 | 62625308 | G>A | NC_000017.10,NC_000017.11 | BRCA1 | 347 |
| 遺傳性癌症傾向症候群(Hereditary cancer-predisposing syndrome) | 63749795 | C>T | NC_000003.11,NC_000003.12 | MLH1 | 348 |
| 遺傳性癌症傾向症候群 | 63749849 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 349 |
| 遺傳性癌症傾向症候群 | 63750636 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 350 |
| 肉鹼棕櫚醯基轉移酶II缺乏症(Carnitine palmitoyltransferase II deficiency) | 74315294 | C>T | NC_000001.10,NC_000001.11 | CPT2 | 351 |
| 囊性纖維化(Cystic fibrosis) | 74597325 | C>T | NC_000007.13,NC_000007.14 | CFTR | 352 |
| UDP葡萄糖-己糖-1-磷酸尿苷醯轉移酶缺乏症(Deficiency of UDPglucose-hexose-1-phosphate uridylyltransferase) | 75391579 | A>G | NC_000009.11,NC_000009.12 | GALT | 353 |
| 囊性纖維化 | 75527207 | G>A | NC_000007.13,NC_000007.14 | CFTR | 354 |
| 澱粉生成性轉甲狀腺素蛋白澱粉樣變(Amyloidogenic transthyretin amyloidosis) | 76992529 | G>A | NC_000018.9,NC_000018.10 | TTR | 355 |
| 囊性纖維化 | 77010898 | G>A | NC_000007.13,NC_000007.14 | CFTR | 356 |
| 異染性白質失養症(Metachromatic leukodystrophy) | 80338815 | C>T | NC_000022.10,NC_000022.11 | ARSA | 357 |
| 考登症候群3型(Cowden syndrome 3) | 80338844 | C>T | NC_000011.9,NC_000011.10 | SDHD | 358 |
| 史-倫-奧三氏症候群(Smith-Lemli-Opitz syndrome) | 80338853 | G>A | NC_000011.9,NC_000011.10 | DHCR7 | 359 |
| 乳癌及/或卵巢癌(Breast and/or ovarian cancer) | 80356962 | C>T | NC_000017.10,NC_000017.11 | BRCA1 | 360 |
| 乳癌及/或卵巢癌 | 80357123 | G>A | NC_000017.10,NC_000017.11 | BRCA1 | 361 |
| 先天性基因疾病(Inborn genetic diseases) | 80358259 | A>G | NC_000018.9,NC_000018.10 | NPC1 | 362 |
| 乳癌及/或卵巢癌 | 80359212 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 363 |
| 範可尼貧血(Fanconi anemia) | 104886457 | G>A | NC_000009.11,NC_000009.12 | FANCC | 364 |
| 與SLC26A2有關的病症(SLC26A2-Related Disorders) | 104893915 | C>T | NC_000005.9,NC_000005.10 | SLC26A2 | 365 |
| 心肌病(Cardiomyopathy) | 104894368 | C>T | NC_000012.11,NC_000012.12 | MYL2 | 366 |
| 性聯遺傳耳聾(Deafness, X-linked) | 104894396 | C>T | NC_000013.10,NC_000013.11 | GJB2 | 367 |
| 先天性基因疾病(Inborn genetic diseases) | 104894635 | C>T | NC_000017.10,NC_000017.11 | SGSH | 368 |
| 家族性地中海熱(Familial Mediterranean fever) | 104895097 | C>T | NC_000016.9,NC_000016.10 | MEFV | 369 |
| 家族性自主神經異常(Familial dysautonomia) | 111033171 | A>G | NC_000009.11,NC_000009.12 | ELP1 | 370 |
| 舒氏症候群(Shwachman syndrome) | 113993993 | A>G | NC_000007.13,NC_000007.14 | SBDS | 371 |
| 與RYR1有關的病症(RYR1-Related Disorders) | 118192172 | C>T | NC_000019.9,NC_000019.10 | RYR1 | 372 |
| 神經元蠟樣脂褐質儲積症2型(Ceroid lipofuscinosis neuronal 2) | 119455955 | G>A | NC_000011.9,NC_000011.10 | TPP1 | 373 |
| 中度鏈醯基輔酶A脫氫酶缺乏症(Medium-chain acyl-coenzyme A dehydrogenase deficiency) | 121434274 | G>A | NC_000001.10,NC_000001.11 | ACADM | 374 |
| 原發性高草酸尿症(Primary hyperoxaluria) | 121908529 | G>A | NC_000002.11,NC_000002.12 | AGXT | 375 |
| 心肌病 | 121908987 | C>T | NC_000007.13,NC_000007.14 | PRKAG2 | 376 |
| 考登症候群 | 121909219 | C>T | NC_000010.10,NC_000010.11 | PTEN | 377 |
| 心肌病 | 121913628 | C>T | NC_000014.8,NC_000014.9 | MYH7 | 378 |
| 先天性基因疾病(Inborn genetic diseases) | 121918243 | G>A | NC_000001.10,NC_000001.11 | MMACHC | 379 |
| 與PTPN11有關的病症(PTPN11-related disorder) | 121918457 | C>T | NC_000012.11,NC_000012.12 | PTPN11 | 380 |
| 青少年骨髓單核細胞性白血病(Juvenile myelomonocytic leukemia) | 121918462 | C>T | NC_000012.11,NC_000012.12 | PTPN11 | 381 |
| 青少年骨髓單核細胞性白血病(Juvenile myelomonocytic leukemia) | 121918466 | A>G | NC_000012.11,NC_000012.12 | PTPN11 | 382 |
| I型黏多醣貯積病(Mucopolysaccharidosis type I) | 121965020 | C>T | NC_000004.11,NC_000004.12 | IDUA | 383 |
| 神經元蠟樣脂褐質儲積症1型(Ceroid lipofuscinosis neuronal 1) | 137852700 | G>A | NC_000001.10,NC_000001.11 | PPT1 | 384 |
| 與CHEK2有關的癌症易罹患性(CHEK2-Related Cancer Susceptibility) | 137853007 | G>A | NC_000022.10,NC_000022.11 | CHEK2 | 385 |
| 大腸癌(Colorectal cancer) | 137854568 | C>T | NC_000005.9,NC_000005.10 | APC | 386 |
| 家族性高膽固醇血症(Familial hypercholesterolemia) | 137929307 | G>A | NC_000019.9,NC_000019.10 | LDLR | 387 |
| 心-面-皮膚症候群(Cardio-facio-cutaneous syndrome) | 180177035 | T>C | NC_000007.13,NC_000007.14 | BRAF | 388 |
| 家族性乳癌(Familial cancer of breast) | 180177083 | G>A | NC_000016.10,NC_000016.9 | PALB2 | 389 |
| 與MYBPC3有關的病症(MYBPC3-Related Disorders) | 200411226 | C>T | NC_000011.9,NC_000011.10 | MYBPC3 | 390 |
| 與RYR1有關的病症 | 200563280 | C>T | NC_000019.9,NC_000019.10 | RYR1 | 391 |
| 與MYBPC3有關的病症 | 387907267 | G>A | NC_000011.9,NC_000011.10 | MYBPC3 | 392 |
| 遺傳性硬纖維瘤疾病(Desmoid disease, hereditary) | 397515734 | C>T | NC_000005.9,NC_000005.10 | APC | 393 |
| 蜘蛛人症候群/ Loeys-Dietz症候群/胸主動脈瘤及夾層(Marfan Syndrome/Loeys-Dietz Syndrome/Familial Thoracic Aortic Aneurysms and Dissections) | 397515757 | C>T | NC_000015.9,NC_000015.10 | FBN1 | 394 |
| 免疫缺乏症14型(Immunodeficiency 14) | 397518423 | G>A | NC_000001.10,NC_000001.11 | PIK3CD | 395 |
| 先天性基因疾病(Inborn genetic diseases) | 398123009 | C>T | NC_000011.9,NC_000011.10 | PACS1 | 396 |
| 無ICD-O次型的B型母淋巴細胞血癌(B lymphoblastic leukemia lymphoma, no ICD-O subtype) | 529008617 | G>A | NC_000001.10,NC_000001.11 | MUTYH | 397 |
| 家族性乳癌(Familial cancer of breast) | 587780021 | G>A | NC_000002.11,NC_000002.12 | BARD1 | 398 |
| 家族性高膽固醇血症(Familial hypercholesterolemia) | 746118995 | C>T | NC_000019.9,NC_000019.10 | LDLR | 399 |
| 家族性高膽固醇血症(Familial hypercholesterolemia) | 769370816 | G>A | NC_000019.10,NC_000019.9 | LDLR | 400 |
| 疾病 | RGN | RS# | 因果突變 | 染色體登錄號 | 基因符號 | 靶向 (SEQ ID NO.) |
| 斯特格疾病1型(Stargardt disease 1) | APG01658.1 | 1800553 | C>T | NC_000001.10,NC_000001.11 | ABCA4 | 538 |
| 斯特格疾病1型 | APG06646.1 | 1800553 | C>T | NC_000001.10,NC_000001.11 | ABCA4 | 539 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 5030804 | A>G | NC_000003.11,NC_000003.12 | VHL | 540 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 5030804 | A>G | NC_000003.11,NC_000003.12 | VHL | 541 |
| 苯酮尿症(Phenylketonuria) | APG01658.1 | 5030851 | G>A | NC_000012.11,NC_000012.12 | PAH | 542 |
| 苯酮尿症 | APG06646.1 | 5030851 | G>A | NC_000012.11,NC_000012.12 | PAH | 543 |
| 黑色素瘤和骨髓瘤(Melanoma and myeloma) | APG01658.1 | 11547328 | G>A | NC_000012.11,NC_000012.12 | CDK4 | 544 |
| 黑色素瘤和骨髓瘤 | APG06646.1 | 11547328 | G>A | NC_000012.11,NC_000012.12 | CDK4 | 545 |
| 家族性高膽固醇血症 | APG01658.1 | 11547917 | C>T | NC_000019.9,NC_000019.10 | LDLR | 546 |
| 家族性高膽固醇血症 | APG06646.1 | 11547917 | C>T | NC_000019.9,NC_000019.10 | LDLR | 547 |
| 恰克-馬利-杜斯氏疾病(Charcot-Marie-Tooth disease) | APG01658.1 | 61444459 | G>A | NC_000001.10,NC_000001.11 | LMNA | 548 |
| 恰克-馬利-杜斯氏疾病 | APG06646.1 | 61444459 | G>A | NC_000001.10,NC_000001.11 | LMNA | 549 |
| 安琪曼氏症候群(Angelman syndrome) | APG01658.1 | 61751362 | G>A | NC_000023.10,NC_000023.11 | MECP2 | 550 |
| 安琪曼氏症候群 | APG06646.1 | 61751362 | G>A | NC_000023.10,NC_000023.11 | MECP2 | 551 |
| 苯酮尿症 | APG01658.1 | 62514895 | C>T | NC_000012.11,NC_000012.12 | PAH | 552 |
| 苯酮尿症 | APG06646.1 | 62514895 | C>T | NC_000012.11,NC_000012.12 | PAH | 553 |
| 苯酮尿症 | APG01658.1 | 62516152 | C>T | NC_000012.11,NC_000012.12 | PAH | 554 |
| 苯酮尿症 | APG06646.1 | 62516152 | C>T | NC_000012.11,NC_000012.12 | PAH | 555 |
| 林奇氏症候群(Lynch syndrome) | APG01658.1 | 63749795 | C>T | NC_000003.11,NC_000003.12 | MLH1 | 556 |
| 林奇氏症候群 | APG06646.1 | 63749795 | C>T | NC_000003.11,NC_000003.12 | MLH1 | 557 |
| 遺傳性癌症(Hereditary cancer) | APG01658.1 | 63749843 | C>T | NC_000002.11,NC_000002.12 | MSH6 | 558 |
| 遺傳性癌症 | APG06646.1 | 63749843 | C>T | NC_000002.11,NC_000002.12 | MSH6 | 559 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 63749849 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 560 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 63749849 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 561 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 63750508 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 562 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 63750508 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 563 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 63750636 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 564 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 63750636 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 565 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 63750871 | G>A | NC_000007.13,NC_000007.14 | PMS2 | 566 |
| 林奇氏症候群 | APG01658.1 | 63751194 | C>T | NC_000003.11,NC_000003.12 | MLH1 | 567 |
| 林奇氏症候群 | APG06646.1 | 63751194 | C>T | NC_000003.11,NC_000003.12 | MLH1 | 568 |
| 林奇氏症候群 | APG01658.1 | 63751711 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 569 |
| 林奇氏症候群 | APG06646.1 | 63751711 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 570 |
| 囊性纖維化 | APG01658.1 | 75039782 | C>T | NC_000007.13,NC_000007.14 | CFTR | 571 |
| 囊性纖維化 | APG06646.1 | 75039782 | C>T | NC_000007.13,NC_000007.14 | CFTR | 572 |
| 耳聾 | APG01658.1 | 76434661 | C>T | NC_000013.10,NC_000013.11 | GJB2 | 573 |
| 耳聾 | APG06646.1 | 76434661 | C>T | NC_000013.10,NC_000013.11 | GJB2 | 574 |
| 囊性纖維化 | APG01658.1 | 76713772 | G>A | NC_000007.13,NC_000007.14 | CFTR | 575 |
| 囊性纖維化 | APG06646.1 | 76713772 | G>A | NC_000007.13,NC_000007.14 | CFTR | 576 |
| 心肌病 | APG01658.1 | 76992529 | G>A | NC_000018.9,NC_000018.10 | TTR | 577 |
| 心肌病 | APG06646.1 | 76992529 | G>A | NC_000018.9,NC_000018.10 | TTR | 578 |
| 囊性纖維化 | APG01658.1 | 77010898 | G>A | NC_000007.13,NC_000007.14 | CFTR | 579 |
| 囊性纖維化 | APG06646.1 | 77010898 | G>A | NC_000007.13,NC_000007.14 | CFTR | 580 |
| 囊性纖維化 | APG01658.1 | 80224560 | G>A | NC_000007.13,NC_000007.14 | CFTR | 581 |
| 囊性纖維化 | APG06646.1 | 80224560 | G>A | NC_000007.13,NC_000007.14 | CFTR | 582 |
| 考登症候群 | APG01658.1 | 80338844 | C>T | NC_000011.9,NC_000011.10 | SDHD | 583 |
| 考登症候群 | APG06646.1 | 80338844 | C>T | NC_000011.9,NC_000011.10 | SDHD | 584 |
| 與SLC26A4有關的病症(SLC26A4-Related Disorders) | APG01658.1 | 80338849 | G>A | NC_000007.13,NC_000007.14 | SLC26A4 | 585 |
| 與SLC26A4有關的病症 | APG06646.1 | 80338849 | G>A | NC_000007.13,NC_000007.14 | SLC26A4 | 586 |
| 乳-卵巢癌(Breast-ovarian cancer) | APG01658.1 | 80356885 | C>T | NC_000017.10,NC_000017.11 | BRCA1 | 587 |
| 乳-卵巢癌 | APG06646.1 | 80356885 | C>T | NC_000017.10,NC_000017.11 | BRCA1 | 588 |
| 乳-卵巢癌 | APG01658.1 | 80358557 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 589 |
| 乳-卵巢癌 | APG06646.1 | 80358557 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 590 |
| 乳-卵巢癌 | APG01658.1 | 80358650 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 591 |
| 乳-卵巢癌 | APG06646.1 | 80358650 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 592 |
| 乳-卵巢癌 | APG01658.1 | 80358659 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 593 |
| 乳-卵巢癌 | APG06646.1 | 80358659 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 594 |
| 乳-卵巢癌 | APG06646.1 | 80358663 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 595 |
| 乳-卵巢癌 | APG01658.1 | 80358871 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 596 |
| 乳-卵巢癌 | APG06646.1 | 80358871 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 597 |
| 乳-卵巢癌 | APG01658.1 | 80358920 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 598 |
| 乳-卵巢癌 | APG06646.1 | 80358920 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 599 |
| 乳-卵巢癌 | APG01658.1 | 80358972 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 600 |
| 乳-卵巢癌 | APG06646.1 | 80358972 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 601 |
| 乳-卵巢癌 | APG01658.1 | 80358981 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 602 |
| 乳-卵巢癌 | APG06646.1 | 80358981 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 603 |
| 乳-卵巢癌 | APG01658.1 | 80359003 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 604 |
| 乳-卵巢癌 | APG06646.1 | 80359003 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 605 |
| 乳-卵巢癌 | APG01658.1 | 80359004 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 606 |
| 乳-卵巢癌 | APG06646.1 | 80359004 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 607 |
| 乳-卵巢癌 | APG01658.1 | 80359013 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 608 |
| 乳-卵巢癌 | APG06646.1 | 80359013 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 609 |
| 乳-卵巢癌 | APG01658.1 | 80359027 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 610 |
| 乳-卵巢癌 | APG06646.1 | 80359027 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 611 |
| 乳-卵巢癌 | APG01658.1 | 80359071 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 612 |
| 乳-卵巢癌 | APG06646.1 | 80359071 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 613 |
| 乳-卵巢癌 | APG01658.1 | 80359115 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 614 |
| 乳-卵巢癌 | APG06646.1 | 80359115 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 615 |
| 乳-卵巢癌 | APG01658.1 | 80359140 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 616 |
| 乳-卵巢癌 | APG06646.1 | 80359140 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 617 |
| 乳-卵巢癌 | APG06646.1 | 80359159 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 618 |
| 乳-卵巢癌 | APG01658.1 | 80359180 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 619 |
| 乳-卵巢癌 | APG06646.1 | 80359180 | C>T | NC_000013.10,NC_000013.11 | BRCA2 | 620 |
| 乳-卵巢癌 | APG01658.1 | 81002846 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 621 |
| 乳-卵巢癌 | APG06646.1 | 81002846 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 622 |
| 乳-卵巢癌 | APG06646.1 | 81002862 | A>G | NC_000013.10,NC_000013.11 | BRCA2 | 623 |
| 範可尼貧血(Fanconi anemia) | APG01658.1 | 104886457 | G>A | NC_000009.11,NC_000009.12 | FANCC | 624 |
| 範可尼貧血 | APG06646.1 | 104886457 | G>A | NC_000009.11,NC_000009.12 | FANCC | 625 |
| 軟骨發育不全(Achondrogenesis) | APG01658.1 | 104893915 | C>T | NC_000005.9,NC_000005.10 | SLC26A2 | 626 |
| 軟骨發育不全 | APG06646.1 | 104893915 | C>T | NC_000005.9,NC_000005.10 | SLC26A2 | 627 |
| 與RYR1有關的病症 | APG01658.1 | 118192172 | C>T | NC_000019.9,NC_000019.10 | RYR1 | 628 |
| 與RYR1有關的病症 | APG06646.1 | 118192172 | C>T | NC_000019.9,NC_000019.10 | RYR1 | 629 |
| 與CHEK2有關的癌症易罹患性 | APG01658.1 | 137853007 | G>A | NC_000022.10,NC_000022.11 | CHEK2 | 630 |
| 與CHEK2有關的癌症易罹患性 | APG06646.1 | 137853007 | G>A | NC_000022.10,NC_000022.11 | CHEK2 | 631 |
| 神經纖維瘤病(Neurofibromatosis) | APG06646.1 | 137854550 | A>G | NC_000017.10,NC_000017.11 | NF1 | 632 |
| 神經纖維瘤病 | APG01658.1 | 137854556 | G>A | NC_000017.10,NC_000017.11 | NF1 | 633 |
| 神經纖維瘤病 | APG06646.1 | 137854556 | G>A | NC_000017.10,NC_000017.11 | NF1 | 634 |
| 肌病(Myopathy) | APG01658.1 | 193922390 | C>T | NC_000014.8,NC_000014.9 | MYH7 | 635 |
| 肌病 | APG06646.1 | 193922390 | C>T | NC_000014.8,NC_000014.9 | MYH7 | 636 |
| QT間距延長症候群(Long QT syndrome) | APG01658.1 | 199473428 | C>T | NC_000007.13,NC_000007.14 | KCNH2 | 637 |
| QT間距延長症候群 | APG06646.1 | 199473428 | C>T | NC_000007.13,NC_000007.14 | KCNH2 | 638 |
| 苯酮尿症 | APG01658.1 | 199475575 | G>A | NC_000012.11,NC_000012.12 | PAH | 639 |
| 苯酮尿症 | APG06646.1 | 199475575 | G>A | NC_000012.11,NC_000012.12 | PAH | 640 |
| 苯酮尿症 | APG01658.1 | 199475679 | C>T | NC_000012.11,NC_000012.12 | PAH | 641 |
| 苯酮尿症 | APG06646.1 | 199475679 | C>T | NC_000012.11,NC_000012.12 | PAH | 642 |
| 與MYBPC3有關的病症 | APG01658.1 | 200411226 | C>T | NC_000011.9,NC_000011.10 | MYBPC3 | 643 |
| 與MYBPC3有關的病症 | APG06646.1 | 200411226 | C>T | NC_000011.9,NC_000011.10 | MYBPC3 | 644 |
| 肌病 | APG06646.1 | 267606908 | T>C | NC_000014.8,NC_000014.9 | MYH7 | 645 |
| 心肌病 | APG01658.1 | 267607003 | C>T | NC_000010.10,NC_000010.11 | RBM20 | 646 |
| 心肌病 | APG06646.1 | 267607003 | C>T | NC_000010.10,NC_000010.11 | RBM20 | 647 |
| 努南氏症候群(Noonan syndrome) | APG01658.1 | 267607048 | A>G | NC_000010.10,NC_000010.11 | SHOC2 | 648 |
| 努南氏症候群 | APG06646.1 | 267607048 | A>G | NC_000010.10,NC_000010.11 | SHOC2 | 649 |
| 家族性高膽固醇血症 | APG01658.1 | 267607213 | G>A | NC_000019.9,NC_000019.10 | LDLR | 650 |
| 家族性高膽固醇血症 | APG06646.1 | 267607213 | G>A | NC_000019.9,NC_000019.10 | LDLR | 651 |
| 林奇氏症候群 | APG01658.1 | 267607789 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 652 |
| 林奇氏症候群 | APG06646.1 | 267607789 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 653 |
| 林奇氏症候群 | APG01658.1 | 267607845 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 654 |
| 林奇氏症候群 | APG06646.1 | 267607845 | G>A | NC_000003.11,NC_000003.12 | MLH1 | 655 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 267608098 | A>G | NC_000002.11,NC_000002.12 | MSH6 | 656 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 267608098 | A>G | NC_000002.11,NC_000002.12 | MSH6 | 657 |
| 與MYBPC3有關的病症 | APG01658.1 | 387906397 | A>G | NC_000011.9,NC_000011.10 | MYBPC3 | 658 |
| 與MYBPC3有關的病症 | APG06646.1 | 387906397 | A>G | NC_000011.9,NC_000011.10 | MYBPC3 | 659 |
| 乳-卵巢癌 | APG01658.1 | 387906843 | G>A | NC_000017.10,NC_000017.11 | RAD51D | 660 |
| 乳-卵巢癌 | APG06646.1 | 387906843 | G>A | NC_000017.10,NC_000017.11 | RAD51D | 661 |
| 與MYBPC3有關的病症 | APG01658.1 | 387907267 | G>A | NC_000011.9,NC_000011.10 | MYBPC3 | 662 |
| 與MYBPC3有關的病症 | APG06646.1 | 387907267 | G>A | NC_000011.9,NC_000011.10 | MYBPC3 | 663 |
| 乳-卵巢癌 | APG01658.1 | 397507389 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 664 |
| 乳-卵巢癌 | APG06646.1 | 397507389 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 665 |
| 乳-卵巢癌 | APG01658.1 | 397507404 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 666 |
| 乳-卵巢癌 | APG06646.1 | 397507404 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 667 |
| 白血病(Leukemia) | APG01658.1 | 397507545 | G>A | NC_000012.11,NC_000012.12 | PTPN11 | 668 |
| 白血病 | APG06646.1 | 397507545 | G>A | NC_000012.11,NC_000012.12 | PTPN11 | 669 |
| 白血病 | APG01658.1 | 397507547 | A>G | NC_000012.11,NC_000012.12 | PTPN11 | 670 |
| 白血病 | APG06646.1 | 397507547 | A>G | NC_000012.11,NC_000012.12 | PTPN11 | 671 |
| 乳-卵巢癌 | APG01658.1 | 397507922 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 672 |
| 乳-卵巢癌 | APG06646.1 | 397507922 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 673 |
| 蜘蛛人症候群 | APG01658.1 | 397515757 | C>T | NC_000015.9,NC_000015.10 | FBN1 | 674 |
| 蜘蛛人症候群 | APG06646.1 | 397515757 | C>T | NC_000015.9,NC_000015.10 | FBN1 | 675 |
| 與MYBPC3有關的病症 | APG01658.1 | 397516074 | C>T | NC_000011.9,NC_000011.10 | MYBPC3 | 676 |
| 與MYBPC3有關的病症 | APG06646.1 | 397516074 | C>T | NC_000011.9,NC_000011.10 | MYBPC3 | 677 |
| 心肌病 | APG01658.1 | 397516354 | C>T | NC_000019.9,NC_000019.10 | TNNI3 | 678 |
| 心肌病 | APG06646.1 | 397516354 | C>T | NC_000019.9,NC_000019.10 | TNNI3 | 679 |
| 免疫缺乏症 | APG01658.1 | 397518423 | G>A | NC_000001.10,NC_000001.11 | PIK3CD | 680 |
| 免疫缺乏症 | APG06646.1 | 397518423 | G>A | NC_000001.10,NC_000001.11 | PIK3CD | 681 |
| B型母淋巴細胞血癌(B lymphoblastic leukemia lymphoma) | APG01658.1 | 529008617 | G>A | NC_000001.10,NC_000001.11 | MUTYH | 682 |
| B型母淋巴細胞血癌 | APG06646.1 | 529008617 | G>A | NC_000001.10,NC_000001.11 | MUTYH | 683 |
| 家族性高膽固醇血症 | APG01658.1 | 570942190 | C>T | NC_000019.9,NC_000019.10 | LDLR | 684 |
| 家族性高膽固醇血症 | APG06646.1 | 570942190 | C>T | NC_000019.9,NC_000019.10 | LDLR | 685 |
| 毛細血管擴張性共濟失調症候群Ataxia-telangiectasia syndrome | APG01658.1 | 587776551 | G>A | NC_000011.10,NC_000011.9 | ATM | 686 |
| 毛細血管擴張性共濟失調症候群 | APG06646.1 | 587776551 | G>A | NC_000011.10,NC_000011.9 | ATM | 687 |
| 腺樣囊性癌(Adenoid cystic carcinoma) | APG01658.1 | 587778720 | C>T | NC_000017.10,NC_000017.11 | TP53 | 688 |
| 腺樣囊性癌 | APG06646.1 | 587778720 | C>T | NC_000017.10,NC_000017.11 | TP53 | 689 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 587779075 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 690 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 587779075 | C>T | NC_000002.11,NC_000002.12 | MSH2 | 691 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 587779333 | T>C | NC_000007.13,NC_000007.14 | PMS2 | 692 |
| 毛細血管擴張性共濟失調症候群 | APG01658.1 | 587779866 | A>G | NC_000011.10,NC_000011.9 | ATM | 693 |
| 毛細血管擴張性共濟失調症候群 | APG06646.1 | 587779866 | A>G | NC_000011.10,NC_000011.9 | ATM | 694 |
| 乳癌 | APG01658.1 | 587780021 | G>A | NC_000002.11,NC_000002.12 | BARD1 | 695 |
| 乳癌 | APG06646.1 | 587780021 | G>A | NC_000002.11,NC_000002.12 | BARD1 | 696 |
| 乳-卵巢癌 | APG01658.1 | 587781629 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 697 |
| 乳-卵巢癌 | APG06646.1 | 587781629 | G>A | NC_000013.10,NC_000013.11 | BRCA2 | 698 |
| 遺傳性癌症傾向症候群 | APG01658.1 | 587782144 | C>T | NC_000017.10,NC_000017.11 | TP53 | 699 |
| 遺傳性癌症傾向症候群 | APG06646.1 | 587782144 | C>T | NC_000017.10,NC_000017.11 | TP53 | 700 |
| 蜘蛛人症候群 | APG01658.1 | 727503054 | A>G | NC_000015.9,NC_000015.10 | FBN1 | 701 |
| 蜘蛛人症候群 | APG06646.1 | 727503054 | A>G | NC_000015.9,NC_000015.10 | FBN1 | 702 |
| 努南氏症候群 | APG01658.1 | 727503110 | T>C | NC_000012.11,NC_000012.12 | KRAS | 703 |
| 努南氏症候群 | APG06646.1 | 727503110 | T>C | NC_000012.11,NC_000012.12 | KRAS | 704 |
| 家族性高膽固醇血症 | APG01658.1 | 746118995 | C>T | NC_000019.9,NC_000019.10 | LDLR | 705 |
| 家族性高膽固醇血症 | APG06646.1 | 746118995 | C>T | NC_000019.9,NC_000019.10 | LDLR | 706 |
| 家族性高膽固醇血症 | APG01658.1 | 748944640 | G>A | NC_000019.9,NC_000019.10 | LDLR | 707 |
| 家族性高膽固醇血症 | APG06646.1 | 748944640 | G>A | NC_000019.9,NC_000019.10 | LDLR | 708 |
| 家族性高膽固醇血症 | APG01658.1 | 765696008 | G>A | NC_000019.10,NC_000019.9 | LDLR | 709 |
| 家族性高膽固醇血症 | APG06646.1 | 765696008 | G>A | NC_000019.10,NC_000019.9 | LDLR | 710 |
| 家族性高膽固醇血症 | APG01658.1 | 769370816 | G>A | NC_000019.10,NC_000019.9 | LDLR | 711 |
| 家族性高膽固醇血症 | APG06646.1 | 769370816 | G>A | NC_000019.10,NC_000019.9 | LDLR | 712 |
| 家族性高膽固醇血症 | APG01658.1 | 769737896 | C>T | NC_000019.10,NC_000019.9 | LDLR | 713 |
| 家族性高膽固醇血症 | APG06646.1 | 769737896 | C>T | NC_000019.10,NC_000019.9 | LDLR | 714 |
| 家族性高膽固醇血症 | APG01658.1 | 771019366 | A>G | NC_000019.10,NC_000019.9 | LDLR | 715 |
| 家族性高膽固醇血症 | APG06646.1 | 771019366 | A>G | NC_000019.10,NC_000019.9 | LDLR | 716 |
| 副神經節瘤(Paragangliomas) | APG01658.1 | 772551056 | C>T | NC_000001.11,NC_000001.10 | SDHB | 717 |
| 副神經節瘤 | APG06646.1 | 772551056 | C>T | NC_000001.11,NC_000001.10 | SDHB | 718 |
| 遺傳性癌症 | APG01658.1 | 786201042 | C>T | NC_000002.12,NC_000002.11 | MSH6 | 719 |
| 遺傳性癌症 | APG06646.1 | 786201042 | C>T | NC_000002.12,NC_000002.11 | MSH6 | 720 |
| 家族性高膽固醇血症 | APG01658.1 | 875989907 | G>A | NC_000019.9,NC_000019.10 | LDLR | 721 |
| 家族性高膽固醇血症 | APG06646.1 | 875989907 | G>A | NC_000019.9,NC_000019.10 | LDLR | 722 |
| 家族性高膽固醇血症 | APG01658.1 | 879254797 | G>A | NC_000019.10,NC_000019.9 | LDLR | 723 |
| 家族性高膽固醇血症 | APG06646.1 | 879254797 | G>A | NC_000019.10,NC_000019.9 | LDLR | 724 |
| 家族性高膽固醇血症 | APG01658.1 | 879254871 | C>T | NC_000019.10,NC_000019.9 | LDLR | 725 |
| 家族性高膽固醇血症 | APG06646.1 | 879254871 | C>T | NC_000019.10,NC_000019.9 | LDLR | 726 |
| 家族性高膽固醇血症 | APG01658.1 | 879255000 | T>C | NC_000019.10,NC_000019.9 | LDLR | 727 |
| 家族性高膽固醇血症 | APG06646.1 | 879255000 | T>C | NC_000019.10,NC_000019.9 | LDLR | 728 |
引起弗裡德賴希氏運動失調症(FRDA)的三核苷酸重複序列的擴展(expansion)發生在FXN基因內、被稱為FRDA不穩定區域的限定遺傳基因基因座位中。RNA導引的核酸酶(RGN)可用於切除FRDA患者細胞中的不穩定區域。此措施需要1)RGN和導引RNA序列,其可被程式化,以靶向人類基因體中的對偶基因;和2)RGN和導引序列的遞送措施。特別是當除了功能表現卡匣所需的其他基因元素外還要考慮到SpCas9基因和導引RNA的長度時,用於基因體編輯的諸如來自化膿性葡萄球菌(SpyCas9)的常用Cas9核酸酶的許多核酸酶太大而無法包裝於腺關聯病毒(AAV)載體內。這使得不太可能存在使用SpCas9的奏效措施。
本發明的諸如APG09748、APG09106.1和APG06646.1的密質(compact)RNA導引的核酸酶唯一很好地適合於FRDA不穩定區域的切除。每一個RGN都具有在FRDA不穩定區域附近的PAM需要。另外,這些RGN中的每一個都可與導引RNA一起包裝於AAV載體內。包裝兩個導引RNA可能需要第二個載體,但這種措施與諸如SpCas9的較大核酸酶所需要的相較仍有優勢,較大核酸酶可能需要在兩個載體之間分裂蛋白質序列。
表10顯示了適合將APG09748、APG09106.1或APG06646.1靶向FRDA不穩定區域的5'和3'側翼的基因體靶向序列的位置以及基因體靶向的sgRNA的序列。一旦到達基因座位,RGN將切除FA不穩定區域。可使用基因座位的Illumina定序來驗證區域的切除。表 10 : RGN 系統的基因體靶向序列
範例 9 :靶向造成鐮狀細胞疾病的突變
| 相對於 FRDA 不穩定區域的位置 | APG09748 或 APG09106.1 的 基因體靶向序列 ( SEQ ID NO. ) | APG09748 或 APG09106.1 的 sgRNA ( SEQ ID NO. ) | APG06646.1 的基因體 靶向序列 (SEQ ID NO.) | APG06646.1 的 sgRNA ( SEQ ID NO. ) |
| 5’ | 401 | 405 | 729 | 733 |
| 5’ | 402 | 406 | 730 | 734 |
| 3’ | 403 | 407 | 731 | 735 |
| 3’ | 404 | 408 | 732 | 736 |
靶向BCL11A增強子區域內的序列(SEQ ID NO:220)可提供增加胎兒血紅蛋白(HbF)以治癒或減輕鐮狀細胞疾病的症狀的機制。舉例而言,基因體廣泛關聯研究已經鑒別出BCL11A處的一組基因變異與增加的HbF位準相關聯。這些變異是在BCL11A的作用為階段特定、譜系限制的增強子區域的非編碼區中發現的SNP的集合。進一步的調研揭示在類紅血球細胞中對於BCL11A表現需要這種BCL11A增強子(Bauer等人(2013)Science 343:253-257,藉由引用併入本文)。在BCL11A基因的內含子2內發現了增強子區域,並且鑒別出內含子2中DNAseI過敏性的三個區(常常表示與調整潛力關聯的染色質狀態)。根據與BCL11A的轉錄初始位點的距離(以千鹼基(kilobase)為單位),將這三個區鑒別為「+62」、「+58」以及「+55」。這些增強子區域的長度大約為350(+55);550(+58);以及350(+62)個核苷酸(Bauer等人,2013)。範例 9.1 :鑒別較佳的 RGN 系統
於此描述了使用RGN系統對β-血紅蛋白病變的有潛力的治療,該RGN系統破壞BCL11A與其在HBB基因座位內的結合位點的結合,HBB基因座位是負責在成人血紅蛋白中製造β-球蛋白的基因。此措施使用在哺乳動物細胞中更有效的NHEJ。除此之外,此措施使用可以被包裝於單一AAV載體內以用於活體內遞送的足夠小尺寸的核酸酶。
人的BCL11A增強子區域中的GATA1增強子模體(SEQ ID NO:220)是在HbF在成人紅血球中同時重新表現的情況下,使用RNA導引的核酸酶(RGN)來降低BCL11A表現從而進行破壞的理想靶向(Wu 等人(2019)Nat Med 387:2554)。與APG09748或APG09106.1相容的幾個PAM序列顯而易見處於圍繞此GATA1位點的基因座位處。這些核酸酶具有5'-DTTN-3'(SEQ ID NO:60)的PAM序列,並且尺寸密質,可能使它們與單一AAV或腺病毒載體中的適合導引RNA一起遞送。除了其尺寸之外,APG06646.1還具有最小的PAM需要(SEQ ID NO:109),這使得其非常適合用於此措施。這種遞送措施相對於其他措施具有多種優勢,諸如,獲得造血幹細胞以及完善建立的安全性分佈和製造技術。
來自化膿性葡萄球菌(SpyCas9)的常用Cas9核酸酶需要5'-NGG-3'的PAM序列(SEQ ID NO:101),其中幾個存在於GATA1模體附近。然而,SpyCas9的大小妨礙了包裝於單一AAV或腺病毒載體內,且因此放棄了上面提及的此措施方法的優點。儘管可以採用雙遞送策略,但這樣會增加明顯的製造複雜性和成本。另外,雙病毒載體遞送明顯降低了基因修正的效率,因為給定細胞中的成功編輯需要用這兩個載體來感染。
生成了編碼人的密碼子最佳化的APG09748(SEQ ID NO: 409)、APG09106.1(SEQ ID NO: 410)或APG06646.1 (SEQ ID NO: 415)的表現卡匣,類似於在範例5中描述的那些。還生成了表現針對RGN APG09748、APG09106.1或APG06646.1的導引RNA的表現卡匣。這些導引RNA包括:1)原型間隔體序列,其與BCL11A增強子基因座位(靶向序列)內的非編碼或編碼DNA股互補;以及2)導引RNA與RGN關聯所需的RNA序列。因為每一個RGN靶向的幾個有潛力的PAM序列圍繞BCL11A GATA1增強子模體,所以生成了幾種有潛力的導引RNA構築體,以確定生成強健割裂和NHEJ媒介的BCL11A GATA1增強子序列破壞的最佳原型間隔體序列。使用表11中提供的sgRNA評價表11中的靶向基因體序列。表 11 :使用 APG06646.1 的 BCL11A GATA1 增強子
基因座位的靶向序列
| APG09748 或 APG0916.1 的 靶向基因體序列( SEQ ID NO. ) ( SEQ ID NO. ) | APG09748 或 APG0916.1 的 sgRNA ( SEQ ID NO. ) | APG06646.1 的 靶向基因體序列 ( SEQ ID NO. ) | APG06646.1 的 sgRNA ( SEQ ID NO. ) |
| 221 | 224 | 737 | 740 |
| 222 | 269 | 738 | 741 |
| 223 | 270 | 739 | 742 |
為了評價APG09748、APG09106.1或APG06646.1產生破壞BCL11A增強子區域的插入或刪除的效率,使用人細胞系,諸如,人胚腎細胞(HEK細胞)。有RGN表現卡匣之DNA載體被生成(如範例5中所述)。還生成包括表現卡匣的各別載體,該表現卡匣包括表11的導引RNA序列的編碼序列。如在範例5中所描述的,這種表現卡匣可更包括人RNA聚合酶III U6啟動子(SEQ ID NO:308)。作為另一種選擇,可以使用包括RGN和導引RNA兩者的表現卡匣的單一載體。使用標準技術,諸如,範例5中所描述的那些技術,將載體引入HEK細胞中,並將細胞培養1-3天。在此培養期後,分離基因體DNA,並藉由使用T7核酸內切酶I消化及/或直接DNA定序來確定插入或刪除頻率,如在範例5中所描述的。
用含有Illumina Nextera XT突出部序列的引子,藉由PCR來擴增涵蓋靶向BCL11A區域的DNA的區域。使用T7核酸內切酶I消化檢查這些PCR擴增子之NHEJ形成,或者按照Illumina 16S環境基因體定序庫的操作流程或類似的下一代定序(NGS)庫製備,這些PCR擴增子經受庫製備。在深度定序後,藉由CRISPResso分析產生的讀數,以計算編輯率。手動策劃輸出對齊,以確認插入和刪除位點。此分析鑒別出較佳RGN和對應的較佳導引RNA(sgRNA)。該分析可得出的結果是APG09748,、APG09106.1或APG06646.1是同樣較佳的,或者一個RGN是最較佳的。另外,該分析可確定存在一個以上的較佳導引RNA,或者表17中的所有靶向基因體序列是同樣較佳的。範例 9.2 :胎兒血紅蛋白表現的測定
在此範例中,測定破壞BCL11A增強子區域的APG09748、APG09106.1或APG06646.1所產生插入或刪除之胎兒血紅蛋白的表現。使用健康人供體CD34+造血幹細胞(HSC)。培養這些HSC,並使用與範例5中所描述的方法類似的方法,引入包括表現卡匣的載體,該表現卡匣包括較佳RGN和較佳sgRNA的編碼區域。作為另一種選擇,可使用電穿孔。在電穿孔後,使用已建立的操作流程將這些細胞在試管內分化為紅血球(舉例而言,Giarratana等人(2004)Nat Biotechnology 23:69-74,藉由引用併入本文)。然後,使用西方印漬法(western blotting),用抗人HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與僅用RGN電穿孔但沒有導引的HSC相較時,預期BCL11A增強子基因座的成功破壞將引起HbF生成的增加。範例 9.3 :減少的鐮狀化細胞形成的測定
在此範例中,測定破壞BCL11A增強子區域的APG09748、APG09106.1或APG06646.1之所產生插入或刪除的減少的鐮狀化細胞形成。使用來自患有鐮狀細胞病的患者的供體CD34+造血幹細胞(HSC)。培養這些HSC,並使用與在範例5中所描述的方法類似的方法引入包括表現卡匣的(數個)載體,該表現卡匣包括較佳RGN的和較佳sgRNA的編碼區域。作為另一種選擇,可使用電穿孔。在電穿孔後,使用已建立的操作流程(Giarratana等人(2004)Nat Biotechnology 23:69-74)將這些細胞在試管內分化成紅血球。然後,使用西方印漬法(western blotting),用抗人HbF抗體來測量HbF的表現,或經由高效液相層析法(HPLC)定量HbF的表現。當與僅用RGN電穿孔但沒有導引的HSC相較時,預期BCL11A增強子基因座位的成功破壞將引起HbF生成的增加。
藉由加入偏酸式亞硫酸鹽(metabisulfite),在這些分化的紅血球中誘導鐮狀細胞形成。使用顯微鏡對鐮狀與正常紅血球的數量計數。預期鐮狀細胞在用APG09748、APG09106.1或APG06646.1加sgRNA處置的細胞中的的數量少於在未處置的細胞中的或單獨用RGN處置的細胞中的數量。範例 9.4 :鼠模型中的疾病治療確效
為了評價使用APG09748、APG09106.1或APG06646.1破壞BCL11A基因座位的效力,使用適合的鐮狀細胞貧血症的人源化小鼠模型。將編碼較佳RGN和較佳sgRNA的表現卡匣包裝於AAV載體或腺病毒載體內。尤其是,腺病毒Ad5/35型在靶向HSC方面是有效的。選用含有帶有鐮狀細胞對偶基因的人源化HBB基因座位的適合的小鼠模型,諸如,B6;FVB-Tg(LCR-HBA2、LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。單獨用粒細胞菌落刺激因子(granulocyte colony-stimulating factor)或與普樂沙福(plerixafor)結合處置這些小鼠,以將HSC移入循環。然後,靜脈內注射攜帶RGN和導引質體的AAV或腺病毒,並使小鼠恢復一周。在試管內鐮狀化測定(sickling assay)中使用偏酸式亞硫酸鹽測試從這些小鼠獲得的血液,並且縱向追蹤小鼠,以監測死亡率和造血功能。當與用缺少兩種表現卡匣的病毒或用僅攜帶RGN表現卡匣的病毒處置的小鼠相較時,預期用攜帶RGN和導引RNA的AAV或腺病毒的治療將降低鐮狀化、死亡率並且改善造血功能。範例 10 :哺乳動物細胞中的鹼基編輯活性
如下構築生成胞苷去胺酶RGN融合蛋白的表現卡匣。RGN的編碼序列(本文描述的APG06646.1及第2019/0367949號美國專利申請公開和第WO 2019/236566號國際專利申請公開描述的APG08290.1,這兩個專利申請公開藉由引用整體併入本文)針對哺乳動物表現而被密碼子最佳化且被突變,以起切口酶(分別地SEQ ID NO:128和262)的作用。此編碼序列被引入生成融合蛋白的表現卡匣,該融合蛋白在其N末端側處包括NLS(SEQ ID NO:125),在其C末端側處可操作地鏈接至3xFLAG標記(SEQ ID NO: 126),在其C末端側處可操作地鏈接至胞苷去胺酶(SEQ ID NO:129-132;它們全部揭露於第PCT/US2019/068079號國際專利申請中,該國際專利申請藉由引用整體併入本文),在其C末端側上可操作地鏈接至胺基酸鏈接子(SEQ ID NO:133),在其C末端側上可操作地鏈接至RGN切口酶,在其C末端側處可操作地鏈接至第二NLS(SEQ ID NO:127)。這些表現卡匣的每一個都被引入能夠在哺乳動物細胞中驅動融合蛋白的表現的f pTwist CMV載體(Twist Bioscience)內。還生成在哺乳動物細胞中在人U6啟動子的控制下表現導引RNA的各別載體。這些導引RNA(nAPG06646.1的SEQ ID NO:134-136和nAPG08290.1的SEQ ID NO:263-265)能夠將脫氨酶nRGN融合蛋白或RGN本身導引至靶向的基因體序列,以分別進行鹼基編輯或基因編輯。
在24孔培養盤中,使用Lipofectamine 2000試劑(Life Technologies),將500 ng的胞苷去胺酶表現質體或標準RGN表現質體和500 ng的導引RNA表現質體共轉染為75-90%匯合率(cofluency)的HEK293FT細胞。然後,使細胞在37 ℃下溫育72小時。然後,按照製造商的說明,使用NucleoSpin 96 Tissue(Macherey-Nagel)萃取基因體DNA。將導引RGN靶向位點側翼的基因體區域進行PCR擴增,並按照製造商的操作流程,使用ZR-96 DNA Clean和Concentrator(Zymo Research)來純化產物。然後,輸送經純化的PCR產物,以對Illumina MiSeq(2x250)進行下一代定序。分析結果是否有插入或缺失(indel)形成或特定胞嘧啶突變。
下面的表12顯示每一個構築體和導引組合物的胞苷鹼基編輯和插入或缺失(indel)形成。有趣的是,當將RGN APG06646.1的活性與使用相同導引RNA的胞苷去胺酶nAPG06646.1的活性相較時,觀察到胞苷鹼基編輯比基因編輯高出達20%。這些結果證明在特別靶向位點具有低核酸酶活性的RGN在此位點仍可作為有效鹼基編輯器。再者,由於鹼基編輯應用中的插入或缺失形成常常是不想要的結局,所以位點處具有低核酸酶活性的RGN對於鹼基編輯應用是較佳的。表 12 : RGN 和胞苷去胺酶 nRGN 的胞苷鹼基編輯和基因編輯
範例 11 :反式 ssDNA 割裂 11.1 確定反式 DNA 割裂的測定條件
| RGN 或去胺酶 RGN | 導引 RNA | 胞苷鹼基編輯的總讀數 % | 插入或缺失形成的總讀數 % |
| ARM05-nAPG06646.1 | SGN000775 | 8.02 | 0.82 |
| ARM06CTD-nAPG06646.1 | SGN000775 | 0 | 0 |
| ARM08-nAPG06646.1 | SGN000775 | 5.15 | 0.46 |
| ARM11-nAPG06646.1 | SGN000775 | 0.66 | 0 |
| APG06646.1 | SGN000775 | 0 | 0.47 |
| ARM05-nAPG06646.1 | SGN000777 | 2.5 | 0.08 |
| ARM06CTD-nAPG06646.1 | SGN000777 | 0.53 | 0 |
| ARM08-nAPG06646.1 | SGN000777 | 8.12 | 0.25 |
| ARM11-nAPG06646.1 | SGN000777 | 3.52 | 1.04 |
| APG06646.1 | SGN000777 | 0 | 1.44 |
| ARM05-nAPG06646.1 | SGN000781 | 13.51 | 0.27 |
| ARM06CTD-nAPG06646.1 | SGN000781 | 2.69 | 0.13 |
| ARM08-nAPG06646.1 | SGN000781 | 12.97 | 0.12 |
| ARM11-nAPG06646.1 | SGN000781 | 4.7 | 0.14 |
| APG06646.1 | SGN000781 | 0 | 0.65 |
| ARM05-nAPG08290.1 | SGN000143 | 1.35 | 7.04 |
| ARM06CTD-nAPG08290.1 | SGN000143 | 1.36 | 3.17 |
| ARM08-nAPG08290.1 | SGN000143 | 2.59 | 10.98 |
| ARM11-nAPG08290.1 | SGN000143 | 4.78 | 5.77 |
| APG08290.1 | SGN000143 | 0 | 6.21 |
| ARM05-nAPG08290.1 | SGN000169 | 4.26 | 12.87 |
| ARM06CTD-nAPG08290.1 | SGN000169 | 1.63 | 8.29 |
| ARM08-nAPG08290.1 | SGN000169 | 6.99 | 14.27 |
| ARM11-nAPG08290.1 | SGN000169 | 4.99 | 6.39 |
| APG08290.1 | SGN000169 | 0 | 11.85 |
| ARM05-nAPG08290.1 | SGN000173 | 3.26 | 5.51 |
| ARM06CTD-nAPG08290.1 | SGN000173 | 0.72 | 0.96 |
| ARM08-nAPG08290.1 | SGN000173 | 6.6 | 6.06 |
| ARM11-nAPG08290.1 | SGN000173 | 2.83 | 4.82 |
| APG08290.1 | SGN000173 | 0 | 2.58 |
在Cutsmart緩衝液(New England Biolabs B7204S)中,將經純化的APG09748(如SEQ ID NO:137所列和第PCT/US2019/068079號國際專利申請所描述的,該國際專利申請藉由引用併入本文)與單一導引RNA (sgRNA) 以50 nM的核酸酶和100 nM的sgRNA或者200 nM的核酸酶和400 nM的sgRNA的最終濃度溫育10分鐘。將這些RNP溶液添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中ssDNA(靶向或誤配陰性對照物ssDNA)的最終濃度為10 nM而報導子探針的最終濃度為250 nM的溶液。報導子探針(TB0125和TB0089,由SEQ ID NO:138和139分別列出)在5’末端含有熒光染劑(56-FAM用於TB0125而Cy5用於TB0089),在3’末端含有淬滅體(3IABkFQ用於TB0125而3IAbRQSp用於TB0089),並且視情況含有內部淬滅體(內部淬滅體ZEN僅存在於TB0125上)。報導子探針的割裂導致熒光染劑去淬滅,並且由此導致熒光訊號增大。為監測熒光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在30℃下在Corning的小體積384孔微量盤中溫育10 µl的每一個反應物。
為對此測定確定適合的參數,探測許多條件。為確定是否有淬滅的探針設計或熒光團特性的效果,在每一個反應物中包含兩個這種報導子而作為混合物。在任何給定的反應物中,它們處於彼此相同的濃度。在所有情況中,對照物或靶向ssDNA的濃度(LE201或LE205,由SEQ ID NO:140和141分別列出)為10 nM。RNP名稱示意了如下面的表13所表示的核酸酶和靶向。表 13. 核糖核蛋白複合物
| RNP 名稱 | 核酸酶 | sgRNA | 旨在靶向 |
| APG09748.1 | APG09748 | 27sg.1 (SEQ ID NO: 144) | LE201 (SEQ ID NO: 140) |
| APG09748.2 | APG09748 | 27sg.2 (SEQ ID NO: 145) | LE205 (SEQ ID NO: 141) |
結果示於下面的表14中。表 14. 反式 DNA 割裂測定的結果
| 斜率 ( RFU/ 分鐘 ) | |||||
| RNP 名稱 | [RNP] (nM) | [ 報導子 ] (nM) | 靶向 | Cy5 通道 | FAM 通道 |
| APG09748.1 | 25 nM | 0 | LE201 | -0.30 | -2.40 |
| APG09748.1 | 25 nM | 50 | LE201 | 420.00 | 46.20 |
| APG09748.1 | 25 nM | 250 | LE201 | 1040.40 | 47.40 |
| APG09748.1 | 25 nM | 500 | LE201 | 1090.20 | 57.00 |
| APG09748.1 | 25 nM | 750 | LE201 | 996.60 | 36.60 |
| APG09748.1 | 25 nM | 1000 | LE201 | 770.40 | 36.00 |
| APG09748.1 | 25 nM | 0 | LE205 | 0.60 | -1.80 |
| APG09748.1 | 25 nM | 50 | LE205 | 6.00 | -1.20 |
| APG09748.1 | 25 nM | 250 | LE205 | 16.80 | -3.00 |
| APG09748.1 | 25 nM | 500 | LE205 | 33.00 | 1.80 |
| APG09748.1 | 25 nM | 750 | LE205 | 18.00 | 3.00 |
| APG09748.1 | 25 nM | 1000 | LE205 | -21.60 | -51.60 |
| APG09748.2 | 25 nM | 0 | LE201 | -0.18 | -1.80 |
| APG09748.2 | 25 nM | 50 | LE201 | 4.20 | 1.20 |
| APG09748.2 | 25 nM | 250 | LE201 | 42.60 | 3.00 |
| APG09748.2 | 25 nM | 500 | LE201 | 70.80 | 10.20 |
| APG09748.2 | 25 nM | 750 | LE201 | 67.80 | 10.80 |
| APG09748.2 | 25 nM | 1000 | LE201 | 55.80 | 7.80 |
| APG09748.2 | 25 nM | 0 | LE205 | 0.06 | -2.40 |
| APG09748.2 | 25 nM | 50 | LE205 | 321.00 | 64.20 |
| APG09748.2 | 25 nM | 250 | LE205 | 669.60 | 63.00 |
| APG09748.2 | 25 nM | 500 | LE205 | 706.80 | 52.20 |
| APG09748.2 | 25 nM | 750 | LE205 | 627.00 | 55.20 |
| APG09748.2 | 25 nM | 1000 | LE205 | 534.60 | 46.80 |
| APG09748.1 | 100 nM | 0 | LE201 | -0.42 | -1.80 |
| APG09748.1 | 100 nM | 50 | LE201 | 1063.80 | 155.40 |
| APG09748.1 | 100 nM | 250 | LE201 | 2386.20 | 144.00 |
| APG09748.1 | 100 nM | 500 | LE201 | 3058.80 | 108.60 |
| APG09748.1 | 100 nM | 750 | LE201 | 2974.20 | 99.00 |
| APG09748.1 | 100 nM | 1000 | LE201 | 3282.00 | 113.40 |
| APG09748.1 | 100 nM | 0 | LE205 | 1.20 | -0.36 |
| APG09748.1 | 100 nM | 50 | LE205 | 6.60 | 0.18 |
| APG09748.1 | 100 nM | 250 | LE205 | 27.00 | 1.80 |
| APG09748.1 | 100 nM | 500 | LE205 | 52.80 | 12.60 |
| APG09748.1 | 100 nM | 750 | LE205 | 57.60 | 9.00 |
| APG09748.1 | 100 nM | 1000 | LE205 | 73.80 | 16.20 |
| APG09748.2 | 100 nM | 0 | LE201 | 0.06 | -0.48 |
| APG09748.2 | 100 nM | 50 | LE201 | 25.80 | 9.00 |
| APG09748.2 | 100 nM | 250 | LE201 | 198.00 | 15.00 |
| APG09748.2 | 100 nM | 500 | LE201 | 265.80 | 16.20 |
| APG09748.2 | 100 nM | 750 | LE201 | 277.20 | 19.20 |
| APG09748.2 | 100 nM | 1000 | LE201 | 258.00 | 7.80 |
| APG09748.2 | 100 nM | 0 | LE205 | 0.12 | 0.00 |
| APG09748.2 | 100 nM | 50 | LE205 | 844.80 | 257.40 |
| APG09748.2 | 100 nM | 250 | LE205 | 2091.60 | 270.60 |
| APG09748.2 | 100 nM | 500 | LE205 | 2551.80 | 196.80 |
| APG09748.2 | 100 nM | 750 | LE205 | 2490.60 | 186.00 |
| APG09748.2 | 100 nM | 1000 | LE205 | 2511.00 | 138.00 |
由此實驗得出的結論是相較於25 nM濃度的RNP,100 nM濃度的RNP一般而言導致較高的報導子探針割裂率。一般來說,最多到250至500 nM的報導子濃度,報導子寡核苷酸濃度越高,則報導子割裂率越高,幾乎沒有從報導子濃度的進一步升高觀察到什麼益處。顯然,對於TB0089報導子(在Cy5通道中偵測的),尤其是在報導子濃度高於250 nM時,存在干擾靶向分化的實質較高位準的背景活性。因此,得出結論,報導子濃度高於250 nM沒有什麼益處。藉由RNP,兩個探針似乎更適合觀察靶向辨識。11.2 APG09748 反式 DNA 割裂以及純化對非特定活性的影響
經純化的APG09748與單一導引RNA(sgRNA)在37℃下在1X Cutsmart緩衝液(New England Biolabs B7204S)中以200 nM核酸酶和400 nM的sgRNA的最終濃度溫育10分鐘。然後,將這些RNP溶液添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中ssDNA(靶向或誤配陰性對照物ssDNA)的最終濃度為10 nM而報導子探針(TP0003)的最終濃度為250 nM的溶液。報導子探針在5’末端含有熒光染劑,而在3’末端含有淬滅體。報導子探針的割裂導致熒光染劑去淬滅,並且由此導致熒光訊號增大。為監測熒光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中溫育10 µl的每一個反應物。
相對於陰性對照物,與靶向序列的溫育導致以時間為函數的熒光強度實質增強。割裂率被概況為熒光對時間函數的線性部分的斜率,如表15所顯示。表 15. 反式 DNA 割裂的測定結果
| ssDNA 基質序列 | 斜率 (RFU/ 分鐘 ) |
| 誤配 (LE111; SEQ ID NO: 142) | 549 |
| 匹配 (LE113; SEQ ID NO: 143) | 7724 |
這些資料顯示藉由使用割裂的報導子探針可清楚地偵測的RNP之從陰性對照物分化的靶向序列。11.3 使用平行質體 DNA 庫的 PAM 確定
使用NEBuilder HiFi DNA Assembly Master Mix(New England Biolabs),來黏合含有其前面是5 nt簡並PAM序列(NNNNN)的靶向序列的寡核苷酸(如SEQ ID NO:266和267分別所列的LE00680和LE00688)並將其選殖於雙消化pUC19質體內。由此反應物的轉化得到的每一個菌落與選殖質體DNA序列對應,使得來自由單一菌落衍生的培養物的質體DNA的製備物是從原始庫取樣的獨特質體製備物。質體製備物由96個菌落的取樣獲得。這些製備物個別地經受Sanger定序,以驗證它們的PAM序列。
經純化的APG09748與sgRNA (27sg.2)在1X Cutsmart緩衝液(New England Biolabs B7204S)中以200 nM的核酸酶和400 nM的sgRNA的最終濃度在室溫下溫育20分鐘。
將這些RNP溶液以100 nM的最終濃度添加至在1.5X Cutsmart緩衝液(New England Biolabs B7204S)中質體DNA靶向的最終濃度為8.3 nM而TB0125和TB0089報導子(SEQ ID NO:138和139分別所列的)的最終濃度分別為250 nM和50 nM的溶液。為監測熒光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中溫育10 µl的每一個反應物。
少數樣本中的質體濃度低於濃度正規化的靶向,或者溶液的體積不足以將所欲靶向量遞送至反應孔。把這些樣本從分析中排除,且由此,通過複製品之間的不一致性,預期這些樣本是錯誤的原因。把使用在藉由Sanger定序評價後被確定在靶向序列中具有交互污染(PAM區域中顯而易見的複數痕量)或改變的質體的樣本從分析中排除,且下面未顯示它們的結果。分析結果藉由FAM通道中的斜率以降序顯示於下面的表16中。表 16. PAM 序列
| 斜率 (RFU/ 分鐘 ) | |||
| PAM | SEQ ID NO | Cy5 通道 | FAM 通道 |
| ATATG | 147 | 111.52 | 1728.13 |
| ATATG | 147 | 102.42 | 1612.86 |
| TATTG | 148 | 137.15 | 846.12 |
| TATTG | 148 | 148.61 | 799.82 |
| CGTTC | 149 | 151.06 | 744.18 |
| CGTTC | 149 | 134.61 | 735.35 |
| TTTTT | 150 | 167.71 | 731.11 |
| TTTTT | 150 | 149.83 | 711.78 |
| CAATC | 151 | 120.84 | 675.71 |
| AATCT | 152 | 134.67 | 622.52 |
| AATCT | 152 | 134.1 | 620.2 |
| CAATC | 151 | 96.94 | 608.58 |
| AAATT | 153 | 152.6 | 607.24 |
| AAATT | 153 | 150.57 | 591.77 |
| CATCC | 154 | 97.34 | 588.7 |
| AGATA | 155 | 214.69 | 579.56 |
| TATTC | 156 | 124.22 | 570.81 |
| ATTTT | 157 | 134.72 | 551.91 |
| AGATA | 155 | 198.45 | 544.81 |
| TATTC | 156 | 108.57 | 538.18 |
| TCTTT | 158 | 141.66 | 532.87 |
| ATTTT | 157 | 107.9 | 526.75 |
| AGATC | 159 | 106.93 | 497.71 |
| AATAA | 160 | 78.94 | 484.67 |
| TCTTT | 158 | 117.19 | 484.13 |
| GATCC | 161 | 112.85 | 479.91 |
| GATCC | 161 | 105.04 | 474.94 |
| AGATC | 159 | 106.5 | 473.98 |
| ATTCA | 162 | 115.03 | 473.24 |
| AATAA | 160 | 77.43 | 465.75 |
| AAAAT | 163 | 78.3 | 458.23 |
| TTATC | 164 | 102.14 | 456.73 |
| TATCA | 165 | 106.45 | 448.78 |
| TCACT | 166 | 167.02 | 429.36 |
| CTTAT | 167 | 82.9 | 418.38 |
| TATTG | 148 | 116.08 | 417.94 |
| TCACT | 166 | 160.29 | 415.64 |
| AAAAT | 163 | 56.43 | 411.26 |
| TGATA | 168 | 89.02 | 406.14 |
| TGATA | 168 | 85.99 | 395.57 |
| TACTA | 169 | 90.61 | 391.06 |
| ATTTT | 157 | 113.18 | 382.59 |
| TACTA | 169 | 74.33 | 364.56 |
| ATTTT | 157 | 106.72 | 364.02 |
| TATTG | 148 | 93.95 | 341.36 |
| CTTAT | 167 | 76.12 | 336.8 |
| ATATA | 170 | 83.39 | 326.86 |
| ATATA | 170 | 72.98 | 318.2 |
| TATCA | 165 | 65.41 | 317.53 |
| GACTC | 171 | 56.56 | 302.2 |
| GCTCA | 172 | 22.1 | 293.68 |
| TAACC | 173 | 56.08 | 283.99 |
| CGTGT | 174 | 66.57 | 268.89 |
| TAACC | 173 | 56.55 | 265.45 |
| TTTCG | 175 | 59.55 | 262.91 |
| CGTGT | 174 | 50.71 | 262.37 |
| TTTCG | 175 | 61.42 | 261.65 |
| CAGTA | 176 | 51.81 | 240.09 |
| GCTCA | 172 | 19.08 | 228.08 |
| CAGTA | 176 | 51.09 | 220.25 |
| CCCTT | 177 | 17.83 | 136.69 |
| CCTAT | 178 | 40.4 | 125.81 |
| TCCCT | 179 | 39.93 | 124.6 |
| AGGTT | 180 | 40.96 | 117.18 |
| AGGTT | 180 | 40.81 | 114.79 |
| TAACG | 181 | 32.53 | 94.68 |
| AACAG | 182 | 8.19 | 91.72 |
| CCTAT | 178 | 34.51 | 87.57 |
| TGAAC | 183 | 10.22 | 86.38 |
| TAAGT | 184 | 19.35 | 85.12 |
| TCCCT | 179 | 26.67 | 83.02 |
| TAACG | 181 | 27.62 | 79.17 |
| TAACG | 181 | 28.89 | 78.55 |
| TAACG | 181 | 22.23 | 78.36 |
| CTGTA | 185 | 23.27 | 77.06 |
| AGGGG | 186 | 30.8 | 74.4 |
| GCTGT | 187 | 28.3 | 71.54 |
| ATCTA | 188 | 18.73 | 69.15 |
| GCTGT | 187 | 25.61 | 69.06 |
| TTATC | 164 | 22.8 | 68.13 |
| AACAG | 182 | 23.98 | 67.27 |
| TCAGG | 189 | 17.25 | 67.04 |
| ATGTC | 190 | 13.91 | 65.93 |
| TGCTA | 191 | 26.33 | 65.73 |
| TAAAA | 192 | 17.32 | 65.43 |
| ATCTA | 188 | 16.88 | 65.3 |
| CTGTA | 185 | 21.81 | 64.15 |
| GACTC | 171 | 24.05 | 64.02 |
| ATTCA | 162 | 25.04 | 63.87 |
| TGAAC | 183 | 24.53 | 63.64 |
| CCCTT | 177 | 21.35 | 61.95 |
| ATGTC | 190 | 12.99 | 60.6 |
| ATCAG | 193 | 22.32 | 59.63 |
| ATCAG | 193 | 18.55 | 56.58 |
| CGGGG | 194 | 27.86 | 56.28 |
| TAAAA | 192 | 17.72 | 56.03 |
| TTCTC | 195 | 25.7 | 55.83 |
| GTCAT | 196 | 23.07 | 55.76 |
| GCGTG | 197 | 17.36 | 55.12 |
| GCGTG | 197 | 22.02 | 55.02 |
| GCAAT | 198 | 15.47 | 54.91 |
| TTCTC | 199 | 21.89 | 54.89 |
| GTCAT | 196 | 17.22 | 54.34 |
| GCAAT | 198 | 17.36 | 53.32 |
| AGCAT | 200 | 22.47 | 52.23 |
| GTCAA | 201 | 14.14 | 52.12 |
| AGAGC | 202 | 19.62 | 51.79 |
| AGAGC | 202 | 15.99 | 50.37 |
| GTGGG | 203 | 22.38 | 50.1 |
| CTGAA | 204 | 21.24 | 49.45 |
| CTGAT | 205 | 12.05 | 49.32 |
| ATGAA | 206 | 17.93 | 49.15 |
| ACCTT | 207 | 19.66 | 49.12 |
| ACCTT | 207 | 22.74 | 49.12 |
| GTCAA | 201 | 13 | 48.21 |
| AACCA | 208 | 17.81 | 48.04 |
| AACCA | 208 | 15.75 | 47.87 |
| GTAAA | 209 | 16.3 | 47.85 |
| TAGGA | 210 | 18.68 | 47.73 |
| CCGAA | 211 | 20.24 | 47.58 |
| AGCAT | 200 | 22.95 | 47.52 |
| CGGGG | 194 | 20.94 | 47.41 |
| GTCAT | 196 | 15.17 | 47.24 |
| CTGAA | 204 | 20.4 | 46.36 |
| GTGGG | 203 | 19.98 | 46.25 |
| TACGA | 212 | 16.79 | 46.18 |
| TGGCT | 213 | 14.81 | 45.75 |
| GTCAT | 196 | 15.55 | 45.51 |
| ATGAA | 206 | 19.11 | 45.09 |
| TAGGA | 210 | 21.65 | 44.94 |
| TTCTC | 199 | 21.44 | 44.76 |
| CCAAG | 214 | 16.98 | 44.61 |
| GTAAA | 209 | 15.35 | 44.59 |
| TGCTT | 215 | 15.79 | 44.54 |
| CTAAA | 216 | 12.72 | 44.28 |
| TGCTA | 191 | 16 | 44.14 |
| TACGA | 212 | 16.07 | 44.06 |
| TCGAT | 217 | 22.28 | 43.96 |
| TTCTC | 199 | 15.94 | 42.55 |
| CTGAT | 205 | 16.13 | 42.27 |
| TCAGG | 189 | 11.38 | 41.9 |
| CCAAG | 214 | 11.28 | 41.45 |
| AGGGG | 186 | 16.04 | 41.44 |
| TCGAT | 217 | 18.68 | 40.5 |
| CCGAA | 211 | 15.39 | 39.09 |
| CTAAA | 216 | 10.72 | 30.37 |
| GTAAC | 218 | 4.36 | 9.51 |
| TGCTT | 215 | -0.32 | -0.7 |
| TAAGT | 184 | -0.57 | -1.3 |
| CATCC | 154 | 0.47 | -1.95 |
| TGGCT | 213 | -0.03 | -2.2 |
| GTAAC | 219 | -0.46 | -2.3 |
具有最高斜率的序列看起來符合藉由前面在第PCT/US2019/068079號國際專利申請(藉由引用併入本文)中描述的質體消耗測定法確定的預測PAM(如SEQ ID NO:60所列的DTTN)。特別是,我們看到“T”處於該位置靶向的兩個核苷酸5’的強烈偏好。令人驚奇的是,在此測定中觀察到的大多數活性PAM位點(ATATG,SEQ ID NO:147)不與DTTN(SEQ ID NO:60)的共有體(consensus)完全匹配,這暗示在此辨識位點中有某個位準的靈活性。11.4 存在 PCR 擴展 DNA 情況下的反式 ssDNA 割裂活性
使用適當引子,由基因體DNA(如SEQ ID NO:225和226分別所列的TRAC和VEGF擴增子)產生PCR擴增靶向。藉由具有序列LE573和LE578 (SEQ ID NO:228和229分別所列的)的引子,VEGF靶向(SEQ ID NO:227所列的)是從HEK293T細胞基因體DNA被PCR擴增。TRAC靶向(SEQ ID NO:230所列的)是藉由LE257和LE258(SEQ ID NO:231和232分別所列的)PCR擴增的。
RNP是藉由溫育在1X NEBuffer 2(New England Biolabs)中分別為0.5 µM 以及1 µM的本文描述的APG09106.1核酸酶和sgRNA形成的,且在室溫下溫育20分鐘。表 17. 核糖核蛋白複合物
| RNP | 核酸酶 | 導引 RNA | 所欲靶向 |
| APG09106.2 | APG09106.1 | 27sg.2 (SEQ ID NO: 145) | LET126擴增子 隨機化PAM擴增子 |
| APG09106.836 | APG09106.1 | 27sg.836 (SEQ ID NO: 233) | VEGF擴增子 |
| APG09106.838 | APG09106.1 | 27sg.838 (SEQ ID NO: 234) | TRAC擴增子 |
在1.5X NEBuffer 2中與具有5’ TEX615標記和3' Iowa Black FQ淬滅體以及100 nM的分別的PCR產物的1.5 µM ssDNA的寡核苷酸報導子進行割裂反應。報導子探針的割裂導致熒光染劑去淬滅,且由此導致熒光訊號升高。為監測熒光強度,在微量盤讀取機(microplate reader)(CLARIOstar Plus)中在37℃下在Corning的小體積384孔微量盤中溫育10 µl的每一個反應物。動力分析結果顯示於表18中。表 18. 反式 DNA 割裂測定結果
| RNP | 靶向濃度 (nM) | 靶向 | 斜率 (RFU/ 分鐘 ) |
| 28.836 | 30 | TRAC擴增子 | 1204 |
| 28.838 | 30 | TRAC擴增子 | 8436 |
| 28.838 | 30 | VEGF擴增子 | 766 |
| 28.836 | 30 | VEGF擴增子 | 3484 |
這些結果表明在存在來自各種來源的PCR擴增DNA的情況下反式ssDNA割裂活性的特定活化。活性取決於PCR擴增基質的濃度。11.5 使用 ssDNA 割裂作為診斷
因於在存在靶向DNA序列的情況下這些核酸酶產生光學可偵測訊號的能力,它們有希望在診斷裝置內實現偵測基因疾病或諸如細菌、病毒或真菌的傳染性疾病的藥劑的功用。
診斷程序可包含對待測試的樣本中的核酸的分離或擴增。在不對核酸進行任何分離或擴增的情況下,使用某些樣本亦可以是適合的,因它們可以相當高的量存在於樣本中,在沒有擴增(諸如PCR)或在沒有干擾偵測或訊號生成的物料的情況下,足以被偵測。
然後,如其他範例中所描述而形成的RNP和報導子(諸如,前面的範例中使用的熒光團或淬滅體修飾的ssDNA寡核苷酸,或當被割裂時生成可見的或以其他方式容易偵測的訊號的某個其他種類的ssDNA基質)一起被暴露於樣本(或前面的段落中描述的經處理的樣本)中。如果使用熒光團-淬滅體綴合的DNA寡核苷酸(與前面描述的範例中相同),則使用在前面的範例中描述的熒光計可偵測那些。為簡化偵測,可進行終點測定,代替前面描述的動力測定,意味著該測定可相對於陽性和陰性對照物進行固定時間,且在此經過時間結束時讀出。
這些試劑亦可被整合於橫向流動裝置內,這樣允許利用非常小的儀器對引起給定疾病的藥劑或特定核酸序列(諸如,個體中的患病對偶基因)進行偵測。在此測定中,ssDNA報導子會與複數適合抗體或親和試劑捕獲的諸如熒光素、生物素和/或長葉毛地黃配質(digoxigenin)的分子綴合。
Claims (34)
- 一種核酸分子,包括編碼一RNA導引的核酸酶(RGN)多肽的一多核苷酸,其中該多核苷酸包括編碼一RGN多肽的一核苷酸序列,該RGN多肽選自由下列組成的群組中: a)包括具有與SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列一致性的一胺基酸序列的一RGN多肽;以及 b)包括列為SEQ ID NO:54的該胺基酸序列的一RGN多肽; 其中,當與能夠與一靶向DNA序列雜交的一導引RNA(gRNA)結合時,該RGN多肽能夠以一RNA導引的序列特定方式結合一DNA分子的該靶向DNA序列,並且 其中編碼一RGN多肽的該多核苷酸為可操作地鏈接至與該多核苷酸異源的一啟動子。
- 如請求項1所述的核酸分子,其中該RGN多肽是無核酸酶反應的或是能夠起一切口酶的作用。
- 如請求項1或請求項2所述的核酸分子,其中該RGN多肽為可操作地與一鹼基編輯的多肽融合。
- 一種包括如請求項1至請求項3中任一項所述的核酸分子的載體。
- 如請求項4所述的載體,更包括編碼能夠與該靶向DNA序列雜交的該gRNA的至少一個核苷酸序列,且其中該導引RNA包括一CRISPR RNA,該CRISPR RNA包括具有與SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列一致性的一CRISPR重複序列。
- 如請求項5所述的載體,其中該gRNA包括一tracrRNA,該tracrRNA具有與SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列一致性。
- 一種包括如請求項1至請求項3中任一項所述核酸分子、或如請求項4至請求項6中任一項所述載體的細胞。
- 一種核酸分子,包括編碼一CRISPR RNA(crRNA)的一多核苷酸,其中該crRNA包括一間隔體序列和一CRISPR重複序列,其中該CRISPR重複序列包括具有與SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列一致性的一核苷酸序列; 其中一導引RNA包括: a)該crRNA;視情況而定地以及 b)能夠與該crRNA的該CRISPR重複序列雜交的一反式活化的CRISPR RNA(tracrRNA); 當該導引RNA與一RNA導引的核酸酶(RGN)多肽結合時,該導引RNA通過該crRNA的該間隔體序列以一序列特定方式能夠與一DNA分子的一靶向DNA序列雜交,以及 其中編碼一crRNA的該多核苷酸為可操作地鏈接至與該多核苷酸異源的一啟動子。
- 一種包括如請求項25所述的核酸分子的載體。
- 如請求項9所述的載體,其中該載體更包括編碼該tracrRNA的一多核苷酸,並且其中該tracrRNA包括具有與SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列一致性的一核苷酸序列。
- 一種包括編碼一反式活化的CRISPR RNA(tracrRNA)的一多核苷酸的核酸分子,該反式活化的tracrRNA包括具有與SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列一致性的一核苷酸序列; 其中一導引RNA包括: a)該tracrRNA;以及 b)包括一間隔體序列和一CRISPR重複序列的一crRNA,其中該tracrRNA能夠與該crRNA的該CRISPR重複序列雜交; 當該導引RNA與一RNA導引的核酸酶(RGN)多肽結合時,該導引RNA通過該crRNA的該間隔體序列以一序列特定方式能夠與一DNA分子的一靶向DNA序列雜交,以及 其中編碼一tracrRNA的該多核苷酸為可操作地鏈接至與該多核苷酸異源的一啟動子。
- 一種包括如請求項11所述的核酸分子的載體。
- 如請求項9所述的載體,其中該載體更包括編碼該crRNA的一多核苷酸,並且其中該crRNA的該CRISPR重複序列包括具有與SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列一致性的一核苷酸序列。
- 一種用於結合一DNA分子的一靶向DNA序列的系統,該系統包括: a)能夠與該靶向DNA序列雜交的一個或複數導引RNA或包括編碼該一個或複數導引RNA(gRNA)的核苷酸序列的一個或複數多核苷酸;以及 b)一RNA導引的核酸酶(RGN)多肽, 該RGN多肽包括選自由下列組成的群組中的一胺基酸序列: i)具有與SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列一致性的一胺基酸序列; ii)列為SEQ ID NO:54的該胺基酸序列; 或包括編碼該RGN多肽的一核苷酸序列的一多核苷酸, 其中編碼該一個或複數導引RNA及編碼該RGN多肽的該核苷酸序列的每一個為可操作地鏈接至與該核苷酸序列異源的一啟動子; 以及 其中該一個或複數導引RNA能夠與該RGN多肽形成一複合物,從而將該RGN多肽導向至與該DNA分子的該靶向DNA序列結合。
- 如請求項14所述的系統,其中該靶向DNA序列是在一細胞內。
- 如請求項14或請求項15所述的系統,其中該RGN多肽是無核酸酶反應的或是能夠起一切口酶的作用,以及其中該RGN多肽為可操作地鏈接至一鹼基編輯多肽。
- 如請求項14或請求項15所述的系統,其中該系統更包括一個或複數供體多核苷酸或編碼該一個或複數供體多核苷酸的一個或複數核苷酸序列。
- 一種用於結合一DNA分子的一靶向DNA序列的方法,該方法包括將如請求項14至請求項17中任一項所述的系統遞送至該靶向DNA序列或包括該靶向DNA序列的一細胞。
- 一種用於割裂或修飾一DNA分子的一靶向DNA序列的方法,該方法包括將如請求項14至請求項17中任一項所述的系統遞送至該靶向DNA序列或包括該DNA分子的一細胞,以及發生該靶向DNA序列的割裂或修飾。
- 一種用於結合一DNA分子的一靶向DNA序列的方法,該方法包括: a)在適合形成一RNA導引的核酸酶(RGN)核糖核苷酸複合物的條件下,藉由組合: i)能夠與該靶向DNA序列雜交的一個或複數導引RNA;以及 ii)一RGN多肽,其包括選自由下列組成的群組中的一胺基酸序列: A)具有與SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列一致性的一胺基酸序列; B)列為SEQ ID NO:54的該胺基酸序列, 在試管內組裝該RGN核糖核苷酸複合物;以及 b)使該靶向DNA序列或包括該靶向DNA序列的一細胞與該在試管內組裝的RGN核糖核苷酸複合物接觸; 其中該一個或複數導引RNA與該靶向DNA序列雜交,從而將該RGN多肽導向至與該靶向DNA序列結合。
- 一種用於割裂及/或修飾一DNA分子的一靶向DNA序列的方法,該方法包括使該DNA分子與下列接觸: a)一RNA導引的核酸酶(RGN)多肽,其中該RGN包括選自由下列組成的群組中的一胺基酸序列: i)具有與SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列一致性的一胺基酸序列; ii)列為SEQ ID NO:54的該胺基酸序列; b)能夠將(a)的該RGN靶向該靶向DNA序列的一個或複數導引RNA; 其中該一個或複數導引RNA與該靶向DNA序列雜交,從而將該RGN多肽導向至與該靶向DNA序列結合,並且發生該靶向DNA序列的割裂及/或修飾。
- 如請求項21所述的方法,其中該修飾後靶向DNA序列包括該靶向DNA序列中的至少一個核苷酸的刪除或突變。
- 如請求項21或請求項22所述的方法,其中該RGN多肽是無核酸酶反應的或起一切口酶的作用,以及其中該RGN多肽為可操作地鏈接至一鹼基編輯多肽。
- 如請求項21所述的方法,其中該修飾後靶向DNA序列包括異源DNA插入該靶向DNA序列內。
- 如請求項21至請求項24中任一項所述的方法,其中該靶向DNA序列是在一細胞內。
- 如請求項25所述的方法,更包括在其中該RGN多肽被表現且割裂該靶向DNA序列以生成包括一修飾後DNA序列的一DNA分子的條件下培養該細胞;以及選擇包括該修飾後靶向DNA序列的一細胞。
- 一種包括如請求項26所述方法的一修飾後靶向DNA序列的細胞。
- 一種用於結合一DNA分子的一靶向DNA序列的系統,該系統包括: a)能夠與該靶向DNA序列雜交的一個或複數導引RNA,或包括編碼該一個或複數導引RNA(gRNA)的一個或複數核苷酸序列的一個或複數多核苷酸;以及 b)一RNA導引的核酸酶(RGN)多肽,其包括選自由下列組成的群組中的一胺基酸序列: i)具有與SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列一致性的一胺基酸序列; ii)列為SEQ ID NO:54的該胺基酸序列; 其中該一個或複數導引RNA能夠與該靶向DNA序列雜交,以及 其中該一個或複數導引RNA能夠與該RGN多肽形成一複合物,從而將該RGN多肽導向至與該DNA分子的該靶向DNA序列結合。
- 一種用於偵測一樣本中的一DNA分子的一靶向DNA序列的方法,該方法包括: a)使該樣本接觸: i)一RNA導引的核酸酶(RGN)多肽,其包括具有與SEQ ID NO:54或137至少95%序列一致性的一胺基酸序列,其中當與能夠與該靶向DNA序列雜交的一導引RNA結合時,該RGN多肽能夠以一RNA導引的序列特定方式結合一DNA分子的該靶向DNA序列; ii)該導引RNA;以及 iii)不與該導引RNA雜交的一偵測器單股DNA(ssDNA);以及 b)測量藉由該RGN割裂該偵測器ssDNA所生成的可偵測訊號,從而偵測該靶向DNA。
- 一種用於偵測一樣本中的一DNA分子的一靶向DNA序列的套組,該套組包括: a)一RNA導引的核酸酶(RGN)多肽,其包括具有與SEQ ID NO:54或137至少95%序列一致性的一胺基酸序列,其中當與能夠與該靶向DNA序列雜交的一導引RNA結合時,該RGN多肽能夠以一RNA導引的序列特定方式結合一DNA分子的該靶向DNA序列; b)該導引RNA;以及 c)不與該導引RNA雜交的一偵測器單股DNA(ssDNA)。
- 如請求項29所述的方法或如請求項30所述的套組,其中該偵測器ssDNA包括一螢光團/淬滅體對或一螢光共振能量轉移(FRET)對。
- 一種割裂單股DNA的方法,該方法包括使一族群的核酸接觸,其中該族群包括一DNA分子和複數個非靶向ssDNA,該DNA分子包括一靶向DNA序列: a)一RNA導引的核酸酶(RGN)多肽,其包括具有與SEQ ID NO:54或137至少95%序列一致性的一胺基酸序列,其中當與能夠與該靶向DNA序列雜交的一導引RNA結合時,該RGN多肽能夠以一RNA導引的序列特定方式結合該靶向DNA序列;以及 b)該導引RNA, 其中該RGN多肽割裂該複數個中的非靶向ssDNA。
- 一種包括編碼一CRISPR RNA(crRNA)的一多核苷酸的核酸分子,其中該crRNA包括一間隔體序列和一CRISPR重複序列,其中該CRISPR重複序列包括具有與SEQ ID NO:240至少95%序列一致性的一核苷酸序列; 其中一導引RNA包括: a)該crRNA;視情況而定以及 b)能夠與該crRNA的該CRISPR重複序列雜交的一反式活化的CRISPR RNA(tracrRNA); 當該導引RNA與一RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的該間隔體序列以一序列特定方式與一DNA分子的一靶向DNA序列雜交,以及 其中編碼一crRNA的該多核苷酸為可操作地鏈接至與該多核苷酸異源的一啟動子。
- 一種包括編碼一反式活化的CRISPR RNA(tracrRNA)的一多核苷酸的核酸分子,該tracrRNA包括具有與SEQ ID NO:241至少95%序列一致性的一核苷酸序列; 其中一導引RNA包括: a)該tracrRNA;以及 b)包括一間隔體序列和一CRISPR重複序列的一crRNA,其中該tracrRNA能夠與該crRNA的該CRISPR重複序列雜交; 當該導引RNA與一RNA導引的核酸酶(RGN)多肽結合時,該導引RNA能夠通過該crRNA的該間隔體序列以一序列特定方式與一DNA分子的一靶向DNA序列雜交;以及 其中編碼一tracrRNA的該多核苷酸為可操作地鏈接至與該多核苷酸異源的一啟動子。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962885483P | 2019-08-12 | 2019-08-12 | |
| US62/885,483 | 2019-08-12 | ||
| US201962901875P | 2019-09-18 | 2019-09-18 | |
| US62/901,875 | 2019-09-18 | ||
| US202063030088P | 2020-05-26 | 2020-05-26 | |
| US63/030,088 | 2020-05-26 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW202120688A true TW202120688A (zh) | 2021-06-01 |
Family
ID=72243198
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW109127218A TW202120688A (zh) | 2019-08-12 | 2020-08-11 | Rna導引之核酸酶及其活性片段及變體以及使用方法 |
Country Status (12)
| Country | Link |
|---|---|
| US (1) | US20220364074A1 (zh) |
| EP (1) | EP4013864A1 (zh) |
| JP (2) | JP7640527B2 (zh) |
| KR (1) | KR20220062289A (zh) |
| CN (2) | CN118813654A (zh) |
| AU (1) | AU2020329912A1 (zh) |
| BR (1) | BR112022002695A2 (zh) |
| CA (1) | CA3147783A1 (zh) |
| IL (1) | IL290562A (zh) |
| MX (1) | MX2022001849A (zh) |
| TW (1) | TW202120688A (zh) |
| WO (1) | WO2021030344A1 (zh) |
Families Citing this family (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9340800B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | Extended DNA-sensing GRNAS |
| AU2015330699B2 (en) | 2014-10-10 | 2021-12-02 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
| WO2019226953A1 (en) | 2018-05-23 | 2019-11-28 | The Broad Institute, Inc. | Base editors and uses thereof |
| WO2020092453A1 (en) | 2018-10-29 | 2020-05-07 | The Broad Institute, Inc. | Nucleobase editors comprising geocas9 and uses thereof |
| WO2020139783A2 (en) * | 2018-12-27 | 2020-07-02 | Lifeedit, Inc. | Polypeptides useful for gene editing and methods of use |
| US12351837B2 (en) | 2019-01-23 | 2025-07-08 | The Broad Institute, Inc. | Supernegatively charged proteins and uses thereof |
| EP3942042A1 (en) | 2019-03-19 | 2022-01-26 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
| EP3956349A1 (en) | 2019-04-17 | 2022-02-23 | The Broad Institute, Inc. | Adenine base editors with reduced off-target effects |
| US12435330B2 (en) | 2019-10-10 | 2025-10-07 | The Broad Institute, Inc. | Methods and compositions for prime editing RNA |
| TW202208626A (zh) * | 2020-04-24 | 2022-03-01 | 美商生命編輯公司 | Rna引導核酸酶及其活性片段與變體,以及使用方法 |
| WO2021226558A1 (en) | 2020-05-08 | 2021-11-11 | The Broad Institute, Inc. | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
| KR20230030618A (ko) | 2020-07-01 | 2023-03-06 | 엘레바테바이오 테크놀로지스, 인코포레이티드 | 원형 rna를 사용하는 세포 리프로그래밍을 위한 조성물 및 방법 |
| EP4182454A1 (en) | 2020-07-15 | 2023-05-24 | Lifeedit Therapeutics, Inc. | Uracil stabilizing proteins and active fragments and variants thereof and methods of use |
| AU2021339805A1 (en) | 2020-09-11 | 2023-05-25 | Life Edit Therapeutics, Inc. | Dna modifying enzymes and active fragments and variants thereof and methods of use |
| AR125191A1 (es) | 2021-03-22 | 2023-06-21 | Lifeedit Therapeutics Inc | Enzimas modificadoras del adn y sus fragmentos activos y variantes y métodos de uso |
| EP4326864A4 (en) * | 2021-04-22 | 2025-06-18 | Emendobio Inc. | OMNI-17,140, 150-158,160-165,167-177,180-188,1921-92,205-201,215-201,221,2222,2236,239,229,239,285,245,26R |
| WO2024077267A1 (en) * | 2022-10-07 | 2024-04-11 | The Broad Institute, Inc. | Prime editing methods and compositions for treating triplet repeat disorders |
| WO2024095245A2 (en) | 2022-11-04 | 2024-05-10 | LifeEDIT Therapeutics, Inc. | Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use |
| CA3277009A1 (en) * | 2022-12-16 | 2024-06-20 | Life Edit Therapeutics, Inc. | RNA GUIDELINES TARGETING THE TRAC GENE AND METHODS OF USE |
| WO2024178397A2 (en) | 2023-02-24 | 2024-08-29 | Elevatebio Technologies, Inc. | Modified immune effector cells and methods of use |
| WO2025174908A1 (en) * | 2024-02-12 | 2025-08-21 | Life Edit Therapeutics, Inc. | Novel rna-guided nucleases and proteins for polymerase editing |
Family Cites Families (65)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
| US4196265A (en) | 1977-06-15 | 1980-04-01 | The Wistar Institute | Method of producing antibodies |
| US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
| US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
| US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
| US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
| US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
| US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
| US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
| US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
| US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
| US4853331A (en) | 1985-08-16 | 1989-08-01 | Mycogen Corporation | Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera |
| US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
| US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
| US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
| US5039523A (en) | 1988-10-27 | 1991-08-13 | Mycogen Corporation | Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin |
| WO1990011361A1 (en) | 1989-03-17 | 1990-10-04 | E.I. Du Pont De Nemours And Company | External regulation of gene expression |
| DE69133128T2 (de) | 1990-04-12 | 2003-06-18 | Syngenta Participations Ag, Basel | Gewebe-spezifische Promotoren |
| US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
| AU7979491A (en) | 1990-05-03 | 1991-11-27 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
| US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
| CA2051562C (en) | 1990-10-12 | 2003-12-02 | Jewel M. Payne | Bacillus thuringiensis isolates active against dipteran pests |
| US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
| US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
| US5604121A (en) | 1991-08-27 | 1997-02-18 | Agricultural Genetics Company Limited | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
| TW261517B (zh) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
| US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
| US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
| US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
| US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
| US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
| US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
| US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
| US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
| WO1999043797A2 (en) | 1998-02-26 | 1999-09-02 | Pioneer Hi-Bred International, Inc. | Constitutive maize promoters |
| US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
| US6555655B1 (en) | 1999-05-04 | 2003-04-29 | Monsanto Technology, Llc | Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants |
| CN1390259A (zh) | 1999-09-15 | 2003-01-08 | 孟山都技术有限公司 | 对鳞翅目昆虫有活性的苏云金芽孢杆菌δ内毒素组合物及其使用方法 |
| US20050183161A1 (en) | 2003-10-14 | 2005-08-18 | Athenix Corporation | AXMI-010, a delta-endotoxin gene and methods for its use |
| WO2005066202A2 (en) | 2003-12-22 | 2005-07-21 | E.I. Du Pont De Nemours And Company | Bacillus cry9 family members |
| AU2007260716B2 (en) | 2006-06-14 | 2013-05-02 | BASF Agricultural Solutions Seed US LLC | Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use |
| EP3208339B1 (en) | 2008-09-15 | 2019-05-01 | The Children's Medical Center Corporation | Modulation of bcl11a for treatment of hemoglobinopathies |
| EP2449109B1 (en) | 2009-07-02 | 2016-09-28 | Athenix Corporation | Axmi-205 pesticidal gene and methods for its use |
| WO2011084324A2 (en) | 2009-12-21 | 2011-07-14 | Pioneer Hi-Bred International, Inc. | Novel bacillus thuringiensis gene with lepidopteran activity |
| KR101445945B1 (ko) | 2009-12-24 | 2014-09-29 | 제이엑스 닛코 닛세키 킨조쿠 가부시키가이샤 | 가돌리늄제 스퍼터링 타깃 및 동 타깃의 제조 방법 |
| US8802934B2 (en) | 2010-08-19 | 2014-08-12 | Pioneer Hi Bred International Inc | Bacillus thuringiensis gene with lepidopteran activity |
| US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
| SI3401400T1 (sl) * | 2012-05-25 | 2019-10-30 | Univ California | Postopki in sestavki za RNA usmerjeno modifikacijo tarčne DNA in za RNA usmerjeno modulacijo prepisovanja |
| CA2875618C (en) | 2012-07-11 | 2021-04-27 | Sangamo Biosciences, Inc. | Methods and compositions for the treatment of lysosomal storage diseases |
| US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
| EP3633032A3 (en) * | 2014-08-28 | 2020-07-29 | North Carolina State University | Novel cas9 proteins and guiding features for dna targeting and genome editing |
| CN107709562A (zh) * | 2015-05-15 | 2018-02-16 | 先锋国际良种公司 | 指导rna/cas内切核酸酶系统 |
| US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
| IL258821B (en) | 2015-10-23 | 2022-07-01 | Harvard College | Nucleobase editors and their uses |
| EP3426778A1 (en) * | 2016-03-11 | 2019-01-16 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
| WO2017155714A1 (en) * | 2016-03-11 | 2017-09-14 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
| EP3481857A1 (en) * | 2016-07-06 | 2019-05-15 | Crispr Therapeutics AG | Materials and methods for treatment of pain related disorders |
| KR20250103795A (ko) | 2016-08-03 | 2025-07-07 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
| WO2018172556A1 (en) * | 2017-03-24 | 2018-09-27 | Curevac Ag | Nucleic acids encoding crispr-associated proteins and uses thereof |
| WO2019036185A1 (en) * | 2017-08-15 | 2019-02-21 | The Regents Of The University Of California | COMPOSITIONS AND METHODS FOR IMPROVING GENOMIC SEQUENCE CORRECTION |
| WO2019236566A1 (en) | 2018-06-05 | 2019-12-12 | Lifeedit, Inc. | Rna-guided nucleases and active fragments and variants thereof and methods of use |
| WO2020056924A1 (zh) * | 2018-09-20 | 2020-03-26 | 中国科学院动物研究所 | 核酸检测方法 |
-
2020
- 2020-08-11 AU AU2020329912A patent/AU2020329912A1/en active Pending
- 2020-08-11 CA CA3147783A patent/CA3147783A1/en active Pending
- 2020-08-11 BR BR112022002695A patent/BR112022002695A2/pt unknown
- 2020-08-11 EP EP20761938.8A patent/EP4013864A1/en active Pending
- 2020-08-11 US US17/634,723 patent/US20220364074A1/en active Pending
- 2020-08-11 JP JP2022509175A patent/JP7640527B2/ja active Active
- 2020-08-11 KR KR1020227008114A patent/KR20220062289A/ko active Pending
- 2020-08-11 CN CN202411155276.7A patent/CN118813654A/zh active Pending
- 2020-08-11 WO PCT/US2020/045759 patent/WO2021030344A1/en not_active Ceased
- 2020-08-11 MX MX2022001849A patent/MX2022001849A/es unknown
- 2020-08-11 CN CN202080068763.3A patent/CN114641568B/zh active Active
- 2020-08-11 TW TW109127218A patent/TW202120688A/zh unknown
-
2022
- 2022-02-13 IL IL290562A patent/IL290562A/en unknown
-
2025
- 2025-02-20 JP JP2025025892A patent/JP2025086912A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| CN114641568A (zh) | 2022-06-17 |
| CN114641568B (zh) | 2024-09-06 |
| CN118813654A (zh) | 2024-10-22 |
| EP4013864A1 (en) | 2022-06-22 |
| KR20220062289A (ko) | 2022-05-16 |
| JP7640527B2 (ja) | 2025-03-05 |
| US20220364074A1 (en) | 2022-11-17 |
| IL290562A (en) | 2022-04-01 |
| CA3147783A1 (en) | 2021-02-18 |
| AU2020329912A1 (en) | 2022-03-24 |
| JP2025086912A (ja) | 2025-06-09 |
| BR112022002695A2 (pt) | 2022-08-23 |
| MX2022001849A (es) | 2022-03-11 |
| WO2021030344A1 (en) | 2021-02-18 |
| JP2022545385A (ja) | 2022-10-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12338455B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
| US12188018B2 (en) | Polypeptides useful for gene editing and methods of use | |
| TW202120688A (zh) | Rna導引之核酸酶及其活性片段及變體以及使用方法 | |
| EA049684B1 (ru) | Рнк-направляемые нуклеазы, их активные фрагменты и варианты, а также способы применения | |
| EA047491B1 (ru) | Рнк-направляемые нуклеазы, их активные фрагменты и варианты, а также способы применения | |
| HK40108758A (zh) | 可用於基因编辑的多肽及使用方法 | |
| HK40063040A (zh) | 可用於基因编辑的多肽及使用方法 | |
| HK40063040B (zh) | 可用於基因编辑的多肽及使用方法 | |
| EA048415B1 (ru) | Полипептиды, применимые для редактирования генов, и способы их применения | |
| HK40050306A (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 | |
| HK40050306B (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 | |
| EA046542B1 (ru) | Рнк-управляемые нуклеазы и активные фрагменты, и их варианты и способы применения |