RU2812848C2 - Genome engineering - Google Patents
Genome engineering Download PDFInfo
- Publication number
- RU2812848C2 RU2812848C2 RU2021136326A RU2021136326A RU2812848C2 RU 2812848 C2 RU2812848 C2 RU 2812848C2 RU 2021136326 A RU2021136326 A RU 2021136326A RU 2021136326 A RU2021136326 A RU 2021136326A RU 2812848 C2 RU2812848 C2 RU 2812848C2
- Authority
- RU
- Russia
- Prior art keywords
- dna
- cell
- artificial
- sequence
- cells
- Prior art date
Links
- 238000010362 genome editing Methods 0.000 title description 52
- 108020004414 DNA Proteins 0.000 claims abstract description 403
- 108091033409 CRISPR Proteins 0.000 claims abstract description 104
- 150000007523 nucleic acids Chemical group 0.000 claims abstract description 99
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 81
- 102000004190 Enzymes Human genes 0.000 claims abstract description 66
- 108090000790 Enzymes Proteins 0.000 claims abstract description 66
- 238000000034 method Methods 0.000 claims abstract description 65
- 230000000295 complement effect Effects 0.000 claims abstract description 25
- 230000008045 co-localization Effects 0.000 claims abstract description 24
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 23
- 238000010354 CRISPR gene editing Methods 0.000 claims abstract description 21
- 238000000338 in vitro Methods 0.000 claims abstract description 6
- 210000004027 cell Anatomy 0.000 claims description 201
- 102000039446 nucleic acids Human genes 0.000 claims description 81
- 108020004707 nucleic acids Proteins 0.000 claims description 81
- 230000006780 non-homologous end joining Effects 0.000 claims description 59
- 210000000130 stem cell Anatomy 0.000 claims description 46
- 125000003729 nucleotide group Chemical group 0.000 claims description 27
- 239000002773 nucleotide Substances 0.000 claims description 25
- 238000002744 homologous recombination Methods 0.000 claims description 16
- 230000006801 homologous recombination Effects 0.000 claims description 16
- 210000004263 induced pluripotent stem cell Anatomy 0.000 claims description 15
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 7
- 108091029865 Exogenous DNA Proteins 0.000 claims description 6
- 210000004102 animal cell Anatomy 0.000 claims description 5
- 210000005260 human cell Anatomy 0.000 claims description 4
- 108020005196 Mitochondrial DNA Proteins 0.000 claims description 3
- 108020005202 Viral DNA Proteins 0.000 claims description 3
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 3
- 210000005253 yeast cell Anatomy 0.000 claims description 2
- 210000002308 embryonic cell Anatomy 0.000 claims 1
- 230000004927 fusion Effects 0.000 claims 1
- 210000004602 germ cell Anatomy 0.000 claims 1
- 210000002980 germ line cell Anatomy 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 22
- 239000000126 substance Substances 0.000 abstract 1
- 102000053602 DNA Human genes 0.000 description 383
- 238000010459 TALEN Methods 0.000 description 88
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 79
- 230000008685 targeting Effects 0.000 description 71
- 229940088598 enzyme Drugs 0.000 description 56
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 55
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 45
- 239000013598 vector Substances 0.000 description 34
- 101710163270 Nuclease Proteins 0.000 description 33
- 238000003780 insertion Methods 0.000 description 33
- 230000037431 insertion Effects 0.000 description 33
- 238000006243 chemical reaction Methods 0.000 description 32
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 31
- 108090000623 proteins and genes Proteins 0.000 description 28
- 239000002609 medium Substances 0.000 description 21
- 238000001890 transfection Methods 0.000 description 21
- 101710096438 DNA-binding protein Proteins 0.000 description 20
- 239000013612 plasmid Substances 0.000 description 20
- 238000012217 deletion Methods 0.000 description 19
- 230000037430 deletion Effects 0.000 description 19
- 230000001404 mediated effect Effects 0.000 description 19
- 239000000203 mixture Substances 0.000 description 19
- 102100032912 CD44 antigen Human genes 0.000 description 18
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 18
- 238000013461 design Methods 0.000 description 17
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 14
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 14
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 14
- 230000035772 mutation Effects 0.000 description 14
- 230000032965 negative regulation of cell volume Effects 0.000 description 14
- 238000009826 distribution Methods 0.000 description 12
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 12
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 11
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 11
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 11
- 102000004533 Endonucleases Human genes 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 11
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000008439 repair process Effects 0.000 description 11
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 10
- 108060002716 Exonuclease Proteins 0.000 description 10
- 230000005782 double-strand break Effects 0.000 description 10
- 102000013165 exonuclease Human genes 0.000 description 10
- 230000004568 DNA-binding Effects 0.000 description 9
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 9
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 9
- 238000005520 cutting process Methods 0.000 description 9
- 230000003252 repetitive effect Effects 0.000 description 9
- 238000012163 sequencing technique Methods 0.000 description 9
- 239000000539 dimer Substances 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 7
- 102000008579 Transposases Human genes 0.000 description 7
- 108010020764 Transposases Proteins 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000006285 cell suspension Substances 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 108010082117 matrigel Proteins 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- OZFAFGSSMRRTDW-UHFFFAOYSA-N (2,4-dichlorophenyl) benzenesulfonate Chemical compound ClC1=CC(Cl)=CC=C1OS(=O)(=O)C1=CC=CC=C1 OZFAFGSSMRRTDW-UHFFFAOYSA-N 0.000 description 6
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 6
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 6
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 6
- 241000713666 Lentivirus Species 0.000 description 6
- 206010043276 Teratoma Diseases 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 150000001413 amino acids Chemical group 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 239000003112 inhibitor Substances 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000000178 monomer Substances 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 229950010131 puromycin Drugs 0.000 description 6
- 239000011435 rock Substances 0.000 description 6
- 238000012216 screening Methods 0.000 description 6
- 230000035945 sensitivity Effects 0.000 description 6
- 102000012410 DNA Ligases Human genes 0.000 description 5
- 108010061982 DNA Ligases Proteins 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241000589602 Francisella tularensis Species 0.000 description 5
- 210000004413 cardiac myocyte Anatomy 0.000 description 5
- 230000001973 epigenetic effect Effects 0.000 description 5
- 229940118764 francisella tularensis Drugs 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 230000005783 single-strand break Effects 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 4
- 230000008836 DNA modification Effects 0.000 description 4
- 230000007018 DNA scission Effects 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- 108090000364 Ligases Proteins 0.000 description 4
- 102000003960 Ligases Human genes 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 239000012091 fetal bovine serum Substances 0.000 description 4
- 238000000684 flow cytometry Methods 0.000 description 4
- 238000012239 gene modification Methods 0.000 description 4
- 230000005017 genetic modification Effects 0.000 description 4
- 235000013617 genetically modified food Nutrition 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 239000011541 reaction mixture Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 210000001082 somatic cell Anatomy 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 108010063905 Ampligase Proteins 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 3
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 239000012097 Lipofectamine 2000 Substances 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 201000009906 Meningitis Diseases 0.000 description 3
- 241000699666 Mus <mouse, genus> Species 0.000 description 3
- 241000588653 Neisseria Species 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 241000194017 Streptococcus Species 0.000 description 3
- LTFLDDDGWOVIHY-NAKRPEOUSA-N Val-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N LTFLDDDGWOVIHY-NAKRPEOUSA-N 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 108010007093 dispase Proteins 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- -1 nucleic acid acids Chemical class 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000008263 repair mechanism Effects 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 239000006228 supernatant Substances 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241000589875 Campylobacter jejuni Species 0.000 description 2
- 208000031229 Cardiomyopathies Diseases 0.000 description 2
- 241000193155 Clostridium botulinum Species 0.000 description 2
- 108020004705 Codon Proteins 0.000 description 2
- 241001485655 Corynebacterium glutamicum ATCC 13032 Species 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- UWZLBXOBVKRUFE-HGNGGELXSA-N Gln-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N UWZLBXOBVKRUFE-HGNGGELXSA-N 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- HTTSBEBKVNEDFE-AUTRQRHGSA-N Glu-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N HTTSBEBKVNEDFE-AUTRQRHGSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 2
- 241000423296 Gluconacetobacter diazotrophicus PA1 5 Species 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 101100495925 Schizosaccharomyces pombe (strain 972 / ATCC 24843) chr3 gene Proteins 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008970 bacterial immunity Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000013412 genome amplification Methods 0.000 description 2
- 238000003205 genotyping method Methods 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000012966 insertion method Methods 0.000 description 2
- 238000011813 knockout mouse model Methods 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000005580 one pot reaction Methods 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000006798 recombination Effects 0.000 description 2
- 238000005215 recombination Methods 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000007480 sanger sequencing Methods 0.000 description 2
- 230000000392 somatic effect Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 108091006106 transcriptional activators Proteins 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- IDDDVXIUIXWAGJ-DDSAHXNVSA-N 4-[(1r)-1-aminoethyl]-n-pyridin-4-ylcyclohexane-1-carboxamide;dihydrochloride Chemical compound Cl.Cl.C1CC([C@H](N)C)CCC1C(=O)NC1=CC=NC=C1 IDDDVXIUIXWAGJ-DDSAHXNVSA-N 0.000 description 1
- 230000002407 ATP formation Effects 0.000 description 1
- 108091006112 ATPases Proteins 0.000 description 1
- 241001041760 Acidothermus cellulolyticus 11B Species 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 241000417230 Actinobacillus succinogenes 130Z Species 0.000 description 1
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 1
- 241000778935 Akkermansia muciniphila ATCC BAA-835 Species 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 1
- NHWYNIZWLJYZAG-XVYDVKMFSA-N Ala-Ser-His Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N NHWYNIZWLJYZAG-XVYDVKMFSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 241000589941 Azospirillum Species 0.000 description 1
- 101150023320 B16R gene Proteins 0.000 description 1
- 241000257169 Bacillus cereus ATCC 10987 Species 0.000 description 1
- 241000606124 Bacteroides fragilis Species 0.000 description 1
- 201000005943 Barth syndrome Diseases 0.000 description 1
- 241000186020 Bifidobacterium dentium Species 0.000 description 1
- 241001209261 Bifidobacterium longum DJO10A Species 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- AQGNHMOJWBZFQQ-UHFFFAOYSA-N CT 99021 Chemical compound CC1=CNC(C=2C(=NC(NCCNC=3N=CC(=CC=3)C#N)=NC=2)C=2C(=CC(Cl)=CC=2)Cl)=N1 AQGNHMOJWBZFQQ-UHFFFAOYSA-N 0.000 description 1
- 241001453247 Campylobacter jejuni subsp. doylei Species 0.000 description 1
- 241000941427 Campylobacter lari RM2100 Species 0.000 description 1
- 241001034636 Capnocytophaga ochracea DSM 7271 Species 0.000 description 1
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 1
- 241001112695 Clostridiales Species 0.000 description 1
- 241001509423 Clostridium botulinum B Species 0.000 description 1
- 241001509504 Clostridium botulinum F Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 108060005980 Collagenase Proteins 0.000 description 1
- 102000029816 Collagenase Human genes 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 241001487058 Corynebacterium efficiens YS-314 Species 0.000 description 1
- 241000671338 Corynebacterium glutamicum R Species 0.000 description 1
- 241001525611 Corynebacterium kroppenstedtii DSM 44385 Species 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 241001082278 Desulfovibrio salexigens DSM 2638 Species 0.000 description 1
- 241000688137 Diaphorobacter Species 0.000 description 1
- 241000933091 Dinoroseobacter shibae DFL 12 = DSM 16493 Species 0.000 description 1
- 241001338691 Elusimicrobium minutum Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000608038 Fibrobacter succinogenes subsp. succinogenes S85 Species 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000359186 Finegoldia magna ATCC 29328 Species 0.000 description 1
- 241000382842 Flavobacterium psychrophilum Species 0.000 description 1
- 108091092584 GDNA Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 101150109546 HDR gene Proteins 0.000 description 1
- 241001453258 Helicobacter hepaticus Species 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 229920000209 Hexadimethrine bromide Polymers 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- LYCVKHSJGDMDLM-LURJTMIESA-N His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 LYCVKHSJGDMDLM-LURJTMIESA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- 241000256602 Isoptera Species 0.000 description 1
- 241000102542 Kara Species 0.000 description 1
- 241001596092 Kribbella flavida DSM 17836 Species 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 244000199866 Lactobacillus casei Species 0.000 description 1
- 235000013958 Lactobacillus casei Nutrition 0.000 description 1
- 241000917009 Lactobacillus rhamnosus GG Species 0.000 description 1
- 241001427851 Lactobacillus salivarius UCC118 Species 0.000 description 1
- 241001193656 Legionella pneumophila str. Paris Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 241001378931 Methanococcus maripaludis C7 Species 0.000 description 1
- 241000825684 Mycobacterium abscessus ATCC 19977 Species 0.000 description 1
- 241000204022 Mycoplasma gallisepticum Species 0.000 description 1
- 241000107400 Mycoplasma mobile 163K Species 0.000 description 1
- 241001135743 Mycoplasma penetrans Species 0.000 description 1
- 241000051161 Mycoplasma synoviae 53 Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241001648684 Nitrobacter hamburgensis X14 Species 0.000 description 1
- 241001037736 Nocardia farcinica IFM 10152 Species 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 238000002944 PCR assay Methods 0.000 description 1
- 241000601272 Parvibaculum lavamentivorans DS-1 Species 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241000981393 Persephonella marina Species 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 101710101851 Phosphoglycolate phosphatase 1 Proteins 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 241000773205 Pseudarthrobacter chlorophenolicus A6 Species 0.000 description 1
- 241000695265 Pseudoalteromonas atlantica T6c Species 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 239000012979 RPMI medium Substances 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108020003564 Retroelements Proteins 0.000 description 1
- 241000647111 Rhodococcus erythropolis PR4 Species 0.000 description 1
- 241001459443 Rhodococcus jostii RHA1 Species 0.000 description 1
- 241001113889 Rhodococcus opacus B4 Species 0.000 description 1
- 241001303434 Rhodopseudomonas palustris BisB18 Species 0.000 description 1
- 241001303431 Rhodopseudomonas palustris BisB5 Species 0.000 description 1
- 241000190967 Rhodospirillum Species 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- 241000516659 Roseiflexus Species 0.000 description 1
- 241000504328 Roseiflexus castenholzii DSM 13941 Species 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 241000933177 Shewanella pealeana ATCC 700345 Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 241001496704 Slackia heliotrinireducens DSM 20476 Species 0.000 description 1
- 241000756832 Streptobacillus moniliformis DSM 12112 Species 0.000 description 1
- 241000193985 Streptococcus agalactiae Species 0.000 description 1
- 241001209210 Streptococcus agalactiae A909 Species 0.000 description 1
- 241001540742 Streptococcus agalactiae NEM316 Species 0.000 description 1
- 241000194042 Streptococcus dysgalactiae Species 0.000 description 1
- 241000120569 Streptococcus equi subsp. zooepidemicus Species 0.000 description 1
- 241001167808 Streptococcus gallolyticus UCN34 Species 0.000 description 1
- 241001147754 Streptococcus gordonii str. Challis Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 241000672607 Streptococcus mutans NN2025 Species 0.000 description 1
- 241000103155 Streptococcus pyogenes MGAS10270 Species 0.000 description 1
- 241000103160 Streptococcus pyogenes MGAS10750 Species 0.000 description 1
- 241000103154 Streptococcus pyogenes MGAS2096 Species 0.000 description 1
- 241001520169 Streptococcus pyogenes MGAS315 Species 0.000 description 1
- 241001148739 Streptococcus pyogenes MGAS5005 Species 0.000 description 1
- 241001332083 Streptococcus pyogenes MGAS6180 Species 0.000 description 1
- 241000103156 Streptococcus pyogenes MGAS9429 Species 0.000 description 1
- 241001496716 Streptococcus pyogenes NZ131 Species 0.000 description 1
- 241001455236 Streptococcus pyogenes SSI-1 Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000192593 Synechocystis sp. PCC 6803 Species 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 241001496699 Thermomonospora curvata DSM 43183 Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- QOLYAJSZHIJCTO-VQVTYTSYSA-N Thr-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O QOLYAJSZHIJCTO-VQVTYTSYSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- 241000322994 Tolumonas auensis DSM 9187 Species 0.000 description 1
- 108091028113 Trans-activating crRNA Proteins 0.000 description 1
- 241000999858 Treponema denticola ATCC 35405 Species 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 101100316831 Vaccinia virus (strain Copenhagen) B18R gene Proteins 0.000 description 1
- 101100004099 Vaccinia virus (strain Western Reserve) VACWR200 gene Proteins 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- 241000847071 Verminephrobacter eiseniae EF01-2 Species 0.000 description 1
- 241000605939 Wolinella succinogenes Species 0.000 description 1
- 241000883281 [Clostridium] cellulolyticum H10 Species 0.000 description 1
- 241000714896 [Eubacterium] rectale ATCC 33656 Species 0.000 description 1
- 108010076089 accutase Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 101150063416 add gene Proteins 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 238000000876 binomial test Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 101150102092 ccdB gene Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007541 cellular toxicity Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000008711 chromosomal rearrangement Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 229960002424 collagenase Drugs 0.000 description 1
- 230000005757 colony formation Effects 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- ZGSPNIOCEDOHGS-UHFFFAOYSA-L disodium [3-[2,3-di(octadeca-9,12-dienoyloxy)propoxy-oxidophosphoryl]oxy-2-hydroxypropyl] 2,3-di(octadeca-9,12-dienoyloxy)propyl phosphate Chemical compound [Na+].[Na+].CCCCCC=CCC=CCCCCCCCC(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COP([O-])(=O)OCC(O)COP([O-])(=O)OCC(OC(=O)CCCCCCCC=CCC=CCCCCC)COC(=O)CCCCCCCC=CCC=CCCCCC ZGSPNIOCEDOHGS-UHFFFAOYSA-L 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 108010026638 endodeoxyribonuclease FokI Proteins 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 239000003797 essential amino acid Substances 0.000 description 1
- 235000020776 essential amino acid Nutrition 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000001476 gene delivery Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000001654 germ layer Anatomy 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 238000007490 hematoxylin and eosin (H&E) staining Methods 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000003125 immunofluorescent labeling Methods 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 238000012744 immunostaining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 229940017800 lactobacillus casei Drugs 0.000 description 1
- 229940059406 lactobacillus rhamnosus gg Drugs 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 201000000271 mature teratoma Diseases 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 231100000324 minimal toxicity Toxicity 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- DOBKQCZBPPCLEG-UHFFFAOYSA-N n-benzyl-2-(pyrimidin-4-ylamino)-1,3-thiazole-4-carboxamide Chemical compound C=1SC(NC=2N=CN=CC=2)=NC=1C(=O)NCC1=CC=CC=C1 DOBKQCZBPPCLEG-UHFFFAOYSA-N 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010070643 prolylglutamic acid Proteins 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000011552 rat model Methods 0.000 description 1
- 238000009790 rate-determining step (RDS) Methods 0.000 description 1
- 108700005467 recombinant KCB-1 Proteins 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 102000000568 rho-Associated Kinases Human genes 0.000 description 1
- 108010041788 rho-Associated Kinases Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000002000 scavenging effect Effects 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 210000001988 somatic stem cell Anatomy 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 229940115920 streptococcus dysgalactiae Drugs 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000003239 susceptibility assay Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 239000003104 tissue culture media Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 108091006107 transcriptional repressors Proteins 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Abstract
Description
Данные связанных заявокRelated ticket data
Данная заявка испрашивает приоритет предварительной заявки на патент США No. 61/858866, поданной 26 июля 2013 г. и включенной в данный документ ссылкой в полном объеме и для всех целей.This application claims priority to U.S. Provisional Patent Application No. 61/858866, filed July 26, 2013 and incorporated herein by reference in its entirety and for all purposes.
Заявление государственных интересовStatement of State Interests
Это изобретение было осуществлено при государственной поддержке согласно P50 HG003170 от Национального научно-исследовательского центра генома человека за выдающиеся достижения в геномике. Правительство имеет определенные права на это изобретение.This invention was supported by public support under P50 HG003170 from the National Human Genome Research Center for Excellence in Genomics. The government has certain rights to this invention.
Предшествующий уровень техникиPrior Art
Известно редактирование генома с помощью специфических к последовательности нуклеаз. Смотрите источники 1, 2 и 3, которые включены в данный документ ссылкой в полном объеме. Опосредованный нуклеазой разрыв двухцепочечной ДНК (дцДНК) в геноме может быть устранен с помощью двух основных механизмов: негомологичного соединения концов (NHEJ), который часто приводит к введению неспецифических вставок и делеций (indels), или направляемой гомологией репарации (HDR), которая использует гомологичную цепь в качестве шаблона для репарации. См. источник 4 включенный ссылкой в полном объеме. Когда специфичная к последовательности нуклеаза доставляется вместе с гомологичной донорной ДНК-конструкцией, содержащей искомые мутации, эффективности направленного воздействия на ген повышаются в 1000 раз по сравнению только с доставкой донорной конструкции отдельно. См. источник 5, включенный в данный документ ссылкой в полном объеме. Сообщалось об использовании одноцепочечных олигодезоксирибонуклеотидов («ssODNs») в качестве ДНК-доноров. См. источники 21 и 22, включенные в данный документ ссылкой в полном объеме.Genome editing using sequence-specific nucleases is known. See references 1, 2 and 3, which are incorporated herein by reference in their entirety. Nuclease-mediated double-stranded DNA (dsDNA) breaks in the genome can be repaired by two main mechanisms: non-homologous end joining (NHEJ), which often introduces non-specific insertions and deletions (indels), or homology-directed repair (HDR), which uses homologous chain as a template for repair. See source 4 incorporated by reference in full. When a sequence-specific nuclease is delivered together with a homologous donor DNA construct containing the desired mutations, gene targeting efficiencies are increased 1000-fold compared to delivery of the donor construct alone. See reference 5, which is incorporated herein by reference in its entirety. The use of single-stranded oligodeoxyribonucleotides (“ssODNs”) as DNA donors has been reported. See references 21 and 22, which are incorporated herein by reference in their entirety.
Несмотря на большие достижения в области технологий редактирования генов, остаются нерешенными многие проблемы и многие вопросы относительно применения специально сконструированных нуклеаз при конструировании человеческих индуцированных плюрипотентных стволовых клеток («hiPSC»). Во-первых, несмотря на простоту своей конструкции TALEN (эффекторные нуклеазы, подобные активаторам траснкрипции) нацеливаются на определенные последовательности ДНК тандемными копиями доменов RVD (домены вариабельных двух остатков). См. источник 6, включенный в данный документ ссылкой в полном объеме. В то время как модульный характер RVDs упрощает дизайн TALEN, их повторяющиеся последовательности усложняют способы синтеза ДНК-конструкций на их основе (см. источники 2, 9 и 15-19, включенные в данный документ ссылкой в полном объеме), а также делает практически невозможным их совместное применение вместе со средствами доставки генов на основе лентивирусов. См. источник 13, включенный в данный документ ссылкой в полном объеме.Despite great advances in gene editing technologies, many problems and many questions remain regarding the use of specially designed nucleases in the construction of human induced pluripotent stem cells (“hiPSC”). First, despite the simplicity of their design, TALENs (transcription activator-like effector nucleases) target specific DNA sequences with tandem copies of RVD domains (residue variable domains). See reference 6, which is incorporated herein by reference in its entirety. While the modular nature of RVDs simplifies the design of TALENs, their repetitive sequences complicate methods for synthesizing DNA constructs based on them (see references 2, 9 and 15-19, incorporated herein by reference in their entirety), and also make it virtually impossible their combined use with lentiviral-based gene delivery vehicles. See reference 13, which is incorporated herein by reference in its entirety.
В современной практике NHEJ и HDR часто оцениваются с помощью отдельных анализов. Тесты с эндонуклеазой, чувствительной к некомлементарности (см. источник 14, включенный в данный документ ссылкой в полном объеме) часто используются для оценки NHEJ, но количественная точность этого способа переменчива, и чувствительность ограничивается частотами NHEJ выше ~ 3%. См. источник 15, включенный в данный документ ссылкой в полном объеме. HDR часто оценивается с помощью клонирования и секвенирования, совершенно иной и часто громоздкой процедуры. Чувствительность по-прежнему является проблемой, поскольку, несмотря на высокие частоты редактирования порядка 50% о которых часто сообщалось в случае некоторых типов клеток, таких как U20S и К562 (см. источники 12 и 14, включенные в данный документ ссылкой в полном объеме), в случае hiPSC частоты, как правило, ниже. См. Источник 10, включенный в данный документ ссылкой в полном объеме. В последнее время высокие частоты редактирования были зарегистрированы в hiPSC и hESC, достигнутые с помощью TALENs (см. источник 9, включенный в данный документ ссылкой в полном объеме), и еще более высокие частоты были достигнуты с помощью системы CRISPR Cas9-гидРНК (см. источники 16-19, включенные в данный документ ссылкой в полном объеме. Тем не менее, показатели редактирования на различных участках по всей видимости, сильно отличаются (см. источник 17, включенный в данный документ ссылкой в полном объеме), а в некоторых участках редактирование иногда не обнаруживается вообще (см. источник 20, включенный в данный документ ссылкой в полном объеме). In current practice, NHEJ and HDR are often assessed using separate assays. Non-complementarity-sensitive endonuclease assays (see reference 14, incorporated herein by reference in its entirety) are often used to assess NHEJ, but the quantitative accuracy of this method is variable and sensitivity is limited to NHEJ frequencies above ~3%. See reference 15, which is incorporated herein by reference in its entirety. HDR is often assessed using cloning and sequencing, a completely different and often cumbersome procedure. Sensitivity remains an issue because, despite high editing rates of about 50% often reported for some cell types such as U20S and K562 (see references 12 and 14, incorporated by reference herein in their entirety), in the case of hiPSC the frequencies are generally lower. See Source 10, which is incorporated herein by reference in its entirety. Recently, high editing frequencies have been reported in hiPSCs and hESCs achieved using TALENs (see reference 9, incorporated herein by reference in its entirety), and even higher frequencies have been achieved using the CRISPR Cas9-hydrRNA system (see Sources 16-19, which are incorporated herein by reference in their entirety.However, editing rates appear to vary widely across sites (see Source 17, incorporated herein by reference in their entirety), and in some sites, editing sometimes not detected at all (see reference 20, incorporated herein by reference in its entirety).
Бактериальные и архейные системы CRISPR-Cas основываются на коротких направляющих РНК (гидРНК) в комплексе с Cas-белками, которые управляют деградацией комплементарных последовательностей, присутствующих во вторгающихся чужеродных нуклеиновых кислотах. См. Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011); Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012); Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011); and Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011). Недавнее воссоздание in vitro системы CRISPR II типа из S. pyogenes показало, что crRNA («CRISPR РНК»), слитая, как правило, с транс-кодируемой tracrRNA («транс-активированная CRISPR РНК») достаточны для направления белка Cas9 к специфически расщепляемой последовательности ДНК-мишени, соответствующей crRNA. Экспрессия гидРНК гомологичных сайту-мишени приводит к рекрутированию Cas9 и деградации ДНК-мишени. См. H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008).Bacterial and archaeal CRISPR-Cas systems rely on short guide RNAs (hydrRNAs) complexed with Cas proteins that direct the degradation of complementary sequences present in invading foreign nucleic acids. See Deltcheva, E. et al. CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III. Nature 471, 602-607 (2011); Gasiunas, G., Barrangou, R., Horvath, P. & Siksnys, V. Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria. Proceedings of the National Academy of Sciences of the United States of America 109, E2579-2586 (2012); Jinek, M. et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science 337, 816-821 (2012); Sapranauskas, R. et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli. Nucleic acids research 39, 9275-9282 (2011); and Bhaya, D., Davison, M. & Barrangou, R. CRISPR-Cas systems in bacteria and archaea: versatile small RNAs for adaptive defense and regulation. Annual review of genetics 45, 273-297 (2011). Recent in vitro reconstitution of the type II CRISPR system from S. pyogenes has shown that crRNA (“CRISPR RNA”) fused typically to trans-encoded tracrRNA (“trans-CRISPR RNA”) is sufficient to target the Cas9 protein to specifically cleave the target DNA sequence corresponding to the crRNA. Expression of guideRNAs homologous to the target site leads to the recruitment of Cas9 and degradation of the target DNA. See H. Deveau et al., Phage response to CRISPR-encoded resistance in Streptococcus thermophilus. Journal of Bacteriology 190, 1390 (Feb, 2008).
Сущность изобретенияThe essence of the invention
Аспекты настоящего описания относятся к применению модифицированных нуклеаз TALEN (эффекторные нуклеазы, подобные активатору транскрипции) для генетической модификации клетки, такой как соматическая клетка или стволовая клетка. Как известно, TALEN включают повторяющиеся последовательности. Аспекты настоящего раскрытия относятся к способу изменения ДНК-мишени в клетке, в том числе введением в клетку TALEN, утратившую последовательности повторов в 100 п.о. или длиннее, где TALEN расщепляет ДНК-мишени и клетка подвергается негомологичному соединению концов с получением измененной ДНК в клетке. В соответствии с некоторыми аспектами, повторяющиеся последовательности искомой длины были удалены из TALEN. В соответствии с некоторыми аспектами, TALEN была лишена повторяющихся последовательностей определенной искомой длины. В соответствии с некоторыми аспектами, TALEN предоставляется с удаленными повторяющимися последовательностями искомой длины. В соответствии с некоторыми аспектами, TALEN модифицируется, для удаления повторяющихся последовательностей искомой длины. В соответствии с некоторыми аспектами, TALEN сконструирована с удалением повторяющихся последовательностей искомой длины.Aspects of the present disclosure relate to the use of modified TALEN nucleases (transcription activator-like effector nucleases) to genetically modify a cell, such as a somatic cell or stem cell. TALENs are known to include repetitive sequences. Aspects of the present disclosure relate to a method of altering target DNA in a cell, including introducing into the cell TALENs that have lost 100 bp repeat sequences. or longer, where TALEN cleaves target DNA and the cell undergoes non-homologous end joining to produce altered DNA in the cell. In accordance with some aspects, repeated sequences of the desired length were removed from TALEN. In some aspects, TALEN was devoid of repeat sequences of a certain desired length. In accordance with some aspects, the TALEN is provided with repeated sequences of the desired length removed. In accordance with some aspects, TALEN is modified to remove repeated sequences of the desired length. In accordance with some aspects, TALEN is designed to remove repetitive sequences of a desired length.
Аспекты настоящего изобретения включают способы изменения ДНК-мишени в клетке, в том числе объединением в клетке TALEN, утратившей повторяющиеся последовательности в 100 п.о. или длиннее, и последовательности донорной нуклеиновой кислоты, где TALEN расщепляет ДНК-мишень и донорная последовательность нуклеиновой кислоты встраивается в ДНК клетки. Аспекты настоящего раскрытия направлены на вирус, включающий последовательность нуклеиновой кислоты, кодирующую TALEN, утратившую повторяющиеся последовательности в 100 п.о. или длиннее. Аспекты настоящего раскрытия относятся к клетке, включающей последовательность нуклеиновой кислоты, кодирующую TALEN, утратившую повторяющиеся последовательности в 100 п. н. или длиннее. В соответствии с некоторыми аспектами, описанными в данном документе, TALEN утратила повторяющиеся последовательности в 100 п.о. или длиннее, 90 п.о. или длиннее, 80 п.о. или длиннее, 70 п.о. или длиннее, 60 п.о. или длиннее, 50 п.о. или длиннее, 40 п.о. или длиннее, 30 п.о. или длиннее, 20 п.о. или длиннее, 19 п.о. или длиннее, 18 п.о. или длиннее, 17 п.о. или длиннее, 16 п.о. или длиннее, 15 п.о. или длиннее, 14 п.о. или длиннее, 13 п.о. или длиннее, 12 п.о. или длиннее, на 11 п.о. или длиннее, или 10 пар или длиннее.Aspects of the present invention include methods for altering target DNA in a cell, including incorporating TALENs that have lost 100 bp of repeat sequence into the cell. or longer, and donor nucleic acid sequences, where TALEN cleaves the target DNA and the donor nucleic acid sequence is incorporated into the cell's DNA. Aspects of the present disclosure are directed to a virus comprising a nucleic acid sequence encoding TALEN that has lost 100 bp of repetitive sequences. or longer. Aspects of the present disclosure relate to a cell including a nucleic acid sequence encoding TALEN that has lost 100 bp of repetitive sequences. or longer. In accordance with certain aspects described herein, TALEN has lost 100 bp of repetitive sequences. or longer, 90 bp or longer, 80 bp or longer, 70 bp or longer, 60 bp or longer, 50 bp or longer, 40 bp or longer, 30 bp or longer, 20 bp or longer, 19 bp or longer, 18 bp or longer, 17 bp or longer, 16 bp or longer, 15 bp or longer, 14 bp or longer, 13 bp. or longer, 12 bp. or longer, 11 bp. or longer, or 10 pairs or longer.
Аспекты настоящего раскрытия направлены на изготовление TALE, включающего объединение эндонуклеазы, ДНК-полимеразы, ДНК-лигазы, экзонуклеазы, множество блоков нуклеотидных димеров, кодирующих RVD-домены (домены вариабельных двух остатков) и каркасного вектора TALE-N/TF, включающего сайт расщепления эндонуклеазой, активацию эндонуклеазы для разрезания каркасного вектора TALE-N/TF по сайту разрезания эндонуклеазой, с получением первого конца и второго конца, активацию экзонуклеазы, для создания 3' и 5' выступов на каркасном векторе TALE-N/TF и множестве блоков нуклеотидных димеров и соединения каркасного вектора TALE-N/TF и множества блоков нуклеотидных димеров в искомом порядке, активации ДНК-полимеразы и ДНК-лигазы для соединения каркасного вектора TALE-N/TF и множества блоков нуклеотидных димеров. Специалист в данной области техники легко поймет на основании настоящего описания, как идентифицировать подходящие эндонуклеазы, ДНК-полимеразы, ДНК-лигазы, экзонуклеазы, блоки нуклеотидных димеров, кодирующих RVD-домены и каркасные векторы TALE-N/TF.Aspects of the present disclosure are directed to the manufacture of a TALE comprising a combination of an endonuclease, a DNA polymerase, a DNA ligase, an exonuclease, a plurality of nucleotide dimer blocks encoding RVD domains (two residue variable domains) and a TALE-N/TF backbone vector including an endonuclease cleavage site , activating an endonuclease to cut the TALE-N/TF backbone vector at the endonuclease cutting site to produce a first end and a second end, activating an exonuclease to create 3' and 5' overhangs on the TALE-N/TF backbone vector and multiple nucleotide dimer blocks, and connecting the TALE-N/TF framework vector and multiple blocks of nucleotide dimers in the desired order, activating DNA polymerase and DNA ligase to connect the TALE-N/TF framework vector and multiple blocks of nucleotide dimers. One skilled in the art will readily understand from the present disclosure how to identify suitable endonucleases, DNA polymerases, DNA ligases, exonucleases, nucleotide dimer blocks encoding RVD domains, and TALE-N/TF framework vectors.
Аспекты настоящего описания относятся к способу изменения ДНК-мишени в стволовых клетках, экспрессирующих фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, включающий (а) введение в стволовую клетку первой чужеродной нуклеиновой кислоты, кодирующей РНК, комплементарную ДНК-мишени, который направляет фермент на ДНК-мишень, где РНК и фермент являются членами комплекса колокализации на ДНК-мишени, введение в стволовую клетку второй чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, где РНК и донорная нуклеотидная последовательность экспрессируются, где РНК и фермент колокализуются с ДНК-мишенью, фермент расщепляет ДНК-мишени и донорная нуклеиновая кислота встраивается в ДНК-мишени, с получением измененной ДНК в стволовой клетке.Aspects of the present disclosure relate to a method of altering target DNA in stem cells expressing an enzyme that forms a colocalization complex with RNA complementary to the target DNA and that cleaves the target DNA in a site-specific manner, comprising (a) introducing into the stem cell a first foreign nucleic acid acid encoding RNA complementary to the target DNA, which directs the enzyme to the target DNA, where the RNA and the enzyme are members of a colocalization complex on the target DNA, introduction into the stem cell of a second foreign nucleic acid encoding the donor nucleic acid sequence, where RNA and donor nucleotide sequence is expressed where the RNA and enzyme colocalize with the target DNA, the enzyme cleaves the target DNA and the donor nucleic acid is incorporated into the target DNA, producing altered DNA in the stem cell.
Аспекты настоящего раскрытия направлены на стволовую клетку, включающую первую чужеродную нуклеиновую кислоту, кодирующую фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом.Aspects of the present disclosure are directed to a stem cell comprising a first foreign nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to target DNA and that cleaves target DNA in a site-specific manner.
Аспекты настоящего раскрытия относятся к клетке, включающую первую чужеродную нуклеиновую кислоту, кодирующую фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом и включающую индуцируемый промотор для содействия экспрессии фермента. Таким образом, экспрессия может регулироваться, например, она может быть запущена и может быть остановлена.Aspects of the present disclosure relate to a cell comprising a first foreign nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to target DNA and that cleaves target DNA in a site-specific manner, and including an inducible promoter to promote expression of the enzyme. In this way, expression can be regulated, for example it can be started and stopped.
Аспекты настоящего раскрытия нацелены на клетку, включающую первую чужеродную нуклеиновую кислоту, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, где первая чужеродная нуклеиновая кислота является удаляемой из геномной ДНК клетки с помощью удаляющего фермента, такого как транспозаза.Aspects of the present disclosure are directed to a cell comprising a first foreign nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to a target DNA and that cleaves the target DNA in a site-specific manner, wherein the first foreign nucleic acid is excised from the genomic DNA of the cell with using a scavenging enzyme such as transposase.
Аспекты настоящего раскрытия относятся к способу изменения ДНК-мишени в клетке, экспрессирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, который включает (а) введение в клетку первой чужеродной нуклеиновой кислоты, кодирующей последовательность донорной нуклеиновой кислоты, введение в клетку из среды, окружающей клетку, РНК, комплементарной ДНК-мишени, которая направляет фермент на ДНК-мишень, где и РНК и фермент являются членами комплекса колокализации на ДНК-мишени, где последовательность донорной нуклеиновой кислоты экспрессируется, где РНК и фермент колокализованы на ДНК-мишени, фермент расщепляет ДНК-мишень и донорная нуклеиновая кислота встраивается в ДНК-мишень с получением измененной ДНК в клетке.Aspects of the present disclosure relate to a method of altering target DNA in a cell expressing an enzyme that forms a colocalization complex with RNA complementary to the target DNA and that cleaves target DNA in a site-specific manner, which includes (a) introducing a first foreign nucleic acid into the cell , encoding the donor nucleic acid sequence, introduction into the cell from the environment surrounding the cell, RNA, complementary to the target DNA, which directs the enzyme to the target DNA, where both the RNA and the enzyme are members of a colocalization complex on the target DNA, where the donor nucleic acid sequence expressed where the RNA and enzyme are colocalized on the target DNA, the enzyme cleaves the target DNA and the donor nucleic acid is incorporated into the target DNA to produce altered DNA in the cell.
Аспекты настоящего раскрытия направлены на использование направляемого РНК ДНК-связывающего белка для генетической модификации стволовых клеток. В одном аспекте, стволовая клетка генетически модифицирована для включения нуклеиновой кислоты, кодирующей направляемый РНК ДНК-связывающий белок и стволовая клетка экспрессирует направляемый РНК ДНК-связывающий белок. Согласно конкретному аспекту, донорные нуклеиновые кислоты для введения специфических мутаций оптимизированы для редактирования генома с использованием либо модифицированных TALEN, либо направляемого РНК ДНК-связывающего белка.Aspects of the present disclosure are directed to the use of an RNA-directed DNA-binding protein for the genetic modification of stem cells. In one aspect, the stem cell is genetically modified to include a nucleic acid encoding an RNA-guided DNA-binding protein, and the stem cell expresses the RNA-guided DNA-binding protein. In a particular aspect, donor nucleic acids for introducing specific mutations are optimized for genome editing using either modified TALENs or an RNA-guided DNA binding protein.
Аспекты настоящего раскрытия направлены на модификацию ДНК, например, мультиплексную модификацию ДНК, в стволовой клетке с помощью одной или нескольких направляющих РНК (рибонуклеиновых кислот), для того, чтобы направить фермент, обладающий нуклеазной активностью, экспрессируемый стволовой клеткой, например, ДНК-связывающий белок, имеющий активность нуклеазы, в указанное положение на ДНК (дезоксирибонуклеиновой кислоте), где фермент разрезает ДНК и экзогенная донорная нуклеиновая кислота встраивается в ДНК, например, путем гомологичной рекомбинации. Аспекты настоящего изобретения включают циклические или повторяющиеся стадии модификации ДНК стволовой клетки для создания стволовой клетки, имеющей множество модификаций ДНК внутри клетки. Модификации могут включать введение экзогенных донорных нуклеиновых кислот.Aspects of the present disclosure are directed to DNA modification, e.g., multiplex DNA modification, in a stem cell using one or more guide RNAs (ribonucleic acids) to direct an enzyme having nuclease activity expressed by the stem cell, e.g., a DNA binding protein , having nuclease activity, to a specified position on DNA (deoxyribonucleic acid), where the enzyme cuts the DNA and the exogenous donor nucleic acid is incorporated into the DNA, for example, by homologous recombination. Aspects of the present invention include cyclic or repeated steps of modifying the DNA of a stem cell to create a stem cell having multiple DNA modifications within the cell. Modifications may include the introduction of exogenous donor nucleic acids.
Множественные экзогенные вставки нуклеиновых кислот могут быть осуществлены одиночной стадией введения в стволовую клетку, которая экспрессирует фермент, нуклеиновых кислот, кодирующих множество РНК и множество экзогенных донорных нуклеиновых кислот, например, путем котрансформации, где РНК экспрессируются и где каждая РНК в совокупности направляет фермент на конкретный участок ДНК, фермент разрезает ДНК и одна из множества экзогенных нуклеиновых кислот встраивается в ДНК в месте разреза. Согласно этому аспекту, многие изменения или модификации ДНК в клетке создаются в одиночном цикле.Multiple exogenous nucleic acid insertions can be accomplished by a single step of introducing into a stem cell that expresses the enzyme, nucleic acids encoding multiple RNAs and multiple exogenous donor nucleic acids, for example, by cotransformation, where the RNAs are expressed and where each RNA collectively directs the enzyme to a specific section of DNA, an enzyme cuts the DNA and one of many exogenous nucleic acids is incorporated into the DNA at the site of the cut. According to this aspect, many changes or modifications to DNA in a cell are created in a single cycle.
Множественные экзогенные вставки нуклеиновых кислот в стволовую клетку могут быть осуществлены путем повторных стадий или циклов введения в стволовую клетку, которая экспрессирует фермент, одной или нескольких нуклеиновых кислот, кодирующих одну или несколько РНК или множество РНК и одну или несколько экзогенных нуклеиновых кислот или множество экзогенных нуклеиновых кислот, где РНК экспрессируется и направляет фермент на конкретный участок ДНК, фермент разрезает ДНК и экзогенная нуклеиновая кислота встраивается в ДНК в месте разреза, при этом получается клетка, обладающая несколькими изменениями или вставками экзогенной ДНК в ДНК внутри стволовой клетки. Согласно одному аспекту, стволовая клетка, экспрессирующая фермент, была генетически изменена для экспрессии фермента, например, путем введения в клетку нуклеиновой кислоты, кодирующей фермент, которая может экспрессироваться стволовой клеткой. Таким образом, аспекты настоящего изобретения включают циклические стадии введения РНК в стволовую клетку, которая экспрессирует фермент, введения экзогенной донорной нуклеиновой кислоты в стволовую клетку, которая экспрессирует РНК, образования комплекса колокализации РНК, фермента и ДНК, ферментативное разрезание ДНК ферментом, и вставку донорной нуклеиновой кислоты в ДНК. Цикл или повторение вышеуказанных стадий приводит к мультиплексной генетической модификации стволовых клеток во множестве локусов, т. е. приводит к образованию стволовой клетки, имеющей множество генетических модификаций.Multiple exogenous insertions of nucleic acids into a stem cell can be accomplished by repeated steps or cycles of introducing into the stem cell that expresses the enzyme one or more nucleic acids encoding one or more RNAs or a plurality of RNAs and one or more exogenous nucleic acids or a plurality of exogenous nucleic acids. acids, where RNA is expressed and directs the enzyme to a specific site of DNA, the enzyme cuts the DNA and exogenous nucleic acid is inserted into the DNA at the cut site, resulting in a cell that has several changes or insertions of exogenous DNA into the DNA within the stem cell. In one aspect, a stem cell expressing an enzyme has been genetically modified to express the enzyme, for example, by introducing into the cell a nucleic acid encoding an enzyme that can be expressed by the stem cell. Thus, aspects of the present invention include the cyclic steps of introducing RNA into a stem cell that expresses an enzyme, introducing an exogenous donor nucleic acid into a stem cell that expresses RNA, forming an RNA-enzyme-DNA colocalization complex, enzymatic cutting of the DNA by the enzyme, and inserting a donor nucleic acid acids in DNA. The cycle or repetition of the above stages leads to multiplex genetic modification of stem cells at multiple loci, i.e., leads to the formation of a stem cell having multiple genetic modifications.
В соответствии с некоторыми аспектами, ДНК-связывающие белки или ферменты в пределах объема настоящего изобретения включают белок, который образует комплекс с направляющей РНК, и с помощью направляющей РНК комплекс направляется к двухцепочечной последовательности ДНК, где комплекс связывается с последовательностью ДНК. Согласно одному аспекту, фермент может быть РНК направляемым ДНК-связывающим белком, таким как РНК направляемый ДНК-связывающий белок системы CRISPR II типа, который связывается с ДНК и направляется РНК. Согласно одному аспекту, направляемый РНК ДНК-связывающий белок представляет собой белок Cas9.In some aspects, DNA-binding proteins or enzymes within the scope of the present invention include a protein that forms a complex with a guide RNA, and with the help of the guide RNA, the complex is directed to a double-stranded DNA sequence, where the complex binds to the DNA sequence. In one aspect, the enzyme may be an RNA-directed DNA-binding protein, such as an RNA-directed DNA-binding protein of the CRISPR type II system, which binds to DNA and is directed by RNA. In one aspect, the RNA-directed DNA binding protein is a Cas9 protein.
Этот аспект настоящего изобретения может быть отнесен к колокализации РНК и ДНК-связывающего белка с двухцепочечной ДНК. Таким образом, комплекс ДНК-связывающего белка-направляющей РНК может быть использован для расщепления множества участков на двухцепочечной ДНК, с образованием таким образом стволовой клетки с несколькими генетическими модификациями, например, множественными вставками экзогенной донорной ДНК.This aspect of the present invention can be attributed to the colocalization of RNA and DNA binding protein with double-stranded DNA. Thus, the DNA binding protein-guide RNA complex can be used to cleave multiple sites on double-stranded DNA, thereby producing a stem cell with multiple genetic modifications, such as multiple insertions of exogenous donor DNA.
В соответствии с некоторыми аспектами, предлагается способ внесения нескольких изменений в ДНК-мишень в стволовой клетке, экспрессирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом, который включает (а) введение в стволовую клетку первой чужеродной нуклеиновой кислоты, кодирующей одну или несколько РНК, комплементарных ДНК-мишени, которые направляют фермент к ДНК-мишени, где одна или несколько РНК и фермент являются членами комплекса колокализации с ДНК-мишенью, введение в стволовую клетку второй чужеродной нуклеиновой кислоты, кодирующей одну или несколько последовательностей донорной нуклеиновой кислоты, где одна или несколько РНК и одна или несколько последовательностей донорной нуклеиновой кислоты экспрессируются, где одна или несколько РНК и фермент колокализуются с ДНК-мишенью, фермент расщепляет ДНК и донорная нуклеиновая кислота встраивается в ДНК-мишень, с получением таким образом измененной ДНК в стволовой клетке, и повторение стадии (а) несколько раз, для внесения множества изменений в ДНК стволовой клетки.In accordance with some aspects, a method is provided for making several changes to target DNA in a stem cell expressing an enzyme that forms a colocalization complex with RNA complementary to the target DNA and that cleaves the target DNA in a site-specific manner, which includes (a) administering into the stem cell of a first foreign nucleic acid encoding one or more RNAs complementary to the target DNA, which direct an enzyme to the target DNA, where one or more RNAs and the enzyme are members of a colocalization complex with the target DNA, introduction of a second foreign nucleic acid into the stem cell acid encoding one or more donor nucleic acid sequences, where one or more RNA and one or more donor nucleic acid sequences are expressed, where one or more RNA and an enzyme colocalize with the target DNA, the enzyme cleaves the DNA, and the donor nucleic acid is incorporated into the DNA target, thereby obtaining altered DNA in the stem cell, and repeating step (a) several times to introduce multiple changes into the DNA of the stem cell.
Согласно одному аспекту, длина РНК составляет от около 10 до около 500 нуклеотидов. Согласно одному аспекту, длина РНК составляет от около 20 до около 100 нуклеотидов.In one aspect, the RNA is between about 10 and about 500 nucleotides in length. In one aspect, the RNA is between about 20 and about 100 nucleotides in length.
Согласно одному аспекту, одна или несколько РНК представляют собой направляющую РНК. Согласно одному аспекту, одна или несколько РНК представляют собой химеру tracrRNA-crRNA.In one aspect, the one or more RNAs are guide RNAs. In one aspect, the one or more RNAs are a tracrRNA-crRNA chimera.
Согласно одному аспекту, ДНК представляет собой геномную ДНК, митохондриальную ДНК, вирусную ДНК или экзогенную ДНК.In one aspect, the DNA is genomic DNA, mitochondrial DNA, viral DNA, or exogenous DNA.
Согласно одному аспекту, клетка может быть генетически модифицирована для обратимого включения нуклеиновой кислоты, кодирующей ДНК-связывающий фермент, с использованием вектора, который может быть легко удален с помощью фермента. Полезные векторы и способы известны специалистам в данной области техники и включают лентивирусы, аденоассоциированный вирус, опосредованные нуклеазами и интегразами способы направленной вставки и способы вставки, опосредованные транспозонами. Согласно одному аспекту, нуклеиновая кислота, кодирующая ДНК-связывающую фермент, который был добавлен, например, с помощью кассеты или вектора, к примеру, может быть удалена полностью вместе с кассетой и вектором, не оставляя часть такой нуклеиновой кислоты, кассеты или вектора в геномной ДНК. Такое удаление упоминается в данной области техники как «не оставляющее шрамов» удаление, поскольку геном становится таким же, каким он был до добавления нуклеиновой кислоты, кассеты или вектора.In one aspect, a cell can be genetically modified to reversibly incorporate a nucleic acid encoding a DNA binding enzyme using a vector that can be readily removed by the enzyme. Useful vectors and methods are known to those skilled in the art and include lentiviruses, adeno-associated virus, nuclease- and integrase-mediated targeted insertion methods, and transposon-mediated insertion methods. In one aspect, a nucleic acid encoding a DNA-binding enzyme that has been added, for example, by a cassette or vector, for example, can be removed entirely along with the cassette and vector, without leaving a portion of such nucleic acid, cassette or vector in the genomic DNA. Such removal is referred to in the art as “scarless” removal because the genome becomes the same as it was before the addition of the nucleic acid, cassette or vector.
Одним примерным воплощением вставки и удаления без шрамов является вектор PiggyBac, коммерчески доступный у System Biosciences.One exemplary embodiment of scarless insertion and removal is the PiggyBac vector, commercially available from System Biosciences.
Дополнительные признаки и преимущества определенных воплощений настоящего изобретения станут более очевидными в следующем описании воплощений и чертежей, и из формулы изобретения.Additional features and advantages of certain embodiments of the present invention will become more apparent from the following description of embodiments and drawings, and from the claims.
Краткое описание чертежейBrief description of drawings
Вышеуказанные и другие признаки и преимущества настоящих воплощений будут более понятны из нижеследующего подробного описания иллюстративных воплощений, рассматриваемых вместе с сопроводительными чертежами, где:The above and other features and advantages of the present embodiments will be better understood from the following detailed description of the illustrative embodiments taken in conjunction with the accompanying drawings, wherein:
Фиг. 1 относится к функциональным тестам re-TALENs в соматических и стволовых клетках человека.Fig. 1 relates to functional assays of re-TALENs in human somatic and stem cells.
(а) Схематическое изображение экспериментального проекта для тестирования эффективности направленного воздействия на геном. Интегрированная в геном последовательность, кодирующая GFP, нарушается вставкой стоп-кодона и 68 п.о. геномного фрагмента, полученного из локуса AAVS1 (внизу). Восстановление последовательности GFP с помощью нуклеазо-опосредованной гомологичной рекомбинации с помощью донора tGFP (вверху) приводит к образованию клеток GFP+, которые могут быть количественно оценены с помощью FACS. Re-TALENs и TALENs направлено воздействуют на одинаковые последовательности в пределах фрагментов AAVS1.(a) Schematic representation of an experimental design to test the effectiveness of genome targeting. The GFP coding sequence integrated into the genome is disrupted by the insertion of a stop codon and 68 bp. genomic fragment derived from the AAVS1 locus (bottom). Reconstruction of the GFP sequence by nuclease-mediated homologous recombination with the tGFP donor (top) results in the formation of GFP + cells that can be quantified by FACS. Re-TALENs and TALENs target identical sequences within AAVS1 fragments.
(b) Столбиковая диаграмма, демонстрирующая процент GFP+ клеток, полученных с помощью только tGFP-донора отдельно, с помощью TALENs с tGFP-донором и re-TALENs с tGFP-донором в локусе-мишени, согласно измерениям с помощью FACS. (N = 3, планки погрешности = SD). Репрезентативные графики FACS показаны ниже.(b) Bar graph showing the percentage of GFP + cells generated with tGFP-donor alone, with tGFP-donor TALENs, and tGFP-donor re-TALENs at the target locus, as measured by FACS. (N = 3, error bars = SD). Representative FACS plots are shown below.
(с) Схематический обзор, изображающий стратегию направленного воздействия, для нативного локуса AAVS1. Плазмида-донор содержит акцептор сплайсинга (SA) - 2A (саморасщепляющиеся пептиды), ген устойчивости к пуромицину (PURO) и GFP (см. источник 10, включенный в данный документ ссылкой в полном объеме). Места расположения ПЦР-праймеров, используемых для обнаружения успешных событий редактирования, изображены в виде голубых стрелок.(c) Schematic overview depicting the targeting strategy for the native AAVS1 locus. The donor plasmid contains splice acceptor (SA)-2A (self-cleaving peptides), puromycin resistance gene (PURO) and GFP (see reference 10, incorporated herein by reference in its entirety). The locations of PCR primers used to detect successful editing events are depicted as blue arrows.
(d) Подвергнутые успешному направленному воздействию клоны PGP1 hiPSCs отбирали на пуромицине (0,5 мкг/мл) в течение 2 недель. Показаны микроскопические изображения трех представительных GFP+ клонов. Клетки также окрашивали по маркерам плюрипотентности TRA-1-60. Измерительная линейка: 200 мкм.(d) Successfully targeted PGP1 hiPSCs clones were selected on puromycin (0.5 μg/ml) for 2 weeks. Microscopic images of three representative GFP + clones are shown. Cells were also stained for pluripotency markers TRA-1-60. Measuring ruler: 200 µm.
(e) Анализы ПЦР, выполненные на этих моноклональных GFP+ hiPSC клонах, продемонстрировали успешное встраивание донорных кассет в участок AAVS1 (дорожки 1,2,3), в то время как обычные hiPSCs не демонстрировали никаких признаков успешного встраивания (дорожка C).(e) PCR assays performed on these monoclonal GFP + hiPSC clones demonstrated successful insertion of donor cassettes into the AAVS1 site (lanes 1,2,3), while conventional hiPSCs showed no evidence of successful insertion (lane C).
(f) Отображение последовательности SEQ ID NO: 1.(f) Sequence display SEQ ID NO: 1.
Фиг. 2 относится к сравнению эффективности направленного воздействия на геном с помощью reTALENs и Cas9-гидРНК на CCR5 в iPSCs.Fig. 2 relates to a comparison of the genome targeting efficiency of reTALENs and Cas9 guideRNAs to CCR5 in iPSCs.
(а) Схематическое изображение эксперимента по геномной инженерии. В целевой участок пары re-TALEN или Cas9-гидРНК в PGP1 hiPSCs доставляли 90-мер ssODN, несущий 2 п.о. несоответствие относительно геномной ДНК, вместе с конструкциями reTALEN или Cas9-гидРНК. Участки расщепления нуклеазами изображены на фигуре в виде красных стрелок.(a) Schematic representation of a genome engineering experiment. A 90-mer ssODN carrying 2 bp was delivered to the target site of the re-TALEN or Cas9-hydrRNA pair in PGP1 hiPSCs. mismatch relative to genomic DNA, together with reTALEN or Cas9 guideRNA constructs. Sites of nuclease cleavage are shown in the figure as red arrows.
(b) Анализ глубоким секвенированием эффективностей HDR и NHEJ для пар re-TALEN (CCR5 #3) и ssODN, или Cas9-гидРНК и ssODN. Изменения в геноме hiPSCs анализировали на основе данных о последовательности, полученной высокопроизводительными способами, с помощью GEAS. Вверху: HDR количественно оценивали из фракции ридов, содержащих 2 п.о. точечные мутации, встроенных в центр ssODN (синий), а активность NHEJ количественно оценивали из фракции делеций (серые)/вставок (красные) в каждом конкретном положении в геноме. Для графиков reTALEN и ssODN, зеленый пунктир нанесен для того, чтобы отметить внешнюю границу участков связывания пар re-TALENs, которые находятся в положениях -26 п.о. и + 26 п.о. относительно центра двух участков связывания re-TALEN. Для графиков Cas9-гидРНК и ssODN, зеленый пунктир отмечает внешнюю границу участка направленного воздействия гидРНК, который находится в положениях -20 и -1 п.о. по отношению к последовательности РАМ. Внизу: распределение по размерам Делеция/Вставка в hiPSCs анализировали по всей популяции NHEJ с обработкой, указанной выше.(b) Deep sequencing analysis of HDR and NHEJ efficiencies for pairs of re-TALEN (CCR5 #3) and ssODN, or Cas9-hydrRNA and ssODN. Changes in the genome of hiPSCs were analyzed based on high-throughput sequence data using GEAS. Top: HDR was quantified from the fraction of reads containing 2 bp. point mutations inserted into the center of ssODN (blue), and NHEJ activity was quantified from the deletion (gray)/insertion (red) fraction at each specific position in the genome. For the reTALEN and ssODN plots, the green dotted line is drawn to mark the outer boundary of the binding sites of the re-TALENs pairs, which are at the -26 bp position. and + 26 bp relative to the center of the two re-TALEN binding sites. For the Cas9-guideRNA and ssODN plots, the green dotted line marks the outer boundary of the guideRNA targeting region, which is located at positions -20 and -1 bp. in relation to the PAM sequence. Bottom: Deletion/Insertion size distribution in hiPSCs was analyzed across the entire NHEJ population with the treatments indicated above.
(с) Эффективность редактирования генома re-TALENs и Cas9-гидРНК, направленно воздействовавших на CCR5 в PGP1 hiPSCs.(c) Genome editing efficiency of re-TALENs and Cas9 guideRNAs targeting CCR5 in PGP1 hiPSCs.
Вверху: схематическое представление участков, подвергшихся направленному редактированию геномов в CCR5. 15 участков для направленного воздействия показаны синими стрелками снизу. Для каждого участка клетки котрансфецировали парой re-TALENs и их соответствующего донорного ssODN, несущего 2 п.о. несовпадение относительно геномной ДНК. Эффективность редактирования генома анализировали через 6 дней после трансфекции. Аналогичным образом, 15 Cas9-гидРНК трансфецировали с соответствующими ssODNs индивидуально в PGP1-hiPSCs для направленного воздействия не те же 15 участков и анализировали эффективность через 6 дней после трансфекции. Внизу: эффективность редактирования генома re-TALENs и Cas9-гидРНК при направленном целевом воздействии на CCR5 в PGP1 hiPSCs. Панели 1 и 2 демонстрируют эффективности NHEJ и HDR, опосредованные reTALENs. Панель 3 и 4 демонстрируют эффективности NHEJ и HDR, опосредованные Cas9-гидРНК. Показатели NHEJ рассчитывали по частоте геномных аллелей, несущих делеции или вставки в подвергнутом направленному воздействию участке; показатели HDR рассчитывали по частоте геномных аллелей, несущих 2 п.о. несоответствия. Панель 5, профиль DNAseI HS для клеточной линии hiPSC из базы данных ENCODE (Duke DNase HS, iPS NIHi7 DS). Следует отметить, что масштабы панелей отличаются.Top: Schematic representation of regions affected by targeted genome editing in CCR5. The 15 targeted areas are shown with blue arrows below. For each site, cells were cotransfected with a pair of re-TALENs and their corresponding donor ssODN carrying 2 bp. mismatch regarding genomic DNA. The efficiency of genome editing was analyzed 6 days after transfection. Similarly, 15 Cas9 guideRNAs were transfected with the corresponding ssODNs individually into PGP1-hiPSCs to target the same 15 sites and efficiency was analyzed 6 days after transfection. Bottom: genome editing efficiency of re-TALENs and Cas9 guideRNAs when targeting CCR5 in PGP1 hiPSCs. Panels 1 and 2 demonstrate the efficiencies of NHEJ and HDR mediated by reTALENs. Panels 3 and 4 demonstrate the efficiencies of Cas9 guideRNA-mediated NHEJ and HDR. NHEJ scores were calculated from the frequency of genomic alleles carrying deletions or insertions in the targeted region; HDR indices were calculated based on the frequency of genomic alleles carrying 2 bp. inconsistencies. Panel 5, DNAseI HS profile for hiPSC cell line from ENCODE database (Duke DNase HS, iPS NIHi7 DS). It should be noted that the scales of the panels differ.
Фиг. 3 направлена на изучение функциональных параметров, регулирующих ssODN-опосредованную HDR с re-TALENs или Cas9-гидРНК в PGP1 hiPSCs.Fig. 3 aims to explore the functional parameters regulating ssODN-mediated HDR with re-TALENs or Cas9 guideRNAs in PGP1 hiPSCs.
(а) PGP1 hiPSCs котрансфецировали с помощью пары re-TALENs (#3) и ssODNs различной длины (50, 70, 90,110, 130 150 170 нуклеотидов). Все ssODNs обладали идентичным 2 п.о. несовпадением относительно геномной ДНК в середине своей последовательности. 90-мерный ssODN достиг оптимального уровня HDR в подвергнутом направленному воздействию геноме. Оценка HDR-, NHEJ-опосредованной эффективности делеции и вставки описана в данном документе.(a) PGP1 hiPSCs were cotransfected with a pair of re-TALENs (#3) and ssODNs of varying lengths (50, 70, 90,110, 130,150,170 nucleotides). All ssODNs shared identical 2 bp. a mismatch with respect to genomic DNA in the middle of its sequence. The 90-mer ssODN achieved optimal HDR levels in the targeted genome. Evaluation of HDR-, NHEJ-mediated deletion and insertion efficiencies is described herein.
(b) 90-мерные ssODNs, соответствующие паре re-TALEN # 3, каждая из которых содержит 2 п.о. несовпадение (А) в центре и дополнительное 2 п.о. несовпадение (B) в разных положениях, смещенных от А (где смещения варьировали от -30 п.о. -> 30 п.о.), были использованы для тестирования последствий отклонения от гомологии вдоль ssODN. Эффективность редактирования генома каждого ssODN оценивали в PGP1 hiPSCs. Нижняя столбиковая диаграмма демонстрирует частоту включения только А, только В и А + В в подвергнутом направленному воздействию геноме. Показатели HDR уменьшались по мере увеличения расстояния от центра участка с отклонением по гомологии.(b) 90-mer ssODNs corresponding to re-TALEN pair #3, each containing 2 bp. mismatch (A) in the center and an additional 2 bp. mismatches (B) at different positions offset from A (where offsets varied from -30 bp -> 30 bp) were used to test the consequences of deviation from homology along the ssODN. The genome editing efficiency of each ssODN was assessed in PGP1 hiPSCs. The bottom bar graph shows the frequency of A-only, B-only, and A+B inclusions in the targeted genome. HDR scores decreased as the distance from the center of the homology-biased region increased.
(с) ssODNs, нацеленные на участки с варьирующими расстояниями (-620п.о. ~ 480 п.о.) от участка-мишени пары #3 re-TALEN, были испытаны для оценки максимального расстояния, в пределах которого ssODNs могут быть помещены для введения мутаций. Все ssODNs несли 2 п.о. несоответствие в середине своих последовательностей. Наблюдали минимальную эффективность HDR (<= 0,06%), когда несовпадение в ssODN располагалось на расстоянии 40 п.о. от середины участка связывания пары re-TALEN.(c) ssODNs targeting sites with varying distances (-620bp ~ 480bp) from the target site of re-TALEN pair #3 were tested to evaluate the maximum distance within which ssODNs could be placed to introduction of mutations. All ssODNs carried 2 bp. inconsistency in the middle of its sequences. Minimal HDR efficiency (<=0.06%) was observed when the mismatch in the ssODN was located 40 bp apart. from the middle of the binding site of the re-TALEN pair.
(d) PGP1 hiPSCs котрансфецировали Cas9-гидРНК (AAVS1) и ssODNs различной ориентации (Ос: комлпементарная гидРНК; On: некомплементарная гидРНК) и разной длины (30, 50, 70, 90, 110 нуклеотидов). Все ssODNs обладали идентичными 2 п.о. несовпадениями относительно геномной ДНК в середине своих последовательностей. 70-мерный Ос достигал оптимального значения HDR в подвергнутом направленному воздействию геноме.(d) PGP1 hiPSCs were cotransfected with Cas9-guideRNA (AAVS1) and ssODNs of different orientations (Oc: complementary guideRNA; On: non-complementary guideRNA) and different lengths (30, 50, 70, 90, 110 nucleotides). All ssODNs had identical 2 bp. mismatches with respect to genomic DNA in the middle of their sequences. The 70-mer Oc achieved optimal HDR in the targeted genome.
Фиг. 4 направлен на использование re-TALENs и ssODNs для получения моноклональных hiPSCс отредактированным геномом без селекции.Fig. 4 aims to use re-TALENs and ssODNs to generate genome-edited monoclonal hiPSCs without selection.
(а) Временная шкала эксперимента.(a) Timeline of the experiment.
(b) Эффективность редактирования генома пары re-TALENs и ssODN (# 3), оценивали с помощью платформы NGS, описанной на фигуре 2b.(b) The genome editing efficiency of the pair re-TALENs and ssODNs (#3) was assessed using the NGS platform described in Figure 2b.
(с) Результаты секвенирования по Сенгеру колоний моноклональных hiPSC после редактирования генома. 2 п.о. гетерогенный генотип (CT/CT->TA/CT) был успешно внедрен в геном колоний PGP 1-IPS-3-11, PGPl-IPS-3-13.(c) Sanger sequencing results of monoclonal hiPSC colonies after genome editing. 2 p.o. the heterogeneous genotype (CT/CT->TA/CT) was successfully introduced into the genome of the PGP 1-IPS-3-11, PGPl-IPS-3-13 colonies.
(d) Иммунофлуоресцентное окрашивание подвергнутых направленному воздействию PGPl-IPS-3-11. Клетки окрашивали на маркеры плюрипотентности TRA-1-60 и SSEA4.(d) Immunofluorescence staining of targeted PGPl-IPS-3-11. Cells were stained for pluripotency markers TRA-1-60 and SSEA4.
(e) Гематоксилин-эозиновое окрашивание срезов тератом, полученных из моноклональных клеток PGPl-IPS-3-11.(e) Hematoxylin-eosin staining of teratoma sections obtained from monoclonal cells PGPl-IPS-3-11.
Фиг. 5. Дизайн reTALE. (a) Выравнивание последовательности исходного мономера TALE RVD относительно мономеров в re-TALE-16.5 (re-TALE-M1>re-TALE-M17). Нуклеотидные изменения относительно исходной последовательности выделены серым, (b) Тест повторяемости re-TALE с помощью ПЦР. Верхняя панель показывает структуру re-TALE/TALE и позиции праймеров для ПЦР-реакции. Нижняя панель показывает полосы ПЦР в условиях, указанных ниже. Электрофоретическая картина фрагментов ПЦР представлена с помощью исходного шаблона TALE (правая дорожка).Fig. 5. Design by reTALE. (a) Sequence alignment of the original TALE RVD monomer relative to the monomers in re-TALE-16.5 (re-TALE-M1>re-TALE-M17). Nucleotide changes relative to the original sequence are highlighted in gray, (b) re-TALE repeatability test by PCR. The top panel shows the re-TALE/TALE structure and primer positions for the PCR reaction. The bottom panel shows the PCR bands under the conditions listed below. The electrophoretic pattern of the PCR fragments is shown using the original TALE template (right lane).
Фиг. 6. Дизайн и практическое осуществление сборки TASA (TALE Single-incubation Assembly), (а) Схематическое представление библиотеки димерных блоков re-TALE для сборки TASA. Представлена библиотека 10 димерных блоков re-TALE, кодирующих два RVDs. Внутри каждого блока, все 16 димеров имеют одну и ту же последовательность, за исключением последовательностей, кодирующих RVD; Димеры в различных блоках имеют отличающиеся последовательности, но спроектированы таким образом, чтобы они имели общие 32 п.о. перекрывания с соседними блоками. Нуклеотидная и аминокислотная последовательности одного димера (Блок 6_AC) представлены справа.Fig. 6. Design and practical implementation of TASA (TALE Single-incubation Assembly), (a) Schematic representation of the re-TALE dimer block library for TASA assembly. A library of 10 re-TALE dimeric blocks encoding two RVDs is presented. Within each block, all 16 dimers have the same sequence, with the exception of the sequences encoding RVD; The dimers in the different blocks have different sequences but are designed to share 32 bp. overlapping with neighboring blocks. The nucleotide and amino acid sequences of one dimer (Block 6_AC) are shown on the right.
(b) Схематическое представление сборки TASA. На левой панели показан способ сборки TASA: однореакторная реакция инкубации проводится с ферментной смесью/re-TALE блок s/re-TALE-N/TF каркасными векторами. Продукт реакции может быть использован непосредственно для трансформации бактерий. Правая панель демонстрирует механизм TASA. Вектор назначения линеаризуется эндонуклеазой при 37°С для того, чтобы отрезать контрселективную кассету ccdB; экзонуклеаза, которая обрабатывает конец блоков и линеаризованных векторов, экспонирует оцДНК выступы на конце фрагментов, что позволяет блокам и векторным каркасам соединяться в назначенном порядке. При повышении температуры до 50°С, полимеразы и лигазы работают вместе для того, чтобы заделать разрыв, что позволяет получить конечные конструкции, готовые к трансформации.(b) Schematic representation of the TASA assembly. The left panel shows the TASA assembly method: a one-pot incubation reaction is carried out with the enzyme mixture/re-TALE block s/re-TALE-N/TF scaffold vectors. The reaction product can be used directly to transform bacteria. The right panel shows the TASA mechanism. The destination vector is linearized by endonuclease at 37°C to cut off the counterselective ccdB cassette; The exonuclease that processes the end of blocks and linearized vectors exposes ssDNA overhangs at the ends of the fragments, allowing the blocks and vector scaffolds to join in the designated order. When the temperature rises to 50°C, polymerases and ligases work together to repair the gap, resulting in final constructs ready for transformation.
(с) Эффективность сборки TASA для re-TALEs, обладающих разными длинами мономеров. Используемые для сборки блоки показаны слева, а эффективность сборки представлена справа.(c) TASA assembly efficiency for re-TALEs possessing different monomer lengths. The blocks used for assembly are shown on the left, and the assembly efficiency is shown on the right.
Фиг. 7. Функциональность и целостность последовательности Lenti-reTALEs. Клетки 293T, трансдуцированные lenti-re-TALE-TF показали 36x активацию экспрессии репортера по сравнению с только отрицательным репортером.Fig. 7. Functionality and sequence integrity of Lenti-reTALEs. 293T cells transduced with lenti-re-TALE-TF showed 36x upregulation of reporter expression compared to the negative reporter alone.
Фиг. 8. Чувствительность и воспроизводимость GEAS.Fig. 8. Sensitivity and reproducibility of GEAS.
(А) Информационный анализ предела обнаружения HDR. С учетом набора данных re-TALENs (# 10)/ssODN, были определены «риды», содержащие ожидаемое редактирование (HDR) и эти HDR-«риды» систематически удалялись для создания различных искусственных наборов данных с «разведенным» редактирующим сигналом. Наборы данных с 100, 99,8, 99,9, 98,9, 97,8, 89,2, 78,4, 64,9, 21,6, 10,8, 2,2, 1,1, 0,2, 0,1, 0,02 и 0% удалением HDR-«ридов» были сгенерированы для получения искусственных наборов с эффективностью HR в диапазоне 0-0,67%. Для каждого отдельного набора данных, была оценена взаимная информация (mutual information, MI) фонового сигнала (обозначено фиолетовым) и сигнала, полученного в участке направленного воздействия (обозначено зеленым). MI в участке направленного воздействия заметно выше, чем фон, при этом эффективность HDR выше 0,0014%. По оценке предел обнаружения HDR находится в диапазоне от 0,0014% до 0,0071%. Расчет MI описан в данном документе.(A) Information analysis of HDR detection limit. Given the re-TALENs (#10)/ssODN dataset, reads containing expected editing (HDR) were identified and these HDR reads were systematically removed to create various artificial datasets with a diluted editing signal. Datasets with 100, 99.8, 99.9, 98.9, 97.8, 89.2, 78.4, 64.9, 21.6, 10.8, 2.2, 1.1, 0 ,2, 0.1, 0.02 and 0% removal of HDR reads were generated to obtain artificial sets with HR efficiency in the range of 0-0.67%. For each individual data set, the mutual information (MI) of the background signal (in purple) and the signal received at the target site (in green) was estimated. The MI in the targeted area is noticeably higher than the background, while the HDR efficiency is higher than 0.0014%. The HDR detection limit is estimated to range from 0.0014% to 0.0071%. The calculation of MI is described in this document.
(b) Тест воспроизводимости системы оценки редактирования генома. Пары графиков (верхний и нижний) демонстрируют результаты оценки HDR и NHEJ в двух повторах с парой re-TALENs и типом клеток, указанным выше. Для каждого эксперимента независимо были проведены нуклеофекция, направленная амплификация генома, глубокое секвенирование и анализ данных. Разброс повторов при оценке редактирования генома рассчитывали как V2 (|HDRl-HDR2|)/((HDR+HDR2)/2) =AHDR/HDR и V2 (|NHEJ1-NHEJ2|) /((NHEJl+NHEJ2)/2) =ANHEJ/NHEJ, а результаты по разбросу приведены ниже графиков. Средний разброс системы составил (19% + 11% + 4% + 9% + 10% + 35%)/6 = 15%. Факторы, которые могут способствовать разбросу, включают статус клеток при нуклеофекции, эффективность нуклеофекции, охват и качество секвенирования.(b) Reproducibility test of the genome editing scoring system. Pairs of graphs (top and bottom) show the results of HDR and NHEJ assessment in duplicate with the pair of re-TALENs and cell type specified above. For each experiment, nucleofection, targeted genome amplification, deep sequencing, and data analysis were performed independently. The spread of repeats when assessing genome editing was calculated as V2 (|HDRl-HDR2|)/((HDR+HDR2)/2) =AHDR/HDR and V2 (|NHEJ1-NHEJ2|) /((NHEJl+NHEJ2)/2) = ANHEJ/NHEJ, and the scatter results are shown below the graphs. The average system spread was (19% + 11% + 4% + 9% + 10% + 35%)/6 = 15%. Factors that may contribute to scatter include cell nucleofection status, nucleofection efficiency, sequencing coverage, and sequencing quality.
Фиг. 9. Статистический анализ эффективностей NHEJ и HDR при использовании reTALENs и Cas9-гидРНК на CCR5.Fig. 9. Statistical analysis of NHEJ and HDR efficiencies using reTALENs and Cas9-hydrRNA on CCR5.
(а) Корреляция эффективностей HR и NHEJ при использовании reTALENs на одинаковых участках в iPSCs (i= 0,91, P <IX 10-5).(a) Correlation of HR and NHEJ efficiencies using reTALENs at identical sites in iPSCs (i= 0.91, P <IX 10-5).
(b) Корреляция эффективностей HR и NHEJ, опосредованных Cas9-гидРНК на одинаковых участках в iPSCs (i= 0,74, р = 0,002).(b) Correlation of HR and NHEJ efficiencies mediated by Cas9 guideRNA at identical sites in iPSCs (i= 0.74, p = 0.002).
(с) Корреляция эффективности NHEJ, опосредованной Cas9-гидРНК и температуры Tm целевого участка для гидРНК в iPSCs (г = 0,52, р = 0,04)(c) Correlation of Cas9-guideRNA-mediated NHEJ efficiency and guideRNA target site temperature Tm in iPSCs (r = 0.52, p = 0.04)
Фиг. 10. Корреляционный анализ эффективности редактирования генома и эпигенетического состояния. Корреляции Пирсона использовали для изучения возможных связей между чувствительностью ДНКазы I и эффективностью геномной инженерии (HR, NHEJ). Наблюдаемую корреляцию сравнивали с рандомизированным набором (N = 100000). Наблюдаемые корреляции выше 95-го процентиля или ниже 5-го процентиля моделируемого распределения считались потенциальными ассоциациями. Не наблюдали заметной корреляции между чувствительностью ДНКазы 1 и эффективностью NHEJ/HR.Fig. 10. Correlation analysis of the efficiency of genome editing and the epigenetic state. Pearson correlations were used to examine possible relationships between DNase I sensitivity and genome engineering efficiency (HR, NHEJ). The observed correlation was compared with a randomized set (N = 100,000). Observed correlations above the 95th percentile or below the 5th percentile of the simulated distribution were considered potential associations. No significant correlation was observed between DNase 1 sensitivity and NHEJ/HR efficiency.
Фиг. 11. Влияние гомологичного спаривания при ssODN-опосредованном редактировании генома.Fig. 11. Effect of homologous pairing in ssODN-mediated genome editing.
(а) В эксперименте, описанном на рисунке 3b, общая HDR снижалось, что измерялось по темпам, с которыми происходило включение среднего 2 п.о. несовпадения (А), по мере того, как росла дистанция на которую вторичные несовпадения В удалялись от А (относительное положение В по отношению к А, к варьирует от -30 до 30 п.о.). Более высокие темпы включения, когда В находится всего лишь в 10 п.о. от A (-10 п.о. и + 10 п.о.) могут отражать меньшую потребность в спаривании ssODN против геномной ДНК, проксимальной к двухцепочечному разрыву ДНК.(a) In the experiment described in Figure 3b, overall HDR decreased, as measured by the rate at which incorporation of the middle 2 bp occurred. mismatches (A), as the distance at which secondary mismatches B moved away from A increased (the relative position of B in relation to A, k varies from -30 to 30 bp). Higher incorporation rates when B is only 10 bp away. from A (−10 bp and + 10 bp) may reflect a lesser requirement for ssODN pairing against genomic DNA proximal to the DNA double-strand break.
(b) Распределение длин генной конверсии вдоль ssODN. На каждом расстоянии В от А, доля событий HDR включает только А, тогда как друга доля включает как А, так и В. Эти два события могут интерпретироваться в терминах трактов конверсии генов (Elliott et al., 1998), в результате чего A+B-события представляют длинные конверсионные тракты, которые выходят за рамки только В и только А событий, представляющие более короткие пути, которые не достигают В. Согласно данной интерпретации, может быть оценено распределение трактов генной конверсии в обоих направлениях вдоль олигонуклеотида (середина ssODN определяется как 0, конверсионные тракты по направлению к 5'-концу ssODN - как «-» направление, а к 3'-концу - как «+» направление). Тракты генной конверсии постепенно уменьшаются по мере увеличения их длин, результат очень похожий на распределение трактов генной конверсии, наблюдаемое с дцДНК-донорами, но на сильно сжатой шкала дистанций в десятки п.о. для одноцепочечных олигодезоксинуклеотидов по сравнению с сотнями пар оснований для дцДНК-доноров.(b) Distribution of gene conversion lengths along the ssODN. At each distance B from A, a fraction of HDR events involve only A, while another fraction involves both A and B. These two events can be interpreted in terms of gene conversion tracts (Elliott et al., 1998), resulting in A+ B events represent long conversion tracts that extend beyond just B and only A events, which represent shorter pathways that do not reach B. According to this interpretation, the distribution of gene conversion tracts in both directions along the oligonucleotide can be estimated (the middle of the ssODN is defined as 0, conversion tracts towards the 5' end of ssODN - as the "-" direction, and towards the 3' end - as the "+" direction). Gene conversion tracts gradually decrease as their lengths increase, a result very similar to the distribution of gene conversion tracts observed with dsDNA donors, but on a highly compressed distance scale of tens of bp. for single-stranded oligodeoxynucleotides compared to hundreds of base pairs for dsDNA donors.
(с) Анализы трактов генной конверсии с использованием одиночного ssODN, который содержит ряд мутаций, и измерение непрерывных последовательностей включений. Использовали ssODN-донор с тремя парами 2 п.о. несовпадений (оранжевый), разнесенных с интервалом в 10 нуклеотидов в обе стороны от центрального 2 п.о. несовпадения (вверху). Было обнаружено незначительное количество «ридов» геномного секвенирования (см. источник 62, включенный в данный документ ссылкой в полном объеме), несущих >=1 несовпадения, определенных с помощью ssODN среди> 300 000 «ридов» при секвенировании этой области. Все эти «риды» были нанесены на график (внизу), а последовательность «ридов» была закодирована условной окраской. Оранжевый: определенные несоответствия; зеленый: последовательность дикого типа. Геномное редактирование с этими ssODN дало паттерн, в котором средняя мутация отдельно была включена в 85% (53/62) моментов времени, с множеством В- несовпадений, включенных в другие моменты. Хотя количество событий В-включений было слишком низким для оценки распределения длин путей > 10 п. о., ясно, что преобладает область коротких путей от -10 до 10 п.о.(c) Gene conversion tract assays using a single ssODN that contains a number of mutations and measuring continuous sequences of inclusions. An ssODN donor with three 2 bp pairs was used. mismatches (orange) spaced 10 nucleotides apart from the central 2 bp. mismatches (top). A small number of genomic sequencing reads (see reference 62, incorporated herein by reference in its entirety) were found to carry >=1 mismatch identified by ssODN among >300,000 sequencing reads in this region. All of these reads were plotted (below), and the sequence of reads was color coded. Orange: certain inconsistencies; green: wild-type sequence. Genome editing with these ssODNs produced a pattern in which the average mutation alone was included at 85% (53/62) of time points, with many B mismatches included at other times. Although the number of B-inclusion events was too low to estimate the distribution of path lengths >10 bp, it is clear that a region of short paths from −10 to 10 bp predominates.
Фиг. 12. Эффективности редактирования генома Cas9-гидРНК нуклеазой и никазами.Fig. 12. Efficiency of genome editing by Cas9-hydrRNA nuclease and nickases.
PGP1 iPSCs котрансфецировали комбинацией нуклеазы (С2) (Cas9-гидРНК) или никазы (Cс) (Cas9D10A-гидРНК) и ssODNs различной ориентации (Oс и On). Все ssODNs обладали идентичным 2 п.о. несовпадением относительно геномной ДНК в середине своей последовательности. Оценка HDR описана в данном документе.PGP1 iPSCs were cotransfected with a combination of nuclease (C2) (Cas9-hydrRNA) or nickase (Cc) (Cas9D10A-hydrRNA) and ssODNs of different orientations (Oc and On). All ssODNs shared identical 2 bp. a mismatch with respect to genomic DNA in the middle of its sequence. HDR evaluation is described in this document.
Фиг. 13. Дизайн и оптимизация последовательности re-TALE.Fig. 13. Design and optimization of the re-TALE sequence.
Последовательность re-TALE подвергали эволюции в течение нескольких циклов дизайна для устранения повторов. В каждом цикле оценивали синонимичные последовательности из каждого повтора. Отбирали те из них, которые имели наибольшее расстояние Хэмминга к эволюционирующей ДНК. Окончательная последовательность имела cai = 0,59 ΔG = -9,8 ккал/моль. Для выполнения общей основы для дизайна синтетического белка использовали пакет R.The re-TALE sequence was evolved over several design cycles to eliminate redundancies. In each cycle, synonymous sequences from each repeat were evaluated. Those that had the greatest Hamming distance to the evolving DNA were selected. The final sequence had cai = 0.59 ΔG = -9.8 kcal/mol. The R package was used to provide a general framework for synthetic protein design.
Фиг. 14 представляет собой изображение геля, демонстрирующее проверку с помощью ПЦР геномной вставки Cas9 в клетки PGP1. Дорожки 3, 6, 9, 12 являются продуктами ПЦР обычных клеточных линий PGP1.Fig. 14 is a gel image showing PCR verification of Cas9 genomic insertion in PGP1 cells. Lanes 3, 6, 9, 12 are PCR products from conventional PGP1 cell lines.
Фиг. 15 представляет собой график уровня экспрессии мРНК Cas9 при индукции.Fig. 15 is a graph of the Cas9 mRNA expression level upon induction.
Фиг. 16 представляет собой график, показывающий эффективность направленного воздействия на геном РНК с различным дизайном.Fig. 16 is a graph showing the genome targeting efficiency of RNAs with different designs.
Фиг. 17 представляет собой график, показывающий эффективность направленного воздействия на геном 44% гомологичной рекомбинации, достигнутой с помощью химеры направляющей РНК- донорной ДНК.Fig. 17 is a graph showing the genome targeting efficiency of 44% homologous recombination achieved using a guide RNA-donor DNA chimera.
Фиг. 18 является схемой, демонстрирующей генотип изогенных клеточных линий PGP 1, полученных с помощью системы, описанной в данном документе. PGPl-IPS-BTHH имеет фенотип с однонуклеотидными делециями, как у пациентов с BTHH. PGP 1-NHEJ имеет 4 п.о. делеции, которые образуют мутации со сдвигом рамки считывания другим образом.Fig. 18 is a diagram showing the genotype of isogenic PGP 1 cell lines produced using the system described herein. PGPl-IPS-BTHH has a single-nucleotide deletion phenotype similar to BTHH patients. PGP 1-NHEJ has 4 bp. deletions that produce frameshift mutations in a different way.
Фиг. 19 представляет собой график, показывающий, что кардиомиоциты, полученные из изогенных PGP1 iPS, воспроизводят дефектную выработку АТФ и специфическую активность F1F0 АТФазы, как продемонстрировано в пациент-специфических клетках.Fig. 19 is a graph showing that cardiomyocytes derived from isogenic PGP1 iPS recapitulate defective ATP production and specific F1F0 ATPase activity as demonstrated in patient-specific cells.
Фиг. 20 показывает последовательности для последовательности re-TALEN-основной и основной последовательности re-TALE-TF.Fig. 20 shows the sequences for the re-TALEN-base sequence and the re-TALE-TF base sequence.
Подробное описаниеDetailed description
Аспекты настоящего изобретения относятся к применению TALEN, которая утратила определенные повторяющиеся последовательности, для инженерии нуклеиновых кислот, например, путем расщепления двухцепочечной нуклеиновой кислоты. Применение TALEN для расщепления двухцепочечной нуклеиновой кислоты может привести к негомологичному соединению концов (NHEJ) или к гомологичной рекомбинации (HR). Аспекты настоящего раскрытия также предусматривают применение TALEN, которая утратила повторяющиеся последовательности, для инженерии нуклеиновых кислот, например, путем расщепления двухцепочечной нуклеиновой кислоты в присутствии донорной нуклеиновой кислоты и введения донорной нуклеиновой кислоты в двухцепочечную нуклеиновую кислоту, например, путем негомологичного соединения концов (NHEJ) или гомологичной рекомбинации (HR).Aspects of the present invention relate to the use of TALENs that have lost certain repetitive sequences for nucleic acid engineering, for example, by cleaving a double-stranded nucleic acid. The use of TALENs to cleave double-stranded nucleic acid can result in non-homologous end joining (NHEJ) or homologous recombination (HR). Aspects of the present disclosure also contemplate the use of TALENs that have lost repetitive sequences for engineering nucleic acids, for example, by cleaving a double-stranded nucleic acid in the presence of a donor nucleic acid and introducing the donor nucleic acid into the double-stranded nucleic acid, for example, by non-homologous end joining (NHEJ) or homologous recombination (HR).
Эфеекторные нуклеазы, подобные активаторам транскрипции (TALEN) известны в данной области техники и включают искусственные ферменты рестрикции, полученные слиянием ДНК-связывающего домена TAL-эффектора с ДНК-расщепляющим доменом. Ферменты рестрикции являются ферментами, которые разрезают цепи ДНК в определенной последовательности. Эффекторы, подобные активаторам транскрипции (TALE) могут быть сконструированы для связывания с искомой последовательностью ДНК. См. Boch, Jens (February 2011). "TALEs of genome targeting". Nature Biotechnology 29 (2): 135-6, включенный в данный документ ссылкой в полном объеме. Путем объединения такого сконструированного TALE с ДНК-расщепляющим доменом (который разрезает нити ДНК), получается TALEN, которая является ферментом рестрикции, специфичным к любой искомой последовательности ДНК. В соответствии с некоторыми аспектами, TALEN вводят в клетку для целевого редактирования нуклеиновой кислоты in situ, например, для редактирования генома in situ.Transcription activator-like effector nucleases (TALENs) are known in the art and include artificial restriction enzymes made by fusing the DNA binding domain of a TAL effector to a DNA cleavage domain. Restriction enzymes are enzymes that cut DNA strands in a specific sequence. Transcription activator-like effectors (TALEs) can be engineered to bind to the DNA sequence of interest. See Boch, Jens (February 2011). "TALEs of genome targeting". Nature Biotechnology 29 (2): 135-6, incorporated herein by reference in its entirety. By combining such an engineered TALE with a DNA cleavage domain (which cuts DNA strands), TALEN is obtained, which is a restriction enzyme specific for any DNA sequence of interest. In some aspects, TALENs are introduced into a cell for targeted in situ nucleic acid editing, such as in situ genome editing.
Согласно одному аспекту, неспецифический ДНК-расщепляющий домен с конца эндонуклеазы FokI может быть использован для создания гибридных нуклеаз, которые активны в клетках дрожжей, растений и животных. Домен FokI функционирует в виде димера, требующего две конструкции с уникальными ДНК-связывающими доменами для участков в геноме-мишени с правильной ориентацией и расстоянием. Как число аминокислотных остатков между TALE ДНК-связывающим доменом и расщепляющим доменом Fokl, так и количества оснований между двумя отдельными участками связывания TALEN оказывают влияние на активность.In one aspect, the nonspecific DNA cleavage domain at the end of the FokI endonuclease can be used to create hybrid nucleases that are active in yeast, plant and animal cells. The FokI domain functions as a dimer, requiring two constructs with unique DNA-binding domains for regions in the target genome with the correct orientation and spacing. Both the number of amino acid residues between the TALE DNA binding domain and the Fokl cleavage domain and the number of bases between the two individual TALEN binding sites influence activity.
Взаимоотношение между аминокислотной последовательностью и распознаванием ДНК связывающим доменом TALE позволяет создавать конструируемые белки. Компьютерные программы, такие как «DNA Works» могут быть использованы для разработки TALE-конструкций. Другие способы разработки TALE-конструкций известны специалистам в данной области техники. См. Cermak, Т. ; Doyle, E. L. ; Christian, M. ; Wang, L. ; Zhang, Y. ; Schmidt, C; Bailer, J. A. ; Somia, N. V. et al. (2011). "Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting". Nucleic Acids Research. doi:10. 1093/nar/gkr218; Zhang, Feng; et. al. (February 2011). "Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription", Nature Biotechnology 29 (2): 149-53; Morbitzer, R. ; Elsaesser, J. ; Hausner, J. ; Lahaye, T. (2011). "Assembly of custom TALE-type DNA binding domains by modular cloning". Nucleic Acids Research. doi:10'1093/nar/gkrl51; Li, Т. ; Huang, S. ; Zhao, X. ; Wright, D. A. ; Carpenter, S. ; Spalding, M. H. ; Weeks, D. P. ; Yang, B. (2011). "Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes". Nucleic Acids Research. doi"10. 1093/nar/gkrl88; GeipTer, R. ; Scholze, H. ; Hahn, S. ; Streubel, J. ; Bonas, U. ; Behrens, S. E. ; Boch, J. (2011). "Transcriptional Activators of Human Genes with Programmable DNA-Specificity". In Shiu, Shin-Han. PLoS ONE 6 (5): el9509; Weber, E. ; Graetzner, R. ; Werner, S. ; Engler, C; Marillonnet, S. (2011). "Assembly of Designer TAL Effectors by Golden Gate Cloning". In Bendahmane, Mohammed. PLoS One 6 (5): el9722, которые включены в данный документ ссылкой в полном объеме.The relationship between amino acid sequence and DNA recognition by the TALE binding domain allows the creation of engineered proteins. Computer programs such as DNA Works can be used to develop TALE designs. Other methods for developing TALE structures are known to those skilled in the art. See Cermak, T.; Doyle, E. L.; Christian, M.; Wang, L.; Zhang, Y.; Schmidt, C; Bailer, J. A.; Somia, N. V. et al. (2011). "Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting." Nucleic Acids Research. doi:10. 1093/nar/gkr218; Zhang, Feng; et. al. (February 2011). "Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription", Nature Biotechnology 29 (2): 149-53; Morbitzer, R.; Elsaesser, J.; Hausner, J.; Lahaye, T. (2011). "Assembly of custom TALE-type DNA binding domains by modular cloning". Nucleic Acids Research. doi:10'1093/nar/gkrl51; Li, T.; Huang, S.; Zhao, X.; Wright, D. A.; Carpenter, S.; Spalding, M. H.; Weeks, D. P.; Yang, B. (2011). "Modularly assembled designer TAL effector nucleases for targeted gene knockout and gene replacement in eukaryotes." Nucleic Acids Research. doi"10. 1093/nar/gkrl88; GeipTer, R. ; Scholze, H. ; Hahn, S. ; Streubel, J. ; Bonas, U. ; Behrens, S. E. ; Boch, J. (2011). "Transcriptional Activators of Human Genes with Programmable DNA-Specificity". In Shiu, Shin-Han. PLoS ONE 6 (5): el9509; Weber, E. ; Graetzner, R. ; Werner, S. ; Engler, C; Marillonnet, S. ( 2011). "Assembly of Designer TAL Effectors by Golden Gate Cloning." In Bendahmane, Mohammed. PLoS One 6 (5): el9722, which are incorporated herein by reference in their entirety.
В соответствии с типичным аспектом, сразу после сборки гены TALEN можно вставлять в плазмиды, в соответствии с определенными воплощениями; плазмиды затем используются для трансфекции клетки-мишени, при этом генные продукты экспрессируются и входят в ядро для доступа к геному. Согласно типичным аспектам, TALEN, как описано в данном документе, могут быть использованы для редактирования целевой нуклеиновой кислоты, например, генома, с помощью индукции двухцепочечных разрывов (DSB), на которые клетки реагируют посредством механизмов репарации. Примерные механизмы репарации включают негомологичное соединение концов (NHEJ), который восстанавливает ДНК по обе стороны от двухцепочечного разрыва, где имеется весьма незначительное перекрывание для отжига, или такое перекрывание отсутствует вовсе. Этот репаративный механизм индуцирует ошибки в геноме, через вставку или делецию (indel), или хромосомную перестройку; такие ошибки могут сделать генные продукты, кодируемые в данном месте, нефункциональными. См. Miller, Jeffrey; et. al. (February 2011). "A TALE nuclease architecture for efficient genome editing". Nature Biotechnology 29 (2): 143-8, включенный в данный документ ссылкой в полном объеме. Поскольку эта активность может изменяться в зависимости от используемых вида, типа клеток, гена-мишени, и нуклеазы, активность можно контролировать с помощью анализа гетеродуплексного расщепления, который не обнаруживает никакой разницы между двумя аллелеями, амплифицированными с помощью ПЦР. Продукты расщепления могут быть визуализированы на простом агарозном геле или блочной гелевой системе.In accordance with a typical aspect, once assembled, TALEN genes can be inserted into plasmids, in accordance with certain embodiments; the plasmids are then used to transfect the target cell, whereby the gene products are expressed and enter the nucleus to access the genome. In typical aspects, TALENs, as described herein, can be used to edit a target nucleic acid, such as a genome, by inducing double-strand breaks (DSBs), to which cells respond through repair mechanisms. Exemplary repair mechanisms include non-homologous end joining (NHEJ), which repairs DNA on either side of a double-strand break where there is little or no overlap for annealing. This repair mechanism induces errors in the genome, through insertion or deletion (indel), or chromosomal rearrangement; such errors can render the gene products encoded at a given location nonfunctional. See Miller, Jeffrey; et. al. (February 2011). "A TALE nuclease architecture for efficient genome editing". Nature Biotechnology 29 (2): 143-8, incorporated herein by reference in its entirety. Because this activity can vary depending on the species, cell type, target gene, and nuclease used, activity can be monitored using a heteroduplex digestion assay, which detects no difference between two PCR-amplified alleles. Digestion products can be visualized on a plain agarose gel or a block gel system.
В ином случае, ДНК может быть введена в геном посредством NHEJ в присутствии экзогенных фрагментов двухцепочечной ДНК. Управляемая гомологией репарация также может ввести чужеродную ДНК в DSB, поскольку трансфецированные двухцепочечные последовательности используются в качестве шаблонов для ферментов репарации. В соответствии с некоторыми аспектами, TALEN, описанные в данном документе, могут быть использованы для получения стабильно модифицированных человеческих эмбриональных стволовых клеток и клонов индуцированных плюрипотентных стволовых клеток (iPSCs). В соответствии с некоторыми аспектами, TALEN, описанные в данном документе, могут быть использованы для получения нокаутных видов, таких как C. elegans, нокаутные крысы, нокаутные мыши или нокаутные данио-рерио.Alternatively, DNA may be introduced into the genome via NHEJ in the presence of exogenous double-stranded DNA fragments. Homology-driven repair can also introduce foreign DNA into DSBs because transfected double-stranded sequences are used as templates for repair enzymes. In accordance with certain aspects, the TALENs described herein can be used to produce stably modified human embryonic stem cells and induced pluripotent stem cell clones (iPSCs). In accordance with some aspects, the TALENs described herein can be used to generate knockout species, such as C. elegans, knockout rats, knockout mice, or knockout zebrafish.
Согласно одному аспекту настоящего раскрытия, воплощения нацелены на применение экзогенной ДНК, нуклеазных ферментов, таких как ДНК-связывающие белки и направляющие РНК, для колокализации с ДНК в стволовой клетке и гидролиза или разрезания ДНК с вставкой экзогенной ДНК. Такие ДНК-связывающие белки хорошо известны специалистам в данной области техники, для связывания с ДНК для различных целей. Такие ДНК-связывающие белки могут быть природными. ДНК-связывающие белки, включенные в объем настоящего изобретения, включают те, которые могут направляться РНК, которые называются в данном документе как направляющие РНК. Согласно этому аспекту, направляющая РНК и РНК-направляемый ДНК-связывающий белок образуют комплекс колокализации на ДНК. Такие ДНК-связывающие белки, обладающие нуклеазной активностью, известны специалистам в данной области техники, и включают природные ДНК-связывающие белки, имеющие нуклеазную активность, такие как белки Cas9, присутствующие, например, в системах CRISPR II типа. Такие белки Cas9 и системы CRISPR типа II хорошо описаны в данной области техники. См. Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477 включая всю дополнительную информацию, включенный в данный документ ссылкой в полном объеме.According to one aspect of the present disclosure, embodiments are directed to the use of exogenous DNA, nuclease enzymes such as DNA binding proteins and guide RNAs to colocalize with DNA in a stem cell and hydrolyze or cut the DNA to insert the exogenous DNA. Such DNA-binding proteins are well known to those skilled in the art for binding to DNA for various purposes. Such DNA-binding proteins may be natural. DNA-binding proteins included within the scope of the present invention include those that can be directed by RNA, which are referred to herein as guide RNAs. According to this aspect, the guide RNA and the RNA-guided DNA binding protein form a colocalization complex on DNA. Such DNA-binding proteins having nuclease activity are known to those skilled in the art and include naturally occurring DNA-binding proteins having nuclease activity, such as Cas9 proteins present, for example, in type II CRISPR systems. Such Cas9 proteins and type II CRISPR systems are well described in the art. See Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477 including all additional information, which is incorporated herein by reference in its entirety.
Типичные ДНК-связывающие белки имеют функцию нуклеазной активности для внесения одноцепочечных разрывов (ников) или разрезания двухцепочечной ДНК. Такая нуклеазная активность может быть результатом действия ДНК-связывающего белка, имеющего одну или несколько полипептидных последовательностей, демонстрирующих нуклеазную активность. Такие типичные ДНК-связывающие белки могут иметь два отдельных нуклеазных домена, при этом каждый домен отвечает за разрезание или внесение одноцепочечных разрывов конкретной цепи двухцепочечной ДНК. Типичные полипептидные последовательности, имеющие нуклеазную активность, известные специалистам в данной области, включают домен, родственный нуклеазе McrA-HNH и домен RuvC-подобной нуклеазы. Соответственно, типичными ДНК-связывающими белками являются те, которые по своей природе содержат один или несколько из числа домена, родственного нуклеазе McrA-HNH и домен RuvC-подобной нуклеазы.Typical DNA-binding proteins have nuclease activity to introduce single-strand breaks (nicks) or cut double-stranded DNA. Such nuclease activity may result from the action of a DNA binding protein having one or more polypeptide sequences exhibiting nuclease activity. Such typical DNA-binding proteins may have two separate nuclease domains, with each domain responsible for cutting or introducing single-strand breaks on a particular strand of double-stranded DNA. Exemplary polypeptide sequences having nuclease activity known to those skilled in the art include the McrA-HNH nuclease-related domain and the RuvC-like nuclease domain. Accordingly, typical DNA binding proteins are those that inherently contain one or more of a McrA-HNH nuclease-related domain and a RuvC-like nuclease domain.
Типичный ДНК-связывающий белок представляет собой РНК управляемый ДНК-связывающий белок системы CRISPR II типа. Типичный ДНК-связывающий белок представляет собой белок Cas9.A typical DNA binding protein is an RNA-driven DNA binding protein of the CRISPR type II system. A typical DNA binding protein is the Cas9 protein.
В S. pyogenes, Cas9Сas9 образует двухцепочечной разрыв с тупыми концами на 3 п.о. выше мотива PAM (прилегающий к протоспейсеру мотив) с помощью процесса, опосредованного двумя каталитическими доменами в белке: доменом HNH, который расщепляет комплементарную нить ДНК и доменом подобного RuvC, который расщепляет некомплементарную цепь. См. Jinke et al., Science, 337, 816-821 (2012), включенный в данный документ ссылкой в полном объеме. Белки Cas9, как известно, существуют во многих системах CRISPR типа II, включая те, которые определены в дополнительных документах к Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477: Methanococcus maripaludis C7; Corynebacterium diphtheriae; Corynebacterium efficiens YS-314; Corynebacterium glutamicum ATCC 13032 Kitasato; Corynebacterium glutamicum ATCC 13032 Bielefeld; Corynebacterium glutamicum R; Corynebacterium kroppenstedtii DSM 44385; Mycobacterium abscessus ATCC 19977; Nocardia farcinica IFM10152; Rhodococcus erythropolis PR4; Rhodococcus jostii RHA1; Rhodococcus opacus B4 uid36573; Acidothermus cellulolyticus 11B; Arthrobacter chlorophenolicus A6; Kribbella flavida DSM 17836 uid43465; Thermomonospora curvata DSM 43183; Bifidobacterium dentium Bdl; Bifidobacterium longum DJO10A; Slackia heliotrinireducens DSM 20476; Persephonella marina EX HI; Bacteroides fragilis NCTC 9434; Capnocytophaga ochracea DSM 7271; Flavobacterium psychrophilum JIP02 86; Akkermansia muciniphila ATCC BAA 835; Roseiflexus castenholzii DSM 13941; Roseiflexus RSI; Synechocystis PCC6803; Elusimicrobium minutum Peil91; бактериальный филотип Rs D17 некультивированной группы 1 Termite; Fibrobacter succinogenes S85; Bacillus cereus ATCC 10987; Listeria innocua;Lactobacillus casei; Lactobacillus rhamnosus GG; Lactobacillus salivarius UCC118; Streptococcus agalactiae A909; Streptococcus agalactiae NEM316; Streptococcus agalactiae 2603; Streptococcus dysgalactiae equisimilis GGS 124; Streptococcus equi zooepidemicus MGCS10565; Streptococcus gallolyticus UCN34 uid46061; Streptococcus gordonii Challis subst CHI; Streptococcus mutans NN2025 uid46353; Streptococcus mutans; Streptococcus pyogenes Ml GAS; Streptococcus pyogenes MGAS5005; Streptococcus pyogenes MGAS2096; Streptococcus pyogenes MGAS9429; Streptococcus pyogenes MGAS10270; Streptococcus pyogenes MGAS6180; Streptococcus pyogenes MGAS315; Streptococcus pyogenes SSI-1; Streptococcus pyogenes MGAS 10750; Streptococcus pyogenes NZ131; Streptococcus thermophiles CNRZ1066; Streptococcus thermophiles LMD-9; Streptococcus thermophiles LMG 18311; Clostridium botulinum A3 Loch Maree; Clostridium botulinum В Eklund 17B; Clostridium botulinum Ba4 657; Clostridium botulinum F Langeland; Clostridium cellulolyticum H10; Finegoldia magna ATCC 29328; Eubacterium rectale ATCC 33656; Mycoplasma gallisepticum; Mycoplasma mobile 163K; Mycoplasma penetrans; Mycoplasma synoviae 53; Streptobacillus moniliformis DSM 12112; Bradyrhizobium BTAil; Nitrobacter hamburgensis X14; Rhodopseudomonas palustris BisB18; Rhodopseudomonas palustris BisB5; Parvibaculum lavamentivorans DS-1; Dinoroseobacter shibae DFL 12; Gluconacetobacter diazotrophicus Pal 5 FAPERJ; Gluconacetobacter diazotrophicus Pal 5 JGI; Azospirillum B510 uid46085; Rhodospirillum rabram ATCC 11170; Diaphorobacter TPSY uid29975; Verminephrobacter eiseniae EF01-2; Neisseria meningitides 053442; Neisseria meningitides alphal4; Neisseria meningitides Z2491; Desulfovibrio salexigens DSM 2638; Campylobacter jejuni doylei 269 97; Campylobacter jejuni 81116; Campylobacter jejuni; Campylobacter lari RM2100; Helicobacter hepaticus; Wolinella succinogenes; Tolumonas auensis DSM 9187; Pseudoalteromonas atlantica T6c; Shewanella pealeana ATCC 700345; Legionella pneumophila Paris; Actinobacillus succinogenes 130Z; Pasteurella multocida; Francisella tularensis novicida U112; Francisella tularensis holarctica; Francisella tularensis FSC 198; Francisella tularensis tularensis; Francisella tularensis WY96-3418; и Treponema denticola ATCC 35405. Соответственно, аспекты настоящего раскрытия направлены на белок Cas9, присутствующий в системе CRISPR II типа.In S. pyogenes, Cas9Cas9 forms a 3-bp double-stranded break with blunt ends. upstream of the PAM motif (protospacer adjacent motif) by a process mediated by two catalytic domains in the protein: an HNH domain that cleaves the complementary strand of DNA and a RuvC-like domain that cleaves the non-complementary strand. See Jinke et al., Science, 337, 816-821 (2012), incorporated herein by reference in its entirety. Cas9 proteins are known to exist in many type II CRISPR systems, including those defined in supplementary documents to Makarova et al., Nature Reviews, Microbiology, Vol. 9, June 2011, pp. 467-477: Methanococcus maripaludis C7; Corynebacterium diphtheriae; Corynebacterium efficiens YS-314; Corynebacterium glutamicum ATCC 13032 Kitasato; Corynebacterium glutamicum ATCC 13032 Bielefeld; Corynebacterium glutamicum R; Corynebacterium kroppenstedtii DSM 44385; Mycobacterium abscessus ATCC 19977; Nocardia farcinica IFM10152; Rhodococcus erythropolis PR4; Rhodococcus jostii RHA1; Rhodococcus opacus B4 uid36573; Acidothermus cellulolyticus 11B; Arthrobacter chlorophenolicus A6; Kribbella flavida DSM 17836 uid43465; Thermomonospora curvata DSM 43183; Bifidobacterium dentium Bdl; Bifidobacterium longum DJO10A; Slackia heliotrinireducens DSM 20476; Persephonella marina EX HI; Bacteroides fragilis NCTC 9434; Capnocytophaga ochracea DSM 7271; Flavobacterium psychrophilum JIP02 86; Akkermansia muciniphila ATCC BAA 835; Roseiflexus castenholzii DSM 13941; Roseiflexus RSI; Synechocystis PCC6803; Elusimicrobium minutum Peil91; bacterial phylotype Rs D17 uncultivated group 1 Termite; Fibrobacter succinogenes S85; Bacillus cereus ATCC 10987; Listeria innocua; Lactobacillus casei; Lactobacillus rhamnosus GG; Lactobacillus salivarius UCC118; Streptococcus agalactiae A909; Streptococcus agalactiae NEM316; Streptococcus agalactiae 2603; Streptococcus dysgalactiae equisimilis GGS 124; Streptococcus equi zooepidemicus MGCS10565; Streptococcus gallolyticus UCN34 uid46061; Streptococcus gordonii Challis subst CHI; Streptococcus mutans NN2025 uid46353; Streptococcus mutans; Streptococcus pyogenes Ml GAS; Streptococcus pyogenes MGAS5005; Streptococcus pyogenes MGAS2096; Streptococcus pyogenes MGAS9429; Streptococcus pyogenes MGAS10270; Streptococcus pyogenes MGAS6180; Streptococcus pyogenes MGAS315; Streptococcus pyogenes SSI-1; Streptococcus pyogenes MGAS 10750; Streptococcus pyogenes NZ131; Streptococcus thermophiles CNRZ1066; Streptococcus thermophiles LMD-9; Streptococcus thermophiles LMG 18311; Clostridium botulinum A3 Loch Maree; Clostridium botulinum B Eklund 17B; Clostridium botulinum Ba4 657; Clostridium botulinum F Langeland; Clostridium cellulolyticum H10; Finegoldia magna ATCC 29328; Eubacterium rectale ATCC 33656; Mycoplasma gallisepticum; Mycoplasma mobile 163K; Mycoplasma penetrans; Mycoplasma synoviae 53; Streptobacillus moniliformis DSM 12112; Bradyrhizobium BTAil; Nitrobacter hamburgensis X14; Rhodopseudomonas palustris BisB18; Rhodopseudomonas palustris BisB5; Parvibaculum lavamentivorans DS-1; Dinoroseobacter shibae DFL 12; Gluconacetobacter diazotrophicus Pal 5 FAPERJ; Gluconacetobacter diazotrophicus Pal 5 JGI; Azospirillum B510 uid46085; Rhodospirillum rabram ATCC 11170; Diaphorobacter TPSY uid29975; Verminephrobacter eiseniae EF01-2; Neisseria meningitides 053442; Neisseria meningitides alphal4; Neisseria meningitides Z2491; Desulfovibrio salexigens DSM 2638; Campylobacter jejuni doylei 269 97; Campylobacter jejuni 81116; Campylobacter jejuni; Campylobacter lari RM2100; Helicobacter hepaticus; Wolinella succinogenes; Tolumonas auensis DSM 9187; Pseudoalteromonas atlantica T6c; Shewanella pealeana ATCC 700345; Legionella pneumophila Paris; Actinobacillus succinogenes 130Z; Pasteurella multocida; Francisella tularensis novicida U112; Francisella tularensis holarctica; Francisella tularensis FSC 198; Francisella tularensis tularensis; Francisella tularensis WY96-3418; and Treponema denticola ATCC 35405. Accordingly, aspects of the present disclosure are directed to the Cas9 protein present in the type II CRISPR system.
Белок Cas9 может быть назван специалистом в данной области литературы как Csn1. Белок Cas9 из S. pyogenes показан ниже. См. Deltcheva et al., Nature 471, 602-607 (2011), включенный в данный документ ссылкой в полном объеме.The Cas9 protein may be referred to by one skilled in the art as Csn1. The Cas9 protein from S. pyogenes is shown below. See Deltcheva et al., Nature 471, 602-607 (2011), incorporated herein by reference in its entirety.
Согласно одному аспекту, управляемый РНК ДНК-связывающий белок включает гомологи и ортологи Cas9, которые сохраняют способность белка связываться с ДНК, быть управляемыми РНК и разрезать ДНК. Согласно одному аспекту, белок Cas9 включает последовательность, которая представлена в естественном белке Cas9 из S. pyogenes и белковых последовательностях, гомологичных, по меньшей мере, на 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95 %, 98% или 99% к этому белку, и, являющихся ДНК-связывающим белком, таким как направляемый РНК ДНК-связывающий белок.In one aspect, the RNA-guided DNA-binding protein includes Cas9 homologs and orthologs that retain the protein's ability to bind to DNA, be guided by RNA, and cut DNA. In one aspect, the Cas9 protein includes a sequence that is present in the natural Cas9 protein from S. pyogenes and protein sequences that are at least 30%, 40%, 50%, 60%, 70%, 80%, 90% homologous. , 95%, 98% or 99% to this protein, and being a DNA-binding protein such as an RNA-guided DNA-binding protein.
Согласно одному аспекту предлагается сконструированная система Cas9-гидРНК, которая позволяет осуществить направляемое РНК разрезание генома сайт-специфическим образом в стволовой клетке, при необходимости, и модификацию генома стволовой клетки путем вставки экзогенных донорных нуклеиновых кислот. Направляющие РНК являются комплементарными к участкам-мишеням или локусам-мишеням на ДНК. Направляющие РНК могут быть химерами crRNA-tracrRNA. Направляющие РНК могут быть введены из среды, окружающей клетки. Таким образом, предлагается способ непрерывной модификации клетки, которая осуществляется при внесении направляющих РНК в окружающую среду и при поглощении данных направляющих РНК и при обогащении среды дополнительными направляющими РНК. Обогащение может идти непрерывно. Cas9 связывается с или около ДНК-мишени в геноме. Одна или несколько направляющих РНК связываются с или около ДНК-мишени в геноме. Cas9 разрезает ДНК-мишень в геноме и экзогенная донорская ДНК встраивается в ДНК в месте разреза.In one aspect, an engineered Cas9-hydrRNA system is provided that allows for RNA-guided genome cutting in a site-specific manner in a stem cell, if desired, and modification of the stem cell genome by insertion of exogenous donor nucleic acids. Guide RNAs are complementary to target regions or target loci on DNA. Guide RNAs can be crRNA-tracrRNA chimeras. Guide RNAs can be introduced from the environment surrounding the cells. Thus, a method is proposed for continuous modification of the cell, which is carried out by introducing guide RNAs into the environment and by absorbing these guide RNAs and by enriching the environment with additional guide RNAs. Enrichment can go on continuously. Cas9 binds to or near target DNA in the genome. One or more guide RNAs bind to or near target DNA in the genome. Cas9 cuts the target DNA in the genome and exogenous donor DNA is incorporated into the DNA at the site of the cut.
Соответственно, способы направлены на применение направляющей РНК с белком Cas9 и экзогенной донорной нуклеиновой кислотой для мультиплексных вставок экзогенных донорных нуклеиновых кислот в ДНК стволовой клетки, экспрессирующей Cas9, посредством циклической вставки нуклеиновой кислоты, кодирующей РНК (или путем предоставления РНК из окружающей среды) и экзогенной донорной нуклеиновой кислоты, экспрессирующей РНК (или путем поглощения РНК), колокализации РНК, Cas9 и ДНК таким образом, чтобы происходило разрезание ДНК, и вставки экзогенной донорной нуклеиновой кислоты. Стадии способа могут быть циклически повторены любое необходимое количество раз для получения необходимого количества модификаций ДНК. Способы настоящего описания соответственно направлены на редактирование генов-мишеней с помощью белков Cas9 и направляющих РНК, описанных в данном документе, с целью осуществления мультиплексной генетической и эпигенетической инженерии стволовых клеток.Accordingly, the methods are directed to the use of a guide RNA with a Cas9 protein and an exogenous donor nucleic acid for multiplex insertions of exogenous donor nucleic acids into the DNA of a Cas9-expressing stem cell by cyclic insertion of the nucleic acid encoding the RNA (or by providing RNA from the environment) and exogenous donor nucleic acid expressing RNA (or by uptake of RNA), colocalization of RNA, Cas9 and DNA so that DNA is cut, and insertion of exogenous donor nucleic acid. The stages of the method can be cyclically repeated any necessary number of times to obtain the required number of DNA modifications. The methods herein are accordingly directed to editing target genes using the Cas9 proteins and guide RNAs described herein to achieve multiplex genetic and epigenetic engineering of stem cells.
Дальнейшие аспекты настоящего описания направлены на применение ДНК-связывающих белков или систем (например, модифицированных TALENs или Cas9, описанных в данном документе) в целом для мультиплексной вставки экзогенных донорных нуклеиновых кислот в ДНК, такую как геномная ДНК стволовой клетки, например, человеческой стволовой клетки. Специалист в данной области техники легко определит типичные ДНК-связывающие системы на основании настоящего описания.Further aspects of the present disclosure are directed to the use of DNA binding proteins or systems (e.g., modified TALENs or Cas9 described herein) generally for the multiplex insertion of exogenous donor nucleic acids into DNA, such as the genomic DNA of a stem cell, e.g., a human stem cell . One skilled in the art will readily identify typical DNA binding systems based on the present disclosure.
Клетки в соответствии с настоящим описанием, если не указано иное, включают любую клетку, в которую могут быть введены и в которой могут быть экспрессированы чужеродные нуклеиновые кислоты, как описано в данном документе. Следует понимать, что основные принципы настоящего раскрытия, описанные в данном документе, не ограничиваются типом клеток. Клетки, согласно настоящему изобретению, включают соматические клетки, стволовые клетки, эукариотические клетки, прокариотические клетки, клетки животных, растительные клетки, клетки грибов, клетки, клетки архей, клетки эубактерий и т. п. Клетки включают эукариотические клетки, такие как дрожжевые клетки, растительные клетки и клетки животных. Конкретные клетки включают клетки млекопитающих, такие как клетки человека. Кроме того, клетки включают любую клетку, в которой было бы выгодно или желательно модифицировать ДНК.Cells as used herein, unless otherwise specified, include any cell into which foreign nucleic acids as described herein can be introduced and expressed. It should be understood that the basic principles of the present disclosure described herein are not limited to cell type. The cells of the present invention include somatic cells, stem cells, eukaryotic cells, prokaryotic cells, animal cells, plant cells, fungal cells, cells, archaeal cells, eubacterial cells, etc. Cells include eukaryotic cells such as yeast cells, plant cells and animal cells. Specific cells include mammalian cells, such as human cells. Cells also include any cell in which it would be advantageous or desirable to modify the DNA.
Нуклеиновой кислоты включают любую последовательность нуклеиновой кислоты, в случае которой TALEN или направляемый РНК ДНК-связывающий белок, обладающий нуклеазной активностью, как описано в данном документе, могут быть полезны для внесения одноцепочечных разрывов или разрезания. Нуклеиновые кислоты-мишени включают любую последовательность нуклеиновой кислоты, в случае которой комплекс колокализации, как описано в данном документе, может быть полезен для внесения одноцепочечных разрывов или разрезания. Нуклеиновые кислоты-мишени включают гены. Для целей настоящего описания, ДНК, такая как двухцепочечная ДНК, может включать нуклеиновую кислоту-мишень, а комплекс колокализации может связываться или иным образом колокализоваться с ДНК или TALEN может в ином случае связываться с ДНК в или в непосредственной близости или вблизи нуклеиновой кислоты-мишени таким образом, чтобы комплекс колокализации или TALEN оказывали искомый эффект на нуклеиновую кислоту-мишень. Такие нуклеиновые кислоты-мишени могут включать эндогенную (или естественную) нуклеиновую кислоту и экзогенную (или чужеродную) нуклеиновую кислоту. Специалист на основе настоящего описания легко идентифицирует или разработает направляющие РНК и белки Cas9, которые колокализуются с ДНК или TALEN, которые связываются с ДНК, включающей нуклеиновую кислоту-мишень. Специалист также будет способен идентифицировать транскрипционные регуляторные белки или домены, такие как транскрипционные активаторы или транскрипционные репрессоры, которые аналогичным образом колокализуются с ДНК, включающей нуклеиновую кислоту-мишень. ДНК включает геномную ДНК, митохондриальную ДНК, вирусную ДНК или экзогенную ДНК. Согласно одному аспекту, материалы и способы, используемые при практическом осуществлении настоящего изобретения, включают те, которые описаны в Di Carlo, et al., Nucleic Acids Research, 2013, vol. 41, No. 7 4336-4343, включенном в данный документ ссылкой в полном объеме и для всех целей, включая типичные штаммы и среды, плазмидные конструкции, трансформацию плазмид, электропорацию транзиторной гидРНК-кассеты и донорных нуклеиновых кислот, трансформацию гидРНК-плазмиды с донорной ДНК в Cas9-экспрессирующие клетки, индукцию Cas9 галактозой, определение мишеней CRISPR-Cas в геноме дрожжей, и т. д. Дополнительные источники, включая информацию, материалы и методы, полезные для специалиста в данной области при осуществлении изобретения, приведены в Mali,P., Yang,L., Esvelt,K. M., Aach,J., Guell,M., DiCarlo,J. E., Norville,J. E. and Church,G. M. (2013) RNA-Guided human genome engineering via Cas9. Science, 10. 1126fscience. 1232033; Storici,F., Durham,C. L., Gordenin,D. A. and Resnick,M. A. (2003) Chromosomal site-specific double-strand breaks are efficiently targeted for repair by oligonucleotides in yeast. PNAS, 100, 14994-14999 and Jinek,M., Chylinski,K., Fonfara,l., Hauer,M., Doudna,J. A. and Charpentier,E. (2012) A programmable dual-RNA-Guided DNA endonuclease in adaptive bacterial immunity. Science, 337, 816-821, каждый из которых включен в данное описание ссылкой в полном объеме и для всех целей.Nucleic acids include any nucleic acid sequence for which a TALEN or an RNA-guided DNA binding protein having nuclease activity as described herein would be useful to introduce single-strand breaks or cuts. Target nucleic acids include any nucleic acid sequence for which a colocalization complex, as described herein, may be useful to introduce single-strand breaks or cuts. Target nucleic acids include genes. For purposes of the present disclosure, DNA, such as double-stranded DNA, may comprise a target nucleic acid, and a colocalization complex may bind or otherwise colocalize with the DNA, or the TALEN may otherwise bind to DNA at or in the vicinity or vicinity of the target nucleic acid such that the colocalization complex or TALEN has the desired effect on the target nucleic acid. Such target nucleic acids may include endogenous (or natural) nucleic acid and exogenous (or foreign) nucleic acid. One skilled in the art will readily identify or design guide RNAs and Cas9 proteins that colocalize with DNA or TALENs that bind to DNA comprising the target nucleic acid based on the present disclosure. One of ordinary skill in the art will also be able to identify transcriptional regulatory proteins or domains, such as transcriptional activators or transcriptional repressors, that similarly colocalize with DNA comprising the target nucleic acid. The DNA includes genomic DNA, mitochondrial DNA, viral DNA or exogenous DNA. In one aspect, materials and methods used in the practice of the present invention include those described in Di Carlo, et al., Nucleic Acids Research, 2013, vol. 41, No. 7 4336-4343, incorporated herein by reference in its entirety and for all purposes, including representative strains and media, plasmid constructs, plasmid transformation, electroporation of the transient guideRNA cassette and donor nucleic acids, transformation of guideRNA plasmid with donor DNA into Cas9- expressing cells, induction of Cas9 by galactose, identification of CRISPR-Cas targets in the yeast genome, etc. Additional references, including information, materials and methods useful to one skilled in the art in practicing the invention, are provided in Mali, P., Yang, L., Esvelt, K. M., Aach, J., Guell, M., DiCarlo, J. E., Norville,J. E. and Church, G. M. (2013) RNA-Guided human genome engineering via Cas9. Science, 10. 1126fscience. 1232033; Storici,F., Durham,C. L., Gordenin, D. A. and Resnick, M. A. (2003) Chromosomal site-specific double-strand breaks are efficiently targeted for repair by oligonucleotides in yeast. PNAS, 100, 14994-14999 and Jinek, M., Chylinski, K., Fonfara, l., Hauer, M., Doudna, J. A. and Charpentier, E. (2012) A programmable dual-RNA-Guided DNA endonuclease in adaptive bacterial immunity. Science, 337, 816-821, each of which is incorporated herein by reference in its entirety and for all purposes.
Чужеродные нуклеиновые кислоты (т. е. те, которые не являются частью природной композиции нуклеиновых кислот клетки) могут быть введены в клетку с помощью любого способа, известного специалистам в данной области техники для такого введения. Такие способы включают трансфекцию, трансдукцию, вирусную трансдукцию, микроинъекции, липофекцию, нуклеофекцию, бомбардировку наночастицами, трансформацию, конъюгацию и т. п. Специалисту в данной области техники легко понять и адаптировать такие способы, с помощью легко идентифицируемых литературных источников.Foreign nucleic acids (ie, those that are not part of the natural nucleic acid composition of the cell) can be introduced into the cell using any method known to those skilled in the art for such introduction. Such methods include transfection, transduction, viral transduction, microinjection, lipofection, nucleofection, nanoparticle bombardment, transformation, conjugation, etc. Such methods are easily understood and adapted by one skilled in the art with the help of easily identifiable literature sources.
Донорные нуклеиновые кислоты включают любую нуклеиновую кислоту, которая будет вставлена в последовательность нуклеиновой кислоты, как описано в данном документе.Donor nucleic acids include any nucleic acid that will be inserted into a nucleic acid sequence as described herein.
Следующие примеры приведены в качестве типичных образцов настоящего описания. Эти примеры не должны быть истолкованы как ограничивающие объем настоящего описания, поскольку они и другие эквивалентные воплощения будут очевидны в свете настоящего описания, чертежей и сопровождающей формулы изобретения.The following examples are provided as representative examples of the present disclosure. These examples should not be construed as limiting the scope of the present specification, as they and other equivalent embodiments will be apparent in light of the present specification, the drawings, and the accompanying claims.
Пример IExample I
Сборка направляющей РНКGuide RNA Assembly
19 п.о. выбранной последовательности-мишени (т. е. 5'-N19 5'-N19-NGG-3 ') были включены в два комплементарных олигонуклеотида 100-мера 19 p.o. selected target sequence (i.e. 5'-N19 5'-N19-NGG-3') were included in two complementary 100-mer oligonucleotides
Каждый олигонуклеотид 100-мер суспендировали в концентрации 100 мМ в воде, смешивали с равным объемом и гибридизовали в термоциклере (95°С, 5 мин; линейное уменьшение до 4°С, 0,1°С/сек). Для приготовления вектор назначения, клонирующий вектор с гидРНК (Addgene plasmid ID 41824) линеаризовали с помощью AflII и очищали вектор. Реакцию сборки (10 мкл) гидРНК проводили с 10 нг соединившегося 100 п.о. фрагмента, 100 нг каркаса назначения, IX реакционной смеси для сборки Gibson (New England Biolabs) при 50°С в течение 30 мин. Продукт реакция может быть сразу же трансформирован в бактерии для получения колоний отдельных сборок.Each 100-mer oligonucleotide was suspended at 100 mM in water, mixed in an equal volume, and hybridized in a thermal cycler (95°C, 5 min; ramp down to 4°C, 0.1°C/sec). To prepare the destination vector, a guideRNA cloning vector (Addgene plasmid ID 41824) was linearized with AflII and the vector was purified. The assembly reaction (10 μl) of guideRNA was carried out with 10 ng of the combined 100 bp. fragment, 100 ng of target scaffold, Gibson assembly reaction mixture IX (New England Biolabs) at 50°C for 30 min. The product of the reaction can be immediately transformed into bacteria to produce colonies of individual assemblies.
Пример IIExample II
Дизайн и Сборка перекодированных TALEDesign and Assembly of recoded TALE
re-TALEs были оптимизированы на разных уровнях для облечения сборки, а также для улучшения экспрессии. ДНК-последовательности вначале вместе оптимизировали для приближения к частоте использования кодонов у человека, и низкой энергии сворачивания мРНК на 5'-конце (GeneGA, Bioconductor). Полученную последовательность подвергали эволюции в течение нескольких циклов для устранения повторов (прямых или инвертированных) длиннее, чем 11 п.о. (см. Фиг. 12). В каждом цикле оценивали синонимичные последовательности для каждого повтора. Отбирали те, у которых было наибольшее расстояние Хэмминга к эволюционирующей ДНК. Последовательность одного из re-TALE, обладающего 16,5 мономерами представлена нижеre-TALEs have been optimized at different levels to facilitate assembly as well as improve expression. The DNA sequences were first optimized together to approximate the human codon usage frequency and the low folding energy of the mRNA at the 5′ end (GeneGA, Bioconductor). The resulting sequence was subjected to evolution over several cycles to eliminate repeats (direct or inverted) longer than 11 bp. (see Fig. 12). In each cycle, synonymous sequences for each repeat were evaluated. Those with the greatest Hamming distance to the evolving DNA were selected. The sequence of one of the re-TALEs, which has 16.5 monomers, is presented below
CTAACCCCTGAACAGGTAGTCGCTATAGCTTCAAATATCGGGGGCAAGCAAGCACTTGAGACCGTTCAACGACTCCTGCCAGTGCTCTGCCAAGCCCATGGATTGACTCCGGAGCAAGTCGTCGCGATCGCGAGCAACGGCGGGGGGAAGCAGGCGCTGGAAACTGTTCAGAGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTCACCCCCGAACAGGTTGTCGCAATAGCAAGTAATATAGGCGGTAAGCAAGCCCTAGAGACTGTGCAACGCCTGCTCCCCGTGCTGTGTCAGGCTCACGGTCTGACACCTGAACAAGTTGTCGCGATAGCCAGTCACGACGGGGGAAAACAAGCTCTAGAAACGGTTCAAAGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTAACACCCGAACAAGTAGTAGCGATAGCGTCAAATAACGGGGGTAAACAGGCTTTGGAGACGGTACAGCGGTTATTGCCGGTCCTCTGCCAGGCCCACGGACTTACGCCAGAACAGGTGGTTGCAATTGCCTCCAACATCGGCGGGAAACAAGCGTTGGAAACTGTGCAGAGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCTGAGCAGGTTGTGGCCATCGCTAGCCACGACGGAGGGAAGCAGGCTCTTGAAACCGTACAGCGACTTCTCCCAGTTTTGTGCCAAGCTCACGGGCTAACCCCCGAGCAAGTAGTTGCCATAGCAAGCAACGGAGGAGGAAAACAGGCATTAGAAACAGTTCAGCGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTAACTCCGGAACAGGTCGTAGCCATTGCTTCCCATGATGGCGGCAAACAGGCGCTAGAGACAGTCCAGAGGCTCTTGCCTGTGTTATGCCAGGCACATGGCCTCACCCCGGAGCAGGTCGTTGCCATCGCCAGTAATATCGGCGGAAAGCAAGCTCTCGAAACAGTACAACGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTGACGCCCGAGCAGGTAGTGGCAATCGCATCTCACGATGGAGGTAAACAAGCACTCGAGACTGTCCAAAGATTGTTACCCGTACTATGCCAAGCGCATGGTTTAACCCCAGAGCAAGTTGTGGCTATTGCATCTAACGGCGGTGGCAAACAAGCCTTGGAGACAGTGCAACGATTACTGCCTGTCTTATGTCAGGCCCATGGCCTTACTCCTGAGCAAGTCGTAGCTATCGCCAGCAACATAGGTGGGAAACAGGCCCTGGAAACCGTACAACGTCTCCTCCCAGTACTTTGTCAAGCACACGGGTTGACACCGGAACAAGTGGTGGCGATTGCGTCCAACGGCGGAGGCAAGCAGGCACTGGAGACCGTCCAACGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTCACGCCAGAGCAGGTGGTAGCAATAGCGTCGAACATCGGTGGTAAGCAAGCGCTTGAAACGGTCCAGCGTCTTCTGCCGGTGTTGTGCCAGGCGCACGGACTCACACCAGAACAAGTGGTTGCTATTGCTAGTAACAACGGTGGAAAGCAGGCCCTCGAGACGGTGCAGAGGTTACTTCCCGTCCTCTGTCAAGCGCACGGCCTCACTCCAGAGCAAGTGGTTGCGATCGCTTCAAACAATGGTGGAAGACCTGCCCTGGAACTAACCCCTGAACAGGTAGTCGCTATAGCTTCAAATATCGGGGGCAAGCAAGCACTTGAGACCGTTCAACGACTCCTGCCAGTGCTCTGCCAAGCCCATGGATTGACTCCGGAGCAAGTCGTCGCGATCGCGAGCAACGGCGGGGGGAAGCAGGCGCTGGAAACTGTTCAGAGACTGCTGCCTGTACTTTGTCAGGCGCATGGTCTCACCCCCGAACAGGTTGTCGCAATAGCAAGTAATATA GGCGGTAAGCAAGCCCTAGAGACTGTGCAACGCCTGCTCCCCGTGCTGTGTCAGGCTCACGGTCTGACACCTGAACAAGTTGTCGCGATAGCCAGTCACGACGGGGAAAACAAGCTCTAGAAACGGTTCAAAGGTTGTTGCCCGTTCTGTGCCAAGCACATGGGTTAACACCCGAACAAGTAGTAGCGATAGCGTCAAATAACGGGGGTAAACAGGCTTTGGAGACGGTACAGCGGTT ATTGCCGGTCCTCTGCCAGGCCCACGGACTTACGCCAGAACAGGTGGTTGCAATTGCCTCCAACATCGGCGGGAAACAAGCGTTGGAAACTGTGCAGAGACTCCTTCCTGTTTTGTGTCAAGCCCACGGCTTGACGCCTGAGCAGGTTGTGGCCATCGCTAGCCACGACGGAGGGAAGCAGGCTCTTGAAACCGTACAGCGACTTCTCCCAGTTTTGTGCCAAGCTCACGGGCTAACCCCCGAGCA AGTAGTTGCCATAGCAAGCAACGGAGGAGGAAAACAGGCATTAGAAACAGTTCAGCGCTTGCTCCCGGTACTCTGTCAGGCACACGGTCTAACTCCGGAACAGGTCGTAGCCATTGCTTCCCATGATGGCGGCAAACAGGCGCTAGAGACAGTCCAGAGGCTCTTGCCTGTGTTATGCCAGGCACATGGCCTCACCCCGGAGCAGGTCGTTGCCATCGCCAGTAATATCGGCGGAAAGCAAGCTCTCG CAGTACAACGGCTGTTGCCAGTCCTATGTCAAGCTCATGGACTGACGCCCGAGCAGGTAGTGGCAATCGCATCTCACGATGGAGGTAAACAAGCACTCGAGACTGTCCAAAGATTGTTACCCGTACTATGCCAAGCGCATGGTTTAACCCCAGAGCAAGTTGTGGCTATTGCATCTAACGGCGGTGGCAAACAAGCCTTGGAGACAGTGCAACGATTACTGCCTGTCTTATGTCAGGCCCAT GGCCTTACTCCTGAGCAAGTCGTAGCTATCGCCAGCAACATAGGTGGGAAACAGGCCCTGGAAACCGTACAACGTCTCCTCCCAGTACTTTGTCAAGCACACGGGTTGACACCGGAACAAGTGGTGGCGATTGCGTCCAACGGCGGAGGCAAGCAGGCACTGGAGACCGTCCAACGGCTTCTTCCGGTTCTTTGCCAGGCTCATGGGCTCACGCCAGAGCAGGTGGTAGCAATAGCGTCGAA CATCGGTGGTAAGCAAGCGCTTGAAACGGTCCAGCGTCTTCTGCCGGTGTTGTGCCAGGCGCACGGACTCACACCAGAACAAGTGGTTGCTATTGCTAGTAACAACGGTGGAAAGCAGGCCCTCGAGACGGTGCAGAGGTTACTTCCCGTCCTCTGTCAAGCGCACGGCCTCACTCCAGAGCAAGTGGTTGCGATCGCTTCAAACAATGGTGGAAGACCTGCCCTGGAA
В соответствии с некоторыми аспектами, могут быть использованы TALEs, имеющие, по меньшей мере, 80% идентичность последовательности, по меньшей мере, 85% идентичность последовательности, по меньшей мере, 90% идентичность последовательности, по меньшей мере, 95% идентичность последовательности, по меньшей мере, 98% идентичность последовательности, или, по меньшей мере, 99% идентичность последовательности с приведенной выше последовательностью. Специалист легко поймет, где указанная последовательность может варьировать при сохранении ДНК-связывающей активности TALE.In accordance with some aspects, TALEs having at least 80% sequence identity, at least 85% sequence identity, at least 90% sequence identity, at least 95% sequence identity, may be used. at least 98% sequence identity, or at least 99% sequence identity with the above sequence. One skilled in the art will readily understand where said sequence may vary while maintaining the DNA binding activity of TALE.
Димерные блоки re-TALE кодирующие два RVDs (см. Фиг. 6A) получали с помощью двух раундов ПЦР в стандартных условиях Кара HIFI (KPAP), при которых первый раунд ПЦР вводил RVD-кодирующую последовательность, а второй раунд ПЦР приводил к образованию целых димерных блоков с 36 п.о. перекрытием с соседними блоками. ПЦР-продукты очищали с помощью QIAquick 96 PCR Purification Kit (QIAGEN), а концентрации измеряли с помощью Nano-drop. Последовательности праймеров и матриц перечислены в таблице 1 и таблице 2 ниже.The re-TALE dimeric blocks encoding the two RVDs (see Fig. 6A) were generated using two rounds of PCR under standard Kara HIFI (KPAP) conditions, in which the first round of PCR introduced the RVD-coding sequence and the second round of PCR resulted in the formation of intact dimers blocks with 36 bp overlap with neighboring blocks. PCR products were purified using a QIAquick 96 PCR Purification Kit (QIAGEN) and concentrations were measured using a Nano-drop. The primer and template sequences are listed in Table 1 and Table 2 below.
Таблица 1. последовательности блоков re-TALETable 1. re-TALE block sequences
Block 5
Таблица 2. Последовательности праймеров блоков re-TALETable 2. Primer sequences of re-TALE blocks
Re-TALENs и векторы назначения re-TALE-TF были сконструированы путем модификации TALE-TF и клонирующего каркаса TALEN (см. источник 24, включенный в данный документ ссылкой в полном объеме). 0,5 RVD-области на векторах были повторно закодированы, а в назначенный участок для клонирования re-TALE был включен сайт разрезания SapI. Последовательности re-TALENs и каркасы re-TALE-TF представлены на Фиг. 20. Плазмиды могут быть предварительно обработаны с помощью SapI (New England Biolabs) в рекомендованных производителем условиях, и очищены с помощью набора для очистки ПЦР QIAquick (QIAGEN).Re-TALENs and re-TALE-TF destination vectors were constructed by modifying TALE-TF and the TALEN cloning framework (see reference 24, incorporated herein by reference in its entirety). The 0.5 RVD regions on the vectors were re-encoded and a SapI cutting site was included in the designated re-TALE cloning site. The sequences of re-TALENs and re-TALE-TF scaffolds are presented in Fig. 20. Plasmids can be predigested with SapI (New England Biolabs) under the manufacturer's recommended conditions, and purified using the QIAquick PCR purification kit (QIAGEN).
Однореакторную (10 мкл) реакцию сборки TASA проводили с 200 нг каждого блока, 500 нг каркаса назначения, IX ферментной смеси TASA (2 Ед. SapI, 100 Ед. амплигазы (Epicentre), 2,5 Ед. ДНК-полимеразы (New England Biolabs)) и IX буфер для изотермической реакции сборки, как описано ранее (см. источник 25, включенный в данный документ ссылкой в полном объеме) (5% PEG-8000, 100 мМ Трис-HCl, рН 7,5, 10 мМ MgC12, 10 мМ DTT, 0,2 мМ каждого из четырех dNTP и 1 мМ NAD). Инкубирование проводили при 37°С в течение 5 мин и 50°С в течение 30 мин. Реакция может быть подвергнута непосредственно бактериальной трансформации для получения колоний отдельных сборок. При таком подходе эффективность получения полноразмерного конструкции составила -20% . В ином случае эффективность > 90% может быть достигнута трехступенчатой сборкой. Во-первых, 10 мкл реакции сборки re-TALE осуществляли с 200 нг каждого блока, 1X ферментной смеси re-TALE, (100 Ед. амплигазы, 12,5 мЕд. T5-экзонуклеазы, 2,5 Ед. ДНК-полимеразы Phusion) и IX изотермического буфера для сборки при 50°С в течение 30 мин, а затем проводили стандартизированные реакции ПЦР Кара HIFI, электрофореза в агарозном геле и экстракции из геля QIAquick Gel extraction (Qiagen) для обогащения полноразмерных re-TALEs. 200 нг ампликонов re-TALE затем могут быть смешаны с 500 нг каркаса назначения, предварительно обработанного SapI, 1X изотермического реакционного буфера для сборки re-TALE и инкубировали при 50°С в течение 30 мин. Конечная реакция сборки re-TALE может быть подвергнута непосредственно бактериальной трансформации для получения колоний отдельных сборок. Специалист в данной области техники легко сможет выбрать эндонуклеазы, экзонуклеазы, полимеразы и лигазы из числа тех, которые известны для практического осуществления способов, описанных в данном документе. Например, можно использовать эндонуклеазы типа IIs, такие как: Fok 1, Bts I, Ear I, Sap I. Могут быть использованы титруемые экзонуклеазы, такие как лямбда-экзонуклеаза, Т5-экзонуклеаза и экзонуклеаза III. Могут быть использованы полимеразы, применяемые без горячего старта, такие как, ДНК-полимераза Phusion, ДНК-полимераза Taq и ДНК-полимераза VentR. В данной реакции могут быть использованы термостойкие лигазы, такие как амплигаза, ДНК-лигаза pfu, ДНК-лигаза Taq. Кроме того, в зависимости от конкретного вида используемых ферментов для активации таких эндонуклеаз, экзонуклеаз, полимераз и лигаз могут быть использованы различные условия реакции.A one-pot (10 μl) TASA assembly reaction was performed with 200 ng of each block, 500 ng of target scaffold, TASA enzyme mix IX (2 U SapI, 100 U Ampligase (Epicentre), 2.5 U DNA Polymerase (New England Biolabs )) and isothermal assembly reaction buffer IX as previously described (see reference 25, incorporated herein by reference in its entirety) (5% PEG-8000, 100 mM Tris-HCl, pH 7.5, 10 mM MgC12, 10 mM DTT, 0.2 mM each of the four dNTPs, and 1 mM NAD). Incubation was carried out at 37°C for 5 min and 50°C for 30 min. The reaction can be directly bacterially transformed to produce colonies of individual assemblies. With this approach, the efficiency of obtaining a full-size structure was -20%. Otherwise, >90% efficiency can be achieved with a three-stage assembly. First, a 10 µl re-TALE assembly reaction was carried out with 200 ng of each block, 1X re-TALE enzyme mix, (100 U Ampligase, 12.5 U T5 Exonuclease, 2.5 U Phusion DNA Polymerase) and IX isothermal assembly buffer at 50°C for 30 min, followed by standardized Cara HIFI PCR, agarose gel electrophoresis, and QIAquick Gel extraction (Qiagen) reactions to enrich for full-length re-TALEs. 200 ng of re-TALE amplicons can then be mixed with 500 ng of target scaffold pre-treated with SapI, 1X isothermal re-TALE assembly reaction buffer and incubated at 50°C for 30 min. The final re-TALE assembly reaction can be directly bacterially transformed to produce colonies of individual assemblies. One skilled in the art will readily be able to select endonucleases, exonucleases, polymerases and ligases from among those known to practice the methods described herein. For example, type IIs endonucleases such as: Fok 1, Bts I, Ear I, Sap I can be used. Titrate exonucleases such as lambda exonuclease, T5 exonuclease and exonuclease III can be used. Non-hot start polymerases such as Phusion DNA polymerase, Taq DNA polymerase and VentR DNA polymerase can be used. Heat-stable ligases such as ampligase, pfu DNA ligase, Taq DNA ligase can be used in this reaction. In addition, depending on the specific type of enzyme used, different reaction conditions may be used to activate such endonucleases, exonucleases, polymerases and ligases.
Пример IIIExample III
Клеточная линия и Клеточная культураCell Line and Cell Culture
Клетки PGP1 iPS поддерживали в покрытых матригелем (BD Biosciences) планшетах в mTeSRl (StemCell Technologies). Культуры пересевали каждые 5-7 дней с TrypLE Express (Invitrogen). Клетки 293T и 293FT выращивали и поддерживали в модифицированной Дульбекко среде Игла (DMEM, Invitrogen) с высоким содержанием глюкозы с добавлением 10% фетальной бычьей сыворотки (FBS, Invitrogen), пенициллина/стрептомицина (pen/strep, Invitrogen), и незаменимых аминокислот (NEAA, Invitrogen). Клетки К562 выращивали и поддерживали в среде RPMI (Invitrogen) с добавлением 10% фетальной бычьей сыворотки (FBS, Invitrogen 15%) и пенициллина/стрептомицина (pen/strep, Invitrogen). Все клетки поддерживали при 37°С и 5% CO2 в увлажненном инкубаторе.PGP1 iPS cells were maintained in Matrigel (BD Biosciences)-coated plates in mTeSRl (StemCell Technologies). Cultures were subcultured every 5–7 days with TrypLE Express (Invitrogen). 293T and 293FT cells were grown and maintained in Dulbecco's modified Eagle's medium (DMEM, Invitrogen) high glucose supplemented with 10% fetal bovine serum (FBS, Invitrogen), penicillin/streptomycin (pen/strep, Invitrogen), and essential amino acids (NEAA , Invitrogen). K562 cells were grown and maintained in RPMI medium (Invitrogen) supplemented with 10% fetal bovine serum (FBS, Invitrogen 15%) and penicillin/streptomycin (pen/strep, Invitrogen). All cells were maintained at 37°C and 5% CO2 in a humidified incubator.
Была создана стабильная клеточная линия 293Т для детекции эффективности HDR, как описано в источнике 26, включенном в данное описание ссылкой в полном объеме. В частности, репортерную клеточную линию, несущую интегрированные в геном последовательности, кодирующие GFP, разрушали вставкой стоп-кодона и 68 п.о. геномного фрагмента, полученного из локуса AAVS1.A stable cell line, 293T, was generated to detect the effectiveness of HDR as described in reference 26, which is incorporated herein by reference in its entirety. Specifically, a reporter cell line carrying genome-integrated GFP coding sequences was disrupted by insertion of a stop codon and 68 bp. genomic fragment obtained from the AAVS1 locus.
Пример IVExample IV
Тест активности re-TALENsre-TALENs activity test
Репортерные клетки 293Т высевали при плотности 2 х 105 клеток на лунку в 24-луночный планшет и трансфецировали их 1 мкг каждой плазмиды re-TALENs и 2 мкг плазмиды с донорной ДНК с использованием Lipofectamine 2000 согласно протоколам производителя. Клетки собирали с помощью TrypLE Express (Invitrogen) через ~ 18 ч после трансфекции и ресуспендировали в 200 мкл среды для анализа проточной цитометрией с использованием анализатора клеток LSRFortessa (BD Biosciences). Данные проточной цитометрии анализировали с использованием FlowJo (FlowJo). По меньшей мере, 25 000 событий анализировали для каждого трансфецированного образца. Для экспериментов по направленному воздействию на эндогенный локус AAVS1 в клетках 293T, процедуры трансфекции были идентичны описанным выше, и отбор на пуромицине был проведен с концентрацией лекарственного средства 3 мкг/мл через 1 неделю после трансфекции.293T reporter cells were seeded at a density of 2 × 10 cells per well in a 24-well plate and transfected with 1 μg of each re-TALENs plasmid and 2 μg of donor DNA plasmid using Lipofectamine 2000 according to the manufacturer's protocols. Cells were harvested using TrypLE Express (Invitrogen) ∼18 h posttransfection and resuspended in 200 μl of media for flow cytometry analysis using an LSRFortessa Cell Analyzer (BD Biosciences). Flow cytometry data were analyzed using FlowJo (FlowJo). At least 25,000 events were analyzed for each transfected sample. For experiments targeting the endogenous AAVS1 locus in 293T cells, transfection procedures were identical to those described above, and puromycin selection was performed at a drug concentration of 3 μg/ml 1 week after transfection.
Пример VExample V
Оценка образования функциональных лентивирусовAssessment of the production of functional lentiviruses
Лентивирусные векторы были созданы с помощью стандартных методов ПЦР и клонирования. Лентивирусные плазмиды трансфецировали Lipofectamine 2000 с помощью лентивирусной упаковочной смеси (Invitrogen) в культивируемые клетки 293FT (Invitrogen), с целью получения лентивируса. Надосадочную жидкость собирали через 48 и 72 ч после трансфекции, стерильно фильтровали, и 100 мкл фильтрованной надосадочной жидкости добавляли к 5 х 105 свежих клеток 293Т с полибреном. Титр лентивируса рассчитывали на основании следующей формулы: титр вируса = (процент клеток GFP+ 293T * исходное количество клеток при трансдукции)/(объем исходной вирус-содержащей надосадочной жидкости, используемой в эксперименте трансдукции). Чтобы проверить работоспособность лентивирусов, через 3 дня после трансдукции, лентивирус-трансдуцированные клетки 293T трансфецировали 30 нг плазмиды, несущей репортер mCherry и 500 нг плазмиды pUC19 с помощью Lipofectamine 2000 (Invitrogen). Изображения клеток анализировали с помощью Axio Observer Zl (Zeiss) через 18 часов после трансфекции, после чего клетки собирали с помощью TrypLE Express (Invitrogen) и ресуспендировали в 200 мкл среды для анализа проточной цитометрией с использованием анализатора клеток LSRFortessa (BD Biosciences). Данные проточной цитометрии анализировали с использованием BD FACSDiva (BD Biosciences).Lentiviral vectors were generated using standard PCR and cloning methods. Lentiviral plasmids were transfected with Lipofectamine 2000 using lentiviral packaging mixture (Invitrogen) into cultured 293FT cells (Invitrogen) to produce lentivirus. The supernatant was collected at 48 and 72 h posttransfection, sterile filtered, and 100 μl of the filtered supernatant was added to 5 × 105 fresh 293T cells with polybrene. The lentivirus titer was calculated based on the following formula: virus titer = (percentage of GFP+ 293T cells * initial number of cells during transduction)/(volume of original virus-containing supernatant used in the transduction experiment). To test the performance of the lentiviruses, 3 days after transduction, lentivirus-transduced 293T cells were transfected with 30 ng of plasmid carrying the mCherry reporter and 500 ng of pUC19 plasmid using Lipofectamine 2000 (Invitrogen). Images of cells were analyzed using Axio Observer Zl (Zeiss) 18 hours after transfection, after which cells were collected using TrypLE Express (Invitrogen) and resuspended in 200 μl of medium for flow cytometry analysis using an LSRFortessa Cell Analyzer (BD Biosciences). Flow cytometry data were analyzed using BD FACSDiva (BD Biosciences).
Пример VIExample VI
Тест эффективности редактирования генома с помощью re-TALENs и Cas9-гидРНКTest of genome editing efficiency using re-TALENs and Cas9-hydrRNA
PGP1 iPSCs культивировали с ингибитором Rho-киназы (ROCK) Y-27632 (Calbiochem) за 2 ч перед нуклеофекцией. Трансфекцию проводили с помощью P3 Primary Cell 4D-Nucleofector X Kit (Lonza). В частности, клетки собирали с помощью TrypLE Express (Invitrogen) и ресуспендировали 2x106 клеток в 20 мкл смеси для нуклеофекции, содержащей 16,4 мкл раствора Р3 Nucleofector, 3,6 мкл добавки, 1 мкг каждой плазмиды re-TALENs или 1 мкг Cas9 и 1 мкг гидРНК-конструкции, 2мкл 100 мкМ ssODN. Затем смеси переносили в 20мкл полоски Nucleocuvette и проводили нуклеофекцию с помощью программы CB150. Клетки высевали в планшеты, покрытые матригелем в среде mTeSR1 среде с добавлением ингибитора ROCK в течение первых 24 часов. Для эксперимента направленного воздействия на эндогенный локус AAVS1 с помощью донорной двухцепочечной ДНК, проводили такую же процедуру за исключением того, что было использовано 2 мкг донорной двухцепочечной ДНК, а среда mTeSRl была дополнена пуромицином в концентрации 0,5 мкг/мл через 1 неделю после трансфекции.PGP1 iPSCs were cultured with the Rho kinase (ROCK) inhibitor Y-27632 (Calbiochem) 2 h before nucleofection. Transfection was performed using the P3 Primary Cell 4D-Nucleofector X Kit (Lonza). Specifically, cells were harvested using TrypLE Express (Invitrogen) and 2x106 cells were resuspended in 20 μl of nucleofection mixture containing 16.4 μl of P3 Nucleofector solution, 3.6 μl of supplement, 1 μg of each re-TALENs plasmid or 1 μg of Cas9, and 1 µg guideRNA construct, 2 µl 100 µM ssODN. The mixtures were then transferred to 20 μl Nucleocuvette strips and nucleofection was performed using the CB150 program. Cells were seeded onto Matrigel-coated plates in mTeSR1 medium supplemented with ROCK inhibitor for the first 24 hours. For the endogenous AAVS1 locus targeting experiment using donor dsDNA, the same procedure was performed except that 2 μg of donor dsDNA was used and mTeSRl medium was supplemented with 0.5 μg/ml puromycin 1 week after transfection. .
Информация о reTALENs, гидРНК и ssODNs, используемых в данном примере, приведена в Таблице 3 и Таблице 4 ниже.Information about the reTALENs, guideRNAs, and ssODNs used in this example is provided in Table 3 and Table 4 below.
Таблица 3. Информация о парах re-TALEN/Cas9-гидРНК, нацеленных на CCR5Table 3. Information on re-TALEN/Cas9-hydrRNA pairs targeting CCR5
целевая последовательностьre-TALEN-L
target sequence
целевая последовательностьre-TALEN-R
target sequence
последователь
ностьguideRNA target
follower
ness
Целевого участка#
Target area
ло)target area of the pair (beginning
lo)
99424640
9942
99934640
9993
99464640
9946
02274641
0227
02784641
0278
02644641
0264
12604641
1260
13114641
1311
12614641
1261
14644641
1464
15154641
1515
14564641
1456
15174641
1517
15684641
1568
15384641
1538
16344641
1634
16854641
1685
16324641
1632
24324641
2432
24834641
2483
24614641
2461
Таблица 4. Дизайн ssODN для изучения ssODN-опосредованного редактирования геномаTable 4. ssODN design for studying ssODN-mediated genome editing
DSBDistance between the second mutation and
DSB
*190-
*1
*290-
*2
*390-
*3
090M-
0
*490-
*4
*590-
*5
*690-
*6
DSBDistance between ssODN and
DSB
bp_9 OML570
bp_9 OM
30-мерComplementary -
30-mer
ориен-тация ssODN для направ-ленного воздей-ствия Cas9-гидРНКLength and
orientation of ssODN for directed action of Cas9-hydrRNA
50-мерComplementary-
50-mer
70-мерComplementary-
70-mer
90-мерComplementary-
90-mer
110-мерComplementary-
110-mer
мерNon-complementary - 30-
measures
мерNon-complementary -70-
measures
5-1Cas9 guideRNA-CCR
5-1
5-2Cas9 guideRNA-CCR
5-2
5-3Cas9 guideRNA-CCR
5-3
5-4Cas9 guideRNA-CCR
5-4
5-5Cas9 guideRNA-CCR
5-5
5-6Cas9 guideRNA-CCR
5-6
5-7Cas9 guideRNA-CCR
5-7
5-8Cas9 guideRNA-CCR
5-8
5-9Cas9 guideRNA-CCR
5-9
5-10Cas9 guideRNA-CCR
5-10
5-11Cas9 guideRNA-CCR
5-11
5-12Cas9 guideRNA-CCR
5-12
5-13Cas9 guideRNA-CCR
5-13
5-14Cas9 guideRNA-CCR
5-14
5-15Cas9 guideRNA-CCR
5-15
CC R5Donor ssO DN for targeted action of RETALENs on
CC R5
5-1reTALEN-CCR
5-1
5-2reTALEN-CCR
5-2
5-3reTALEN-CCR
5-3
5-7reTALEN-CCR
5-7
5-8reTALEN-CCR
5-8
Пример VIIExample VII
Получение библиотеки ампликонов целевых участковObtaining a library of amplicons of target regions
Собирали клетки через 6 дней после нуклеофекции и 0,1 мкл фермента-тканевой протеазы prepGEM (ZyGEM) и 1 мкл буфера prepGEM gold (ZyGEM) добавляли к 8,9 мкл 2~5 X 105 клеток в среде, затем по 1 мкл реакций добавляли в 9 мкл ПЦР-смеси, содержащей 5 мкл готовой смеси 2X КАРА Hifi Hotstart Readymix (КАРА Biosystems) и 100 нМ соответствующих пар праймеров для амплификации. Реакционные смеси инкубировали при 95°С в течение 5 мин с последующими 15 циклами 98°С, 20 с; 65°С, 20 с и 72°С, 20 с. Для добавления адаптерной последовательности Illumina, 5 мкл продуктов реакции затем добавляли в 20 мкл ПЦР-смеси, содержащей 12,5 мкл готовой смеси 2X КАРА HIFI Hotstart Readymix (КАРА Biosystems) и 200 нМ праймеров, несущих адаптерные последовательности Illumina. Реакционные смеси инкубировали при 95°С в течение 5 мин с последующими 25 циклами 98°С, 20 с; 65°C, 20 с и 72°C, 20 с. ПЦР-продукты очищали с помощью набора для очистки ПЦР QIAquick, смешивали приблизительно в одинаковых концентрациях, и секвенировали с помощью персонального секвенатора MiSeq. ПЦР-праймеры перечислены ниже в Таблице 5.Cells were harvested 6 days after nucleofection and 0.1 µl prepGEM tissue protease enzyme (ZyGEM) and 1 µl prepGEM gold buffer (ZyGEM) were added to 8.9 µl 2~5 X 105 cells in medium, then 1 µl reactions were added in 9 μl of a PCR mixture containing 5 μl of 2X KAPA Hifi Hotstart Readymix (KAPA Biosystems) and 100 nM of the corresponding primer pairs for amplification. Reaction mixtures were incubated at 95°C for 5 min, followed by 15 cycles of 98°C, 20 s; 65°C, 20 s and 72°C, 20 s. To add the Illumina adapter sequence, 5 μl of reaction products were then added to a 20 μl PCR mixture containing 12.5 μl of 2X KAPA HIFI Hotstart Readymix (KAPA Biosystems) and 200 nM primers carrying the Illumina adapter sequences. Reaction mixtures were incubated at 95°C for 5 min, followed by 25 cycles of 98°C, 20 s; 65°C, 20 s and 72°C, 20 s. PCR products were purified using the QIAquick PCR purification kit, mixed at approximately equal concentrations, and sequenced using a MiSeq personal sequencer. PCR primers are listed below in Table 5.
Таблица 5 Последовательности ПЦР-праймеров для участка направленного воздействия в CCR5Table 5 PCR primer sequences for the targeting site in CCR5
CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCCAAGCAACTAAGTCACAGCAACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGTCATTT GCAGTGTGCGTTACTCC
CTCGGCATTCCTGCTGAACCGCTCTTCCGATCTCCAAGCAACTAAGTCACAGCA
адаптерIllumina
adapter
* index-PCR - праймеры приобретены в Epicentre (праймеры ScriptSeq™ Index PCR Primers)* index-PCR - primers purchased from Epicentre (ScriptSeq™ Index PCR Primers)
Пример VIIIExample VIII
Система оценки редактирования генома (GEAS)Genome Editing Assessment System (GEAS)
Для обнаружения редких геномных изменений использовали секвенирование нового поколения. См. источники 27-30, включенные в данный документ ссылкой в полном объеме. Для того, чтобы сделать возможным широкое применение данного подхода для быстрой оценки эффективности HDR и NHEJ в hiPSCS, было создано программное обеспечение, названное «pipeline», для анализа данных инженерии генома. «Pipeline» интегрирована в одиночный модуль Unix, который использует различные инструменты, такие как R, BLAT и FASTX Toolkit.Next generation sequencing was used to detect rare genomic changes. See references 27-30, which are incorporated herein by reference in their entirety. To enable widespread application of this approach to quickly evaluate the performance of HDR and NHEJ in hiPSCS, software called “pipeline” was created for analyzing genome engineering data. "Pipeline" is integrated into a single Unix module that uses various tools such as R, BLAT and FASTX Toolkit.
Разбивка по штрих-коду: Группы образцов объединяли вместе и секвенировали по технологии спаренных концов с длиной прочтения 150 п.о. на секвенаторе MiSeq (PE150) (Illumina Next Gen Sequencing), а далее разделяли на основе ДНК-штрихкодирования с помощью пакета программ FASTX.Barcode breakdown: Sample groups were pooled together and paired-end sequenced with 150 bp read length. on a MiSeq (PE150) sequencer (Illumina Next Gen Sequencing) and were further separated based on DNA barcoding using the FASTX software package.
Качество фильтрации: Нуклеотиды с низким качеством последовательности (балл Phred <20) были обрезаны. После обрезки, «риды» короче 80 нуклеотидов были отброшены.Filtering quality: Nucleotides with low sequence quality (Phred score <20) were trimmed. After trimming, reads shorter than 80 nucleotides were discarded.
Картирование: BLAT использовали для независимого картирования «ридов», полученных секвенированием спаренных концов, на эталонном геноме и на выходе получали файлы *.psl.Mapping: BLAT was used to independently map paired-end sequencing reads to the reference genome and output *.psl files.
Определение вставок/делеций: вставки/делеции были определены как полноразмерные «риды», содержащие 2 блока совпадений при выравнивании. В расчет принимались только «риды», соответствующие этому паттерну в обоих «ридах» спаренных концов. В качестве контроля качества требовались «риды» вставок/делеций, которые обладали минимальным 70 нуклеотидным совпадением с эталонным геномом, а оба блока должны иметь длину, по меньшей мере, 20 нуклеотидов. Размер и положение вставок/делеций рассчитывали по положению каждого блока в эталонном геноме. Негомологичное соединение концов (NHEJ) оценивали как процент «ридов», содержащих вставки/делеции (см. уравнение 1 ниже). Большинство событий NHEJ были обнаружены в непосредственной близости от участка направленного воздействия.Definition of Insertions/Deletions: Insertions/deletions were defined as full-length reads containing 2 blocks of matches in the alignment. Only reads matching this pattern in both paired-end reads were taken into account. As quality control, insertion/deletion “reads” were required that had a minimum 70 nucleotide match to the reference genome, and both blocks must be at least 20 nucleotides in length. The size and position of insertions/deletions were calculated from the position of each block in the reference genome. Non-homologous end joining (NHEJ) was estimated as the percentage of “reads” containing insertions/deletions (see Equation 1 below). Most NHEJ events were found in close proximity to the target site.
Эффективность рекомбинации, направляемой гомологией (HDR): Сравнение с паттерном (grep) в окне 12 п.о. центрированном по DSB, использовали для подсчета специфических сигнатур, соответствующих «ридам», содержащим эталонную последовательность, модификации эталонной последовательности (предполагаемые 2 п.о. несовпадения), и «риды», содержащие только 1 п.о. мутацию в пределах предполагаемых 2 п.о. несовпадений (2 п.о. предполагаемые несовпадения) (см. уравнение 1 ниже).Homology-directed recombination (HDR) efficiency: Comparison with pattern (grep) in a 12 bp window. DSB-centered were used to count specific signatures corresponding to reads containing the reference sequence, modifications of the reference sequence (putative 2 bp mismatches), and reads containing only 1 bp. mutation within the expected 2 bp. mismatches (2 bp putative mismatches) (see equation 1 below).
Уравнение 1. Оценка NHEJ и HDREquation 1. Estimation of NHEJ and HDR
А = риды идентичные эталону: XXXXXABXXXXXA = reads identical to the standard: XXXXXABXXXXXX
B = риды, содержащие 2 п.о. несовпадения, которые кодируются ssODN: XXXXXabXXXXXB = reads containing 2 bp. mismatches that are encoded by ssODN: XXXXXabXXXXX
C = риды, содержащие только 1 п.о. мутацию в участке-мишени: например, XXXXXaBXXXXX или XXXXXAbXXXXXC = reads containing only 1 bp. mutation in the target region: for example, XXXXXaBXXXXX or XXXXXAbXXXXX
D = риды, содержащие вставки/делеции, как описано вышеD = reads containing insertions/deletions as described above
Пример IXExample IX
Скрининг Генотипа колонизированных hiPSCsGenotype Screening of Colonized hiPSCs
Человеческие клетки iPS на безфидерных культурах предварительно обрабатывали средой mTesr-1, обогащенной SMC4 (5 мкМ тиазовивин, 1 мкМ CHIR99021, 0,4 мкМ PD0325901, 2 мкМ SB431542) (см. источник 23, включенный в данный документ ссылкой в полном объеме), по меньшей мере, за 2 часа до сортировки FACS. Культуры диссоциировали с помощью аккутазы (Millipore) и ресуспендировали в среде mTesr-1, обогащенной SMC4 и красителем ToPro-3 для проверки жизнеспособности (Invitrogen) в концентрации 1-2 X107/мл. Живые клетки hiPS сортировали по одной клетке с помощью BD FACSAria II SORP UV (BD Biosciences) со 100 мкм соплом в стерильных условиях в 96-луночные планшеты, покрытые облученными мышиными эмбриональными фибробластами CF-1 (Global Stem). Каждая лунка содержала клеточную среду для hES (см. источник 31, включенный в данный документ ссылкой в полном объеме) со 100 нг/мл рекомбинантного человеческого основного фактора роста фибробластов (bFGF) (Millipore) с добавлением SMC4 и 5 мкг/мл фибронектина (Sigma). После сортировки планшеты центрифугировали при 70 x g в течение 3 мин. Образование колоний было отмечено через 4 дня после сортировки, а культуральную среду заменили клеточной средой для hES с SMC4. SMC4 может быть удалена из клеточной среды для hES через 8 дней после сортировки.Human iPS cells in feeder-free cultures were pretreated with mTesr-1 medium supplemented with SMC4 (5 μM thiazovivin, 1 μM CHIR99021, 0.4 μM PD0325901, 2 μM SB431542) (see reference 23, incorporated herein by reference in its entirety). at least 2 hours before FACS sorting. Cultures were dissociated using accutase (Millipore) and resuspended in mTesr-1 medium supplemented with SMC4 and ToPro-3 viability dye (Invitrogen) at a concentration of 1-2 X107/ml. Live hiPS cells were sorted one cell at a time using a BD FACSAria II SORP UV (BD Biosciences) with a 100 μm nozzle under sterile conditions into 96-well plates coated with irradiated CF-1 mouse embryonic fibroblasts (Global Stem). Each well contained hES cell medium (see reference 31, incorporated herein by reference in its entirety) with 100 ng/ml recombinant human basic fibroblast growth factor (bFGF) (Millipore) supplemented with SMC4 and 5 μg/ml fibronectin (Sigma ). After sorting, the plates were centrifuged at 70 x g for 3 min. Colony formation was noted 4 days after sorting, and the culture medium was replaced with hES cell medium with SMC4. SMC4 can be removed from hES cell media 8 days after sorting.
Собирали несколько тысяч клеток через 8 дней после флуоресцентно-активируемой сортировки клеток и (FACS) и добавляли 0,1 мкл фермента-тканевой протеазы prepGEM (ZyGEM) и 1 мкл буфера prepGEM gold (ZyGEM) к 8,9 мкл клеток в среде. Реакции затем добавляли к 40 мкл ПЦР-смеси, содержащей 35,5 мл platinum 1,1X Supermix (Invitrogen), 250 нМ каждого dNTP и 400 нМ праймеров. Реакционные смеси инкубировали при 95°С в течение 3 мин с последующими 30 циклами 95°С, 20 с; 65°C, 30 и 72°С, 20 с. Продукты секвенировали по Сенгеру с использованием любого из ПЦР-праймеров таблицы 5 и анализировали последовательности с помощью DNASTAR (DNASTAR).Several thousand cells were collected 8 days after fluorescence-activated cell sorting and (FACS) and 0.1 μl of prepGEM tissue protease enzyme (ZyGEM) and 1 μl of prepGEM gold buffer (ZyGEM) were added to 8.9 μl of cells in the medium. Reactions were then added to 40 μl of PCR mixture containing 35.5 ml of platinum 1.1X Supermix (Invitrogen), 250 nM of each dNTP, and 400 nM of primers. Reaction mixtures were incubated at 95°C for 3 min, followed by 30 cycles of 95°C, 20 s; 65°C, 30 and 72°C, 20 s. Products were Sanger sequenced using any of the PCR primers in Table 5 and sequences analyzed using DNASTAR (DNASTAR).
Пример XExample X
Иммунноокрашивание и анализы тератом, полученных из hiPSCsImmunostaining and analyzes of teratomas derived from hiPSCs
Клетки инкубировали в нокаутной среде DMEM/F-12 при 37°С в течение 60 минут с использованием следующих антител: анти-SSEA-4 PE (Millipore) (разбавленное 1: 500); Tra-1-60 (BD Pharmingen) (разбавленное 1: 100). После инкубации клетки промывали три раза нокаутной DMEM/F-12 и фотографировали на на Axio Observer Z.1 (ZIESS). Cells were incubated in DMEM/F-12 knockout medium at 37°C for 60 minutes using the following antibodies: anti-SSEA-4 PE (Millipore) (diluted 1:500); Tra-1-60 (BD Pharmingen) (diluted 1:100). After incubation, cells were washed three times with knockout DMEM/F-12 and photographed on an Axio Observer Z.1 (ZIESS).
Для проведения анализа образования тератом, человеческие iPSCs собирали с помощью коллагеназы IV типа (Invitrogen), ресуспендировали клетки в 200 мкл матригеля и вводили внутримышечно в подушечки задних конечностей мышей с нокаутом по Rag2gamma. Тератомы выделяли и фиксировали в формалине через 4-8 недель после инъекции. Тератомы затем анализировали после окрашивания гематоксилином и эозином.To perform the teratoma formation assay, human iPSCs were harvested using collagenase type IV (Invitrogen), cells were resuspended in 200 μl of Matrigel, and injected intramuscularly into the hindlimb pads of Rag2gamma knockout mice. Teratomas were isolated and fixed in formaldehyde 4-8 weeks after injection. Teratomas were then analyzed after hematoxylin and eosin staining.
Пример XIExample XI
Ориентация локусов генома в соматических клетках человека и стволовых клетках человека с помощью reTALENSOrientation of genomic loci in human somatic cells and human stem cells using reTALENS
Согласно некоторым аспектам, TALEs, известные специалистам в данной области техники, модифицированы или перекодированы для устранения повторяющихся последовательностей. Такие TALEs, подходящие для модификации и применения в способах редактирования генома в вирусных средствах доставки и в различных клеточных линиях и микроорганизмах, описанных в данном документе, описаны в источниках 2, 7-12, включенных в данных документ ссылкой в полном объеме. Было разработано несколько стратегий для сборки массива повторяющихся TALE RVD (см. источники 14 и 32-34, включенные в данных документ ссылкой в полном объеме. Однако после сборки повторяющиеся последовательности TALE остаются нестабильными, что ограничивает широкую применимость этого инструмента, особенно для вирусных средств доставки гена (см. источники 13 и 35 включенные в данных документ ссылкой в полном объеме. Соответственно, один аспект настоящего изобретения относится к TALEs, лишенных повторов, например, полностью лишенных повторов. Такие перекодированные TALE является эффективными, поскольку позволяют быстрее и проще синтезировать расширенные массивы TALE RVD.In some aspects, TALEs known to those skilled in the art are modified or recoded to eliminate repetitive sequences. Such TALEs suitable for modification and use in genome editing methods in viral delivery vehicles and in the various cell lines and microorganisms described herein are described in references 2, 7-12, incorporated herein by reference in their entirety. Several strategies have been developed to assemble the RVD TALE repeat array (see references 14 and 32-34, incorporated herein by reference in its entirety. However, once assembled, the TALE repeat sequences remain unstable, limiting the broad applicability of this tool, especially for viral delivery vehicles gene (see references 13 and 35 incorporated herein by reference in their entirety. Accordingly, one aspect of the present invention relates to TALEs that are devoid of repeats, e.g., completely devoid of repeats. Such recoded TALEs are effective because they allow for faster and easier synthesis of extended arrays TALE RVD.
Для устранения повторов, нуклеотидные последовательности массивов TALE RVD эволюционировали вычислительным образом с тем, чтобы минимизировать количество последовательностей-повторов при сохранении аминокислотной композиции. Перекодированные TALE (Re-TALEs), кодирующие 16 тандемных мономеров RVD, распознающих ДНК, плюс конечный полуповтор RVD, лишены любых 12 п.о. повторов (см. Фигуру 5а). Примечательно, что этот уровень перекодирования достаточен для того, чтобы провести амплификацию ПЦР какого-либо конкретного мономера или подраздела из полноразмерного конструкции с re-TALE (см. Фиг. 5b). Усовершенствованный дизайн re-TALEs может быть синтезирован с помощью стандартных технологий синтеза ДНК (см. источник 36, включенный в данный документ ссылкой в полном объеме, без каких дополнительных расходов или процедур, связанных с обогащенными повтрами последовательностями. Кроме того, дизайн перекодированных последовательностей позволяет эффективно собирать конструкции с re-TALE с использованием модифицированной изотермической реакции сборки, как описано в способах данного документа и со ссылкой на Фиг. 6.To eliminate repeats, the nucleotide sequences of the TALE RVD arrays were computationally evolved to minimize the number of repeat sequences while maintaining amino acid composition. Recoded TALEs (Re-TALEs), encoding 16 tandem RVD DNA recognition monomers plus a terminal RVD half-repeat, lack any 12 bp. repetitions (see Figure 5a). Notably, this level of recoding is sufficient to allow PCR amplification of any particular monomer or subsection from the full-length re-TALE construct (see Fig. 5b). The advanced design of re-TALEs can be synthesized using standard DNA synthesis technologies (see reference 36, incorporated herein by reference in its entirety, without any additional costs or procedures associated with re-enriched sequences. In addition, the design of re-TALEs allows for efficient assemble re-TALE constructs using a modified isothermal assembly reaction as described in the methods herein and with reference to Figure 6.
NGS-данные по редактированию генома статистически анализировали следующим образом. Для анализа специфичности HDR, использовали точный биномиальный тест для вычисления вероятности наблюдения различных количеств «ридов», содержащих 2 п.о. несовпадения. На основании результатов секвенирования 10 п.о. окон до и после участка направленного воздействия, оценивали максимальные скорости замены оснований двух окон (PI и Р2). С помощью нулевой гипотезы о том, что изменения каждой из двух целевых п.о. были независимыми, была вычислена ожидаемая вероятность обнаружения 2 п.о. несоответствия в участке направленного воздействия случайно как произведение этих двух вероятностей (Р1 * Р2). Учитывая набор данных, содержащих N количество общих ридов и n количество HDR-ридов, мы рассчитали p-значение наблюдаемой эффективности HDR. Для анализа чувствительности HDR, донорные ssODN содержали 2 п.о. несовпадение относительно генома-мишени, что делает вероятной одновременную замену оснований в двух п. о., являющихся мишенями при включении ssODN в геном-мишень. Прочие нецелевые наблюдаемые изменения последовательностей, вероятно, не будут изменяться в это же время. Соответственно, нецелевые изменения были гораздо менее взаимозависимы. Исходя из этих предположений, взаимная информация (MI) была использована для измерения взаимной зависимости одновременных двух изменений пар оснований во всех других парах позиций, и предел обнаружения HDR оценивали как наименьшее HDR, где MI целевого 2 п.о. сайта выше, чем MI всех пар в других позициях. Для данного эксперимента, в оригинальном файле fastq были идентифицированы риды HDR с целевым 2 п.о. несовпадением и набор файлов fastq с разбавленными эффективностями HDR был смоделирован посредством систематического удаления различных количеств ридов HDR из исходного набора данных. Взаимную информацию (MI) вычисляли между всеми парами положений в пределах 20 п.о. окна с центром на участке направленного воздействия. В этих расчетах вычисляется взаимная информация о композиции оснований между любыми двумя позициями. В отличие от меры специфичности HDR, описанной выше, эта мера не оценивает тенденцию пар позиций изменять какие-либо конкретные пары целевых оснований, а только оценивает их тенденцию изменяться в одно и тоже время (см. Фиг. 8А). В таблице 6 приведены эффективности HDR и NHEJ для направленного воздействия re-TALEN/ssODN на CCR5 и эффективность NHEL для Cas9-гидРНК. Мы запрограммировали наш анализ в R и рассчитали MI при помощи пакета infotheo.NGS data on genome editing were statistically analyzed as follows. To analyze the specificity of HDR, an exact binomial test was used to calculate the probability of observing different numbers of 2-bp reads. mismatches. Based on the results of sequencing 10 bp. windows before and after the directional exposure section, the maximum replacement rates of the bases of two windows (PI and P2) were assessed. Using the null hypothesis that changes in each of the two target p.o. were independent, the expected probability of detecting 2 bp was calculated. discrepancies in the area of directional influence are random as the product of these two probabilities (P1 * P2). Given a dataset containing N number of total reads and n number of HDR reads, we calculated the p-value of the observed HDR efficiency. For HDR sensitivity assays, donor ssODNs contained 2 bp. mismatch with respect to the target genome, which makes it possible that simultaneous base substitutions in two bp that are targets are possible when ssODN is included in the target genome. Other off-target observed sequence changes will likely not change at the same time. Accordingly, non-target changes were much less interdependent. Based on these assumptions, mutual information (MI) was used to measure the mutual dependence of simultaneous two base pair changes at all other position pairs, and the HDR detection limit was estimated as the smallest HDR, where the MI of the target is 2 bp. site is higher than the MI of all pairs in other positions. For this experiment, HDR reads with the target 2 bp were identified in the original fastq file. mismatch and a set of fastq files with diluted HDR efficiencies was simulated by systematically removing varying numbers of HDR reads from the original dataset. Mutual information (MI) was calculated between all pairs of positions within 20 bp. windows centered on the directional exposure area. These calculations calculate the mutual base composition information between any two positions. Unlike the HDR specificity measure described above, this measure does not assess the tendency of position pairs to change any particular target base pairs, but only assesses their tendency to change at the same time (see Fig. 8A). Table 6 shows the efficiencies of HDR and NHEJ for targeting re-TALEN/ssODN to CCR5 and the efficiencies of NHEL for Cas9-hydrRNA. We programmed our analysis in R and calculated MI using the infotheo package.
Таблица 6Table 6
участок направленного воздействия#
area of directed influence
(ReTALEN) (%)HDR
(ReTALEN) (%)
(%)NHEJ (reTALE)
(%)
основе информациионного анализа HDR detection limit at
based on information analysis
(Cas9-гидРНК)HDR
(Cas9-hydrRNA)
* Группа, в которой предел обнаружения HDR превышает реальное детектируемое значение HDR* Group in which the HDR detection limit exceeds the actual HDR detected value
Корреляцию между эффективностью редактирования генома и эпигенетическим состоянием урегулировали следующим образом. Коэффициенты корреляции Пирсона рассчитывали для изучения возможных связей между эпигенетическими параметрами (заполненность ДНКазой I HS или нуклеосомами) и эффективностями генной инженерии (HDR, NHEJ). Набор данных по гиперчувствительности к ДНКазе I был загружен из геномного браузера UCSC. ДНКаза I HS из hiPSCs:The correlation between genome editing efficiency and epigenetic state was adjusted as follows. Pearson correlation coefficients were calculated to examine possible relationships between epigenetic parameters (DNase I HS occupancy or nucleosomes) and genetic engineering efficiencies (HDR, NHEJ). The DNase I hypersensitivity dataset was downloaded from the UCSC Genome Browser. DNase I HS from hiPSCs:
/gbdb/hgl9/bbi/wgEncodeOpenChromDnaseIpsnihi7Sig. bigWig/gbdb/hgl9/bbi/wgEncodeOpenChromDnaseIpsnihi7Sig. bigWig
Для вычисления значения р, наблюдаемую корреляцию сравнивали с моделируемым распределением, которая была построена рандомизацией положения эпигенетического параметра (N = 100 000). Наблюдаемые корреляции выше, чем 95-й процентиль, или ниже, чем 5-й процентиль моделируемого распределения, считались потенциальными ассоциациями.To calculate the p value, the observed correlation was compared with the simulated distribution, which was constructed by randomizing the position of the epigenetic parameter (N = 100,000). Observed correlations higher than the 95th percentile or lower than the 5th percentile of the simulated distribution were considered potential associations.
Определяли функцию re-TALEN по сравнению с соответствующими не перекодироваными TALEN в клетках человека. Линию клеток НЕК 293, содержащую репортерную кассету с GFP, и несущую вставку, смещающую рамку считывания, использовали, как описано в источнике 37, включенном в данное описание ссылкой в полном объеме. Смотрите также Фиг. 1а. Доставка TALENs или reTALENs, направленно воздействующих на последовательность вставки, вместе с беспромоторной донорной конструкцией с GFP, приводит к DSB-индуцированному HDR-восстановлению кассеты с GFP, при этом эффективность восстановления GFP может быть использована для оценки эффективности разрезания нуклеазой. См. источник 38, включенный в данный документ ссылкой в полном объеме. Индуцированное reTALENs восстановление GFP в 1,4% трансфецированных клеток, было аналогично полученному с помощью TALENs (1,2%) (см. Фиг. 1b). Активность reTALENs была протестирована в локусе AAVS1 в PGP1 hiPSCs (см. Фиг. 1с), при этом успешно восстановленные клеточные клоны, содержащие специфические вставки (см. Фиг. 1d, e), подтвердили, что reTALENs активны как в соматических, так и в плюрипотентных клетках человека.The function of re-TALENs was determined in comparison with the corresponding non-recoded TALENs in human cells. The HEK 293 cell line containing a GFP reporter cassette and a frameshift insert carrier was used as described in reference 37, which is incorporated herein by reference in its entirety. See also Fig. 1a. Delivery of TALENs or reTALENs targeting the insertion sequence together with a promoterless GFP donor construct results in DSB-induced HDR repair of the GFP cassette, and the efficiency of GFP repair can be used to assess the efficiency of nuclease cutting. See reference 38, which is incorporated herein by reference in its entirety. The reTALENs-induced GFP recovery in 1.4% of transfected cells was similar to that obtained with TALENs (1.2%) (see Fig. 1b). The activity of reTALENs was tested at the AAVS1 locus in PGP1 hiPSCs (see Figure 1c), with successfully recovered cell clones containing specific inserts (see Figure 1d,e) confirming that reTALENs are active in both somatic and human pluripotent cells.
Устранение повторов позволяет получить функциональный лентивирирус, нагруженный re-TALE. В частности, лентивирусные частицы, в которые были упакованы фрагменты, кодирующие re-TALE-2A-GFP, были протестированы на активность re-TALE-TF, кодируемых вирусными частицами, путем трансфекции репортера mCherry в пул клеток 293Т, инфецированных lenti-reTALE-2A-GFP. Клетки 293T, трансдуцированные lenti-re-TALE-TF показали 36x активацию экспрессии репортера по сравнению с только отрицательным репортером (см. Фиг. 7a,b,c). Проверяли целостность последовательности re-TALE-TF в лентивирус-инфицированных клетках и обнаружили полноразмерные reTALEs во всех 10 протестированных клонах (см. Фиг. 1d).Elimination of repeats produces functional re-TALE-loaded lentivirus. Specifically, lentiviral particles into which fragments encoding re-TALE-2A-GFP were packaged were tested for the activity of re-TALE-TFs encoded by the viral particles by transfecting the mCherry reporter into a pool of lenti-reTALE-2A-infected 293T cells -GFP. 293T cells transduced with lenti-re-TALE-TF showed 36x upregulation of reporter expression compared to the negative reporter alone (see Figure 7a,b,c). The sequence integrity of re-TALE-TF in lentivirus-infected cells was checked and full-length reTALEs were detected in all 10 clones tested (see Fig. 1d).
Пример XIIExample XII
Сравнение эффективности ReTALEs и Cas9-гидРНК в hiPSCs с к помощью системы оценки редактирования генома (GEAS)Comparison of the efficiency of ReTALEs and Cas9 guideRNAs in hiPSCs using the Genome Editing Assessment System (GEAS)
Для сравнения эффективности редактирования re-TALENs относительно Cas9-гидРНК в hiPSCs, была разработана платформа секвенирования следующего поколения (Система оценки Редактирования Генома) для выявления и количественной оценки как NHEJ, так и HDR событий генного редактирования. Пары re-TALEN и Cas9-гидРНК были спроектированы и сконструированы как направленно воздействующие на область, лежащую выше CCR5 (re-TALEN, Cas9-гидРНК пара # 3 в Таблице 3), вместе с 90 нуклеотидным ssODN-донором, идентичным участку направленного воздействия за исключением 2 п.о. несовпадения (см. Фиг. 2а). Нуклеазные конструкции и донорный ssODN трансфецировали в hiPSCs. Для количественной оценки эффективности генного редактирования, через 3 дня после трансфекции проводили глубокое секвенирование с использованием спаренных концевых фрагментов на целевой геномной области. Эффективность HDR измеряли по проценту «ридов», содержащих точное 2 п.о. несовпадение. Эффективность NHEJ измеряли как процент «ридов», несущих вставки/делеции.To compare the editing efficiency of re-TALENs relative to Cas9-hydrRNA in hiPSCs, a next generation sequencing platform (Genome Editing Scoring System) was developed to identify and quantify both NHEJ and HDR gene editing events. The re-TALEN and Cas9-hydrRNA pairs were designed and constructed to target the region upstream of CCR5 (re-TALEN, Cas9-hydrRNA pair #3 in Table 3), together with a 90 nucleotide ssODN donor identical to the targeting site behind with the exception of 2 p.o. mismatches (see Fig. 2a). Nuclease constructs and donor ssODN were transfected into hiPSCs. To quantify the efficiency of gene editing, deep paired-end sequencing was performed on the target genomic region 3 days after transfection. HDR efficiency was measured by the percentage of reads containing the exact 2 bp. mismatch. NHEJ efficiency was measured as the percentage of reads harboring insertions/deletions.
Доставка ssODN отдельно в hiPSCs давала минимальные показатели HDR и NHEJ, в то время как доставка re-TALENs и ssODN давала эффективности 1,7% по HDR и 1,2% по NHEJ (см. Фиг. 2b). Введение Cas9-гидРНК с ssODN давало эффективности 1,2% по HDR и 3,4% по NHEJ. Примечательно, что показатель геномных делеций и вставок достиг своего пика в середине спейсерной области между двумя участками связывания reTALENs, но своего пика достиг на 3-4 п.о. выше последовательности Protospacer Associated Motif (РАМ) участка направленного воздействия Cas9-гидРНК (см. Фиг. 2b), как и следовало ожидать, поскольку двухцепочечные разрывы происходят в этих областях. В случае re-TALENs наблюдали средний геномный размер делеции 6 п.о. и размер вставки 3 п.о., а в случае Cas9-гидРНК средний размер делеции 7 п.о., вставки - 1 п.о. (см. Фиг. 2b), в соответствии с паттернами повреждений ДНК обычно образованных NHEJ (см. источник 4, включенный в данный документ ссылкой в полном объеме). Несколько анализов на платформе секвенирования следующего поколения показало, что GEAS может обнаружить уровень обнаружения HDR до 0,007%, который является одновременно высоко воспроизводимым (коэффициент вариации между повторами = ± 15% * измеренная эффективность) и в 400X более чувствительным, чем наиболее часто используемые тесты с чувствительной к несовпадениям эндонуклеазой (см. Фиг. 8).Delivery of ssODN alone into hiPSCs yielded minimal HDR and NHEJ rates, while delivery of re-TALENs and ssODN yielded efficiencies of 1.7% in HDR and 1.2% in NHEJ (see Figure 2b). The introduction of Cas9 guideRNA with ssODN resulted in efficiencies of 1.2% for HDR and 3.4% for NHEJ. Notably, the rate of genomic deletions and insertions peaked in the middle of the spacer region between the two reTALENs binding sites, but peaked at 3–4 bp. upstream of the Protospacer Associated Motif (PAM) sequence of the Cas9-hydrRNA targeting region (see Fig. 2b), as would be expected since double-strand breaks occur in these regions. In the case of re-TALENs, an average genomic deletion size of 6 bp was observed. and the insert size is 3 bp, and in the case of Cas9-hydrRNA, the average size of the deletion is 7 bp, the insertion is 1 bp. (see Fig. 2b), consistent with DNA damage patterns typically generated by NHEJ (see reference 4, incorporated herein by reference in its entirety). Several analyzes on a next-generation sequencing platform have shown that GEAS can detect HDR detection rates of up to 0.007%, which is both highly reproducible (coefficient of variation between replicates = ±15% * measured efficiency) and 400X more sensitive than most commonly used assays with mismatch-sensitive endonuclease (see Fig. 8).
Пары re-TALEN и Cas9-гидРНК, нацеленные на пятнадцать участков в геномном локусе CCR5, были созданы для определения эффективности редактирования (см. Фиг. 2с, таблица 3). Эти участки были выбраны для того, чтобы представлять широкий спектр чувствительностей ДНКазы I (см. источник 39, включенный в данный документ ссылкой в полном объеме). Нуклеазные конструкции трансфецировали вместе с соответствующими донорными ssODNs (см. таблицу 3) в PGP1 hiPSCs. Через шесть дней после трансфекции профилировали эффективности редактирования генома в этих участках (таблица 6). Для 13 из 15 пар re-TALEN с донорным ssODN, NHEJ и HDR детектировали на уровнях выше статистического порога обнаружения, со средней эффективностью NHEJ 0,4% и средней эффективностью HDR 0,6% (см. Фиг. 2с). Кроме того, статистически значимую положительную корреляцию (R2 = 0,81) обнаружили между эффективностями HR и NHEJ в одних и тех же целевых локусах (P <1 х 10-4) (см. Фиг. 9а), что предполагает, что образование DSB, общей вышестоящей стадии как для HDR, так и для NHEJ, является скорость-лимитирующей стадией для reTALEN-опосредованного редактирования генома.re-TALEN and Cas9 guideRNA pairs targeting fifteen sites in the genomic CCR5 locus were generated to determine editing efficiency (see Figure 2c, Table 3). These regions were chosen to represent the broad range of DNase I sensitivities (see reference 39, incorporated herein by reference in its entirety). Nuclease constructs were transfected along with the corresponding donor ssODNs (see Table 3) into PGP1 hiPSCs. Six days after transfection, genome editing efficiencies at these regions were profiled (Table 6). For 13 of 15 re-TALEN pairs with donor ssODN, NHEJ and HDR were detected at levels above the statistical detection threshold, with an average NHEJ efficiency of 0.4% and an average HDR efficiency of 0.6% (see Figure 2c). Additionally, a statistically significant positive correlation (R2 = 0.81) was found between HR and NHEJ efficiencies at the same target loci (P < 1 x 10-4) (see Fig. 9a), suggesting that DSB formation , a common upstream step for both HDR and NHEJ, is the rate-limiting step for reTALEN-mediated genome editing.
В противоположность этому, все 15 пар Cas9-гидРНК показали значительные уровни NHEJ и HR, со средней эффективностью NHEJ 3% и средней эффективностью HDR 1,0% (см. Фиг. 2с). Кроме того, положительная корреляция была также обнаружена между эффективностью NHEJ и HDR, вызванных Cas9-гидРНК (см. Фиг. 9b) (R2 = 0,52, р = 0,003), что согласуется с наблюдениями для reTALENs. Эффективность NHEJ, достигаемая Cas9-гидРНК была значительно выше, чем та, что достигается с помощью reTALENs (t-тест, спаренные концы, P = 0,02). Наблюдалось умеренная, но статистически значимая корреляция между эффективностью NHEJ и температурой плавления целевой последовательности гидРНК (см. Фиг. 9c) (R2 = 0,28, р = 0,04), что позволяет предположить, что сила спаривания оснований между гидРНК и его геномной мишенью может объяснить вплоть до 28% вариации в эффективности Cas9-гидРНК-опосредованного образования DSB. Даже если Cas9-гидРНК продуцируют уровни NHEJ в среднем в 7 раз выше, чем соответствующие reTALEN, Cas9-гидРНК достигает уровней HDR (среднее = 1,0%), схожих с уровнями соответствующих reTALENs (среднее = 0,6%). Без связи с научной теорией, эти результаты позволяют предложить либо то, что концентрация ssODN при DSB является ограничивающим фактором для HDR, либо то, что структура геномного разрыва, образованного Cas9-гидРНК не выгодна для эффективного HDR. Никакой корреляции между ДНКазой I HS и эффективностями направленного воздействия на геном не наблюдали ни для одного из способов (см. Фиг. 10).In contrast, all 15 Cas9-hydrRNA pairs showed significant levels of NHEJ and HR, with an average NHEJ efficiency of 3% and an average HDR efficiency of 1.0% (see Figure 2c). In addition, a positive correlation was also found between the efficiency of NHEJ and HDR induced by Cas9 guideRNA (see Fig. 9b) (R2 = 0.52, p = 0.003), which is consistent with the observations for reTALENs. The NHEJ efficiency achieved by Cas9-hydrRNA was significantly higher than that achieved by reTALENs (t test, paired ends, P = 0.02). There was a moderate but statistically significant correlation between NHEJ efficiency and the melting temperature of the guideRNA target sequence (see Figure 9c) (R2 = 0.28, p = 0.04), suggesting that the base pairing strength between the guideRNA and its genomic target can explain up to 28% of the variation in the efficiency of Cas9-hydrRNA-mediated DSB formation. Even though Cas9-hydrRNAs produce levels of NHEJ on average 7 times higher than the corresponding reTALENs, Cas9-hydrRNA achieves HDR levels (mean = 1.0%) similar to those of the corresponding reTALENs (mean = 0.6%). Without being bound by scientific theory, these results suggest either that the concentration of ssODN at DSBs is the limiting factor for HDR, or that the structure of the genomic gap formed by Cas9-hydrRNA is not advantageous for efficient HDR. No correlation was observed between DNase I HS and genome targeting efficiencies for any of the methods (see FIG. 10).
Пример XIIIExample XIII
Оптимизация Дизайна донорных ssODN для HDROptimizing the Design of Donor ssODNs for HDR
Высоко эффективные в hiPSCs ssODNs были разработаны следующим образом. Был разработан набор донорных ssODNs разных длин (50-170 нуклеотидов), которые все несут одинаковое 2 п.о. несовпадение в середине спейсерной области участков направленного воздействия пары re-TALEN #3 для CCR5. Наблюдаемая эффективность HDR варьировала в зависимости от длины ssODN, и оптимальная эффективность HDR -1,8% наблюдалась с 90 нуклеотидным ssODN, тогда как более длинные ssODNs имели пониженную эффективность HDR (см. Фиг. 3а). Поскольку более длинные участки гомологии улучшают показатели HDR, когда донорные дцДНК использовались с нуклеазами (см. источник 40, включенный ссылкой в полном объеме), возможные причины такого результата могут заключаться в том, что ssODNs используются в альтернативном процессе восстановления генома; более длинные ssODNs менее доступны для аппарата восстановления генома; или в том, что более длинные ssODNs привносят отрицательные эффекты, которые нейтрализуют любые улучшения, придаваемые более длинной гомологией, по сравнению с дцДНК-донорами (см. источник 41, включенный в данный документ ссылкой в полном объеме). Тем не менее, если дело было в любой из первых двух причин, то показатели NHEJ должны быть либо неизменными, либо увеличиваться с более длинными ssODNs, потому что репарация NHEJ не включает донорный ssODN. Тем не менее, наблюдали снижение показателей NHEJ вместе с HDR (см. Фиг. 3а), что позволяет предположить, что более длинные ssODNs демонстрируют компенсирующие эффекты. Возможные гипотезы могут заключаться в том, что более длинные ssODNs являются токсичными для клетки (см. источник 42, включенный в данный документ ссылкой в полном объеме), или в том, что трансфекция длинных ssODNs насыщает машинерию процессирования ДНК, тем самым вызывая уменьшение молярного поглощения ДНК и уменьшая емкость клеток поглощать и экспрессировать плазмиды с re-TALEN.Highly effective ssODNs in hiPSCs were developed as follows. A set of donor ssODNs of different lengths (50–170 nucleotides) was developed, which all carry the same 2 bp. mismatch in the middle of the spacer region of the sites of directed action of the re-TALEN #3 pair for CCR5. The observed HDR efficiency varied depending on the length of the ssODN, and an optimal HDR efficiency of -1.8% was observed with the 90 nucleotide ssODN, whereas longer ssODNs had reduced HDR efficiency (see Figure 3a). Since longer homology regions improve HDR performance when donor dsDNAs were used with nucleases (see reference 40, incorporated by reference in its entirety), possible reasons for this result may be that ssODNs are used in an alternative genome repair process; longer ssODNs are less accessible to the genome repair machinery; or that longer ssODNs introduce detrimental effects that offset any improvements conferred by longer homology compared to donor dsDNA (see reference 41, incorporated herein by reference in its entirety). However, if either of the first two reasons was the case, then NHEJ rates should either be unchanged or increase with longer ssODNs because NHEJ repair does not involve the donor ssODN. However, a decrease in NHEJ rates together with HDR was observed (see Figure 3 a), suggesting that longer ssODNs exhibit compensatory effects. Possible hypotheses could be that longer ssODNs are toxic to the cell (see reference 42, incorporated herein by reference in its entirety), or that transfection of long ssODNs saturates the DNA processing machinery, thereby causing a decrease in molar uptake DNA and reducing the capacity of cells to take up and express plasmids with re-TALEN.
Была проведена проверка вариабельности показателя включения несовпадений, которые несут донорные ssODN, в зависимости от дистанции от двухцепочечного разрыва («DSB»). Для этого разработали серию 90 нуклеотидных ssODNs, которые все обладают одинаковым 2. п.о. несовпадением (А) в центре спейсерной области пары re-TALEN # 3. Каждый ssODN также содержала второе 2 п.о. несовпадение (B) на различных расстояниях от центра (см. Фиг. 3b). ssODN, обладающий лишь одним 2 п.о. несовпадением использовали в качестве контроля. Каждый из этих ssODNs вводили в индивидуальном порядке с парой re-TALEN #3 и анализировали результаты с помощью GEAS. Мы обнаружили, что общий HDR - если измерять по показателю, при котором включение несовпадения А (только А или A + B) - уменьшается по мере того, как несовпадения В располагаются дальше от центра (см. Фиг. 3b, см. Фиг. 11а). Более высокий показатель HDR, наблюдаемый, когда В находится всего лишь в 10 п.о. от А, может отражать меньшую потребность в отжиге ssODN против геномной ДНК в непосредственной близости от разрыва двухцепочечной ДНК.The variability in the inclusion rate of mismatches carried by donor ssODNs as a function of distance from the double-strand break (“DSB”) was tested. To do this, we developed a series of 90 nucleotide ssODNs, which all have the same 2. bp. mismatch (A) in the center of the spacer region of the re-TALEN #3 pair. Each ssODN also contained a second 2 bp. misalignment (B) at various distances from the center (see Fig. 3b). ssODN, which has only one 2 bp. mismatches were used as controls. Each of these ssODNs was administered individually with a re-TALEN #3 pair and the results were analyzed using GEAS. We found that overall HDR—as measured by the rate at which mismatch A is turned on (A only or A+B)—decreases as B mismatches are located further from the center (see Fig. 3b, see Fig. 11a ). The higher HDR observed when B is only 10 bp away. from A, may reflect a lower requirement for annealing of ssODN against genomic DNA in the vicinity of the double-stranded DNA break.
Для каждого расстояния В от А, часть событий HDR относится к включению только несовпадения А, тогда как другая часть относится к включению как А, так и В несовпадений (см. Фиг. 3b (только A и A + B)). Эти два результата могут быть связаны с трактами генной конверсии (см. источник 43, включенный в данный документ ссылкой в полном объеме) по длине одноцепочечного ДНК-олигонуклеотида, в результате чего включение несовпадений А+В являющегося результатом длинных конверсионных трактов, которые простираются за пределы несовпадения В, а включение только А несовпадения является результатом более коротких путей, которые не достигают В. в соответствии с этой интерпретацией, оценивали распределение трактов генной конверсии в обоих направлениях вдоль ssODN (см. Фиг. 11b). Оцененное распределение подразумевает, что тракты генной конверсии постепенно становятся менее частыми, по мере увеличения их длин, результат, очень похожий на распределения трактов генной конверсии, наблюдаемых с донорными дцДНК, но на сильносжатой шкале дистанций в десятки основания для оцДНК донора относительно сотен оснований для дцДНК доноров. В соответствии с этим результатом, эксперимент с ssODN, включающим три пары 2 п.о. несовпадений с интервалом 10 нуклеотидов в обе стороны от центрального 2 п.о. несовпадения «А», позволил получить паттерн, в котором А отдельно был включен в 85% случаев, с множественными несовпадениями В, включенными в других случаях (см. Фиг. 11с). Хотя количество событий с включением только В было слишком низким для оценки распределения длин путей менее 1 п. о., ясно, что область с коротким путем в пределах 10 п.о. от нуклеазного сайта является преобладающей (см. Фиг. 11,b). Наконец, во всех экспериментах с одиночными несовпадениями В, наблюдалась небольшая часть событий включения только B (0,04% ~ 0,12%), что приблизительно постоянно для всех расстояний от А до В.For each distance B from A, a portion of the HDR events are related to the inclusion of only mismatch A, while another portion is related to the inclusion of both A and B mismatches (see Fig. 3b (A and A+B only)). These two results may be related to gene conversion tracts (see reference 43, incorporated by reference herein in their entirety) along the length of the single-stranded DNA oligonucleotide, resulting in the inclusion of A+B mismatches resulting from long conversion tracts that extend beyond mismatch B, and the inclusion of only the A mismatch results from shorter pathways that do not reach B. Consistent with this interpretation, the distribution of gene conversion tracts in both directions along the ssODN was assessed (see Fig. 11b). The estimated distribution implies that gene conversion tracts gradually become less frequent as their lengths increase, a result very similar to the distributions of gene conversion tracts observed with donor dsDNA, but on a highly compressed distance scale of tens of bases for donor ssDNA relative to hundreds of bases for dsDNA donors. Consistent with this result, an experiment with ssODN comprising three 2 bp pairs. mismatches with an interval of 10 nucleotides on both sides of the central 2 bp. "A" mismatches produced a pattern in which A alone was included 85% of the time, with multiple B mismatches included in other cases (see Fig. 11c). Although the number of B-only events was too low to estimate the distribution of path lengths less than 1 bp, it is clear that the region with a short path within 10 bp. from the nuclease site is predominant (see Fig. 11b). Finally, in all experiments with single B mismatches, a small fraction of B-only inclusion events was observed (0.04% ~ 0.12%), which is approximately constant for all distances from A to B.
Кроме того, был проведен анализ того, как далеко может быть расположен донор ssODN от re-TALEN-индуцированного разрыва двухцепочечной ДНК, при сохранении его включения. Протестировали набор 90-нуклеотидных ssODNs с центральными 2 п.о. несовпадениями, нацеленными на диапазон больших дистанций (-600 п.о. до + 400 п.о.) от re-TALEN-индуцированного участка разрыва дцДНК. Когда ssODNs совпадает с последовательностью в > 40 п. о., мы наблюдали > 30x более низкие эффективности HDR по сравнению с контрольным ssODN, расположенным по центру над областью разрезания (Фиг. 3с). Наблюдавшийся низкий уровень включения может быть результатом процессов, несвязанных с разрезанием дцДНК, как видно в экспериментах, в которых геномы изменены отдельно оцДНК донором, см. источник 42, включенный в данный документ ссылкой в полном объеме. Между тем, низкий уровень HDR, который имеет место, когда ssODN расположен в ~ 40 п. о., может быть связан с комбинацией ослабленной гомологии на содержащей несовпадение стороне разреза дцДНК, вместе с недостаточной длиной оцДНК олигонуклеотида на другой стороне дцДНК разрыва.In addition, an analysis was made of how far the ssODN donor could be located from a re-TALEN-induced DNA double-strand break while maintaining its incorporation. We tested a set of 90-nucleotide ssODNs with a central 2 bp. mismatches targeting a long distance range (-600 bp to + 400 bp) from the re-TALEN-induced dsDNA break site. When ssODNs match >40 bp of sequence, we observed >30x lower HDR efficiencies compared to control ssODNs centered over the cut region (Figure 3c). The observed low level of incorporation may be the result of processes unrelated to dsDNA cutting, as seen in experiments in which genomes are altered separately by the ssDNA donor, see reference 42, incorporated herein by reference in its entirety. Meanwhile, the low level of HDR that occurs when the ssODN is located at ~40 bp may be due to a combination of weakened homology on the mismatch-containing side of the dsDNA cut, together with insufficient length of the ssDNA oligonucleotide on the other side of the dsDNA break.
Было проведено тестирование дизайна донора ssODNs ДНК для опосредованного Cas9-гидРНК направленного воздействия. Сконструировали Cas9-гидРНК (С2), направленно воздействующий на локус AAVS 1, и ssODN-доноры различных ориентаций (Ос: комплементарная к гидРНК и On: некомплементарная к гидРНК) и длин (30, 50, 70, 90, 110 нуклеотидов). Ос были более эффективны, чем On, а 70-мерный Oc достиг оптимального показателя HDR 1,5% (см. Фиг. 3d.) Такую же тенденциозность цепи ssODN детектировали с помощью никазы из Cas9 (CC: Cas9_D10A), несмотря на тот факт, что эффективности HDR, опосредованные Cc с ssODN были значительно меньше, чем С2 (t-тест, cпаренные концы, Р = 0,02). (см. Фиг. 12).The design of ssODNs DNA donor for Cas9-hydrRNA-mediated targeting was tested. We constructed Cas9-hydrRNA (C2), targeting the AAVS 1 locus, and ssODN donors of various orientations (Oc: complementary to guideRNA and On: non-complementary to guideRNA) and lengths (30, 50, 70, 90, 110 nucleotides). Oc were more efficient than On, and the 70-mer Oc achieved an optimal HDR of 1.5% (see Figure 3d.) The same ssODN chain bias was detected using nickase from Cas9 (CC: Cas9_D10A), despite the fact that the HDR efficiencies mediated by Cc with ssODN were significantly less than C2 (t-test, paired ends, P = 0.02). (see Fig. 12).
Пример XIVExample XIV
Клональное Выделение Скорректированных Клеток hiPSCClonal Isolation of Corrected hiPSC Cells
GEAS показало, что re-TALEN пара #3 достигла точного редактирования генома в hiPSCsс эффективностью ~ 1%, уровня, при котором правильно отредактированные клетки обычно можно выделить скринингом клонов. HiPSCs имеют плохую жизнеспособность в виде отдельных клеток. Оптимизированные протоколы, описанные в источнике 23, включенном в данный документ ссылкой в полном объеме, вместе с процедурой сортировки одноклеточной FACS использовали для создания надежной платформы сортировки одиночных hiPSCs и их поддержания, где клоны hiPSC могут быть восстановлены с показателями выживания > 25%. Этот способ был объединен с быстрой и эффективной системой генотипирования, для проведения экстракции хромосомной ДНК и целевой амплификации генома в 1 ч реакциях в одной пробирке, что позволяет осуществить генотипирование hiPSCs в большом масштабе. Вместе эти способы представляют собой конвейер для надежного получения hiPSCs с отредактированным геномом без отбора.GEAS showed that re-TALEN pair #3 achieved accurate genome editing in hiPSCs with an efficiency of ~1%, a level at which correctly edited cells can typically be isolated by lineage screening. HiPSCs have poor viability as single cells. The optimized protocols described in reference 23, incorporated herein by reference in its entirety, together with a single-cell FACS sorting procedure were used to create a robust single-hiPSC sorting and maintenance platform where hiPSC clones can be recovered with survival rates >25%. This method was combined with a fast and efficient genotyping system to perform chromosomal DNA extraction and targeted genome amplification in 1-h reactions in a single tube, allowing genotyping of hiPSCs on a large scale. Together, these methods provide a pipeline for reliably generating genome-edited hiPSCs without selection.
Чтобы продемонстрировать эту систему (см. Фиг. 4а), PGP1 hiPSCs трансфецировали парой reTALENs и ssODN, предназначенных для направленного воздействия на CCR5 в участке #3 (таблица 3). GEAS проводили на части трансфецированных клеток, при этом обнаружили частоту HDR 1,7% (см. Фиг. 4b). Эта информация, наряду с 25% выходом отсортированных клонов единичных клеток, позволяют оценить получение, по меньшей мере, одного правильно отредактированного клона из пяти 96-луночных планшетов с пуассоновской вероятностью 98% (при условии, что μ = 0,017 * 0,25 * 96 * 5 * 2). Через шесть дней после трансфекции, hiPSCs сортировали с помощью FACS, а через восемь дней после сортировки, 100 клонов hiPSC подвергли скринингу. Секвенирование по Сенгеру показало, что 2 из этих 100 не подвергнутых отбору колоний hiPSC содержали гетерозиготный генотип, обладающий 2 п.о. мутацией, введенной донорным ssODN (см. Фиг. 4с). Эффективность направленного воздействия 1% (1% = 2/2 * 100, 2 моноаллельных скорректированных клона из 100 клеток, подвергнутых скринингу) была сопоставима с данными, полученными при анализе секвенированием следующего поколения (1,7%) (см. Фиг. 4b). Плюрипотентность полученных hiPSCs подтвердили иммуногистохимическое окрашивание SSEA4 и TRA-1-60 (см. Фиг. 4d). Подвергнутые успешному направленному воздействию клоны hiPSCs были способны образовывать зрелые тератомы с признаками всех трех зародышевых листков (см. Фиг. 4E).To demonstrate this system (see Fig. 4a), PGP1 hiPSCs were transfected with a pair of reTALENs and ssODNs designed to target CCR5 at site #3 (Table 3). GEAS was performed on a subset of transfected cells and found an HDR frequency of 1.7% (see Figure 4b). This information, along with the 25% yield of sorted single cell clones, allows us to estimate that at least one correctly edited clone is obtained from five 96-well plates with a Poisson probability of 98% (assuming μ = 0.017 * 0.25 * 96 * 5 * 2). Six days after transfection, hiPSCs were sorted by FACS, and eight days after sorting, 100 hiPSC clones were screened. Sanger sequencing revealed that 2 of these 100 unselected hiPSC colonies contained a heterozygous genotype possessing 2 bp. mutation introduced by the donor ssODN (see Fig. 4c). The targeting efficiency of 1% (1% = 2/2 * 100, 2 monoallelic corrected clones per 100 cells screened) was comparable to that obtained from next generation sequencing analysis (1.7%) (see Figure 4b) . The pluripotency of the resulting hiPSCs was confirmed by immunohistochemical staining for SSEA4 and TRA-1-60 (see Figure 4d). Successfully targeted hiPSCs clones were able to form mature teratomas with features of all three germ layers (see Fig. 4E).
Пример XVExample XV
Способ непрерывного редактирования генома клеткиMethod for continuous editing of a cell genome
Согласно некоторым аспектам, предлагается способ редактирования генома в клетках, включающий человеческую клетку, например, человеческую стволовую клетку, где клетка генетически модифицирована для включения нуклеиновой кислоты, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени, и который расщепляет ДНК-мишень сайт-специфическим образом. Такой фермент включает направляемый РНК ДНК-связывающий белок, такой как РНК-направляемый ДНК-связывающий белок системы CRISPR II типа. Типичным ферментом является Cas9. Согласно этому аспекту, клетка экспрессирует фермент, а направляющая РНК вносится в клетку из среды, окружающей клетку. Направляющая РНК и фермент образуют комплекс колокализации на ДНК-мишени, где указанный фермент разрезает ДНК. Необязательно, донорная нуклеиновая кислота может присутствовать для вставки в ДНК в месте разреза, например, путем негомологичного соединения концов или гомологичной рекомбинации. Согласно одному аспекту, нуклеиновая кислота, кодирующая фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишени сайт-специфическим образом, такой как Cas9, находится под управлением промотора, так что нуклеиновая кислота может быть активирована и подавлена. Такие промоторы, хорошо известны специалистам в данной области техники. Одним примерным промотором является промотор, индуцируемый DOX. Согласно одному аспекту, клетка генетически модифицирована обратимой вставкой в ее геном нуклеиновой кислоты, кодирующей фермент, который образует комплекс колокализации с РНК, комплементарной ДНК-мишени и который расщепляет ДНК-мишень сайт-специфическим образом. После вставки нуклеиновая кислота может быть удалена с помощью реактива, такого как транспозаза. Таким образом, нуклеиновая кислота может быть легко удалена после применения.In some aspects, a method of genome editing in cells is provided, comprising a human cell, such as a human stem cell, wherein the cell is genetically modified to include a nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to a target DNA and that cleaves DNA target in a site-specific manner. Such an enzyme includes an RNA-directed DNA-binding protein, such as the RNA-directed DNA-binding protein of the CRISPR type II system. A typical enzyme is Cas9. According to this aspect, the cell expresses the enzyme and the guide RNA is introduced into the cell from the environment surrounding the cell. The guide RNA and enzyme form a colocalization complex on the target DNA, where the enzyme cuts the DNA. Optionally, a donor nucleic acid may be present for insertion into the DNA at the site of the cut, for example, by non-homologous end joining or homologous recombination. In one aspect, a nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to target DNA and that cleaves target DNA in a site-specific manner, such as Cas9, is under the control of a promoter such that the nucleic acid can be activated and repressed . Such promoters are well known to those skilled in the art. One exemplary promoter is the DOX-inducible promoter. In one aspect, a cell is genetically modified by the reversible insertion into its genome of a nucleic acid encoding an enzyme that forms a colocalization complex with RNA complementary to the target DNA and that cleaves the target DNA in a site-specific manner. Once inserted, the nucleic acid can be removed using a reagent such as a transposase. Thus, the nucleic acid can be easily removed after use.
Согласно одному аспекту, предлагается система непрерывного редактирования генома человеческих индуцированных плюрипотентных стволовых клеток (hiPSCs) с помощью системы CRISPR. В соответствии с типичным аспектом способ включает применение линии hiPSC с Cas9, обратимо вставленным в геном (Cas9-hiPSCs); и гидРНК, которые были модифицированы из их нативной формы с тем, чтобы позволить им переход из среды, окружающей клетки, в клетки для применения вместе с Cas9. Такие гидРНК обрабатывали фосфатазой, для удаления фосфатных групп. Редактирование генома в клетки осуществляется с помощью Cas9 путем обогащения обработанной фосфатазой гидРНК среды для культивирования тканей. Такой подход позволяет редактировать геном HiPSCs без «шрамов» с эффективностями вплоть до 50% при однодневных обработках, которые в 2-10 раз более эффективны, чем наилучшие эффективности, известные к настоящему времени. Кроме того, способ прост в использовании и имеет значительно меньшую клеточную токсичность. Воплощения настоящего изобретения включают одиночное редактирование hiPSCs для биологических исследований и терапевтических применений, мультиплексное редактирование hiPSCs для биологических исследований и терапевтических применений, направленную эволюцию hiPSCs и скрининг hiPSCs по фенотипу и клеток, производных от них.In one aspect, a system is proposed for continuous genome editing of human induced pluripotent stem cells (hiPSCs) using the CRISPR system. According to a typical aspect, the method includes using a hiPSC line with Cas9 reversibly inserted into the genome (Cas9-hiPSCs); and guideRNAs that have been modified from their native form to allow them to move from the cell environment into the cells for use with Cas9. Such guideRNAs were treated with phosphatase to remove phosphate groups. Genome editing into cells is accomplished using Cas9 by enriching phosphatase-treated guideRNA in tissue culture media. This approach allows scar-free genome editing of HiPSCs with efficiencies of up to 50% in one-day treatments, which are 2-10 times more effective than the best efficiencies known to date. In addition, the method is easy to use and has significantly lower cellular toxicity. Embodiments of the present invention include single editing of hiPSCs for biological research and therapeutic applications, multiplex editing of hiPSCs for biological research and therapeutic applications, directed evolution of hiPSCs, and phenotypic screening of hiPSCs and cells derived from them.
В соответствии с некоторыми аспектами, другие клеточные линии и организмы, описанные в данном документе, могут быть использованы в дополнение к стволовым клеткам. Например, описанный в данном документе способ может быть использован для клеток животных, таких как мышиные или крысиные клетки, с получением мышиных и крысиных клеток со стабильной интеграцией Cas9, и может быть проведено тканеспецифичное редактирование генома местным введением обработанной фосфатазой направляющей РНК из среды, окружающей клетки. Более того, другие производные Cas9 могут быть вставлены во множество клеточных линий и микроорганизмов, и могут быть проведены геномные манипуляции направленного воздействия, такие как внесение одноцепочечных разрывов, специфичное к последовательности, активация генов, супрессия и эпигенетическая модификация.In accordance with some aspects, other cell lines and organisms described herein can be used in addition to stem cells. For example, the method described herein can be used in animal cells, such as mouse or rat cells, to produce mouse and rat cells with stable Cas9 integration, and tissue-specific genome editing can be performed by locally introducing phosphatase-treated guide RNA from the environment surrounding the cells . Moreover, other Cas9 derivatives can be inserted into a variety of cell lines and microorganisms, and targeted genomic manipulations such as sequence-specific single-strand breaks, gene activation, suppression, and epigenetic modification can be performed.
Аспекты настоящего описания направлены на получение стабильных hiPSCs с вставленным в геном Cas9. Аспекты настоящего описания направлены на модификацию РНК, так чтобы позволить ей проникать в клетку через клеточную стенку и колокализоваться с Cas9, при этом избегая иммунного ответа клетки. Такая модифицированная направляющая РНК может достичь оптимальных эффективностей трансфекции с минимальной токсичностью. Аспекты настоящего раскрытия направлены на оптимизированное редактирование генома в Cas9-hiPSCs с использованием гидРНК, обработанных фосфатазой. Аспекты настоящего изобретения включают устранение Cas9 из hiPSCs для достижения редактирования генома без «шрамов», где нуклеиновая кислота, кодирующая Cas9, была обратимо помещена в клеточный геном. Аспекты настоящего изобретения включают биомедицинскую инженерию с использованием hiPSCs с вставленным в геном Cas9 в для создания искомых генетических мутаций. Такие подвергнутые инженерии hiPSCs поддерживают плюрипотентность и могут успешно дифференцироваться в различные типы клеток, в том числе кардиомиоциты, которые полностью воспроизводят фенотип клеточных линий пациента.Aspects of the present disclosure are directed toward the generation of stable hiPSCs with Cas9 inserted into the genome. Aspects of the present disclosure are directed to modifying RNA to allow it to enter a cell through the cell wall and colocalize with Cas9 while evading the cell's immune response. Such modified guide RNA can achieve optimal transfection efficiencies with minimal toxicity. Aspects of the present disclosure are directed to optimized genome editing in Cas9-hiPSCs using phosphatase-treated guideRNAs. Aspects of the present invention include eliminating Cas9 from hiPSCs to achieve scar-free genome editing where the nucleic acid encoding Cas9 has been reversibly inserted into the cellular genome. Aspects of the present invention include biomedical engineering using hiPSCs with Cas9 inserted into the genome to create desired genetic mutations. These engineered hiPSCs maintain pluripotency and can successfully differentiate into various cell types, including cardiomyocytes, which fully recapitulate the phenotype of patient cell lines.
Аспекты настоящего изобретения включают библиотеки направляющих РНК, обработанных фосфатазой, для мультиплексного редактирования генома. Аспекты настоящего изобретения включают получение библиотеки клеточных линий PGP, в которых каждая клеточная линия несет несколько обозначенных мутаций в геном, которые служат в качестве ресурса для скрининга лекарственных средств. Аспекты настоящего изобретения включают получение клеточных линий PGP1 со всеми ретроэлементами, подвергнутыми штрихкодированию различными последовательностями, для отслеживания расположений и активности этого элемента.Aspects of the present invention include phosphatase-treated guide RNA libraries for multiplex genome editing. Aspects of the present invention include the production of a library of PGP cell lines, in which each cell line carries several designated mutations in the genome that serve as a resource for drug screening. Aspects of the present invention include the generation of PGP1 cell lines with all retroelements barcoded with different sequences to track the locations and activity of this element.
Пример XVIExample XVI
Получение стабильных hiPSCs со вставленным в геном Cas9Generation of stable hiPSCs with Cas9 inserted into the genome
Конструкт с Cas9, экспрессируемый под DOX-индуцируемым промотором, помещали в вектор PiggyBac, который может быть вставлен в геном и удален из него с помощью транспозазы PiggyBac. Реакция ПЦР подтверждала стабильное введение вектора (см. Фиг 14). Индуцируемую экспрессию Cas9 определяли с помощью количественной ПЦР в реальном времени. Уровень мРНК Cas9 увеличился в 1000x после 8 часов 1 мкг/мл DOX в культуральной среде и упал до нормального уровня через ~ 20 часов после удаления DOX (См. Фиг. 15).The Cas9 construct, expressed under a DOX-inducible promoter, was placed into a PiggyBac vector, which can be inserted into and removed from the genome using the PiggyBac transposase. The PCR reaction confirmed stable introduction of the vector (see Fig. 14). Inducible Cas9 expression was determined by quantitative real-time PCR. Cas9 mRNA levels increased 1000x after 8 hours of 1 μg/ml DOX in culture medium and fell to normal levels ~20 hours after DOX removal (See Figure 15).
Согласно одному аспекту, редактирование генома на основе системы Cas9-hiPSC обходит процедуру трансфекции плазмиды с Cas9/РНК, большой конструкции обычно с эффективностью трансфекции в hiPSCs <1%. Настоящая система Cas9-hiPSC может служить в качестве платформы для осуществления высоко эффективной геномной инженерии стволовых клеток человека. Кроме того, кассета Cas9, введенная в hiPSCs, с помощью системы PiggyBac, может быть легко удалена из генома при введении транспозазы.In one aspect, genome editing based on the Cas9-hiPSC system bypasses the Cas9/RNA plasmid transfection procedure, a large construct typically with transfection efficiency in hiPSCs of <1%. The present Cas9-hiPSC system can serve as a platform for highly efficient genomic engineering of human stem cells. In addition, the Cas9 cassette introduced into hiPSCs using the PiggyBac system can be easily removed from the genome by introducing a transposase.
Пример XVIIExample XVII
Направляющая РНК, обработанная фосфатазойPhosphatase-treated guide RNA
Для того, чтобы сделать возможным непрерывное редактирование генома Cas9-hiPSCs, были получены серии модифицированных РНК, кодирующей направляющую РНК, которые вносились в культуральную среду для Cas9-iPS в комплексе с липосомой. Нативная РНК, обработанная фосфатазой, без какого-либо кэпирования достигает оптимального значения HDR 13%, что более чем в 30X больше, чем значения эффективности, сообщаемые ранее для 5'Cap-Mod РНК (см. Фиг. 16).To enable continuous genome editing of Cas9-hiPSCs, a series of modified RNAs encoding guide RNAs were prepared and added to the Cas9-iPS culture medium in complex with a liposome. Native RNA treated with phosphatase without any capping achieved an optimal HDR value of 13%, which is more than 30X greater than the efficiency values previously reported for 5'Cap-Mod RNA (see FIG. 16).
Согласно одному аспекту, направляющая РНК физически прикреплена к донорной ДНК. Таким образом, предлагается способ объединения опосредованного Cas9 разрезания в геноме и ssODN-опосредованной HDR, что приводит к стимуляции последовательность-специфического редактирования генома. Направляющая РНК, связанная с донорным ssODN в оптимизированной концентрации, достигает 44% HDR и 2% неспецифического NHEJ (см. Фиг. 17). Следует отметить, что эта процедура не вызывает видимой токсичности, которая наблюдается в случае нуклеофекции и электропорации.In one aspect, the guide RNA is physically attached to the donor DNA. Thus, a method is proposed to combine Cas9-mediated genomic cutting and ssODN-mediated HDR, resulting in stimulation of sequence-specific genome editing. Guide RNA bound to the donor ssODN at an optimized concentration achieves 44% HDR and 2% nonspecific NHEJ (see Figure 17). It should be noted that this procedure does not cause visible toxicity, which is observed in the case of nucleofection and electroporation.
Согласно одному аспекту, в настоящем изобретении предлагается in vitro сконструированная РНК-структура, кодирующая направляющую РНК, которая достигает высокой эффективности трансфекции, эффективности редактирования генома в сочетании со вставленным в геном Сas9. Кроме того, настоящее изобретение обеспечивает химерный конструкт направляющая РНК-ДНК для объединения события разрезания генома с реакцией направляемой гомологией рекомбинации.In one aspect, the present invention provides an in vitro engineered RNA structure encoding a guide RNA that achieves high transfection efficiency, genome editing efficiency when combined with inserted Cas9 into the genome. In addition, the present invention provides a chimeric guide RNA-DNA construct for combining a genome cutting event with a homology-directed recombination reaction.
Пример XVIIIExample XVIII
Удаление из hiPSCs обратимо вставленного Cas9Removal of reversibly inserted Cas9 from hiPSCs
Для достижения геномного редактирования без «шрамов» согласно некоторым аспектам, кассету с Cas9 вставляли в геном клеток hiPSC с помощью обратимого вектора. Соответственно, кассета Cas9 обратимо встраивается в геном клеток hiPSC с помощью вектора PiggyBac. Кассета с Cas9 удаляли из hiPSCs с отредактированным геномом трансфекцией клетки плазмидой, кодирующей транспозазу. Соответственно, аспекты настоящего изобретения включают применение обратимого вектора, который известен специалистам в данной области техники. Обратимый вектор является вектором, который может быть, например, вставлен в геном, и затем удален с помощью соответствующего фермента для удаления вектора. Такие векторы и соответствующие ферменты для удаления вектора известны специалистам в данной области техники. Проводили скрининг на колонизированных iPS-клетках, и выделяли колонии, лишенные кассеты с Cas9, что было подтверждено реакцией ПЦР. Соответственно, настоящее изобретение обеспечивает способ редактирования генома, который не затрагивает остальную часть генома, при наличии в клетке перманетно вставленной кассеты с Cas9.To achieve scar-free genome editing, in some aspects, a Cas9 cassette was inserted into the genome of hiPSC cells using a reversible vector. Accordingly, the Cas9 cassette is reversibly inserted into the genome of hiPSC cells using the PiggyBac vector. The Cas9 cassette was removed from genome-edited hiPSCs by transfecting the cell with a plasmid encoding the transposase. Accordingly, aspects of the present invention include the use of a reversible vector, which is known to those skilled in the art. A reversible vector is a vector that can, for example, be inserted into a genome and then removed using an appropriate vector removal enzyme. Such vectors and corresponding enzymes for removing the vector are known to those skilled in the art. Screening was carried out on colonized iPS cells, and colonies lacking the Cas9 cassette were isolated, which was confirmed by PCR reaction. Accordingly, the present invention provides a method for genome editing that does not affect the rest of the genome when a Cas9 cassette is permanently inserted into the cell.
Пример XIXExample XIX
Редактирование генома в клетках iPGP1Genome editing in iPGP1 cells
Исследование патогенеза кардиомиопатии исторически было затруднено из-за отсутствия подходящих модельных систем. Дифференцировка кардиомиоцитов из индуцированных плюрипотентных стволовых клеток, полученных из пациентов (iPSCs) считается одним из перспективных путей преодоления данного препятствия, и в настоящее время начинают появляться сообщения о моделировании кардиомиопатии на основе iPSCs. Тем не менее, реализация этой перспективы требует подходов, которые преодолевают генетическую гетерогенность линий iPSC, полученных из пациентов.Research into the pathogenesis of cardiomyopathy has historically been hampered by the lack of suitable model systems. Differentiation of cardiomyocytes from patient-derived induced pluripotent stem cells (iPSCs) is considered one promising way to overcome this obstacle, and reports of iPSC-based models of cardiomyopathy are now beginning to emerge. However, realizing this promise requires approaches that overcome the genetic heterogeneity of patient-derived iPSC lines.
Клеточные линии Cas9-iPGP1 и обработанную фосфатазой направляющую РНК, связанную с ДНК, использовали для получения трех линий iPSC, которые являются изогенными, за исключением последовательности экзона 6 TAZ, который был идентифицирован как несущий однонуклеотидную делецию у пациентов с синдромом Барта. Однораундная трансфекция РНК дает ~30% эффективность HDR. Модифицированные клетки Cas9-iPGP1 с искомыми мутациями выращивали до уровня колоний (см. Фиг. 18), после чего клеточные линии дифференцировали в кардиомиоциты. Кардиомиоциты полученные из сконструированных Сas9-iPGP1, полностью восстановили кардиолипин, митохондриальный дефицит и дефицит АТФ, наблюдаемые в iPSCs, которые были получены из пациентов, и в неонатальной крысиной модели с нокаутом TAZ (см. Фиг. 19). Соответственно, предлагаются способы коррекции мутаций, вызывающих заболевания, в плюрипотентных клетках с последующей дифференцировкой клеток в искомые типы клеток.Cas9-iPGP1 cell lines and phosphatase-treated DNA-linked guide RNA were used to generate three iPSC lines that are isogenic except for the TAZ exon 6 sequence, which was identified as carrying a single-nucleotide deletion in patients with Barth syndrome. Single-round RNA transfection yields ~30% HDR efficiency. Modified Cas9-iPGP1 cells with the desired mutations were grown to the colony level (see Fig. 18), after which the cell lines were differentiated into cardiomyocytes. Cardiomyocytes derived from the engineered Cas9-iPGP1 completely rescued the cardiolipin, mitochondrial, and ATP deficiency observed in iPSCs that were derived from patients and in the neonatal TAZ knockout rat model (see FIG. 19). Accordingly, methods are proposed for correcting disease-causing mutations in pluripotent cells with subsequent differentiation of the cells into the desired cell types.
Пример XXExample XX
Материалы и методыMaterials and methods
1. Получение стабильных клеточных линий iPS/ES с PiggyBacCas9, индуцируемым DOX1. Generation of stable iPS/ES cell lines with DOX-inducible PiggyBacCas9
1. После достижения клетками 70% конфлюэнтности культуру предварительно обрабатывали в течение ночи ингибитором ROCK Y27632 в конечной концентрации 10 мкМ.1. After the cells reached 70% confluency, the culture was pretreated overnight with the ROCK inhibitor Y27632 at a final concentration of 10 μM.
2. На следующий день готовили раствор для нуклеофекции путем объединения 82 мкл раствора для нуклеофекции человеческих стволовых клеток и 18 мкл добавки 1 в стерильной 1,5 мл пробирке Eppendorf. Хорошо перемешивали. Инкубировали раствор при 37°C течение 5 минут.2. The next day, prepare the nucleofection solution by combining 82 μl of human stem cell nucleofection solution and 18 μl of supplement 1 in a sterile 1.5 ml Eppendorf tube. Mixed well. The solution was incubated at 37°C for 5 minutes.
3. Аспирировали mTeSRl; осторожно промывали клетки 2 мл DPBS на лунку шестилуночного планшета.3. mTeSRl was aspirated; gently washed the cells with 2 ml of DPBS per well of a six-well plate.
4. Аспирировали DPBS, добавляли 2 мл/лунку версена, и оставляли культуру в инкубаторе при температуре 37°C, пока они не сгруппируются вместе и не потеряют адгезию, но до отсоединения. Это требует 3-7 мин.4. Aspirate DPBS, add 2 ml/well of versene, and leave the culture in an incubator at 37°C until they clump together and lose adhesion, but before detachment. This requires 3-7 minutes.
5. Аккуратно аспирировали версен и добавляли mTeSRl. Добавляли 1 мл mTeSRl и сбивали клетки с помощью 1000 мкл микропипетки медленным потоком mTeSRl. 5. Gently aspirate the versene and add mTeSRl. 1 ml mTeSRl was added and the cells were knocked down using a 1000 µl micropipette with a slow flow of mTeSRl.
6. Собирали отсоединившиеся клетки, мягко разбивали их в одноклеточную суспензию, количественно оценивали с помощью гематоцитометра, и корректировали плотность клеток до 1 миллиона клеток на мл. 6. The detached cells were collected, gently broken into a single-cell suspension, quantified using a hematocytometer, and the cell density was adjusted to 1 million cells per ml.
7. Добавляли 1 мл суспензии клеток в 1,5 мл пробирку Eppendorf и центрифугировали при 1100 оборотов в минуту в течение 5 мин в настольной центрифуге.7. Add 1 ml of cell suspension to a 1.5 ml Eppendorf tube and centrifuge at 1100 rpm for 5 min in a benchtop centrifuge.
8. Ресуспендировали клетки в 100 мкл раствора Nucleofector для нуклеофекции человеческих стволовых клеток из стадии 2.8. Resuspend the cells in 100 μl Nucleofector solution for nucleofection of human stem cells from stage 2.
9. Переносили клетки к кювету Nucleofector с помощью пипетки на 1 мл. Добавляли в суспензию клеток в кювете 1 мкг плазмиды с транспозазой и 5 мкг плазмид PB Cas9. Смешивали клетки и ДНК осторожным втряхиванием.9. Transfer cells to the Nucleofector cuvette using a 1 ml pipette. 1 μg of plasmid with transposase and 5 μg of PB Cas9 plasmids were added to the cell suspension in a cuvette. The cells and DNA were mixed by gentle shaking.
10. Помещали кювету в Nucleofector. Выбирали программу B-016 и подвергали клетки нуклеофекции нажатием кнопки X.10. Place the cuvette in the Nucleofector. The B-016 program was selected and the cells were subjected to nucleofection by pressing the X button.
11. Добавляли 500ul среды mTeSRl с ингибитором ROCK в кювету после нуклеофекции. 12. Асперировали подвергнутые нуклеофекции клетки из кюветы с помощью предоставленной пластиковой пастеровской пипетки. Переносили клетки покапельно в покрытые матригелем лунки 6 луночного планшета со средом mTeSRl и ингибитором ROCK. Инкубировали клетки при 37°С в течение ночи.11. Add 500ul of mTeSRl medium with ROCK inhibitor to the cuvette after nucleofection. 12. Aspirate the nucleofected cells from the cuvette using the provided plastic Pasteur pipette. The cells were transferred dropwise into Matrigel-coated wells of a 6-well plate with mTeSRl medium and ROCK inhibitor. Cells were incubated at 37°C overnight.
13. Заменяли среду в mTesr1 на следующий день и через 72 часа после трансфекции, добавляли пуромицин в конечной концентрации 1 мкг/мл. Линия выводилась в течение 7 дней.13. The medium in mTesr1 was replaced the next day and 72 hours after transfection, puromycin was added at a final concentration of 1 μg/ml. The line was withdrawn within 7 days.
2. Выделение РНК2. RNA isolation
1. Готовили ДНК-матрицу, гдеТ7-промотор выше последовательности, кодирующей направляющую РНК.1. A DNA template was prepared, where the T7 promoter is upstream of the sequence encoding the guide RNA.
2. Очищали ДНК с помощью Mega Clear Purification и нормализовали ее концентрацию.2. DNA was purified using Mega Clear Purification and its concentration was normalized.
3. Готовили пользовательские смеси NTPS для получения различных направляющих РНК.3. Custom NTPS mixtures were prepared to produce various guide RNAs.
4. Готовили смесь для транскипции in vitro при комнатной температуре.4. Prepare the mixture for in vitro transcription at room temperature.
Amt (мкл)Amt (µl)
об./IVT rxn как указано выше) на льдуCustom NTP (*Add
v/IVT rxn as above) on ice
5. Инкубировали в течение 4 часов (3-6 часов OK) при 37°C (амплификатор).5. Incubate for 4 hours (3-6 hours OK) at 37°C (cycler).
6. Добавляли 2мкл Turbo ДНКазы (набор MEGAscript из Ambion) к каждому образцу. Тщательно перемешивали и инкубировали при 37°С в течение 15'.6. Add 2 µl of Turbo DNase (MEGAscript kit from Ambion) to each sample. Mix thoroughly and incubate at 37°C for 15'.
7. Очищали обработанную ДНКазой реакцию с использованием MegaClear от Ambion в соответствии с инструкциями изготовителя.7. Purify the DNase reaction using MegaClear from Ambion according to the manufacturer's instructions.
8. Очищали РНК с помощью MEGAclear (очищенная РНК может храниться при -80 в течение нескольких месяцев).8. Purify the RNA using MEGAclear (purified RNA can be stored at -80 for several months).
9. Удаляли фосфатные группы, с целью избежать иммунной реакции Toll2 в клетке-хозяине.9. Phosphate groups were removed to avoid the Toll2 immune response in the host cell.
Аккуратно перемешивали образец и инкубировали при 37 С в течение 30 секунд (30 секунд - 1 ч ок)Gently mix the sample and incubate at 37 C for 30 seconds (30 seconds - 1 hour approx)
3. Трансфекция РНК3. RNA transfection
1. Рассевали 10K-20K клеток на 48 лунок без антибиотиков. Для трансфекции клетки должны быть на 30-50% конфлюэнтны.1. Seed 10K-20K cells into 48 wells without antibiotics. For transfection, cells must be 30-50% confluent.
2. Заменяли клеточную среду с B18R (200 нг/мл), DOX (1 мкг/мл), пуромицином (2 мкг/мл), по меньшей мере, за два часа до трансфекции. 2. Change the cell medium with B18R (200 ng/ml), DOX (1 μg/ml), puromycin (2 μg/ml) at least two hours before transfection.
3. Готовили реагент для трансфекции, содержащий направляющую РНК (0,5 мкг ~ 2 мкг), донорную ДНК (0,5 мкг ~ 2 мкг) и RNAiMax, инкубировали смесь при температуре rm в течение 15 минут и переносили в камеру к клеткам.3. Prepare a transfection reagent containing guide RNA (0.5 μg ~ 2 μg), donor DNA (0.5 μg ~ 2 μg) and RNAiMax, incubate the mixture at rm for 15 minutes and transfer it to the cell chamber.
4. Рассеивание одиночных человеческих iPS клеток рассевали и сбор одиночных клонов4. Scattering of single human iPS cells seeded and collection of single clones
1. Через 4 дня индукции DOX и 1 дня отмены DOX, асперировали среду, отмывали осторожно с помощью DPBS, добавляли 2 мл/лунку версена, и помещали культуру обратно в инкубатор при температуре 37°C до тех пор, пока клетки не группировались вместе и становились непрочно прикрепленными, но не отсоединенными. Это требовало 3-7 мин.1. After 4 days of DOX induction and 1 day of DOX withdrawal, asperate the medium, wash gently with DPBS, add 2 ml/well of versene, and place the culture back in the incubator at 37°C until the cells cluster together and became loosely attached, but not detached. This required 3-7 minutes.
2. Аккуратно аспирировали версен и добавляли mTeSRl. Добавляли 1 мл mTeSRl и отсоединяли клетки с помощью 1000 мкл микропипетки медленным потоком mTeSRl.2. Gently aspirate the versene and add mTeSRl. 1 ml mTeSRl was added and cells were detached using a 1000 µl micropipette with a slow flow of mTeSRl.
3. Собирали отсоединенные клетки, мягко разбивали их в одноклеточную суспензию, количественно оценивали с помощью гематоцитометра, и корректировали плотность клеток до 100 тыс. клеток на мл.3. The detached cells were collected, gently broken into a single-cell suspension, quantified using a hematocytometer, and the cell density was adjusted to 100 thousand cells per ml.
4. Рассевали клетки на покрытые матригелем 10 см чашки с mTeSRl плюс ингибитор ROCK при плотности клеток 50К, 100К и 400К на 10 см чашку.4. Cells were seeded onto Matrigel-coated 10 cm dishes with mTeSRl plus ROCK inhibitor at cell densities of 50K, 100K and 400K per 10 cm dish.
5. Скрининг клонов, образованных из одиночных клеток5. Screening of clones formed from single cells
1. Через 12 дней культивирования в 10 см чашке, клоны становились достаточно большими, чтобы быть идентифицированными невооруженным глазом, с возможностью мечения цветным маркером. Не давали клонам становиться слишком большими, и слипаться друг с другом.1. After 12 days of culture in a 10 cm dish, the clones became large enough to be identified by the naked eye, capable of being marked with a colored marker. The clones were prevented from becoming too large and sticking together.
2. Помещали 10 см чашку в ламинар и с помощью пипетки P20 (установленной на 10 мкл) с наконечниками с фильтрами аспирировали 10 мкл среды из каждой лунки 24 луночных планшетов. Отбирали клоны клон путем соскребания клона и переноса в каждую лунку 24 луночного планшета. Для каждого клона использовали отдельный наконечник с фильтром.2. Place a 10 cm dish in laminar and using a P20 pipette (set at 10 µl) with filter tips, aspirate 10 µl of medium from each well of 24 well plates. Clones were selected by scraping the clone and transferring it into each well of a 24-well plate. A separate filter tip was used for each clone.
3. Через 4-5 дней клоны внутри одной лунки 24-луночного планшета становились достаточно большими для разделения.3. After 4-5 days, clones within one well of a 24-well plate were large enough to separate.
4. Аспририровали среду и промывали 2 мл/лунку DPBS.4. Aspirate the medium and wash with 2 ml/well of DPBS.
5. Аспирировали DPBS, заменяли 250 мкл/лунку диспазы (0,1 Ед/мл) и инкубировали клетки с диспазой при 37°С в течение 7 минут.5. Aspirate DPBS, replace with 250 μl/well of dispase (0.1 U/ml), and incubate cells with dispase at 37°C for 7 minutes.
6. Заменяли диспазу 2 мл DPBS.6. Replaced dispase with 2 ml DPBS.
7. Добавляли 250 мкл mTeSRl. С помощью скребка для клеток снимали и собирали клетки.7. Add 250 µl mTeSRl. A cell scraper was used to remove and collect the cells.
8. Переносили 125 мкл суспензии клеток в лунку 24-луночного планшета, покрытого матригелем.8. Transfer 125 μl of the cell suspension into the well of a 24-well plate coated with Matrigel.
9. Переносили 125 мкл суспензии клеток в 1,5 мл пробирку Эппендорф для экстракции геномной ДНК.9. Transfer 125 µl of cell suspension into a 1.5 ml Eppendorf tube for genomic DNA extraction.
6. Скрининг клонов6. Screening of clones
1. Центрифугировали пробирку из стадии 7.71. Centrifuge the tube from step 7.7
2. Аспирировали среду и добавляли 250 мкл буфера для лизиса на лунку (10 мМ + TrispH7. 5 + (или + 8,0), 10 мМ ЭДТА, 10 мМ2. Aspirate the medium and add 250 μl of lysis buffer per well (10 mM + TrispH7.5 + (or + 8.0), 10 mM EDTA, 10 mM
3. NaCl + 10% ДСН, 40 мкг/мл протеиназы К + (добавленной свежей перед использованием буфера). 3. NaCl + 10% SDS, 40 µg/ml proteinase K + (added fresh before using buffer).
4. Выдерживали при 55 в течение ночи. 4. Kept at 55 overnight.
5. Высаживали ДНК добавлением 250 мкл изопропанола.5. DNA was precipitated by adding 250 μl of isopropanol.
6. Центрифугировали в течение 30 минут на максимальной скорости. Промывали 70% этанолом.6. Centrifuge for 30 minutes at maximum speed. Wash with 70% ethanol.
7. Аккуратно удаляли этанол. Сушили на воздухе в течение 5 мин.7. Ethanol was carefully removed. Air dried for 5 minutes.
8. Ресуспендировали гДНК в 100-200 мкл dH2O.8. Resuspend gDNA in 100-200 µl dH2O.
9. Амплифицировали с помощью ПЦР целевую геномную область с помощью специфических праймеров. 9. The target genomic region was amplified by PCR using specific primers.
10. Секвенировали по Сенгеру продукт ПЦР с помощью соответствующего праймера.10. Sanger sequenced the PCR product using the appropriate primer.
11. Анализировали данные о последовательностях по Сэнгеру и экспансию целевых клонов.11. Sanger sequence data and expansion of target clones were analyzed.
7. Удаление вектора PiggyBac7. Removing the PiggyBac Vector
1. Повторяли стадии 2.1-2.91. Repeated stages 2.1-2.9
2. Переносили клетки в кювету Nucleofector с помощью 1 мл наконечника для пипетки. Добавляли 2 мкг плазмиды с транспозазой в суспензию клеток в кювете. Смешивали клетки и ДНК осторожным покачиванием.2. Transfer cells to a Nucleofector cuvette using a 1 ml pipette tip. 2 μg of plasmid with transposase was added to the cell suspension in the cuvette. The cells and DNA were mixed by gentle shaking.
3. Повторяли стадию 2.10-2.113. Repeated stage 2.10-2.11
4. Асперировали нуклеофицированные клетки из кюветы с помощью предоставленной пастеровской пластиковой пипетки и переносили клетки покапельно в 10 см чашки покрытые матригелеем со средой mTeSR1 и ингибитором ROCK. Инкубировали клетки при 37°С в течение ночи.4. Nucleofified cells were asperated from the cuvette using the provided plastic Pasteur pipette and the cells were transferred dropwise into 10 cm dishes coated with Matrigel with mTeSR1 medium and ROCK inhibitor. Cells were incubated at 37°C overnight.
5. На следующий день заменяли среду mTesr1 и заменяли среду каждый день в течение 4 последующих дней.5. The next day, the mTesr1 medium was replaced and the medium was replaced every day for the next 4 days.
6. После того, как клоны стал достаточно большими забирали 20-50 клонов и рассевали в 24 луночный планшет.6. After the clones became large enough, 20-50 clones were taken and seeded into a 24-well plate.
7. Генотипировали клоны с помощью праймеров на вектор PB Cas9 PiggyBac и размножали отрицательные клоны.7. Clones were genotyped using primers for the PB Cas9 PiggyBac vector and negative clones were propagated.
Список литературыBibliography
Литературные источники обозначены в описании их номером и включены в описание как если бы они были полностью изложены в нем. Каждый из следующих источников включен в данное описание ссылкой в полном объеме.Literary sources are identified in the description by their number and are included in the description as if they were fully stated therein. Each of the following sources is incorporated herein by reference in its entirety.
1. Carroll, D. (2011) Genome engineering with zinc-finger nucleases. Genetics, 188, 773-82.1. Carroll, D. (2011) Genome engineering with zinc-finger nucleases. Genetics, 188, 773-82.
2. Wood, A. J., Lo, T. -W., Zeitler, B., Pickle, C. S., Ralston, E. J., Lee, A. H., Amora, R., Miller, J. C, Leung, E., Meng, X., et al. (2011) Targeted genome editing across species using ZFNs and TALENs. Science (New York, N. Y.), 333, 307.2. Wood, A. J., Lo, T. -W., Zeitler, B., Pickle, C. S., Ralston, E. J., Lee, A. H., Amora, R., Miller, J. C., Leung, E., Meng, X. ., et al. (2011) Targeted genome editing across species using ZFNs and TALENs. Science (New York, N.Y.), 333, 307.
3. Perez-Pinera, P., Ousterout, D. G. and Gersbach, C. A. (2012) Advances in targeted genome editing. Current opinion in chemical biology, 16, 268-77.3. Perez-Pinera, P., Ousterout, D. G. and Gersbach, C. A. (2012) Advances in targeted genome editing. Current opinion in chemical biology, 16, 268-77.
4. Symington, L. S. and Gautier, J. (2011) Double-strand break end resection and repair pathway choice. Annual review of genetics, 45, 247-71.4. Symington, L. S. and Gautier, J. (2011) Double-strand break end resection and repair pathway choice. Annual review of genetics, 45, 247-71.
5. Urnov, F. D., Miller, J. C, Lee, Y. -L., Beausejour, C. M., Rock, J. M., Augustus, S., Jamieson, A. C, Porteus, M. H., Gregory, P. D. and Holmes, M. C. (2005) Highly efficient endogenous human gene correction using designed zinc-finger nucleases. Nature, 435, 646-51.5. Urnov, F. D., Miller, J. C., Lee, Y. -L., Beausejour, C. M., Rock, J. M., Augustus, S., Jamieson, A. C., Porteus, M. H., Gregory, P. D. and Holmes, M. C. (2005) Highly efficient endogenous human gene correction using designed zinc-finger nucleases. Nature, 435, 646-51.
6. Boch, J., Scholze, H., Schornack, S., Landgraf, A., Hahn, S., Kay, S., Lahaye, T., Nickstadt, A. and Bonas, U. (2009) Breaking the code of DNA binding specificity of TAL-type III effectors. Science (New York, N. Y.), 326, 1509-12.6. Boch, J., Scholze, H., Schornack, S., Landgraf, A., Hahn, S., Kay, S., Lahaye, T., Nickstadt, A. and Bonas, U. (2009) Breaking the code of DNA binding specificity of TAL-type III effectors. Science (New York, N.Y.), 326, 1509-12.
7. Cell, P., Replacement, K.S., Talens, A., Type, A., Collection, C, Ccl-, A. and Quickextract, E. Genetic engineering of human pluripotent cells using TALE nucleases.7. Cell, P., Replacement, K. S., Talens, A., Type, A., Collection, C, Ccl-, A. and Quickextract, E. Genetic engineering of human pluripotent cells using TALE nucleases.
8. Mussolino, C, Morbitzer, R., Lutge, F., Dannemann, N., Lahaye, T. and Cathomen, T. (2011) A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity. Nucleic acids research, 39, 9283-93.8. Mussolino, C., Morbitzer, R., Lutge, F., Dannemann, N., Lahaye, T. and Cathomen, T. (2011) A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity. Nucleic acids research, 39, 9283-93.
9. Ding, Q., Lee, Y., Schaefer, E. A. K., Peters, D. T., Veres, A., Kim, K., Kuperwasser, N., Motola, D. L., Meissner, T. B., Hendriks, W. T., et al. (2013) Resource A TALEN Genome-Editing System for Generating Human Stem Cell-Based Disease Models.9. Ding, Q., Lee, Y., Schaefer, E. A. K., Peters, D. T., Veres, A., Kim, K., Kuperwasser, N., Motola, D. L., Meissner, T. B., Hendriks, W. T., et al. (2013) Resource A TALEN Genome-Editing System for Generating Human Stem Cell-Based Disease Models.
10. Hockemeyer, D., Wang, H., Kiani, S., Lai, C. S., Gao, Q., Cassady, J. P., Cost, G. J., Zhang, L., Santiago, Y., Miller, J. C, et al. (2011) Genetic engineering of human pluripotent cells using TALE nucleases. Nature biotechnology, 29, 731-4.10. Hockemeyer, D., Wang, H., Kiani, S., Lai, C. S., Gao, Q., Cassady, J. P., Cost, G. J., Zhang, L., Santiago, Y., Miller, J. C. et al. (2011) Genetic engineering of human pluripotent cells using TALE nucleases. Nature biotechnology, 29, 731-4.
11. Bedell, V. M., Wang, Y., Campbell, J. M., Poshusta, T. L., Starker, C. G., Krag Ii, R. G., Tan, W., Penheiter, S. G., Ma, A. C, Leung, A. Y. H., et al. (2012) In vivo genome editing using a high-efficiency TALEN system. Nature, 490, 114-118.11. Bedell, V. M., Wang, Y., Campbell, J. M., Poshusta, T. L., Starker, C. G., Krag Ii, R. G., Tan, W., Penheiter, S. G., Ma, A. C., Leung, A. Y. H., et al. (2012) In vivo genome editing using a high-efficiency TALEN system. Nature, 490, 114-118.
12. Miller, J. C, Tan, S., Qiao, G., Barlow, K. a, Wang, J., Xia, D. F., Meng, X., Paschon, D. E., Leung, E., Hinkley, S. J., et al. (2011) A TALE nuclease architecture for efficient genome editing. Nature biotechnology, 29, 143-8.12. Miller, J. C., Tan, S., Qiao, G., Barlow, K. a, Wang, J., Xia, D. F., Meng, X., Paschon, D. E., Leung, E., Hinkley, S. J. , et al. (2011) A TALE nuclease architecture for efficient genome editing. Nature biotechnology, 29, 143-8.
13. Holkers, M., Maggio, L, Liu, J., Janssen, J. M., Miselli, F., Mussolino, C, Recchia, A., Cathomen, T. and Goncalves, M. a F. V (2012) Differential integrity of TALE nuclease genes following adenoviral and lentiviral vector gene transfer into human cells. Nucleic acids research, 10. 1093/nar/gksl446.13. Holkers, M., Maggio, L, Liu, J., Janssen, J. M., Miselli, F., Mussolino, C., Recchia, A., Cathomen, T. and Gonçalves, M. and F. V (2012) Differential integrity of TALE nuclease genes following adenoviral and lentiviral vector gene transfer into human cells. Nucleic acids research, 10. 1093/nar/gksl446.
14. Reyon, D., Tsai, S. Q., Khayter, C, Foden, J. a, Sander, J. D. and Joung, J. K. (2012) FLASH assembly of TALENs for high-throughput genome editing. Nature Biotechnology, 30, 460-465.14. Reyon, D., Tsai, S. Q., Khayter, C., Foden, J. a, Sander, J. D. and Joung, J. K. (2012) FLASH assembly of TALENs for high-throughput genome editing. Nature Biotechnology, 30, 460-465.
15. Qiu, P., Shandilya, H., D'Alessio, J. M., 0'Connor, K., Durocher, J. and Gerard, G. F. (2004) Mutation detection using Surveyor nuclease. BioTechniques, 36, 702-7.15. Qiu, P., Shandilya, H., D'Alessio, J. M., O'Connor, K., Durocher, J. and Gerard, G. F. (2004) Mutation detection using Surveyor nuclease. Biotechniques, 36, 702-7.
16. Mali, P., Yang, L., Esvelt, K. M., Aach, J., Guell, M., DiCarlo, J. E., Norville, J. E. and Church, G. M. (2013) RNA-guided human genome engineering via Cas9. Science (New York, N. Y.), 339, 823-6.16. Mali, P., Yang, L., Esvelt, K. M., Aach, J., Guell, M., DiCarlo, J. E., Norville, J. E. and Church, G. M. (2013) RNA-guided human genome engineering via Cas9. Science (New York, N.Y.), 339, 823-6.
17. Ding, Q., Regan, S. N., Xia, Y., Oostrom, L. A., Cowan, C. A. and Musunura, K. (2013) Enhanced Efficiency of Human Pluripotent Stem Cell Genome Editing through Replacing TALENs with CRISPRs. Cell Stem Cell, 12, 393-394.17. Ding, Q., Regan, S. N., Xia, Y., Oostrom, L. A., Cowan, C. A. and Musunura, K. (2013) Enhanced Efficiency of Human Pluripotent Stem Cell Genome Editing through Replacing TALENs with CRISPRs. Cell Stem Cell, 12, 393-394.
18. Cong, L., Ran, F. A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P. D., Wu, X., Jiang, W., Marraffini, L. a, et al. (2013) Multiplex genome engineering using CRISPR/Cas systems. Science (New York, N. Y.), 339, 819-23.18. Cong, L., Ran, F. A., Cox, D., Lin, S., Barretto, R., Habib, N., Hsu, P. D., Wu, X., Jiang, W., Marraffini, L. a , et al. (2013) Multiplex genome engineering using CRISPR/Cas systems. Science (New York, N.Y.), 339, 819-23.
19. Cho, S. W., Kim, S., Kim, J. M. and Kim, J. -S. (2013) Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nature biotechnology, 31, 230-232.19. Cho, S. W., Kim, S., Kim, J. M. and Kim, J. -S. (2013) Targeted genome engineering in human cells with the Cas9 RNA-guided endonuclease. Nature biotechnology, 31, 230-232.
20. Hwang, W. Y., Fu, Y., Reyon, D., Maeder, M. L., Tsai, S. Q., Sander, J. D., Peterson, R. T., Yeh, J. -RJ. and Joung, J. K. (2013) Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology, 31, 227-229.20. Hwang, W. Y., Fu, Y., Reyon, D., Maeder, M. L., Tsai, S. Q., Sander, J. D., Peterson, R. T., Yeh, J. -R. J. and Joung, J. K. (2013) Efficient genome editing in zebrafish using a CRISPR-Cas system. Nature biotechnology, 31, 227-229.
21. Chen, F., Praett-Miller, S. M., Huang, Y., Gjoka, M., Duda, K., Taunton, J., Collingwood, T. N., Frodin, M. and Davis, G. D. (2011) High-frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases. Nature methods, 8, 753-5.21. Chen, F., Praett-Miller, S. M., Huang, Y., Gjoka, M., Duda, K., Taunton, J., Collingwood, T. N., Frodin, M. and Davis, G. D. (2011) High- frequency genome editing using ssDNA oligonucleotides with zinc-finger nucleases. Nature methods, 8, 753-5.
22. Soldner, F., Laganiere, J., Cheng, A. W., Hockemeyer, D., Gao, Q., Alagappan, R., Khurana, V., Golbe, L. L, Myers, R. H., Lindquist, S., et al. (2011) Generation of isogenic pluripotent stem cells differing exclusively at two early onset Parkinson point mutations. Cell, 146, 318-31.22. Soldner, F., Laganiere, J., Cheng, A. W., Hockemeyer, D., Gao, Q., Alagappan, R., Khurana, V., Golbe, L. L., Myers, R. H., Lindquist, S. , et al. (2011) Generation of isogenic pluripotent stem cells differing exclusively at two early onset Parkinson point mutations. Cell, 146, 318-31.
23. Valamehr, B., Abujarour, R., Robinson, M., Le, T., Robbins, D., Shoemaker, D. and Flynn, P. (2012) A novel platform to enable the high-throughput derivation and characterization of feeder-free human iPSCs. Scientific reports, 2, 213.23. Valamehr, B., Abujarour, R., Robinson, M., Le, T., Robbins, D., Shoemaker, D. and Flynn, P. (2012) A novel platform to enable the high-throughput derivation and characterization of feeder-free human iPSCs. Scientific reports, 2, 213.
24. Sanjana, N. E., Cong, L., Zhou, Y., Cunniff, M. M., Feng, G. and Zhang, F. (2012) A transcription activator-like effector toolbox for genome engineering. Nature protocols, 7, 171-92.24. Sanjana, N. E., Cong, L., Zhou, Y., Cunniff, M. M., Feng, G. and Zhang, F. (2012) A transcription activator-like effector toolbox for genome engineering. Nature protocols, 7, 171-92.
25. Gibson, D. G., Young, L., Chuang, R., Venter, J. C., Iii, C. A. H., Smith, H. O. and America, N. (2009) Enzymatic assembly of DNA molecules up to several hundred kilobases. 6, 12-16.25. Gibson, D. G., Young, L., Chuang, R., Venter, J. C., Iii, C. A. H., Smith, H. O. and America, N. (2009) Enzymatic assembly of DNA molecules up to several hundred kilobases. 6, 12-16.
26. Zou, J., Maeder, M. L., Mali, P., Praett-Miller, S. M., Thibodeau-Beganny, S., Chou, B. -K., Chen, G., Ye, Z., Park, I. -H., Daley, G. Q., et al. (2009) Gene targeting of a disease-related gene in human induced pluripotent stem and embryonic stem cells. Cell stem cell, 5, 97-110.26. Zou, J., Maeder, M. L., Mali, P., Praett-Miller, S. M., Thibodeau-Beganny, S., Chou, B. -K., Chen, G., Ye, Z., Park, I -H., Daley, G. Q., et al. (2009) Gene targeting of a disease-related gene in human induced pluripotent stem and embryonic stem cells. Cell stem cell, 5, 97-110.
27. Perez, E. E., Wang, J., Miller, J. C, Jouvenot, Y., Kim, K. a, Liu, 0., Wang, N., Lee, G., Bartsevich, V. V, Lee, Y. -L., et al. (2008) Establishment of HIV-1 resistance in CD4+ T cells by genome editing using zinc-finger nucleases. Nature biotechnology, 26, 808-16.27. Perez, E. E., Wang, J., Miller, J. C., Jouvenot, Y., Kim, K. a, Liu, 0., Wang, N., Lee, G., Bartsevich, V. V, Lee , Y.-L., et al. (2008) Establishment of HIV-1 resistance in CD4+ T cells by genome editing using zinc-finger nucleases. Nature biotechnology, 26, 808-16.
28. Bhakta, M. S., Неnry, I.М., OusteroutD. G., Das, K. T., Lockwood, S. H., Meckler, J. F., Wallen, M. C, Zykovich, A., Yu, Y., Leo, H., et al. (2013) Highly active zinc-finger nucleases by extended modular assembly. Genome research, 10. 1101/gr. 143693. 112.28. Bhakta, M. S., Henry, I. M., Ousterout D. G., Das, K. T., Lockwood, S. H., Meckler, J. F., Wallen, M. C., Zykovich, A., Yu, Y., Leo, H., et al. (2013) Highly active zinc-finger nucleases by extended modular assembly. Genome research, 10. 1101/gr. 143693. 112.
29. Kim, E., Kim, S., Kim, D. H., Choi, B. -S., Choi, I. -Y. andKim, J. -S. (2012) Precision genome engineering with programmable DNA-nicking enzymes. Genome research, 22, 1327-33.29. Kim, E., Kim, S., Kim, D. H., Choi, B. -S., Choi, I. -Y. andKim, J.-S. (2012) Precision genome engineering with programmable DNA-nicking enzymes. Genome research, 22, 1327-33.
30. Gupta, A., Meng, X., Zhu, L. J., Lawson, N. D. and Wolfe, S. a (2011) Zinc finger protein-dependent and -independent contributions to the in vivo off-target activity of zinc finger nucleases. Nucleic acids research, 39, 381-92.30. Gupta, A., Meng, X., Zhu, L. J., Lawson, N. D. and Wolfe, S. a (2011) Zinc finger protein-dependent and -independent contributions to the in vivo off-target activity of zinc finger nucleases. Nucleic acids research, 39, 381-92.
31. Park, I. -H., Lerou, P. H., Zhao, R., Huo, H. and Daley, G. Q. (2008) Generation of human-induced pluripotent stem cells. Природа протоколов, 3, 1180-6.31. Park, I. -H., Lerou, P. H., Zhao, R., Huo, H. and Daley, G. Q. (2008) Generation of human-induced pluripotent stem cells. Nature of Protocols, 3, 1180-6.
32. Cermak, T., Doyle, E. L., Christian, M., Wang, L., Zhang, Y., Schmidt, C, Baller, J. A., Somia, N. V, Bogdanove, A. J. and Voytas, D. F. (2011) Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic acids research, 39, e82.32. Cermak, T., Doyle, E. L., Christian, M., Wang, L., Zhang, Y., Schmidt, C., Baller, J. A., Somia, N. V., Bogdanove, A. J. and Voytas, D. F. (2011) Efficient design and assembly of custom TALEN and other TAL effector-based constructs for DNA targeting. Nucleic acids research, 39, e82.
33. Briggs, A. W., Rios, X., Chari, R., Yang, L., Zhang, F., Mali, P. and Church, G. M. (2012) Iterative capped assembly: rapid and scalable synthesis of repeat-module DNA such as TAL effectors from individual monomers. Nucleic acids research, 10. 1093/nar/gks624.33. Briggs, A. W., Rios, X., Chari, R., Yang, L., Zhang, F., Mali, P. and Church, G. M. (2012) Iterative capped assembly: rapid and scalable synthesis of repeat-module DNA such as TAL effectors from individual monomers. Nucleic acids research, 10. 1093/nar/gks624.
34. Zhang, F., Cong, L., Lodato, S., Kosuri, S., Church, G. M. and Arlotta, P. (2011) LETTErs Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. 29, 149-154.34. Zhang, F., Cong, L., Lodato, S., Kosuri, S., Church, G. M. and Arlotta, P. (2011) LETTErs Efficient construction of sequence-specific TAL effectors for modulating mammalian transcription. 29, 149-154.
35. Pathak, V. K. and Temin, H. M. (1990) Broad spectrum of in vivo forward mutations, hypermutations, and mutational hotspots in a retroviral shuttle vector after a single replication cycle: substitutions, frameshifts, and hypermutations. Proceedings of the National Academy of Sciences of the United States of America, 87, 6019-23.35. Pathak, V. K. and Temin, H. M. (1990) Broad spectrum of in vivo forward mutations, hypermutations, and mutational hotspots in a retroviral shuttle vector after a single replication cycle: substitutions, frameshifts, and hypermutations. Proceedings of the National Academy of Sciences of the United States of America, 87, 6019-23.
36. Tian, J., Ma, K. and Saaem, I. (2009) Advancing high-throughput gene synthesis technology. Molecular bioSystems, 5, 714-22.36. Tian, J., Ma, K. and Saaem, I. (2009) Advancing high-throughput gene synthesis technology. Molecular bioSystems, 5, 714-22.
37. Zou, J., Mali, P., Huang, X., Dowey, S. N. and Cheng, L. (2011) Site-specific gene correction of a point mutation in human iPS cells derived from an adult patient with sickle cell disease. Blood, 118, 4599-608.37. Zou, J., Mali, P., Huang, X., Dowey, S. N. and Cheng, L. (2011) Site-specific gene correction of a point mutation in human iPS cells derived from an adult patient with sickle cell disease . Blood, 118, 4599-608.
38. Mali, P., Yang, L., Esvelt, K. M., Aach, J., Guell, M., Dicarlo, J. E., Norville, J. E. and Church, G. M. (2013) RNA-Guided Human Genome.38. Mali, P., Yang, L., Esvelt, K. M., Aach, J., Guell, M., Dicarlo, J. E., Norville, J. E. and Church, G. M. (2013) RNA-Guided Human Genome.
39. Boyle, A. P., Davis, S., Shulha, H. P., Meltzer, P., Margulies, E. H., Weng, Z., Furey, T. S. and Crawford, G. E. (2008) High-resolution mapping and characterization of open chromatin across the genome. Cell, 132, 311-22.39. Boyle, A. P., Davis, S., Shulha, H. P., Meltzer, P., Margulies, E. H., Weng, Z., Furey, T. S. and Crawford, G. E. (2008) High-resolution mapping and characterization of open chromatin across the genome. Cell, 132, 311-22.
40. Orlando, S. J., Santiago, Y., DeKelver, R. C, Freyvert, Y., Boydston, E. a, Moehle, E. a, Choi, V. M., Gopalan, S. M., Lou, J. F., Li, J., et al. (2010) Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic acids research, 38, el52.40. Orlando, S. J., Santiago, Y., DeKelver, R. C., Freyvert, Y., Boydston, E. a, Moehle, E. a, Choi, V. M., Gopalan, S. M., Lou, J. F., Li, J. , et al. (2010) Zinc-finger nuclease-driven targeted integration into mammalian genomes using donors with limited chromosomal homology. Nucleic acids research, 38, el52.
41. Wang, Z., Zhou, Z. -J., Liu, D. -P. and Huang, J. -D. (2008) Double-stranded break can be repaired by single-stranded oligonucleotides via the ATM/ATR pathway in mammalian cells. Oligonucleotides, 18, 21-32.41. Wang, Z., Zhou, Z. -J., Liu, D. -P. and Huang, J. -D. (2008) Double-stranded break can be repaired by single-stranded oligonucleotides via the ATM/ATR pathway in mammalian cells. Oligonucleotides, 18, 21-32.
42. Rios, X., Briggs, A. W., Christodoulou, D., Gorham, J. M., Seidman, J. G. and Church, G. M. (2012) Stable gene targeting in human cells using single-strand oligonucleotides with modified bases. PloS one, 7, e36697.42. Rios, X., Briggs, A. W., Christodoulou, D., Gorham, J. M., Seidman, J. G. and Church, G. M. (2012) Stable gene targeting in human cells using single-strand oligonucleotides with modified bases. PloS one, 7, e36697.
43. Elliott, B., Richardson, C, Winderbaum, J., Jac, A., Jasin, M. and Nickoloff, J. A. C. A. (1998) Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells. 18.43. Elliott, B., Richardson, C., Winderbaum, J., Jac, A., Jasin, M. and Nickoloff, J. A. C. A. (1998) Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells Gene Conversion Tracts from Double-Strand Break Repair in Mammalian Cells Strand Break Repair in Mammalian Cells. 18.
44. Lombardo, A., Genovese, P., Beausejour, C. M., Colleoni, S., Lee, Y. -L., Kim, K. a, Ando, D., Urnov, F. D., Galli, C, Gregory, P. D., et al. (2007) Gene editing in human stem cells using zinc finger nucleases and integrase-defective lentiviral vector delivery. Nature biotechnology, 25, 1298-306.44. Lombardo, A., Genovese, P., Beausejour, C. M., Colleoni, S., Lee, Y.-L., Kim, K. a, Ando, D., Urnov, F. D., Galli, C, Gregory, P. D., et al. (2007) Gene editing in human stem cells using zinc finger nucleases and integrase-defective lentiviral vector delivery. Nature biotechnology, 25, 1298-306.
45. Jinek, M., Chylinski, K., Fonfara, I, Hauer, M., Doudna, J. a and Charpentier, E. (2012) A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science (New York, N. Y.), 337, 816-21.45. Jinek, M., Chylinski, K., Fonfara, I, Hauer, M., Doudna, J. a and Charpentier, E. (2012) A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity. Science (New York, N.Y.), 337, 816-21.
46. Shrivastav, M., De Haro, L. P. and NickoloffJ. a (2008) Regulation of DNA double-strand break repair pathway choice. Cell research, 18, 134-47.46. Shrivastav, M., De Haro, L. P. and Nickoloff J. a (2008) Regulation of DNA double-strand break repair pathway choice. Cell research, 18, 134-47.
47. Kim, Y. G., Cha, J. and Chandrasegaran, S. (1996) Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proceedings of the National Academy of Sciences of the United States of America, 93, 1156-60.47. Kim, Y. G., Cha, J. and Chandrasegaran, S. (1996) Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proceedings of the National Academy of Sciences of the United States of America, 93, 1156-60.
48. Mimitou, E. P. and Symington, L. S. (2008) Sae2, Exol and Sgsl collaborate in DNA double-strand break processing. Nature, 455, 7701.48. Mimitou, E. P. and Symington, L. S. (2008) Sae2, Exol and Sgsl collaborate in DNA double-strand break processing. Nature, 455, 7701.
49. Doyon, Y., Choi, V. M., Xia, D. F., Vo, T. D., Gregory, P. D. and Holmes, M. C. (2010) Transient cold shock enhances zinc-finger nuclease-mediated gene disruption. Nature methods, 7, 459-60.49. Doyon, Y., Choi, V. M., Xia, D. F., Vo, T. D., Gregory, P. D. and Holmes, M. C. (2010) Transient cold shock enhances zinc-finger nuclease-mediated gene disruption. Nature methods, 7, 459-60.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
<110> Church, George<110> Church, George
Yang, LuhanYang, Luhan
Cargol, MarcCargol, Marc
Yang, JoyceYang, Joyce
<120> Genome Engineering<120> Genome Engineering
<130> 010498.00517<130> 010498.00517
<140> PCT/US14/048140<140> PCT/US14/048140
<141> 2014-06-30<141> 2014-06-30
<150> US 61/858,866<150> US 61/858,866
<151> 2013-07-26<151> 2013-07-26
<160> 224<160> 224
<170> PatentIn version 3.5<170> Patent In version 3.5
<210> 1<210> 1
<211> 15<211> 15
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Oligonucleotide sequence<223> Oligonucleotide sequence
<400> 1<400> 1
tggggcaagc ttctg 15tggggcaagc ttctg 15
<210> 2<210> 2
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> TALE template<223> TALE template
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 2<400> 2
ctaaccccag agcaggtcgt ggcaatcgcc tccnnnnnng gcggaaaaca ggcattggaa 60ctaaccccag agcaggtcgt ggcaatcgcc tccnnnnnng gcggaaaaca ggcattggaa 60
acagtacagc ggctgctgcc ggtgctgtgc caagcgcacg ga 102acagtacagc ggctgctgcc ggtgctgtgc caagcgcacg ga 102
<210> 3<210> 3
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 3<400> 3
ctaacccctg aacaggtagt cgctatagct tcannnnnng ggggcaagca agcacttgag 60ctaacccctg aacaggtagt cgctatagct tcannnnnng ggggcaagca agcacttgag 60
accgttcaac gactcctgcc agtgctctgc caagcccatg ga 102accgttcaac gactcctgcc agtgctctgc caagcccatg ga 102
<210> 4<210> 4
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 4<400> 4
ttgactccgg agcaagtcgt cgcgatcgcg agcnnnnnng gggggaagca ggcgctggaa 60ttgactccgg agcaagtcgt cgcgatcgcg agcnnnnnnng gggggaagca ggcgctggaa 60
actgttcaga gactgctgcc tgtactttgt caggcgcatg gt 102actgttcaga gactgctgcc tgtactttgt caggcgcatg gt 102
<210> 5<210> 5
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 5<400> 5
ctcacccccg aacaggttgt cgcaatagca agtnnnnnng gcggtaagca agccctagag 60ctcacccccg aacaggttgt cgcaatagca agtnnnnnng gcggtaagca agccctagag 60
actgtgcaac gcctgctccc cgtgctgtgt caggctcacg gt 102actgtgcaac gcctgctccc cgtgctgtgt caggctcacg gt 102
<210> 6<210> 6
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 6<400> 6
ctgacacctg aacaagttgt cgcgatagcc agtnnnnnng ggggaaaaca agctctagaa 60ctgacacctg aacaagttgt cgcgatagcc agtnnnnnng ggggaaaaca agctctagaa 60
acggttcaaa ggttgttgcc cgttctgtgc caagcacatg gg 102acggttcaaa ggttgttgcc cgttctgtgc caagcacatg gg 102
<210> 7<210> 7
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 7<400> 7
ttaacacccg aacaagtagt agcgatagcg tcannnnnng ggggtaaaca ggctttggag 60ttaacacccg aacaagtagt agcgatagcg tcannnnnng ggggtaaaca ggctttggag 60
acggtacagc ggttattgcc ggtcctctgc caggcccacg ga 102acggtacagc ggttattgcc ggtcctctgc caggcccacg ga 102
<210> 8<210> 8
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 8<400> 8
cttacgccag aacaggtggt tgcaattgcc tccnnnnnng gcgggaaaca agcgttggaa 60cttacgccag aacaggtggt tgcaattgcc tccnnnnnnng gcgggaaaca agcgttggaa 60
actgtgcaga gactccttcc tgttttgtgt caagcccacg gc 102actgtgcaga gactccttcc tgttttgtgt caagcccacg gc 102
<210> 9<210> 9
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 9<400> 9
ttgacgcctg agcaggttgt ggccatcgct agcnnnnnng gagggaagca ggctcttgaa 60ttgacgcctg agcaggttgt ggccatcgct agcnnnnnnng gagggaagca ggctcttgaa 60
accgtacagc gacttctccc agttttgtgc caagctcacg gg 102accgtacagc gacttctccc agttttgtgc caagctcacg gg 102
<210> 10<210> 10
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 10<400> 10
ctaacccccg agcaagtagt tgccatagca agcnnnnnng gaggaaaaca ggcattagaa 60ctaacccccg agcaagtagt tgccatagca agcnnnnnnng gaggaaaaca ggcattagaa 60
acagttcagc gcttgctccc ggtactctgt caggcacacg gt 102acagttcagc gcttgctccc ggtactctgt caggcacacg gt 102
<210> 11<210> 11
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 11<400> 11
ctaactccgg aacaggtcgt agccattgct tccnnnnnng gcggcaaaca ggcgctagag 60ctaactccgg aacaggtcgt agccattgct tccnnnnnnng gcggcaaaca ggcgctagag 60
acagtccaga ggctcttgcc tgtgttatgc caggcacatg gc 102acagtccaga ggctcttgcc tgtgttatgc caggcacatg gc 102
<210> 12<210> 12
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 12<400> 12
ctcaccccgg agcaggtcgt tgccatcgcc agtnnnnnng gcggaaagca agctctcgaa 60ctcaccccgg agcaggtcgt tgccatcgcc agtnnnnnng gcggaaagca agctctcgaa 60
acagtacaac ggctgttgcc agtcctatgt caagctcatg ga 102acagtacaac ggctgttgcc agtcctatgt caagctcatg ga 102
<210> 13<210> 13
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 13<400> 13
ctgacgcccg agcaggtagt ggcaatcgca tctnnnnnng gaggtaaaca agcactcgag 60ctgacgcccg agcaggtagt ggcaatcgca tctnnnnnng gaggtaaaca agcactcgag 60
actgtccaaa gattgttacc cgtactatgc caagcgcatg gt 102actgtccaaa gattgttacc cgtactatgc caagcgcatg gt 102
<210> 14<210> 14
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 14<400> 14
ttaaccccag agcaagttgt ggctattgca tctnnnnnng gtggcaaaca agccttggag 60ttaaccccag agcaagttgt ggctattgca tctnnnnnnng gtggcaaaca agccttggag 60
acagtgcaac gattactgcc tgtcttatgt caggcccatg gc 102acagtgcaac gattactgcc tgtcttatgt caggcccatg gc 102
<210> 15<210> 15
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 15<400> 15
cttactcctg agcaagtcgt agctatcgcc agcnnnnnng gtgggaaaca ggccctggaa 60cttactcctg agcaagtcgt agctatcgcc agcnnnnnng gtgggaaaca ggccctggaa 60
accgtacaac gtctcctccc agtactttgt caagcacacg gg 102accgtacaac gtctcctccc agtactttgt caagcacacg gg 102
<210> 16<210> 16
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 16<400> 16
ttgacaccgg aacaagtggt ggcgattgcg tccnnnnnng gaggcaagca ggcactggag 60ttgacaccgg aacaagtggt ggcgattgcg tccnnnnnng gaggcaagca ggcactggag 60
accgtccaac ggcttcttcc ggttctttgc caggctcatg gg 102accgtccaac ggcttcttcc ggttctttgc caggctcatg gg 102
<210> 17<210> 17
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 17<400> 17
ctcacgccag agcaggtggt agcaatagcg tcgnnnnnng gtggtaagca agcgcttgaa 60ctcacgccag agcaggtggt agcaatagcg tcgnnnnnng gtggtaagca agcgcttgaa 60
acggtccagc gtcttctgcc ggtgttgtgc caggcgcacg ga 102acggtccagc gtcttctgcc ggtgttgtgc caggcgcacg ga 102
<210> 18<210> 18
<211> 102<211> 102
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 18<400> 18
ctcacaccag aacaagtggt tgctattgct agtnnnnnng gtggaaagca ggccctcgag 60ctcacaccag aacaagtggt tgctattgct agtnnnnnng gtggaaagca ggccctcgag 60
acggtgcaga ggttacttcc cgtcctctgt caagcgcacg gc 102acggtgcaga ggttacttcc cgtcctctgt caagcgcacg gc 102
<210> 19<210> 19
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (34)..(39)<222> (34)..(39)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 19<400> 19
ctcactccag agcaagtggt tgcgatcgct tcannnnnng gtggaagacc tgccctggaa 60ctcactccag agcaagtggt tgcgatcgct tcannnnnng gtggaagacc tgccctggaa 60
<210> 20<210> 20
<211> 5714<211> 5714
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Oligonucleotide sequence encoding TALEN backbone<223> Oligonucleotide sequence encoding TALEN backbone
<400> 20<400> 20
atgtcgcgga cccggctccc ttccccaccc gcacccagcc cagcgttttc ggccgactcg 60atgtcgcgga cccggctccc ttccccaccc gcacccagcc cagcgttttc ggccgactcg 60
ttctcagacc tgcttaggca gttcgacccc tcactgttta acacatcgtt gttcgactcc 120ttctcagacc tgcttaggca gttcgacccc tcactgttta acacatcgtt gttcgactcc 120
cttcctccgt ttggggcgca ccatacggag gcggccaccg gggagtggga tgaggtgcag 180cttcctccgt ttggggcgca ccatacggag gcggccaccg gggagtggga tgaggtgcag 180
tcgggattga gagctgcgga tgcaccaccc ccaaccatgc gggtggccgt caccgctgcc 240tcgggattga gagctgcgga tgcaccaccc ccaaccatgc gggtggccgt caccgctgcc 240
cgaccgccga gggcgaagcc cgcaccaagg cggagggcag cgcaaccgtc cgacgcaagc 300cgaccgccga gggcgaagcc cgcaccaagg cggagggcag cgcaaccgtc cgacgcaagc 300
cccgcagcgc aagtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 360cccgcagcgc aagtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 360
aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 420aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 420
acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 480acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 480
aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 540aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 540
gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc gggagagctg 600gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc ggggagagctg 600
agagggcctc cccttcagct ggacacgggc cagttgctga agatcgcgaa gcggggagga 660agaggcctc cccttcagct ggacacggggc cagttgctga agatcgcgaa gcggggagga 660
gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 720gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 720
agttcacgct gacagagacc gcggccgcat taggcacccc aggctttaca ctttatgctt 780agttcacgct gacagagacc gcggccgcat taggcacccc aggctttaca ctttatgctt 780
ccggctcgta taatgtgtgg attttgagtt aggatccgtc gagattttca ggagctaagg 840ccggctcgta taatgtgtgg attttgagtt aggatccgtc gagattttca ggagctaagg 840
aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 900aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 900
gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 960gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 960
agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg
10201020
cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga
10801080
aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc
11401140
aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac
12001200
acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt
12601260
ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt
13201320
taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata
13801380
cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg
14401440
gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg
15001500
gggcgtaaag atctggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg gggcgtaaag atctggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg
15601560
ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag
16201620
gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa
16801680
ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt
17401740
cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg
18001800
tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa
18601860
ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat
19201920
tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga
19801980
taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat
20402040
gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag
21002100
ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc
21602160
aggctccctt atacacagcc agtctgcagg tcgacggtct cgctcttcga aggttacttc aggctccctt atacacagcc agtctgcagg tcgacggtct cgctcttcga aggttacttc
22202220
ccgtcctctg tcaagcgcac ggcctcactc cagagcaagt ggttgcgatc gcttcaaaca ccgtcctctg tcaagcgcac ggcctcactc cagagcaagt ggttgcgatc gcttcaaaca
22802280
acggtggaag acctgccctg gaatcaatcg tggcccagct ttcgaggccg gaccccgcgc acggtggaag acctgccctg gaatcaatcg tggcccagct ttcgaggccg gaccccgcgc
23402340
tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga cgacccgcct tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga cgacccgcct
24002400
tggatgcggt gaagaagggg ctcccgcacg cgcctgcatt gattaagcgg accaacagaa tggatgcggt gaagaagggg ctcccgcacg cgcctgcatt gattaagcgg accaacagaa
24602460
ggattcccga gaggacatca catcgagtgg caggttccca actcgtgaag agtgaacttg ggattcccga gaggacatca catcgagtgg caggttccca actcgtgaag agtgaacttg
25202520
aggagaaaaa gtcggagctg cggcacaaat tgaaatacgt accgcatgaa tacatcgaac aggagaaaaa gtcggagctg cggcacaaat tgaaatacgt accgcatgaa tacatcgaac
25802580
ttatcgaaat tgctaggaac tcgactcaag acagaatcct tgagatgaag gtaatggagt ttatcgaaat tgctaggaac tcgactcaag acagaatcct tgagatgaag gtaatggagt
26402640
tctttatgaa ggtttatgga taccgaggga agcatctcgg tggatcacga aaacccgacg tctttatgaa ggtttatgga taccgaggga agcatctcgg tggatcacga aaacccgacg
27002700
gagcaatcta tacggtgggg agcccgattg attacggagt gatcgtcgac acgaaagcct gagcaatcta tacggtgggg agcccgattg attacggagt gatcgtcgac acgaaagcct
27602760
acagcggtgg gtacaatctt cccatcgggc aggcagatga gatgcaacgt tatgtcgaag acagcggtgg gtacaatctt cccatcgggc aggcagatga gatgcaacgt tatgtcgaag
28202820
aaaatcagac caggaacaaa cacatcaatc caaatgagtg gtggaaagtg tatccttcat aaaatcagac caggaacaaa cacatcaatc caaatgagtg gtggaaagtg tatccttcat
28802880
cagtgaccga gtttaagttt ttgtttgtct ctgggcattt caaaggcaac tataaggccc cagtgaccga gtttaagttt ttgtttgtct ctgggcattt caaaggcaac tataaggccc
29402940
agctcacacg gttgaatcac attacgaact gcaatggtgc ggttttgtcc gtagaggaac agctcacacg gttgaatcac attacgaact gcaatggtgc ggttttgtcc gtagaggaac
30003000
tgctcattgg tggagaaatg atcaaagcgg gaactctgac actggaagaa gtcagacgca tgctcattgg tggagaaatg atcaaagcgg gaactctgac actggaagaa gtcagacgca
30603060
agtttaacaa tggcgagatc aatttccgca agctaaaatg gagaaaaaaa tcactggata agtttaacaa tggcgagatc aatttccgca agctaaaatg gagaaaaaaa tcactggata
31203120
taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt taccaccgtt gatatatccc aatggcatcg taaagaacat tttgaggcat ttcagtcagt
31803180
tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt taaagaccgt tgctcaatgt acctataacc agaccgttca gctggatatt acggcctttt taaagaccgt
32403240
aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc gcctgatgaa aaagaaaaat aagcacaagt tttatccggc ctttattcac attcttgccc gcctgatgaa
33003300
tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat gggatagtgt tgctcatccg gaattccgta tggcaatgaa agacggtgag ctggtgatat gggatagtgt
33603360
tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc tctggagtga tcacccttgt tacaccgttt tccatgagca aactgaaacg ttttcatcgc tctggagtga
34203420
ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg cgtgttacgg ataccacgac gatttccggc agtttctaca catatattcg caagatgtgg cgtgttacgg
34803480
tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg tctcagccaa tgaaaacctg gcctatttcc ctaaagggtt tattgagaat atgtttttcg tctcagccaa
35403540
tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca acttcttcgc tccctgggtg agtttcacca gttttgattt aaacgtggcc aatatggaca acttcttcgc
36003600
ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga tgccgctggc ccccgttttc accatgggca aatattatac gcaaggcgac aaggtgctga tgccgctggc
36603660
gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt gattcaggtt catcatgccg tttgtgatgg cttccatgtc ggcagaatgc ttaatgaatt
37203720
acaacagtac tgcgatgagt ggcagggcgg ggcgtaaaga tctggatccg gcttactaaa acaacagtac tgcgatgagt ggcagggcgg ggcgtaaaga tctggatccg gcttactaaa
37803780
agccagataa cagtatgcgt atttgcgcgc tgatttttgc ggtataagaa tatatactga agccagataa cagtatgcgt atttgcgcgc tgatttttgc ggtataagaa tatatactga
38403840
tatgtatacc cgaagtatgt caaaaagagg tatgctatga agcagcgtat tacagtgaca tatgtatacc cgaagtatgt caaaaagagg tatgctatga agcagcgtat tacagtgaca
39003900
gttgacagcg acagctatca gttgctcaag gcatatatga tgtcaatatc tccggtctgg gttgacagcg acagctatca gttgctcaag gcatatatga tgtcaatatc tccggtctgg
39603960
taagcacaac catgcagaat gaagcccgtc gtctgcgtgc cgaacgctgg aaagcggaaa taagcacaac catgcagaat gaagcccgtc gtctgcgtgc cgaacgctgg aaagcggaaa
40204020
atcaggaagg gatggctgag gtcgcccggt ttattgaaat gaacggctct tttgctgacg atcaggaagg gatggctgag gtcgcccggt ttattgaaat gaacggctct tttgctgacg
40804080
agaacagggg ctggtgaaat gcagtttaag gtttacacct ataaaagaga gagccgttat agaacagggg ctggtgaaat gcagtttaag gtttacacct ataaaagaga gagccgttat
41404140
cgtctgtttg tggatgtaca gagtgatatt attgacacgc ccgggcgacg gatggtgatc cgtctgtttg tggatgtaca gagtgatatt attgacacgc ccgggcgacg gatggtgatc
42004200
cccctggcca gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg cccctggcca gtgcacgtct gctgtcagat aaagtctccc gtgaacttta cccggtggtg
42604260
catatcgggg atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtctcc catatcgggg atgaaagctg gcgcatgatg accaccgata tggccagtgt gccggtctcc
43204320
gttatcgggg aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt gttatcgggg aagaagtggc tgatctcagc caccgcgaaa atgacatcaa aaacgccatt
43804380
aacctgatgt tctggggaat ataaatgtca ggctccctta tacacagcca gtctgcaggt aacctgatgt tctggggaat ataaatgtca ggctccctta tacacagcca gtctgcaggt
44404440
cgacggtctc gctcttcgaa ggttacttcc cgtcctctgt caagcgcacg gcctcactcc cgacggtctc gctcttcgaa ggttacttcc cgtcctctgt caagcgcacg gcctcactcc
45004500
agagcaagtg gttgcgatcg cttcaaacaa cggtggaaga cctgccctgg aatcaatcgt agagcaagtg gttgcgatcg cttcaaacaa cggtggaaga cctgccctgg aatcaatcgt
45604560
ggcccagctt tcgaggccgg accccgcgct ggccgcactc actaatgatc atcttgtagc ggcccagctt tcgaggccgg accccgcgct ggccgcactc actaatgatc atcttgtagc
46204620
gctggcctgc ctcggcggac gacccgcctt ggatgcggtg aagaaggggc tcccgcacgc gctggcctgc ctcggcggac gacccgcctt ggatgcggtg aagaaggggc tcccgcacgc
46804680
gcctgcattg attaagcgga ccaacagaag gattcccgag aggacatagc cccaagaaga gcctgcattg attaagcgga ccaacagaag gattcccgag aggacatagc cccaagaaga
47404740
agagaaaggt ggaggccagc ggttccggac gggctgacgc attggacgat tttgatctgg agagaaaggt ggaggccagc ggttccggac gggctgacgc attggacgat tttgatctgg
48004800
atatgctggg aagtgacgcc ctcgatgatt ttgaccttga catgcttggt tcggatgccc atatgctggg aagtgacgcc ctcgatgatt ttgaccttga catgcttggt tcggatgccc
48604860
ttgatgactt tgacctcgac atgctcggca gtgacgccct tgatgatttc gacctggaca ttgatgactt tgacctcgac atgctcggca gtgacgccct tgatgatttc gacctggaca
49204920
tgctgattaa ctctagaggc agtggagagg gcagaggaag tctgctaaca tgcggtgacg tgctgattaa ctctagaggc agtggagagg gcagaggaag tctgctaaca tgcggtgacg
49804980
tcgaggagaa tcctggccca gtgagcaagg gcgaggagct gttcaccggg gtggtgccca tcgaggagaa tcctggccca gtgagcaagg gcgaggagct gttcaccggg gtggtgccca
50405040
tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgagggcg tcctggtcga gctggacggc gacgtaaacg gccacaagtt cagcgtgtcc ggcgaggcg
51005100
agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc agggcgatgc cacctacggc aagctgaccc tgaagttcat ctgcaccacc ggcaagctgc
51605160
ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg cgtgcagtgc ttcagccgct
52205220
accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc accccgacca catgaagcag cacgacttct tcaagtccgc catgcccgaa ggctacgtcc
52805280
aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt aggagcgcac catcttcttc aaggacgacg gcaactacaa gacccgcgcc gaggtgaagt
53405340
tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg tcgagggcga caccctggtg aaccgcatcg agctgaaggg catcgacttc aaggaggacg
54005400
gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg gcaacatcct ggggcacaag ctggagtaca actacaacag ccacaacgtc tatatcatgg
54605460
ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg ccgacaagca gaagaacggc atcaaggtga acttcaagat ccgccacaac atcgaggacg
55205520
gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc gcagcgtgca gctcgccgac cactaccagc agaacacccc catcggcgac ggccccgtgc
55805580
tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga tgctgcccga caaccactac ctgagcaccc agtccgccct gagcaaagac cccaacgaga
56405640
agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg agcgcgatca catggtcctg ctggagttcg tgaccgccgc cgggatcact ctcggcatgg
57005700
acgagctgta caag 5714acgagctgta caag 5714
<210> 21<210> 21
<211> 3465<211> 3465
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Oligonucleotide sequence encoding TALE backbone sequence<223> Oligonucleotide sequence encoding TALE backbone sequence
<400> 21<400> 21
atgtcgcgga cccggctccc ttccccaccc gcacccagcc cagcgttttc ggccgactcg 60atgtcgcgga cccggctccc ttccccaccc gcacccagcc cagcgttttc ggccgactcg 60
ttctcagacc tgcttaggca gttcgacccc tcactgttta acacatcgtt gttcgactcc 120ttctcagacc tgcttaggca gttcgacccc tcactgttta acacatcgtt gttcgactcc 120
cttcctccgt ttggggcgca ccatacggag gcggccaccg gggagtggga tgaggtgcag 180cttcctccgt ttggggcgca ccatacggag gcggccaccg gggagtggga tgaggtgcag 180
tcgggattga gagctgcgga tgcaccaccc ccaaccatgc gggtggccgt caccgctgcc 240tcgggattga gagctgcgga tgcaccaccc ccaaccatgc gggtggccgt caccgctgcc 240
cgaccgccga gggcgaagcc cgcaccaagg cggagggcag cgcaaccgtc cgacgcaagc 300cgaccgccga gggcgaagcc cgcaccaagg cggagggcag cgcaaccgtc cgacgcaagc 300
cccgcagcgc aagtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 360cccgcagcgc aagtagattt gagaactttg ggatattcac agcagcagca ggaaaagatc 360
aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 420aagcccaaag tgaggtcgac agtcgcgcag catcacgaag cgctggtggg tcatgggttt 420
acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 480acacatgccc acatcgtagc cttgtcgcag caccctgcag cccttggcac ggtcgccgtc 480
aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 540aagtaccagg acatgattgc ggcgttgccg gaagccacac atgaggcgat cgtcggtgtg 540
gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc gggagagctg 600gggaaacagt ggagcggagc ccgagcgctt gaggccctgt tgacggtcgc ggggagagctg 600
agagggcctc cccttcagct ggacacgggc cagttgctga agatcgcgaa gcggggagga 660agaggcctc cccttcagct ggacacggggc cagttgctga agatcgcgaa gcggggagga 660
gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 720gtcacggcgg tcgaggcggt gcacgcgtgg cgcaatgcgc tcacgggagc acccctcaac 720
agttcacgct gacagagacc gcggccgcat taggcacccc aggctttaca ctttatgctt 780agttcacgct gacagagacc gcggccgcat taggcacccc aggctttaca ctttatgctt 780
ccggctcgta taatgtgtgg attttgagtt aggatccgtc gagattttca ggagctaagg 840ccggctcgta taatgtgtgg attttgagtt aggatccgtc gagattttca ggagctaagg 840
aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 900aagctaaaat ggagaaaaaa atcactggat ataccaccgt tgatatatcc caatggcatc 900
gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 960gtaaagaaca ttttgaggca tttcagtcag ttgctcaatg tacctataac cagaccgttc 960
agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg agctggatat tacggccttt ttaaagaccg taaagaaaaa taagcacaag ttttatccgg
10201020
cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga cctttattca cattcttgcc cgcctgatga atgctcatcc ggaattccgt atggcaatga
10801080
aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc aagacggtga gctggtgata tgggatagtg ttcacccttg ttacaccgtt ttccatgagc
11401140
aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac aaactgaaac gttttcatcg ctctggagtg aataccacga cgatttccgg cagtttctac
12001200
acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt acatatattc gcaagatgtg gcgtgttacg gtgaaaacct ggcctatttc cctaaagggt
12601260
ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt ttattgagaa tatgtttttc gtctcagcca atccctgggt gagtttcacc agttttgatt
13201320
taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata taaacgtggc caatatggac aacttcttcg cccccgtttt caccatgggc aaatattata
13801380
cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg cgcaaggcga caaggtgctg atgccgctgg cgattcaggt tcatcatgcc gtttgtgatg
14401440
gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg gcttccatgt cggcagaatg cttaatgaat tacaacagta ctgcgatgag tggcagggcg
15001500
gggcgtaaag atctggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg gggcgtaaag atctggatcc ggcttactaa aagccagata acagtatgcg tatttgcgcg
15601560
ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag ctgatttttg cggtataaga atatatactg atatgtatac ccgaagtatg tcaaaaagag
16201620
gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa gtatgctatg aagcagcgta ttacagtgac agttgacagc gacagctatc agttgctcaa
16801680
ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt ggcatatatg atgtcaatat ctccggtctg gtaagcacaa ccatgcagaa tgaagcccgt
17401740
cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg cgtctgcgtg ccgaacgctg gaaagcggaa aatcaggaag ggatggctga ggtcgcccgg
18001800
tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa tttattgaaa tgaacggctc ttttgctgac gagaacaggg gctggtgaaa tgcagtttaa
18601860
ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat ggtttacacc tataaaagag agagccgtta tcgtctgttt gtggatgtac agagtgatat
19201920
tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga tattgacacg cccgggcgac ggatggtgat ccccctggcc agtgcacgtc tgctgtcaga
19801980
taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat taaagtctcc cgtgaacttt acccggtggt gcatatcggg gatgaaagct ggcgcatgat
20402040
gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag gaccaccgat atggccagtg tgccggtctc cgttatcggg gaagaagtgg ctgatctcag
21002100
ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc ccaccgcgaa aatgacatca aaaacgccat taacctgatg ttctggggaa tataaatgtc
21602160
aggctccctt atacacagcc agtctgcagg tcgacggtct cgctcttcga aggttacttc aggctccctt atacacagcc agtctgcagg tcgacggtct cgctcttcga aggttacttc
22202220
ccgtcctctg tcaagcgcac ggcctcactc cagagcaagt ggttgcgatc gcttcaaaca ccgtcctctg tcaagcgcac ggcctcactc cagagcaagt ggttgcgatc gcttcaaaca
22802280
acggtggaag acctgccctg gaatcaatcg tggcccagct ttcgaggccg gaccccgcgc acggtggaag acctgccctg gaatcaatcg tggcccagct ttcgaggccg gaccccgcgc
23402340
tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga cgacccgcct tggccgcact cactaatgat catcttgtag cgctggcctg cctcggcgga cgacccgcct
24002400
tggatgcggt gaagaagggg ctcccgcacg cgcctgcatt gattaagcgg accaacagaa tggatgcggt gaagaagggg ctcccgcacg cgcctgcatt gattaagcgg accaacagaa
24602460
ggattcccga gaggacatag ccccaagaag aagagaaagg tggaggccag cggttccgga ggattcccga gaggacatag ccccaagaag aagagaaagg tggaggccag cggttccgga
25202520
cgggctgacg cattggacga ttttgatctg gatatgctgg gaagtgacgc cctcgatgat cgggctgacg cattggacga ttttgatctg gatatgctgg gaagtgacgc cctcgatgat
25802580
tttgaccttg acatgcttgg ttcggatgcc cttgatgact ttgacctcga catgctcggc tttgaccttg acatgcttgg ttcggatgcc cttgatgact ttgacctcga catgctcggc
26402640
agtgacgccc ttgatgattt cgacctggac atgctgatta actctagagg cagtggagag agtgacgccc ttgatgattt cgacctggac atgctgatta actctagagg cagtggagag
27002700
ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga atcctggccc agtgagcaag ggcagaggaa gtctgctaac atgcggtgac gtcgaggaga atcctggccc agtgagcaag
27602760
ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac
28202820
ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc
28802880
ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc
29402940
ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc
30003000
ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac
30603060
ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc
31203120
gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac
31803180
aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg
32403240
aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag
33003300
cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc
33603360
cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc
34203420
gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaag 3465gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaag 3465
<210> 22<210> 22
<211> 1368<211> 1368
<212> PRT<212>PRT
<213> Streptococcus pyogenes<213> Streptococcus pyogenes
<400> 22<400> 22
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser ValMet Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 151 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys PheGly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 3020 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu IleLys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 4535 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg LeuGly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 6050 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile CysLys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 8065 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp SerTyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 9585 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys LysPhe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala TyrHis Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val AspHis Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala HisSer Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn ProMet Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr TyrAsp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp AlaAsn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu AsnLys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly AsnLeu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn PheLeu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr AspAsp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala AspAsp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser AspLeu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala SerIle Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu LysMet Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe PheAla Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala SerAsp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met AspGln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu ArgGly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His LeuLys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro PheGly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg IleLeu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala TrpPro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu GluMet Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met ThrVal Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His SerAsn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val LysLeu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu GlnTyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val ThrLys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe AspVal Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu GlySer Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu AspThr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu ThrAsn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr AlaLeu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg TyrHis Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg AspThr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly PheLys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr PheAla Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser LeuLys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys GlyHis Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met GlyIle Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn GlnArg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg IleThr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His ProGlu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr LeuVal Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn ArgGln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu LysLeu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn ArgAsp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met LysGly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg LysAsn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu AspPhe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile ThrLys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr AspLys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerGlu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val ArgLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValGlu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu PheVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile AlaVal Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 10201010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe PheLys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 10351025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu AlaTyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 10501040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly GluAsn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 10651055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr ValThr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 10801070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys ThrArg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 10951085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro LysGlu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 11101100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp ProArg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 11251115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser ValLys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 11401130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu LysLeu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 11551145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser SerSer Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 11701160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr LysPhe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 11851175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser LeuGlu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 12001190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala GlyPhe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 12151205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr ValGlu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 12301220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly SerAsn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 12451235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His LysPro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 12601250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser LysHis Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 12751265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser AlaArg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 12901280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu AsnTyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 13051295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala AlaIle Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 13201310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr SerPhe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 13351325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile ThrThr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 13501340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly AspGly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 13651355 1360 1365
<210> 23<210> 23
<211> 82<211> 82
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Oligonucleotide sequence<223> Oligonucleotide sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (41)..(41)<222> (41)..(41)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 23<400> 23
ttcttggctt tatatatctt gtggaaagga cgaaacaccg ngttttagag ctagaaatag 60ttcttggctt tatatatctt gtggaaagga cgaaacaccg ngttttagag ctagaaatag 60
caagttaaaa taaggctagt cc 82caagttaaaa taaggctagt cc 82
<210> 24<210> 24
<211> 1692<211> 1692
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Oligonucleotide sequence encoding re-TALE<223> Oligonucleotide sequence encoding re-TALE
<400> 24<400> 24
ctaacccctg aacaggtagt cgctatagct tcaaatatcg ggggcaagca agcacttgag 60ctaacccctg aacaggtagt cgctatagct tcaaatatcg ggggcaagca agcacttgag 60
accgttcaac gactcctgcc agtgctctgc caagcccatg gattgactcc ggagcaagtc 120accgttcaac gactcctgcc agtgctctgc caagcccatg gattgactcc ggagcaagtc 120
gtcgcgatcg cgagcaacgg cggggggaag caggcgctgg aaactgttca gagactgctg 180gtcgcgatcg cgagcaacgg cggggggaag caggcgctgg aaactgttca gagactgctg 180
cctgtacttt gtcaggcgca tggtctcacc cccgaacagg ttgtcgcaat agcaagtaat 240cctgtacttt gtcaggcgca tggtctcacc cccgaacagg ttgtcgcaat agcaagtaat 240
ataggcggta agcaagccct agagactgtg caacgcctgc tccccgtgct gtgtcaggct 300ataggcggta agcaagccct agagactgtg caacgcctgc tccccgtgct gtgtcaggct 300
cacggtctga cacctgaaca agttgtcgcg atagccagtc acgacggggg aaaacaagct 360cacggtctga cacctgaaca agttgtcgcg atagccagtc acgacggggg aaaacaagct 360
ctagaaacgg ttcaaaggtt gttgcccgtt ctgtgccaag cacatgggtt aacacccgaa 420ctagaaacgg ttcaaaggtt gttgcccgtt ctgtgccaag cacatgggtt aacacccgaa 420
caagtagtag cgatagcgtc aaataacggg ggtaaacagg ctttggagac ggtacagcgg 480caagtagtag cgatagcgtc aaataacggg ggtaaacagg ctttggagac ggtacagcgg 480
ttattgccgg tcctctgcca ggcccacgga cttacgccag aacaggtggt tgcaattgcc 540ttattgccgg tcctctgcca ggcccacgga cttacgccag aacaggtggt tgcaattgcc 540
tccaacatcg gcgggaaaca agcgttggaa actgtgcaga gactccttcc tgttttgtgt 600tccaacatcg gcgggaaaca agcgttggaa actgtgcaga gactccttcc tgttttgtgt 600
caagcccacg gcttgacgcc tgagcaggtt gtggccatcg ctagccacga cggagggaag 660caagcccacg gcttgacgcc tgagcaggtt gtggccatcg ctagccacga cggagggaag 660
caggctcttg aaaccgtaca gcgacttctc ccagttttgt gccaagctca cgggctaacc 720caggctcttg aaaccgtaca gcgacttctc ccagttttgt gccaagctca cgggctaacc 720
cccgagcaag tagttgccat agcaagcaac ggaggaggaa aacaggcatt agaaacagtt 780cccgagcaag tagttgccat agcaagcaac ggagggaggaa aacaggcatt agaaacagtt 780
cagcgcttgc tcccggtact ctgtcaggca cacggtctaa ctccggaaca ggtcgtagcc 840cagcgcttgc tcccggtact ctgtcaggca cacggtctaa ctccggaaca ggtcgtagcc 840
attgcttccc atgatggcgg caaacaggcg ctagagacag tccagaggct cttgcctgtg 900attgcttccc atgatggcgg caaacaggcg ctagagacag tccagaggct cttgcctgtg 900
ttatgccagg cacatggcct caccccggag caggtcgttg ccatcgccag taatatcggc 960ttatgccagg cacatggcct caccccggag caggtcgttg ccatcgccag taatatcggc 960
ggaaagcaag ctctcgaaac agtacaacgg ctgttgccag tcctatgtca agctcatgga ggaaagcaag ctctcgaaac agtacaacgg ctgttgccag tcctatgtca agctcatgga
10201020
ctgacgcccg agcaggtagt ggcaatcgca tctcacgatg gaggtaaaca agcactcgag ctgacgcccg agcaggtagt ggcaatcgca tctcacgatg gaggtaaaca agcactcgag
10801080
actgtccaaa gattgttacc cgtactatgc caagcgcatg gtttaacccc agagcaagtt actgtccaaa gattgttacc cgtactatgc caagcgcatg gtttaacccc agagcaagtt
11401140
gtggctattg catctaacgg cggtggcaaa caagccttgg agacagtgca acgattactg gtggctattg catctaacgg cggtggcaaa caagccttgg agacagtgca acgattactg
12001200
cctgtcttat gtcaggccca tggccttact cctgagcaag tcgtagctat cgccagcaac cctgtcttat gtcaggccca tggccttact cctgagcaag tcgtagctat cgccagcaac
12601260
ataggtggga aacaggccct ggaaaccgta caacgtctcc tcccagtact ttgtcaagca ataggtggga aacaggccct ggaaaccgta caacgtctcc tcccagtact ttgtcaagca
13201320
cacgggttga caccggaaca agtggtggcg attgcgtcca acggcggagg caagcaggca cacgggttga caccggaaca agtggtggcg attgcgtcca acggcggagg caagcaggca
13801380
ctggagaccg tccaacggct tcttccggtt ctttgccagg ctcatgggct cacgccagag ctggagaccg tccaacggct tcttccggtt ctttgccagg ctcatgggct cacgccagag
14401440
caggtggtag caatagcgtc gaacatcggt ggtaagcaag cgcttgaaac ggtccagcgt caggtggtag caatagcgtc gaacatcggt ggtaagcaag cgcttgaaac ggtccagcgt
15001500
cttctgccgg tgttgtgcca ggcgcacgga ctcacaccag aacaagtggt tgctattgct cttctgccgg tgttgtgcca ggcgcacgga ctcacaccag aacaagtggt tgctattgct
15601560
agtaacaacg gtggaaagca ggccctcgag acggtgcaga ggttacttcc cgtcctctgt agtaacaacg gtggaaagca ggccctcgag acggtgcaga ggttacttcc cgtcctctgt
16201620
caagcgcacg gcctcactcc agagcaagtg gttgcgatcg cttcaaacaa tggtggaaga caagcgcacg gcctcactcc agagcaagtg gttgcgatcg cttcaaacaa tggtggaaga
16801680
cctgccctgg aa 1692cctgccctgg aa 1692
<210> 25<210> 25
<211> 237<211> 237
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (64)..(69)<222> (64)..(69)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (166)..(171)<222> (166)..(171)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 25<400> 25
cgcaatgcgc tcacgggagc acccctcaac ctaacccctg aacaggtagt cgctatagct 60cgcaatgcgc tcacgggagc acccctcaac ctaacccctg aacaggtagt cgctatagct 60
tcannnnnng ggggcaagca agcacttgag accgttcaac gactcctgcc agtgctctgc 120tcannnnnng ggggcaagca agcacttgag accgttcaac gactcctgcc agtgctctgc 120
caagcccatg gattgactcc ggagcaagtc gtcgcgatcg cgagcnnnnn nggggggaag 180caagcccatg gattgactcc ggagcaagtc gtcgcgatcg cgagcnnnnn nggggggaag 180
caggcgctgg aaactgttca gagactgctg cctgtacttt gtcaggcgca tggtctc 237caggcgctgg aaactgttca gagactgctg cctgtacttt gtcaggcgca tggtctc 237
<210> 26<210> 26
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 26<400> 26
agactgctgc ctgtactttg tcaggcgcat ggtctcaccc ccgaacaggt tgtcgcaata 60agactgctgc ctgtactttg tcaggcgcat ggtctcaccc ccgaacaggt tgtcgcaata 60
gcaagtnnnn nnggcggtaa gcaagcccta gagactgtgc aacgcctgct ccccgtgctg 120gcaagtnnnn nnggcggtaa gcaagcccta gagactgtgc aacgcctgct ccccgtgctg 120
tgtcaggctc acggtctgac acctgaacaa gttgtcgcga tagccagtnn nnnnggggga 180tgtcaggctc acggtctgac acctgaacaa gttgtcgcga tagccagtnn nnnnggggga 180
aaacaagctc tagaaacggt tcaaaggttg ttgcccgttc tgtgccaagc acatgggtta 240aaacaagctc tagaaacggt tcaaaggttg ttgcccgttc tgtgccaagc acatgggtta 240
<210> 27<210> 27
<211> 232<211> 232
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (59)..(64)<222> (59)..(64)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (161)..(166)<222> (161)..(166)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 27<400> 27
tgcgctcacg ggagcacccc tcaacctcac ccccgaacag gttgtcgcaa tagcaagtnn 60tgcgctcacg ggagcacccc tcaacctcac ccccgaacag gttgtcgcaa tagcaagtnn 60
nnnnggcggt aagcaagccc tagagactgt gcaacgcctg ctccccgtgc tgtgtcaggc 120nnnnggcggt aagcaagccc tagagactgt gcaacgcctg ctccccgtgc tgtgtcaggc 120
tcacggtctg acacctgaac aagttgtcgc gatagccagt nnnnnngggg gaaaacaagc 180tcacggtctg acacctgaac aagttgtcgc gatagccagt nnnnnngggg gaaaacaagc 180
tctagaaacg gttcaaaggt tgttgcccgt tctgtgccaa gcacatgggt ta 232tctagaaacg gttcaaaggt tgttgcccgt tctgtgccaa gcacatgggt ta 232
<210> 28<210> 28
<211> 246<211> 246
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 28<400> 28
aggttgttgc ccgttctgtg ccaagcacat gggttaacac ccgaacaagt agtagcgata 60aggttgttgc ccgttctgtg ccaagcacat gggttaacac ccgaacaagt agtagcgata 60
gcgtcannnn nngggggtaa acaggctttg gagacggtac agcggttatt gccggtcctc 120gcgtcannnn nngggggtaa acaggctttg gagacggtac agcggttatt gccggtcctc 120
tgccaggccc acggacttac gccagaacag gtggttgcaa ttgcctccnn nnnnggcggg 180tgccaggccc acggacttac gccagaacag gtggttgcaa ttgcctccnn nnnnggcggg 180
aaacaagcgt tggaaactgt gcagagactc cttcctgttt tgtgtcaagc ccacggcttg 240aaacaagcgt tggaaactgt gcagagactc cttcctgttt tgtgtcaagc ccacggcttg 240
acgcct 246acgcct 246
<210> 29<210> 29
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 29<400> 29
agactccttc ctgttttgtg tcaagcccac ggcttgacgc ctgagcaggt tgtggccatc 60agactccttc ctgttttgtg tcaagcccac ggcttgacgc ctgagcaggt tgtggccatc 60
gctagcnnnn nnggagggaa gcaggctctt gaaaccgtac agcgacttct cccagttttg 120gctagcnnnn nnggagggaa gcaggctctt gaaaccgtac agcgacttct cccagttttg 120
tgccaagctc acgggctaac ccccgagcaa gtagttgcca tagcaagcnn nnnnggagga 180tgccaagctc acgggctaac ccccgagcaa gtagttgcca tagcaagcnn nnnnggagga 180
aaacaggcat tagaaacagt tcagcgcttg ctcccggtac tctgtcaggc acacggtcta 240aaacaggcat tagaaacagt tcagcgcttg ctcccggtac tctgtcaggc acacggtcta 240
<210> 30<210> 30
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 30<400> 30
cgcttgctcc cggtactctg tcaggcacac ggtctaactc cggaacaggt cgtagccatt 60cgcttgctcc cggtactctg tcaggcacac ggtctaactc cggaacaggt cgtagccatt 60
gcttccnnnn nnggcggcaa acaggcgcta gagaccgtcc agaggctctt gcctgtgtta 120gcttccnnnn nnggcggcaa acaggcgcta gagaccgtcc agaggctctt gcctgtgtta 120
tgccaggcac atggcctcac cccggagcag gtcgttgcca tcgccagtnn nnnnggcgga 180tgccaggcac atggcctcac cccggagcag gtcgttgcca tcgccagtnn nnnnggcgga 180
aagcaagctc tcgaaacagt acaacggctg ttgccagtcc tatgtcaagc tcatggactg 240aagcaagctc tcgaaacagt acaacggctg ttgccagtcc tatgtcaagc tcatggactg 240
<210> 31<210> 31
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 31<400> 31
cggctgttgc cagtcctatg tcaagctcat ggactgacgc ccgagcaggt agtggcaatc 60cggctgttgc cagtcctatg tcaagctcat ggactgacgc ccgagcaggt agtggcaatc 60
gcatctnnnn nnggaggtaa acaagcactc gagactgtcc aaagattgtt acccgtacta 120gcatctnnnn nnggaggtaa acaagcactc gagactgtcc aaagattgtt acccgtacta 120
tgccaagcgc atggtttaac cccagagcaa gttgtggcta ttgcatctnn nnnnggtggc 180tgccaagcgc atggtttaac cccagagcaa gttgtggcta ttgcatctnn nnnnggtggc 180
aaacaagcct tggagaccgt gcaacgatta ctgcctgtct tatgtcaggc ccatggcctt 240aaacaagcct tggagaccgt gcaacgatta ctgcctgtct tatgtcaggc ccatggcctt 240
<210> 32<210> 32
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 32<400> 32
cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaggt ggtcgctatc 60cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaggt ggtcgctatc 60
gccagcnnnn nngggggcaa gcaagcactg gaaacagtcc agcgtttgct tccagtactt 120gccagcnnnn nngggggcaa gcaagcactg gaaacagtcc agcgtttgct tccagtactt 120
tgtcaggcgc atggattgac accggaacaa gtggtggcta tagcctcann nnnnggagga 180tgtcaggcgc atggattgac accggaacaa gtggtggcta tagcctcann nnnnggagga 180
aagcaggcgc tggaaaccgt ccaacgtctt ttaccggtgc tttgccaggc gcacgggctc 240aagcaggcgc tggaaaccgt ccaacgtctt ttaccggtgc tttgccaggc gcacgggctc 240
<210> 33<210> 33
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 33<400> 33
cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt cgtagctatc 60cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt cgtagctatc 60
gccagcnnnn nnggtgggaa acaggccctg gaaaccgtac aacgtctcct cccagtactt 120gccagcnnnn nnggtgggaa acaggccctg gaaaccgtac aacgtctcct cccagtactt 120
tgtcaagcac acgggttgac accggaacaa gtggtggcga ttgcgtccnn nnnnggaggc 180tgtcaagcac acgggttgac accggaacaa gtggtggcga ttgcgtccnn nnnnggaggc 180
aagcaggcac tggagaccgt ccaacggctt cttccggttc tttgccaggc tcatgggctc 240aagcaggcac tggagaccgt ccaacggctt cttccggttc tttgccaggc tcatgggctc 240
<210> 34<210> 34
<211> 240<211> 240
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Template sequence<223> Template sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (67)..(72)<222> (67)..(72)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<220><220>
<221> misc_feature<221> misc_feature
<222> (169)..(174)<222> (169)..(174)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 34<400> 34
cggcttcttc cggttctttg ccaggctcat gggctcacgc cagagcaggt ggtagcaata 60cggcttcttc cggttctttg ccaggctcat gggctcacgc cagagcaggt ggtagcaata 60
gcgtcgnnnn nnggtggtaa gcaagcgctt gaaacggtcc agcgtcttct gccggtgttg 120gcgtcgnnnn nnggtggtaa gcaagcgctt gaaacggtcc agcgtcttct gccggtgttg 120
tgccaggcgc acggactcac accagaacaa gtggttgcta ttgctagtnn nnnnggtgga 180tgccaggcgc acggactcac accagaacaa gtggttgcta ttgctagtnn nnnnggtgga 180
aagcaggccc tcgagacggt gcagaggtta cttcccgtcc tctgtcaagc gcacggcctc 240aagcaggccc tcgagacggt gcagaggtta cttcccgtcc tctgtcaagc gcacggcctc 240
<210> 35<210> 35
<211> 49<211> 49
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 35<400> 35
cgcaatgcgc tcacgggagc acccctcaac ctaacccctg aacaggtag 49cgcaatgcgc tcacgggagc acccctcaac ctaacccctg aacaggtag 49
<210> 36<210> 36
<211> 46<211> 46
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 36<400> 36
gagaccatgc gcctgacaaa gtacaggcag cagtctctga acagtt 46gagaccatgc gcctgacaaa gtacaggcag cagtctctga acagtt 46
<210> 37<210> 37
<211> 33<211> 33
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 37<400> 37
tggcgcaatg cgctcacggg agcacccctc aac 33tggcgcaatg cgctcacggg agcacccctc aac 33
<210> 38<210> 38
<211> 49<211> 49
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 38<400> 38
agactgctgc ctgtactttg tcaggcgcat ggtctcaccc ccgaacagg 49agactgctgc ctgtactttg tcaggcgcat ggtctcaccc ccgaacagg 49
<210> 39<210> 39
<211> 46<211> 46
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 39<400> 39
taacccatgt gcttggcaca gaacgggcaa caacctttga accgtt 46taacccatgt gcttggcaca gaacgggcaa caacctttga accgtt 46
<210> 40<210> 40
<211> 48<211> 48
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 40<400> 40
aggttgttgc ccgttctgtg ccaagcacat gggttaacac ccgaacaa 48aggttgttgc ccgttctgtg ccaagcacat gggttaacac ccgaacaa 48
<210> 41<210> 41
<211> 52<211> 52
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 41<400> 41
aggcgtcaag ccgtgggctt gacacaaaac aggaaggagt ctctgcacag tt 52aggcgtcaag ccgtgggctt gacacaaaac aggaaggagt ctctgcacag tt 52
<210> 42<210> 42
<211> 45<211> 45
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 42<400> 42
agactccttc ctgttttgtg tcaagcccac ggcttgacgc ctgag 45agactccttc ctgttttgtg tcaagcccac ggcttgacgc ctgag 45
<210> 43<210> 43
<211> 40<211> 40
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 43<400> 43
tagaccgtgt gcctgacaga gtaccgggag caagcgctga 40tagaccgtgt gcctgacaga gtaccgggag caagcgctga 40
<210> 44<210> 44
<211> 39<211> 39
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 44<400> 44
cgcttgctcc cggtactctg tcaggcacac ggtctaact 39cgcttgctcc cggtactctg tcaggcacac ggtctaact 39
<210> 45<210> 45
<211> 40<211> 40
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 45<400> 45
cagtccatga gcttgacata ggactggcaa cagccgttgt 40cagtccatga gcttgacata ggactggcaa cagccgttgt 40
<210> 46<210> 46
<211> 39<211> 39
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 46<400> 46
cggctgttgc cagtcctatg tcaagctcat ggactgacg 39cggctgttgc cagtcctatg tcaagctcat ggactgacg 39
<210> 47<210> 47
<211> 40<211> 40
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 47<400> 47
aaggccatgg gcctgacata agacaggcag taatcgttgc 40aaggccatgg gcctgacata agacaggcag taatcgttgc 40
<210> 48<210> 48
<211> 39<211> 39
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 48<400> 48
cgattactgc ctgtcttatg tcaggcccat ggccttact 39cgattactgc ctgtcttatg tcaggcccat ggccttact 39
<210> 49<210> 49
<211> 43<211> 43
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 49<400> 49
gagcccgtgc gcctggcaaa gcaccggtaa aagacgttgg acg 43gagcccgtgc gcctggcaaa gcaccggtaa aagacgttgg acg 43
<210> 50<210> 50
<211> 50<211> 50
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 50<400> 50
cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt 50cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt 50
<210> 51<210> 51
<211> 40<211> 40
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 51<400> 51
gagcccatga gcctggcaaa gaaccggaag aagccgttgg 40gagcccatga gcctggcaaa gaaccggaag aagccgttgg 40
<210> 52<210> 52
<211> 51<211> 51
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 52<400> 52
cggcttcttc cggttctttg ccaggctcat gggctcacgc cagagcaggt g 51cggcttcttc cggttctttg ccaggctcat gggctcacgc cagagcaggt g 51
<210> 53<210> 53
<211> 40<211> 40
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Primer sequence<223> Primer sequence
<400> 53<400> 53
gaggccgtgc gcttgacaga ggacgggaag taacctctgc 40gaggccgtgc gcttgacaga ggacgggaag taacctctgc 40
<210> 54<210> 54
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 54<400> 54
tccccacttt cttgtgaa 18tccccacttt cttgtgaa 18
<210> 55<210> 55
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 55<400> 55
taaccactca ggacaggg 18taaccactcaggacaggg 18
<210> 56<210> 56
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 56<400> 56
cactttcttg tgaatcctt 19cactttcttg tgaatcctt 19
<210> 57<210> 57
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 57<400> 57
tcacacagca agtcagca 18tcacacagca agtcagca 18
<210> 58<210> 58
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 58<400> 58
tagcggagca ggctcgga 18tagcggagca ggctcgga 18
<210> 59<210> 59
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 59<400> 59
tgggctagcg gagcaggct 19tgggctagcg gagcaggct 19
<210> 60<210> 60
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 60<400> 60
tacccagacg agaaagct 18tacccagacg agaaagct 18
<210> 61<210> 61
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 61<400> 61
tcagactgcc aagcttga 18tcagactgcc aagcttga 18
<210> 62<210> 62
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 62<400> 62
acccagacga gaaagctga 19acccagacga gaaagctga 19
<210> 63<210> 63
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 63<400> 63
tcttgtggct cgggagta 18tcttgtggct cggggagta 18
<210> 64<210> 64
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 64<400> 64
tattgtcagc agagctga 18tattgtcagc agagctga 18
<210> 65<210> 65
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 65<400> 65
agagggcatc ttgtggctc 19agagggcatc ttgtggctc 19
<210> 66<210> 66
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 66<400> 66
ttgagatttt cagatgtc 18ttgagatttt cagatgtc 18
<210> 67<210> 67
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 67<400> 67
tatacagtca tatcaagc 18tatacagtca tatcaagc 18
<210> 68<210> 68
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 68<400> 68
atcaagctct cttggcggt 19atcaagctct cttggcggt 19
<210> 69<210> 69
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 69<400> 69
ttcagataga ttatatct 18ttcagataga ttatatct 18
<210> 70<210> 70
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 70<400> 70
tgccagatac ataggtgg 18tgccagatac ataggtgg 18
<210> 71<210> 71
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 71<400> 71
gcttcagata gattatatc 19gcttcagata gattatatc 19
<210> 72<210> 72
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 72<400> 72
ttatactgtc tatatgat 18ttatactgtc tatatgat 18
<210> 73<210> 73
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 73<400> 73
tcagctcttc tggccaga 18tcagctcttc tggccaga 18
<210> 74<210> 74
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 74<400> 74
acggatgtct cagctcttc 19acggatgtct cagctcttc 19
<210> 75<210> 75
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 75<400> 75
tggccagaag agctgaga 18tggccagaag agctgaga 18
<210> 76<210> 76
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 76<400> 76
ttaccgggga gagtttct 18ttaccgggga gagtttct 18
<210> 77<210> 77
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 77<400> 77
ccggggagag tttcttgta 19ccggggagag tttcttgta 19
<210> 78<210> 78
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 78<400> 78
tttgcagaga gatgagtc 18tttgcagaga gatgagtc 18
<210> 79<210> 79
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 79<400> 79
ttagcagaag ataagatt 18ttagcagaag ataagatt 18
<210> 80<210> 80
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 80<400> 80
gaaatcttat cttctgcta 19gaaatcttat cttctgcta 19
<210> 81<210> 81
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 81<400> 81
tataagacta aactaccc 18tataagacta aactaccc 18
<210> 82<210> 82
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 82<400> 82
tcgtctgcca ccacagat 18tcgtctgcca ccacagat 18
<210> 83<210> 83
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 83<400> 83
aatgcatgac attcatctg 19aatgcatgac attcatctg 19
<210> 84<210> 84
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 84<400> 84
taaaacagtt tgcattca 18taaaacagtt tgcattca 18
<210> 85<210> 85
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 85<400> 85
tataaagtcc tagaatgt 18tataaagtcc tagaatgt 18
<210> 86<210> 86
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 86<400> 86
aacagtttgc attcatgga 19aacagtttgc attcatgga 19
<210> 87<210> 87
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 87<400> 87
tggccatctc tgacctgt 18tggccatctc tgacctgt 18
<210> 88<210> 88
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 88<400> 88
tagtgagccc agaagggg 18tagtgagccc agaagggg 18
<210> 89<210> 89
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 89<400> 89
ccagaagggg acagtaaga 19ccagaagggg acagtaaga 19
<210> 90<210> 90
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 90<400> 90
taggtacctg gctgtcgt 18taggtacctg gctgtcgt 18
<210> 91<210> 91
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 91<400> 91
tgaccgtcct ggctttta 18tgaccgtcct ggctttta 18
<210> 92<210> 92
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 92<400> 92
ctgacaatcg ataggtacc 19ctgacaatcg ataggtacc 19
<210> 93<210> 93
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 93<400> 93
tgtcatggtc atctgcta 18tgtcatggtc atctgcta 18
<210> 94<210> 94
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 94<400> 94
tcgacaccga agcagagt 18tcgacaccga agcagagt 18
<210> 95<210> 95
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 95<400> 95
acaccgaagc agagttttt 19acaccgaagc agagttttt 19
<210> 96<210> 96
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 96<400> 96
tgcccccgcg aggccaca 18tgcccccgcg aggccaca 18
<210> 97<210> 97
<211> 18<211> 18
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 97<400> 97
tctggaagtt gaacaccc 18tctggaagttgaacaccc 18
<210> 98<210> 98
<211> 19<211> 19
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Targeting sequence<223> Targeting sequence
<400> 98<400> 98
ggaagttgaa cacccttgc 19ggaagttgaa cacccttgc 19
<210> 99<210> 99
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 99<400> 99
ctactgtcat tcagggcaat acccagacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagggcaat acccagacga gaaagctgag ggtataacag gtttcaagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 100<210> 100
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 100<400> 100
ctactgtcat tcagcccaat accctaacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat accctaacga gaaagctgag ggtataacag gtttcaagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 101<210> 101
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 101<400> 101
ctactgtcat tcagcccaat acccagacga gaaaagtgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat acccagacga gaaaagtgag ggtataacag gtttcaagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 102<210> 102
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 102<400> 102
ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 103<210> 103
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 103<400> 103
ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttgtagct 60ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttgtagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 104<210> 104
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 104<400> 104
ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60
tggctctctg actacagagg ccactggctt 90tggctctctg actacagagg ccactggctt 90
<210> 105<210> 105
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 105<400> 105
ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60
tggcagtctg actagtgagg ccactggctt 90tggcagtctg actagtgagg ccactggctt 90
<210> 106<210> 106
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 106<400> 106
cactttatat ttccctgctt aaacagtccc ccgagggtgg gtgcggaaaa ggctctacac 60cactttatat ttccctgctt aaacagtccc ccgagggtgg gtgcggaaaa ggctctacac 60
ttgttatcat tccctctcca ccacaggcat 90ttgttatcat tccctctcca ccacaggcat 90
<210> 107<210> 107
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 107<400> 107
tttgtatttg ggttttttta aaacctccac tctacagtta agaattctaa ggcacagagc 60tttgtatttg ggttttttta aaacctccac tctacagtta agaattctaa ggcacagagc 60
ttcaataatt tggtcagagc caagtagcag 90ttcaataatt tggtcagagc caagtagcag 90
<210> 108<210> 108
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 108<400> 108
ggaggttaaa cccagcagca tgactgcagt tcttaatcaa tgccccttga attgcacata 60ggaggttaaa cccagcagca tgactgcagt tcttaatcaa tgccccttga attgcacata 60
tgggatgaac tagaacattt tctcgatgat 90tgggatgaac tagaacattt tctcgatgat 90
<210> 109<210> 109
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 109<400> 109
ctcgatgatt cgctgtcctt gttatgatta tgttactgag ctctactgta gcacagacat 60ctcgatgatt cgctgtcctt gttatgatta tgttactgag ctctactgta gcacagacat 60
atgtccctat atggggcggg ggtgggggtg 90atgtccctat atggggcggg ggtggggggtg 90
<210> 110<210> 110
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Taregt sequence<223> Target sequence
<400> 110<400> 110
ggtgtcttga tcgctgggct atttctatac tgttctggct tttcggaagc agtcatttct 60ggtgtcttga tcgctgggct atttctatac tgttctggct tttcggaagc agtcatttct 60
ttctattctc caagcaccag caattagctt 90ttctattctc caagcaccag caattagctt 90
<210> 111<210> 111
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 111<400> 111
gcttctagtt tgctgaaact aatctgctat agacagagac tccgacgaac caattttatt 60gcttctagtt tgctgaaact aatctgctat agacagagac tccgacgaac caattttatt 60
aggatttgat caaataaact ctctctgaca 90aggatttgat caaataaact ctctctgaca 90
<210> 112<210> 112
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 112<400> 112
gaaagagtaa ctaagagttt gatgtttact gagtgcatag tatgcactag atgctggccg 60gaaagagtaa ctaagagttt gatgtttact gagtgcatag tatgcactag atgctggccg 60
tggatgcctc atagaatcct cccaacaact 90tggatgcctc atagaatcct cccaacaact 90
<210> 113<210> 113
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 113<400> 113
gctagatgct ggccgtggat gcctcataga atcctcccaa caaccgatga aatgactact 60gctagatgct ggccgtggat gcctcataga atcctcccaa caaccgatga aatgactact 60
gtcattcagc ccaataccca gacgagaaag 90gtcattcagc ccaataccca gacgagaaag 90
<210> 114<210> 114
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 114<400> 114
acaggtttca agcttggcag tctgactaca gaggccactg gctttacccc tgggttagtc 60acaggtttca agcttggcag tctgactaca gaggccactg gctttacccc tgggttagtc 60
tgcctctgta ggattggggg cacgtaattt 90tgcctctgta ggattggggg cacgtaattt 90
<210> 115<210> 115
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 115<400> 115
ttagtctgcc tctgtaggat tgggggcacg taattttgct gtttaaggtc tcatttgcct 60ttagtctgcc tctgtaggat tggggggcacg taattttgct gtttaaggtc tcatttgcct 60
tcttagagat cacaagccaa agctttttat 90tcttagagat cacaagccaa agctttttat 90
<210> 116<210> 116
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 116<400> 116
ggaagcccag agggcatctt gtggctcggg agtagctctc tgctaccttc tcagctctgc 60ggaagcccag agggcatctt gtggctcggg agtagctctc tgctaccttc tcagctctgc 60
tgacaatact tgagattttc agatgtcacc 90tgacaatact tgagattttc agatgtcacc 90
<210> 117<210> 117
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 117<400> 117
tcagctctgc tgacaatact tgagattttc agatgtcacc aaccagcaag agagcttgat 60tcagctctgc tgacaatact tgagattttc agatgtcacc aaccagcaag agagcttgat 60
atgactgtat atagtatagt cataaagaac 90atgactgtat atagtatagt cataaagaac 90
<210> 118<210> 118
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 118<400> 118
cataaagaac ctgaacttga ccatatactt atgtcatgtg gaaatcttct catagcttca 60cataaagaac ctgaacttga ccatatactt atgtcatgtg gaaatcttct catagcttca 60
gatagattat atctggagtg aagaatcctg 90gatagattat atctggagtg aagaatcctg 90
<210> 119<210> 119
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 119<400> 119
gtggaaaatt tctcatagct tcagatagat tatatctgga gtgagcaatc ctgccaccta 60gtggaaaatt tctcatagct tcagatagat tatatctgga gtgagcaatc ctgccaccta 60
tgtatctggc atagtgtgag tcctcataaa 90tgtatctggc atagtgtgag tcctcataaa 90
<210> 120<210> 120
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 120<400> 120
ggtttgaagg gcaacaaaat agtgaacaga gtgaaaatcc ccacctagat cctgggtcca 60ggtttgaagg gcaacaaaat agtgaacaga gtgaaaatcc ccacctagat cctgggtcca 60
gaaaaagatg ggaaacctgt ttagctcacc 90gaaaaagatg ggaaacctgt ttagctcacc 90
<210> 121<210> 121
<211> 30<211> 30
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 121<400> 121
ggccactagg gacaaaattg gtgacagaaa 30ggccactagg gacaaaattg gtgacagaaa 30
<210> 122<210> 122
<211> 50<211> 50
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 122<400> 122
cccacagtgg ggccactagg gacaaaattg gtgacagaaa agccccatcc 50cccacagtgg ggccactagg gacaaaattg gtgacagaaa agccccatcc 50
<210> 123<210> 123
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 123<400> 123
tcccctccac cccacagtgg ggccactagg gacaaaattg gtgacagaaa agccccatcc 60tcccctccac cccacagtgg ggccactagg gacaaaattg gtgacagaaa agccccatcc 60
ttaggcctcc 70ttaggcctcc 70
<210> 124<210> 124
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 124<400> 124
cttttatctg tcccctccac cccacagtgg ggccactagg gacaaaattg gtgacagaaa 60cttttatctg tcccctccac cccacagtgg ggccactagg gacaaaattg gtgacagaaa 60
agccccatcc ttaggcctcc tccttcctag 90agccccatcc ttaggcctcc tccttcctag 90
<210> 125<210> 125
<211> 110<211> 110
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 125<400> 125
gttctgggta cttttatctg tcccctccac cccacagtgg ggccactagg gacaaaattg 60gttctgggta cttttatctg tcccctccac cccacagtgg ggccactagg gacaaaattg 60
gtgacagaaa agccccatcc ttaggcctcc tccttcctag tctcctgata 110gtgacagaaa agccccatcc ttaggcctcc tccttcctag tctcctgata 110
<210> 126<210> 126
<211> 30<211> 30
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 126<400> 126
tttctgtcac caatggtgtc cctagtggcc 30tttctgtcac caatggtgtc cctagtggcc 30
<210> 127<210> 127
<211> 50<211> 50
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 127<400> 127
ggatggggct tttctgtcac caatggtgtc cctagtggcc ccactgtggg 50ggatggggct tttctgtcac caatggtgtc cctagtggcc ccactgtggg 50
<210> 128<210> 128
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 128<400> 128
ggaggcctaa ggatggggct tttctgtcac caatggtgtc cctagtggcc ccactgtggg 60ggaggcctaa ggatggggct tttctgtcac caatggtgtc cctagtggcc ccactgtggg 60
gtggagggga 70gtggagggga 70
<210> 129<210> 129
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 129<400> 129
ctaggaagga ggaggcctaa ggatggggct tttctgtcac caatggtgtc cctagtggcc 60ctaggaagga ggaggcctaa ggatggggct tttctgtcac caatggtgtc cctagtggcc 60
ccactgtggg gtggagggga cagataaaag 90ccactgtggg gtggagggga cagataaaag 90
<210> 130<210> 130
<211> 110<211> 110
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 130<400> 130
tatcaggaga ctaggaagga ggaggcctaa ggatggggct tttctgtcac caatggtgtc 60tatcaggaga ctaggaagga ggaggcctaa ggatggggct tttctgtcac caatggtgtc 60
cctagtggcc ccactgtggg gtggagggga cagataaaag tacccagaac 110cctagtggcc ccactgtggg gtggagggga cagataaaag tacccagaac 110
<210> 131<210> 131
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 131<400> 131
ttctagtaac cactcaggac aggggggttc agcccaaaaa ttcacaagaa agtggggacc 60ttctagtaac cactcaggac aggggggttc agcccaaaaa ttcacaagaa agtggggacc 60
catgggaaat 70catgggaaat 70
<210> 132<210> 132
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 132<400> 132
cagcaagtca gcagcacagc gtgtgtgact ccgagggtgc tccgctagcc cacattgccc 60cagcaagtca gcagcacagc gtgtgtgact ccgagggtgc tccgctagcc cacattgccc 60
tctgggggtg 70tctggggggtg 70
<210> 133<210> 133
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 133<400> 133
gtcagactgc caagcttgaa acctgtctta ccctctactt tctcgtctgg gtattgggct 60gtcagactgc caagcttgaa acctgtctta ccctctactt tctcgtctgg gtattgggct 60
gaatgacagt 70gaatgacagt 70
<210> 134<210> 134
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 134<400> 134
cagagctgag aagacagcag agagctactc ccgaagcaca agatgccctc tgggcttccg 60cagagctgag aagacagcag agagctactc ccgaagcaca agatgccctc tgggcttccg 60
tgaccttggc 70tgaccttggc 70
<210> 135<210> 135
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 135<400> 135
ctgacaatac ttgagatttt cagatgtcac caacgaccaa gagagcttga tatgactgta 60ctgacaatac ttgagatttt cagatgtcac caacgaccaa gagagcttga tatgactgta 60
tatagtatag 70tatagtatag 70
<210> 136<210> 136
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 136<400> 136
cagatacata ggtggcagga ttcttcactc cagacttaat ctatctgaag ctatgagaaa 60cagatacata ggtggcagga ttcttcactc cagacttaat ctatctgaag ctatgagaaa 60
ttttccacat 70ttttccacat 70
<210> 137<210> 137
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 137<400> 137
tatatgattg atttgcacag ctcatctggc cagataagct gagacatccg ttcccctaca 60tatatgattg atttgcacag ctcatctggc cagataagct gagacatccg ttcccctaca 60
agaaactctc 70agaaactctc 70
<210> 138<210> 138
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 138<400> 138
atctggccag aagagctgag acatccgttc cccttgaaga aactctcccc ggtaagtaac 60atctggccag aagagctgag acatccgttc cccttgaaga aactctcccc ggtaagtaac 60
ctctcagctg 70ctctcagctg 70
<210> 139<210> 139
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 139<400> 139
aggcatctca ctggagaggg tttagttctc cttaagagaa gataagattt caagagggaa 60aggcatctca ctggagaggg tttagttctc cttaagagaa gataagattt caagagggaa 60
gctaagactc 70gctaagactc 70
<210> 140<210> 140
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 140<400> 140
ataatataat aaaaaatgtt tcgtctgcca ccactaatga atgtcatgca ttctgggtag 60ataatataat aaaaaatgtt tcgtctgcca ccactaatga atgtcatgca ttctgggtag 60
tttagtctta 70tttagtctta 70
<210> 141<210> 141
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 141<400> 141
tttataaagt cctagaatgt atttagttgc cctcgttgaa tgcaaactgt tttatacatc 60tttataaagt cctagaatgt atttagttgc cctcgttgaa tgcaaactgt tttatacatc 60
aataggtttt 70aataggtttt 70
<210> 142<210> 142
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 142<400> 142
gctcaacctg gccatctctg acctgttttt ccttcccact gtccccttct gggctcacta 60gctcaacctg gccatctctg acctgttttt ccttcccact gtccccttct gggctcacta 60
tgctgccgcc 70tgctgccgcc 70
<210> 143<210> 143
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 143<400> 143
ttttaaagca aacacagcat ggacgacagc caggctccta tcgattgtca ggaggatgat 60ttttaaagca aacacagcat ggacgacagc caggctccta tcgattgtca ggaggatgat 60
gaagaagatt 70gaagaagatt 70
<210> 144<210> 144
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 144<400> 144
gcttgtcatg gtcatctgct actcgggaat cctaattact ctgcttcggt gtcgaaatga 60gcttgtcatg gtcatctgct actcgggaat cctaattact ctgcttcggt gtcgaaatga 60
gaagaagagg 70gaagaagagg 70
<210> 145<210> 145
<211> 70<211> 70
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 145<400> 145
atactgcccc cgcgaggcca cattggcaaa ccagcttggg tgttcaactt ccagacttgg 60atactgcccc cgcgaggcca cattggcaaa ccagcttggg tgttcaactt ccagacttgg 60
ccatggagaa 70ccatggagaa 70
<210> 146<210> 146
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 146<400> 146
ctgaagaatt tcccatgggt ccccactttc ttgtgaatcc ttggagtgaa cccccctgtc 60ctgaagaatt tcccatgggt ccccactttc ttgtgaatcc ttggagtgaa cccccctgtc 60
ctgagtggtt actagaacac acctctggac 90ctgagtggtt actagaacac acctctggac 90
<210> 147<210> 147
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 147<400> 147
tggaagtatc ttgccgaggt cacacagcaa gtcagcagca cagccagtgt gactccgagc 60tggaagtatc ttgccgaggt cacacagcaa gtcagcagca cagccagtgt gactccgagc 60
ctgctccgct agcccacatt gccctctggg 90ctgctccgct agcccacatt gccctctggg 90
<210> 148<210> 148
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 148<400> 148
ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60ctactgtcat tcagcccaat acccagacga gaaagctgag ggtataacag gtttcaagct 60
tggcagtctg actacagagg ccactggctt 90tggcagtctg actacagagg ccactggctt 90
<210> 149<210> 149
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 149<400> 149
ggaagcccag agggcatctt gtggctcggg agtagctctc tgctaccttc tcagctctgc 60ggaagcccag agggcatctt gtggctcggg agtagctctc tgctaccttc tcagctctgc 60
tgacaatact tgagattttc agatgtcacc 90tgacaatact tgagattttc agatgtcacc 90
<210> 150<210> 150
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 150<400> 150
tcagctctgc tgacaatact tgagattttc agatgtcacc aacgcccaag agagcttgat 60tcagctctgc tgacaatact tgagattttc agatgtcacc aacgcccaag agagcttgat 60
atgactgtat atagtatagt cataaagaac 90atgactgtat atagtatagt cataaagaac 90
<210> 151<210> 151
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 151<400> 151
gtggaaaatt tctcatagct tcagatagat tatatctgga gtgagcaatc ctgccaccta 60gtggaaaatt tctcatagct tcagatagat tatatctgga gtgagcaatc ctgccaccta 60
tgtatctggc atagtgtgag tcctcataaa 90tgtatctggc atagtgtgag tcctcataaa 90
<210> 152<210> 152
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 152<400> 152
gaaacagcat ttcctacttt tatactgtct atatgattga tttggtcagc tcatctggcc 60gaaacagcat ttcctacttt tatactgtct atatgattga tttggtcagc tcatctggcc 60
agaagagctg agacatccgt tcccctacaa 90agaagagctg agacatccgt tcccctacaa 90
<210> 153<210> 153
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 153<400> 153
ttgatttgca cagctcatct ggccagaaga gctgagacat ccgtatccct acaagaaact 60ttgatttgca cagctcatct ggccagaaga gctgagacat ccgtatccct acaagaaact 60
ctccccggta agtaacctct cagctgcttg 90ctccccggta agtaacctct cagctgcttg 90
<210> 154<210> 154
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 154<400> 154
ggagagggtt tagttctcct tagcagaaga taagatttca agatgagagc taagactcat 60ggagagggtt tagttctcct tagcagaaga taagatttca agatgagagc taagactcat 60
ctctctgcaa atctttcttt tgagaggtaa 90ctctctgcaa atctttcttt tgagaggtaa 90
<210> 155<210> 155
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 155<400> 155
taatataata aaaaatgttt cgtctgccac cacagatgaa tgtcgagcat tctgggtagt 60taatataata aaaaatgttt cgtctgccac cacagatgaa tgtcgagcat tctgggtagt 60
ttagtcttat aaccagctgt cttgcctagt 90ttagtcttat aaccagctgt cttgcctagt 90
<210> 156<210> 156
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 156<400> 156
ttaaaaacct attgatgtat aaaacagttt gcattcatgg agggtgacta aatacattct 60ttaaaaacct attgatgtat aaaacagttt gcattcatgg agggtgacta aatacattct 60
aggactttat aaaagatcac tttttattta 90aggactttat aaaagatcac tttttattta 90
<210> 157<210> 157
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 157<400> 157
gacatctacc tgctcaacct ggccatctct gacctgtttt tcctatttac tgtccccttc 60gacatctacc tgctcaacct ggccatctct gacctgtttt tcctatttac tgtccccttc 60
tgggctcact atgctgccgc ccagtgggac 90tgggctcact atgctgccgc ccagtgggac 90
<210> 158<210> 158
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 158<400> 158
tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctacgttt gctttaaaag 60tcatcctcct gacaatcgat aggtacctgg ctgtcgtcca tgctacgttt gctttaaaag 60
ccaggacggt cacctttggg gtggtgacaa 90ccaggacggt cacctttggg gtggtgacaa 90
<210> 159<210> 159
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 159<400> 159
ggctggtcct gccgctgctt gtcatggtca tctgctactc gggagaccta aaaactctgc 60ggctggtcct gccgctgctt gtcatggtca tctgctactc gggagaccta aaaactctgc 60
ttcggtgtcg aaatgagaag aagaggcaca 90ttcggtgtcg aaatgagaag aagaggcaca 90
<210> 160<210> 160
<211> 90<211> 90
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> Target sequence<223> Target sequence
<400> 160<400> 160
ggcaagcctt gggtcatact gcccccgcga ggccacattg gcaagtcagc aagggtgttc 60ggcaagcctt gggtcatact gcccccgcga ggccacattg gcaagtcagc aagggtgttc 60
aacttccaga cttggccatg gagaagacat 90aacttccaga cttggccatg gagaagacat 90
<210> 161<210> 161
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 161<400> 161
acactctttc cctacacgac gctcttccga tctcgtgatt ttgcagtgtg cgttactcc 59acactctttc cctacacgac gctcttccga tctcgtgatt ttgcagtgtg cgttactcc 59
<210> 162<210> 162
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 162<400> 162
acactctttc cctacacgac gctcttccga tctacatcgt ttgcagtgtg cgttactcc 59acactctttc cctacacgac gctcttccga tctacatcgt ttgcagtgtg cgttactcc 59
<210> 163<210> 163
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 163<400> 163
acactctttc cctacacgac gctcttccga tctgcctaat ttgcagtgtg cgttactcc 59acactctttc cctacacgac gctcttccga tctgcctaat ttgcagtgtg cgttactcc 59
<210> 164<210> 164
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 164<400> 164
acactctttc cctacacgac gctcttccga tcttggtcat ttgcagtgtg cgttactcc 59acactctttc cctacacgac gctcttccga tcttggtcat ttgcagtgtg cgttactcc 59
<210> 165<210> 165
<211> 54<211> 54
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 165<400> 165
ctcggcattc ctgctgaacc gctcttccga tctccaagca actaagtcac agca 54ctcggcattc ctgctgaacc gctcttccga tctccaagca actaagtcac agca 54
<210> 166<210> 166
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 166<400> 166
acactctttc cctacacgac gctcttccga tctcgtgata tgaggaaatg gaagcttg 58acactctttc cctacacgac gctcttccga tctcgtgata tgaggaaatg gaagcttg 58
<210> 167<210> 167
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 167<400> 167
acactctttc cctacacgac gctcttccga tctacatcga tgaggaaatg gaagcttg 58acactctttc cctacacgac gctcttccga tctacatcga tgaggaaatg gaagcttg 58
<210> 168<210> 168
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 168<400> 168
acactctttc cctacacgac gctcttccga tctgcctaaa tgaggaaatg gaagcttg 58acactctttc cctacacgac gctcttccga tctgcctaaa tgaggaaatg gaagcttg 58
<210> 169<210> 169
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 169<400> 169
acactctttc cctacacgac gctcttccga tcttggtcaa tgaggaaatg gaagcttg 58acactctttc cctacacgac gctcttccga tcttggtcaa tgaggaaatg gaagcttg 58
<210> 170<210> 170
<211> 51<211> 51
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 170<400> 170
ctcggcattc ctgctgaacc gctcttccga tctcattagg gtattggagg a 51ctcggcattc ctgctgaacc gctcttccga tctcattagg gtattggagg a 51
<210> 171<210> 171
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 171<400> 171
acactctttc cctacacgac gctcttccga tctcgtgata atcctcccaa caactcat 58acactctttc cctacacgac gctcttccga tctcgtgata atcctcccaa caactcat 58
<210> 172<210> 172
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 172<400> 172
acactctttc cctacacgac gctcttccga tctacatcga atcctcccaa caactcat 58acactctttc cctacacgac gctcttccga tctacatcga atcctcccaa caactcat 58
<210> 173<210> 173
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 173<400> 173
acactctttc cctacacgac gctcttccga tctgcctaaa atcctcccaa caactcat 58acactctttc cctacacgac gctcttccga tctgcctaaa atcctcccaa caactcat 58
<210> 174<210> 174
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 174<400> 174
acactctttc cctacacgac gctcttccga tcttggtcaa atcctcccaa caactcat 58acactctttc cctacacgac gctcttccga tcttggtcaa atcctcccaa caactcat 58
<210> 175<210> 175
<211> 52<211> 52
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 175<400> 175
ctcggcattc ctgctgaacc gctcttccga tctcccaatc ctacagaggc ag 52ctcggcattc ctgctgaacc gctcttccga tctcccaatc ctacagaggc ag 52
<210> 176<210> 176
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 176<400> 176
acactctttc cctacacgac gctcttccga tctcgtgata agccaaagct ttttattc 58acactctttc cctacacgac gctcttccga tctcgtgata agccaaagct ttttattc 58
<210> 177<210> 177
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 177<400> 177
acactctttc cctacacgac gctcttccga tctacatcga agccaaagct ttttattc 58acactctttc cctacacgac gctcttccga tctacatcga agccaaagct ttttattc 58
<210> 178<210> 178
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 178<400> 178
acactctttc cctacacgac gctcttccga tctgcctaaa agccaaagct ttttattc 58acactctttc cctacacgac gctcttccga tctgcctaaa agccaaagct ttttattc 58
<210> 179<210> 179
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 179<400> 179
acactctttc cctacacgac gctcttccga tcttggtcaa agccaaagct ttttattc 58acactctttc cctacacgac gctcttccga tcttggtcaa agccaaagct ttttattc 58
<210> 180<210> 180
<211> 53<211> 53
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 180<400> 180
acactctttc cctacacgac gctcttccga tctaagccaa agctttttat tct 53acactctttc cctacacgac gctcttccga tctaagccaa agctttttat tct 53
<210> 181<210> 181
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 181<400> 181
acactctttc cctacacgac gctcttccga tctcgtgata tcttgtggct cgggagtag 59acactctttc cctacacgac gctcttccga tctcgtgata tcttgtggct cgggagtag 59
<210> 182<210> 182
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 182<400> 182
acactctttc cctacacgac gctcttccga tctacatcga tcttgtggct cgggagtag 59acactctttc cctacacgac gctcttccga tctacatcga tcttgtggct cgggagtag 59
<210> 183<210> 183
<211> 53<211> 53
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 183<400> 183
ctcggcattc ctgctgaacc gctcttccga tcttggcagg attcttcact cca 53ctcggcattc ctgctgaacc gctcttccga tcttggcagg attcttcact cca 53
<210> 184<210> 184
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 184<400> 184
acactctttc cctacacgac gctcttccga tctcgtgatc tattttgttg cccttcaaa 59acactctttc cctacacgac gctcttccga tctcgtgatc tattttgttg cccttcaaa 59
<210> 185<210> 185
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 185<400> 185
acactctttc cctacacgac gctcttccga tctacatcgc tattttgttg cccttcaaa 59acactctttc cctacacgac gctcttccga tctacatcgc tattttgttg cccttcaaa 59
<210> 186<210> 186
<211> 55<211> 55
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 186<400> 186
ctcggcattc ctgctgaacc gctcttccga tctaacctga acttgaccat atact 55ctcggcattc ctgctgaacc gctcttccga tctaacctga acttgaccat atact 55
<210> 187<210> 187
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 187<400> 187
acactctttc cctacacgac gctcttccga tctcgtgatc agctgagagg ttacttacc 59acactctttc cctacacgac gctcttccga tctcgtgatc agctgagagg ttacttacc 59
<210> 188<210> 188
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 188<400> 188
acactctttc cctacacgac gctcttccga tctacatcgc agctgagagg ttacttacc 59acactctttc cctacacgac gctcttccga tctacatcgc agctgagagg ttacttacc 59
<210> 189<210> 189
<211> 53<211> 53
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 189<400> 189
ctcggcattc ctgctgaacc gctcttccga tctaatgatt taactccacc ctc 53ctcggcattc ctgctgaacc gctcttccga tctaatgatt taactccacc ctc 53
<210> 190<210> 190
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 190<400> 190
acactctttc cctacacgac gctcttccga tctcgtgata ctccaccctc cttcaaaaga 60acactctttc cctacacgac gctcttccga tctcgtgata ctccaccctc cttcaaaaga 60
<210> 191<210> 191
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 191<400> 191
acactctttc cctacacgac gctcttccga tctacatcga ctccaccctc cttcaaaaga 60acactctttc cctacacgac gctcttccga tctacatcga ctccaccctc cttcaaaaga 60
<210> 192<210> 192
<211> 52<211> 52
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 192<400> 192
ctcggcattc ctgctgaacc gctcttccga tcttggtgtt tgccaaatgt ct 52ctcggcattc ctgctgaacc gctcttccga tcttggtgtt tgccaaatgt ct 52
<210> 193<210> 193
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 193<400> 193
acactctttc cctacacgac gctcttccga tctcgtgatg ggcacatatt cagaaggca 59acactctttc cctacacgac gctcttccga tctcgtgatg ggcacatatt cagaaggca 59
<210> 194<210> 194
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 194<400> 194
acactctttc cctacacgac gctcttccga tctacatcgg ggcacatatt cagaaggca 59acactctttc cctacacgac gctcttccga tctacatcgg ggcacatatt cagaaggca 59
<210> 195<210> 195
<211> 56<211> 56
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 195<400> 195
ctcggcattc ctgctgaacc gctcttccga tctagtgaaa gactttaaag ggagca 56ctcggcattc ctgctgaacc gctcttccga tctagtgaaa gactttaaag ggagca 56
<210> 196<210> 196
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 196<400> 196
acactctttc cctacacgac gctcttccga tctcgtgatc acaattaaga gttgtcata 59acactctttc cctacacgac gctcttccga tctcgtgatc acaattaaga gttgtcata 59
<210> 197<210> 197
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 197<400> 197
acactctttc cctacacgac gctcttccga tctacatcgc acaattaaga gttgtcata 59acactctttc cctacacgac gctcttccga tctacatcgc acaattaaga gttgtcata 59
<210> 198<210> 198
<211> 53<211> 53
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 198<400> 198
ctcggcattc ctgctgaacc gctcttccga tctctcagct agagcagctg aac 53ctcggcattc ctgctgaacc gctcttccga tctctcagct agagcagctg aac 53
<210> 199<210> 199
<211> 51<211> 51
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 199<400> 199
ctcggcattc ctgctgaacc gctcttccga tctgacactt gataatccat c 51ctcggcattc ctgctgaacc gctcttccga tctgacactt gataatccat c 51
<210> 200<210> 200
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 200<400> 200
acactctttc cctacacgac gctcttccga tctacatcgt caatgtagac atctatgtag 60acactctttc cctacacgac gctcttccga tctacatcgt caatgtagac atctatgtag 60
<210> 201<210> 201
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 201<400> 201
acactctttc cctacacgac gctcttccga tctcgtgatt caatgtagac atctatgtag 60acactctttc cctacacgac gctcttccga tctcgtgatt caatgtagac atctatgtag 60
<210> 202<210> 202
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 202<400> 202
acactctttc cctacacgac gctcttccga tctcgtgata ctgcaaaagg ctgaagagc 59acactctttc cctacacgac gctcttccga tctcgtgata ctgcaaaagg ctgaagagc 59
<210> 203<210> 203
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 203<400> 203
acactctttc cctacacgac gctcttccga tctacatcga ctgcaaaagg ctgaagagc 59acactctttc cctacacgac gctcttccga tctacatcga ctgcaaaagg ctgaagagc 59
<210> 204<210> 204
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 204<400> 204
acactctttc cctacacgac gctcttccga tctgcctaaa ctgcaaaagg ctgaagagc 59acactctttc cctacacgac gctcttccga tctgcctaaa ctgcaaaagg ctgaagagc 59
<210> 205<210> 205
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 205<400> 205
acactctttc cctacacgac gctcttccga tcttggtcaa ctgcaaaagg ctgaagagc 59acactctttc cctacacgac gctcttccga tcttggtcaa ctgcaaaagg ctgaagagc 59
<210> 206<210> 206
<211> 57<211> 57
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 206<400> 206
ctcggcattc ctgctgaacc gctcttccga tctgcctata aaatagagcc ctgtcaa 57ctcggcattc ctgctgaacc gctcttccga tctgcctata aaatagagcc ctgtcaa 57
<210> 207<210> 207
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 207<400> 207
acactctttc cctacacgac gctcttccga tctcgtgatc tctattttat aggcttcttc 60acactctttc cctacacgac gctcttccga tctcgtgatc tctattttat aggcttcttc 60
<210> 208<210> 208
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 208<400> 208
acactctttc cctacacgac gctcttccga tctacatcgc tctattttat aggcttcttc 60acactctttc cctacacgac gctcttccga tctacatcgc tctattttat aggcttcttc 60
<210> 209<210> 209
<211> 52<211> 52
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 209<400> 209
ctcggcattc ctgctgaacc gctcttccga tctagccacc acccaagtga tc 52ctcggcattc ctgctgaacc gctcttccga tctagccacc acccaagtga tc 52
<210> 210<210> 210
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 210<400> 210
acactctttc cctacacgac gctcttccga tctacatcgt tccagacatt aaagatagtc 60acactctttc cctacacgac gctcttccga tctacatcgt tccagacatt aaagatagtc 60
<210> 211<210> 211
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 211<400> 211
acactctttc cctacacgac gctcttccga tctcgtgatt tccagacatt aaagatagtc 60acactctttc cctacacgac gctcttccga tctcgtgatt tccagacatt aaagatagtc 60
<210> 212<210> 212
<211> 54<211> 54
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 212<400> 212
ctcggcattc ctgctgaacc gctcttccga tctaatcatg atggtgaaga taag 54ctcggcattc ctgctgaacc gctcttccga tctaatcatg atggtgaaga taag 54
<210> 213<210> 213
<211> 60<211> 60
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 213<400> 213
acactctttc cctacacgac gctcttccga tctcgtgatc cggcagagac aaacattaaa 60acactctttc cctacacgac gctcttccga tctcgtgatc cggcagagac aaacattaaa 60
<210> 214<210> 214
<211> 54<211> 54
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 214<400> 214
acactctttc cctacacgac gctcttccga tctccggcag agacaaacat taaa 54acactctttc cctacacgac gctcttccga tctccggcag agacaaacat taaa 54
<210> 215<210> 215
<211> 53<211> 53
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 215<400> 215
ctcggcattc ctgctgaacc gctcttccga tctagctagg aagccatggc aag 53ctcggcattc ctgctgaacc gctcttccga tctagctagg aagccatggc aag 53
<210> 216<210> 216
<211> 47<211> 47
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 216<400> 216
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgc 47aatgatacgg cgaccaccga gatctacact ctttccctac acgacgc 47
<210> 217<210> 217
<211> 50<211> 50
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 217<400> 217
caagcagaag acggcatacg agatcggtct cggcattcct gctgaaccgc 50caagcagaag acggcatacg agatcggtct cggcattcct gctgaaccgc 50
<210> 218<210> 218
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 218<400> 218
acactctttc cctacacgac gctcttccga tctagtgcat agtatgtgct agatgctg 58acactctttc cctacacgac gctcttccga tctagtgcat agtatgtgct agatgctg 58
<210> 219<210> 219
<211> 59<211> 59
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 219<400> 219
gtgactggag ttcagacgtg tgctcttccg atcttgatct ctaagaaggc aaatgagac 59gtgactggag ttcagacgtg tgctcttccg atcttgatct ctaagaaggc aaatgagac 59
<210> 220<210> 220
<211> 64<211> 64
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<220><220>
<221> misc_feature<221> misc_feature
<222> (25)..(30)<222> (25)..(30)
<223> n is a, c, g, or t<223> n is a, c, g, or t
<400> 220<400> 220
caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60
atct 64atct 64
<210> 221<210> 221
<211> 58<211> 58
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> PCR primer<223>PCR primer
<400> 221<400> 221
aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58
<210> 222<210> 222
<211> 34<211> 34
<212> PRT<212>PRT
<213> Artificial<213> Artificial
<220><220>
<223> Deduced TALE template amino acid sequence<223> Deduced TALE template amino acid sequence
<220><220>
<221> misc_feature<221> misc_feature
<222> (12)..(13)<222> (12)..(13)
<223> Xaa can be any naturally occurring amino acid<223> Xaa can be any naturally occurring amino acid
<400> 222<400> 222
Leu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly LysLeu Thr Pro Glu Gln Val Val Ala Ile Ala Ser Xaa Xaa Gly Gly Lys
1 5 10 151 5 10 15
Gln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln AlaGln Ala Leu Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala
20 25 3020 25 30
His GlyHis Gly
<210> 223<210> 223
<211> 246<211> 246
<212> DNA<212> DNA
<213> Artificial<213> Artificial
<220><220>
<223> TALE dimer nucleotide sequence<223> TALE dimer nucleotide sequence
<400> 223<400> 223
cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt cgtagctatc 60cgattactgc ctgtcttatg tcaggcccat ggccttactc ctgagcaagt cgtagctatc 60
gccagcaaca taggtgggaa acaggccctg gaaaccgtac aacgtctcct cccagtactt 120gccagcaaca taggtgggaa acaggccctg gaaaccgtac aacgtctcct cccagtactt 120
tgtcaagcac acgggttgac accggaacaa gtggtggcga ttgcgtccca cgatggaggc 180tgtcaagcac acgggttgac accggaacaa gtggtggcga ttgcgtccca cgatggaggc 180
aagcaggcac tggagaccgt ccaacggctt cttccggttc tttgccaggc tcatgggctc 240aagcaggcac tggagaccgt ccaacggctt cttccggttc tttgccaggc tcatgggctc 240
acgcca 246acgcca 246
<210> 224<210> 224
<211> 82<211> 82
<212> PRT<212>PRT
<213> Artificial<213> Artificial
<220><220>
<223> Deduced TALE dimer amino acid sequence<223> Deduced TALE dimer amino acid sequence
<400> 224<400> 224
Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu GlnArg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro Glu Gln
1 5 10 151 5 10 15
Val Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu ThrVal Val Ala Ile Ala Ser Asn Ile Gly Gly Lys Gln Ala Leu Glu Thr
20 25 3020 25 30
Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr ProVal Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu Thr Pro
35 40 4535 40 45
Glu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala LeuGlu Gln Val Val Ala Ile Ala Ser His Asp Gly Gly Lys Gln Ala Leu
50 55 6050 55 60
Glu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly LeuGlu Thr Val Gln Arg Leu Leu Pro Val Leu Cys Gln Ala His Gly Leu
65 70 75 8065 70 75 80
Thr ProThr Pro
<---<---
Claims (23)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US61/858,866 | 2013-07-26 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| RU2019114217A Division RU2764757C2 (en) | 2013-07-26 | 2014-07-25 | Genomic engineering |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| RU2021136326A RU2021136326A (en) | 2023-06-09 |
| RU2812848C2 true RU2812848C2 (en) | 2024-02-02 |
Family
ID=
Non-Patent Citations (2)
| Title |
|---|
| MALI, PRASHANT et al. RNA-guided human genome engineering via Cas9, Science, 15 February 2013, 339(6121): 823-826. WOLTJEN, K. et al. piggyBac transposition reprograms fibroblasts to induced pluripotent stem cells, Nature, 2009, 458(7239): 766-770. CONG LE et al. Multiplex genome engineering using CRISPR/Cas systems, Science, 03 January 2013, 1231143. * |
| ПУГАЧ К.С. и др. CRISPR-системы адаптивного иммунитета прокариот, Молекулярная биология, 2012, 46(2):195-203. * |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7419328B2 (en) | genome engineering | |
| RU2812848C2 (en) | Genome engineering | |
| HK40008471A (en) | Genome engineering | |
| NZ754903A (en) | Genome engineering | |
| NZ754903B2 (en) | Genome engineering | |
| NZ754904B2 (en) | Genome engineering | |
| NZ754902B2 (en) | Genome engineering | |
| NZ716606B2 (en) | Genome engineering | |
| HK1218940B (en) | Genome engineering |