BR122024004319A2 - FUSION PROTEIN COMPRISING A CAS9 PROTEIN AND A SPO11 PROTEIN, AND HOST CELL COMPRISING THE FUSION PROTEIN - Google Patents
FUSION PROTEIN COMPRISING A CAS9 PROTEIN AND A SPO11 PROTEIN, AND HOST CELL COMPRISING THE FUSION PROTEIN Download PDFInfo
- Publication number
- BR122024004319A2 BR122024004319A2 BR122024004319-0A BR122024004319A BR122024004319A2 BR 122024004319 A2 BR122024004319 A2 BR 122024004319A2 BR 122024004319 A BR122024004319 A BR 122024004319A BR 122024004319 A2 BR122024004319 A2 BR 122024004319A2
- Authority
- BR
- Brazil
- Prior art keywords
- spo11
- protein
- fusion protein
- cell
- spcas9
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 139
- 108091033409 CRISPR Proteins 0.000 title claims abstract description 72
- 101000825217 Homo sapiens Meiotic recombination protein SPO11 Proteins 0.000 title description 38
- 102100022253 Meiotic recombination protein SPO11 Human genes 0.000 title description 38
- 102000037865 fusion proteins Human genes 0.000 claims abstract description 131
- 101100366466 Caenorhabditis elegans spo-11 gene Proteins 0.000 claims abstract description 97
- 210000004027 cell Anatomy 0.000 claims description 162
- 240000004808 Saccharomyces cerevisiae Species 0.000 claims description 65
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 claims description 64
- 210000005253 yeast cell Anatomy 0.000 claims description 18
- 101710163270 Nuclease Proteins 0.000 claims description 15
- 241001123227 Saccharomyces pastorianus Species 0.000 claims description 8
- 241000894007 species Species 0.000 claims description 8
- 241001123228 Saccharomyces paradoxus Species 0.000 claims description 5
- 241000582914 Saccharomyces uvarum Species 0.000 claims description 5
- 230000002950 deficient Effects 0.000 claims description 5
- 241000235087 Lachancea kluyveri Species 0.000 claims description 4
- 241000235072 Saccharomyces bayanus Species 0.000 claims description 4
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 claims description 4
- 241000670409 Saccharomyces castelli Species 0.000 claims description 4
- 241001063879 Saccharomyces eubayanus Species 0.000 claims description 4
- 241000198063 Saccharomyces kudriavzevii Species 0.000 claims description 4
- 241000198072 Saccharomyces mikatae Species 0.000 claims description 4
- 108020005004 Guide RNA Proteins 0.000 description 228
- 102000039446 nucleic acids Human genes 0.000 description 99
- 108020004707 nucleic acids Proteins 0.000 description 99
- 150000007523 nucleic acids Chemical class 0.000 description 98
- 108090000623 proteins and genes Proteins 0.000 description 76
- 230000005782 double-strand break Effects 0.000 description 73
- 230000014509 gene expression Effects 0.000 description 62
- 238000000034 method Methods 0.000 description 61
- 210000003527 eukaryotic cell Anatomy 0.000 description 51
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 46
- 230000006798 recombination Effects 0.000 description 44
- 238000005215 recombination Methods 0.000 description 43
- 241000196324 Embryophyta Species 0.000 description 42
- 230000002759 chromosomal effect Effects 0.000 description 40
- 235000018102 proteins Nutrition 0.000 description 37
- 102000004169 proteins and genes Human genes 0.000 description 37
- 239000013598 vector Substances 0.000 description 30
- 102100039556 Galectin-4 Human genes 0.000 description 25
- 239000013604 expression vector Substances 0.000 description 24
- 239000013612 plasmid Substances 0.000 description 24
- 239000002773 nucleotide Substances 0.000 description 23
- 125000003729 nucleotide group Chemical group 0.000 description 23
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 22
- 108020004414 DNA Proteins 0.000 description 22
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 description 20
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 20
- 210000000349 chromosome Anatomy 0.000 description 19
- 239000012634 fragment Substances 0.000 description 19
- 240000007594 Oryza sativa Species 0.000 description 18
- 235000007164 Oryza sativa Nutrition 0.000 description 18
- 235000009566 rice Nutrition 0.000 description 18
- 239000007362 sporulation medium Substances 0.000 description 18
- 101150037782 GAL2 gene Proteins 0.000 description 15
- 210000004899 c-terminal region Anatomy 0.000 description 15
- 230000001939 inductive effect Effects 0.000 description 15
- 230000010076 replication Effects 0.000 description 15
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 14
- 238000002105 Southern blotting Methods 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 14
- 108010001515 Galectin 4 Proteins 0.000 description 13
- 230000027455 binding Effects 0.000 description 13
- 230000002068 genetic effect Effects 0.000 description 13
- 230000021121 meiosis Effects 0.000 description 13
- 101000608765 Homo sapiens Galectin-4 Proteins 0.000 description 12
- 230000001580 bacterial effect Effects 0.000 description 12
- 230000004927 fusion Effects 0.000 description 12
- 230000009466 transformation Effects 0.000 description 12
- 150000001413 amino acids Chemical class 0.000 description 11
- 230000002538 fungal effect Effects 0.000 description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 10
- 102100021735 Galectin-2 Human genes 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 101100163151 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) ARE1 gene Proteins 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 230000000295 complement effect Effects 0.000 description 9
- 235000014304 histidine Nutrition 0.000 description 9
- 125000005647 linker group Chemical group 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 230000032969 meiotic prophase I Effects 0.000 description 9
- 230000008439 repair process Effects 0.000 description 9
- 101150054390 Spo11 gene Proteins 0.000 description 8
- 241000193996 Streptococcus pyogenes Species 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 238000004520 electroporation Methods 0.000 description 8
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 8
- 238000003780 insertion Methods 0.000 description 8
- 230000037431 insertion Effects 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 101100365680 Arabidopsis thaliana SGT1B gene Proteins 0.000 description 7
- 101100417900 Clostridium acetobutylicum (strain ATCC 824 / DSM 792 / JCM 1419 / LMG 5710 / VKM B-1787) rbr3A gene Proteins 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- -1 Mre2/Nam8 Proteins 0.000 description 7
- 101150034686 PDC gene Proteins 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 7
- 239000003446 ligand Substances 0.000 description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 241000233866 Fungi Species 0.000 description 6
- 108700026244 Open Reading Frames Proteins 0.000 description 6
- 101150070789 SAE2 gene Proteins 0.000 description 6
- 101150102320 SWC3 gene Proteins 0.000 description 6
- 238000009825 accumulation Methods 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 239000012071 phase Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 108090000765 processed proteins & peptides Proteins 0.000 description 6
- 108091008146 restriction endonucleases Proteins 0.000 description 6
- 239000000523 sample Substances 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 230000028070 sporulation Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 241000219195 Arabidopsis thaliana Species 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 102000014450 RNA Polymerase III Human genes 0.000 description 5
- 108010078067 RNA Polymerase III Proteins 0.000 description 5
- 241000235070 Saccharomyces Species 0.000 description 5
- 240000008042 Zea mays Species 0.000 description 5
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 5
- 230000012010 growth Effects 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 4
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 4
- 241000235648 Pichia Species 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 239000013613 expression plasmid Substances 0.000 description 4
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 4
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 230000000394 mitotic effect Effects 0.000 description 4
- 101150106936 put4 gene Proteins 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 108020005065 3' Flanking Region Proteins 0.000 description 3
- 241000335053 Beta vulgaris Species 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 3
- 108091060290 Chromatid Proteins 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 3
- 235000010469 Glycine max Nutrition 0.000 description 3
- 244000299507 Gossypium hirsutum Species 0.000 description 3
- 240000005979 Hordeum vulgare Species 0.000 description 3
- 235000007340 Hordeum vulgare Nutrition 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 101100113585 Mus musculus Ccnb1ip1 gene Proteins 0.000 description 3
- 108091005804 Peptidases Proteins 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 102100030684 Sphingosine-1-phosphate phosphatase 1 Human genes 0.000 description 3
- 101710168942 Sphingosine-1-phosphate phosphatase 1 Proteins 0.000 description 3
- 241000209140 Triticum Species 0.000 description 3
- 235000021307 Triticum Nutrition 0.000 description 3
- 108090000848 Ubiquitin Proteins 0.000 description 3
- 102000044159 Ubiquitin Human genes 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- NRAUADCLPJTGSF-ZPGVOIKOSA-N [(2r,3s,4r,5r,6r)-6-[[(3as,7r,7as)-7-hydroxy-4-oxo-1,3a,5,6,7,7a-hexahydroimidazo[4,5-c]pyridin-2-yl]amino]-5-[[(3s)-3,6-diaminohexanoyl]amino]-4-hydroxy-2-(hydroxymethyl)oxan-3-yl] carbamate Chemical compound NCCC[C@H](N)CC(=O)N[C@@H]1[C@@H](O)[C@H](OC(N)=O)[C@@H](CO)O[C@H]1\N=C/1N[C@H](C(=O)NC[C@H]2O)[C@@H]2N\1 NRAUADCLPJTGSF-ZPGVOIKOSA-N 0.000 description 3
- 230000009471 action Effects 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 150000001295 alanines Chemical class 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 229940009098 aspartate Drugs 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-L aspartate group Chemical group N[C@@H](CC(=O)[O-])C(=O)[O-] CKLJMWTZIZZHCS-REOHCLBHSA-L 0.000 description 3
- 210000004756 chromatid Anatomy 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 230000002255 enzymatic effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 230000000415 inactivating effect Effects 0.000 description 3
- JTJMJGYZQZDUJJ-UHFFFAOYSA-N phencyclidine Chemical compound C1CCCCN1C1(C=2C=CC=CC=2)CCCCC1 JTJMJGYZQZDUJJ-UHFFFAOYSA-N 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 125000006239 protecting group Chemical group 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 239000007320 rich medium Substances 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 2
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 2
- 241000228212 Aspergillus Species 0.000 description 2
- 241000223651 Aureobasidium Species 0.000 description 2
- 108010023063 Bacto-peptone Proteins 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 241000222490 Bjerkandera Species 0.000 description 2
- 101100339496 Caenorhabditis elegans hop-1 gene Proteins 0.000 description 2
- 241000222120 Candida <Saccharomycetales> Species 0.000 description 2
- 241000146399 Ceriporiopsis Species 0.000 description 2
- 241000123346 Chrysosporium Species 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 241000222511 Coprinus Species 0.000 description 2
- 241000222356 Coriolus Species 0.000 description 2
- 241001337994 Cryptococcus <scale insect> Species 0.000 description 2
- 241000701022 Cytomegalovirus Species 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 241000206602 Eukaryota Species 0.000 description 2
- 241000221207 Filobasidium Species 0.000 description 2
- 241000223218 Fusarium Species 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- 102000005720 Glutathione transferase Human genes 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 2
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 102100029768 Histone-lysine N-methyltransferase SETD1A Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000865038 Homo sapiens Histone-lysine N-methyltransferase SETD1A Proteins 0.000 description 2
- 241000223198 Humicola Species 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- 241000235649 Kluyveromyces Species 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241001344133 Magnaporthe Species 0.000 description 2
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 2
- 101150100676 Map2k1 gene Proteins 0.000 description 2
- 241000235395 Mucor Species 0.000 description 2
- 108010021466 Mutant Proteins Proteins 0.000 description 2
- 102000008300 Mutant Proteins Human genes 0.000 description 2
- 241000226677 Myceliophthora Species 0.000 description 2
- KSPIYJQBLVDRRI-UHFFFAOYSA-N N-methylisoleucine Chemical compound CCC(C)C(NC)C(O)=O KSPIYJQBLVDRRI-UHFFFAOYSA-N 0.000 description 2
- 101150081841 NBN gene Proteins 0.000 description 2
- 241000233892 Neocallimastix Species 0.000 description 2
- 241000221960 Neurospora Species 0.000 description 2
- 241000233654 Oomycetes Species 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- 241001236817 Paecilomyces <Clavicipitaceae> Species 0.000 description 2
- 241000228143 Penicillium Species 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 241000222385 Phanerochaete Species 0.000 description 2
- 241000222395 Phlebia Species 0.000 description 2
- 102000011755 Phosphoglycerate Kinase Human genes 0.000 description 2
- 241000235379 Piromyces Species 0.000 description 2
- 101000686491 Platymeris rhadamanthus Venom redulysin 1 Proteins 0.000 description 2
- 241000222350 Pleurotus Species 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 101150074479 SPO11-1 gene Proteins 0.000 description 2
- 101150017787 SPO11-2 gene Proteins 0.000 description 2
- 241000222480 Schizophyllum Species 0.000 description 2
- 241000235346 Schizosaccharomyces Species 0.000 description 2
- 235000021536 Sugar beet Nutrition 0.000 description 2
- 241000228341 Talaromyces Species 0.000 description 2
- 241000228178 Thermoascus Species 0.000 description 2
- 101001099217 Thermotoga maritima (strain ATCC 43589 / DSM 3109 / JCM 10099 / NBRC 100826 / MSB8) Triosephosphate isomerase Proteins 0.000 description 2
- 241001494489 Thielavia Species 0.000 description 2
- 241001149964 Tolypocladium Species 0.000 description 2
- 241000222354 Trametes Species 0.000 description 2
- 108091028113 Trans-activating crRNA Proteins 0.000 description 2
- 241000223259 Trichoderma Species 0.000 description 2
- 241000235013 Yarrowia Species 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 230000009418 agronomic effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 108010082025 cyan fluorescent protein Proteins 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 210000001840 diploid cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 235000003869 genetically modified organism Nutrition 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 101150071637 mre11 gene Proteins 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 235000016709 nutrition Nutrition 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 101150010682 rad50 gene Proteins 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 230000035899 viability Effects 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- BVAUMRCGVHUWOZ-ZETCQYMHSA-N (2s)-2-(cyclohexylazaniumyl)propanoate Chemical compound OC(=O)[C@H](C)NC1CCCCC1 BVAUMRCGVHUWOZ-ZETCQYMHSA-N 0.000 description 1
- NPWMTBZSRRLQNJ-VKHMYHEASA-N (3s)-3-aminopiperidine-2,6-dione Chemical compound N[C@H]1CCC(=O)NC1=O NPWMTBZSRRLQNJ-VKHMYHEASA-N 0.000 description 1
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- AEJOEPSMZCEYJN-HXUWFJFHSA-N 2-(3,4-dichlorophenyl)-N-methyl-N-[(1S)-1-phenyl-2-(1-pyrrolidinyl)ethyl]acetamide Chemical compound C([C@@H](N(C)C(=O)CC=1C=C(Cl)C(Cl)=CC=1)C=1C=CC=CC=1)N1CCCC1 AEJOEPSMZCEYJN-HXUWFJFHSA-N 0.000 description 1
- 241000007910 Acaryochloris marina Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 241001464929 Acidithiobacillus caldus Species 0.000 description 1
- 241000605222 Acidithiobacillus ferrooxidans Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 1
- 241000190857 Allochromatium vinosum Species 0.000 description 1
- 241000147155 Ammonifex degensii Species 0.000 description 1
- 101100366465 Arabidopsis thaliana SPO11-1 gene Proteins 0.000 description 1
- 101100366476 Arabidopsis thaliana SPO11-2 gene Proteins 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 241000620196 Arthrospira maxima Species 0.000 description 1
- 240000002900 Arthrospira platensis Species 0.000 description 1
- 235000016425 Arthrospira platensis Nutrition 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 241000906059 Bacillus pseudomycoides Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000823281 Burkholderiales bacterium Species 0.000 description 1
- 101150061050 CIN1 gene Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241001496650 Candidatus Desulforudis Species 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193155 Clostridium botulinum Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000907165 Coleofasciculus chthonoplastes Species 0.000 description 1
- 241000065716 Crocosphaera watsonii Species 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000326311 Exiguobacterium sibiricum Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000192016 Finegoldia magna Species 0.000 description 1
- 101150077230 GAL4 gene Proteins 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000878540 Homo sapiens Protein-tyrosine kinase 2-beta Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- LCWXJXMHJVIJFK-UHFFFAOYSA-N Hydroxylysine Natural products NCC(O)CC(N)CC(O)=O LCWXJXMHJVIJFK-UHFFFAOYSA-N 0.000 description 1
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 1
- 108700002232 Immediate-Early Genes Proteins 0.000 description 1
- 108020005350 Initiator Codon Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241001430080 Ktedonobacter racemifer Species 0.000 description 1
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- AGPKZVBTJJNPAG-UHNVWZDZSA-N L-allo-Isoleucine Chemical compound CC[C@@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-UHNVWZDZSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- SNDPXSYFESPGGJ-UHFFFAOYSA-N L-norVal-OH Natural products CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 1
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 1
- 241000186869 Lactobacillus salivarius Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 208000002720 Malnutrition Diseases 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- 241000204637 Methanohalobium evestigatum Species 0.000 description 1
- 241000192710 Microcystis aeruginosa Species 0.000 description 1
- 241000190928 Microscilla marina Species 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- YPIGGYHFMKJNKV-UHFFFAOYSA-N N-ethylglycine Chemical compound CC[NH2+]CC([O-])=O YPIGGYHFMKJNKV-UHFFFAOYSA-N 0.000 description 1
- 108010065338 N-ethylglycine Proteins 0.000 description 1
- AKCRVYNORCOYQT-YFKPBYRVSA-N N-methyl-L-valine Chemical compound CN[C@@H](C(C)C)C(O)=O AKCRVYNORCOYQT-YFKPBYRVSA-N 0.000 description 1
- 241000167285 Natranaerobius thermophilus Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 241001028048 Nicola Species 0.000 description 1
- 241000919925 Nitrosococcus halophilus Species 0.000 description 1
- 241001515112 Nitrosococcus watsonii Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 241001223105 Nodularia spumigena Species 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 241000142651 Pelotomaculum thermopropionicum Species 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241000983938 Petrotoga mobilis Species 0.000 description 1
- 241001599925 Polaromonas naphthalenivorans Species 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 108010020346 Polyglutamic Acid Proteins 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 102100037787 Protein-tyrosine kinase 2-beta Human genes 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 101150013004 Rec8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 101150086465 SPO7 gene Proteins 0.000 description 1
- 101100139091 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) PUT4 gene Proteins 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 101000582398 Staphylococcus aureus Replication initiation protein Proteins 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 101000910045 Streptococcus thermophilus (strain ATCC BAA-491 / LMD-9) CRISPR-associated endonuclease Cas9 2 Proteins 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 1
- 241000203587 Streptosporangium roseum Species 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- 241000206213 Thermosipho africanus Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102100036407 Thioredoxin Human genes 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 241001673106 [Bacillus] selenitireducens Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 1
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 229940011019 arthrospira platensis Drugs 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 125000006367 bivalent amino carbonyl group Chemical group [H]N([*:1])C([*:2])=O 0.000 description 1
- 125000006297 carbonyl amino group Chemical group [H]N([*:2])C([*:1])=O 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000012411 cloning technique Methods 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 238000000749 co-immunoprecipitation Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- YSMODUONRAFBET-UHFFFAOYSA-N delta-DL-hydroxylysine Natural products NCC(O)CCC(N)C(O)=O YSMODUONRAFBET-UHFFFAOYSA-N 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 235000021186 dishes Nutrition 0.000 description 1
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- YSMODUONRAFBET-UHNVWZDZSA-N erythro-5-hydroxy-L-lysine Chemical compound NC[C@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-UHNVWZDZSA-N 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 229930182833 estradiol Natural products 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- 125000000816 ethylene group Chemical group [H]C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 235000010855 food raising agent Nutrition 0.000 description 1
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 1
- 229920000370 gamma-poly(glutamate) polymer Polymers 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000002672 hepatitis B Diseases 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- QJHBJHUKURJDLG-UHFFFAOYSA-N hydroxy-L-lysine Natural products NCCCCC(NO)C(O)=O QJHBJHUKURJDLG-UHFFFAOYSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000009776 industrial production Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 150000003951 lactams Chemical group 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005297 material degradation process Methods 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 230000008627 meiotic prophase Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000011278 mitosis Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 235000018343 nutrient deficiency Nutrition 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 230000008775 paternal effect Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 230000031877 prophase Effects 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 229930002330 retinoic acid Natural products 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000014639 sexual reproduction Effects 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000003270 steroid hormone Substances 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- YSMODUONRAFBET-WHFBIAKZSA-N threo-5-hydroxy-L-lysine Chemical compound NC[C@@H](O)CC[C@H](N)C(O)=O YSMODUONRAFBET-WHFBIAKZSA-N 0.000 description 1
- FGMPLJWBKKVCDB-UHFFFAOYSA-N trans-L-hydroxy-proline Natural products ON1CCCC1C(O)=O FGMPLJWBKKVCDB-UHFFFAOYSA-N 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 230000009261 transgenic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 229960001727 tretinoin Drugs 0.000 description 1
- 239000003744 tubulin modulator Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 230000009105 vegetative growth Effects 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 239000007222 ypd medium Substances 0.000 description 1
- 239000007221 ypg medium Substances 0.000 description 1
Abstract
A presente invenção se refere a uma proteína de fusão que compreende uma proteína Cas9 e uma proteína Spo11, bem como a uma célula hospedeira que compreende a referida proteína de fusão.The present invention relates to a fusion protein comprising a Cas9 protein and a Spo11 protein, as well as to a host cell comprising said fusion protein.
Description
[001] A presente invenção se situa no campo dos eucariotas, mais particularmente, no campo de microbiologia. A mesma está relacionada notavelmente a um método para aprimorar ou modificar uma cepa de levedura pela indução de recombinações meióticas endereçadas.[001] The present invention is located in the field of eukaryotes, more particularly, in the field of microbiology. It is notably related to a method for improving or modifying a yeast strain by inducing addressed meiotic recombinations.
[002] As leveduras são usadas em uma ampla variedade de indústrias. Devido à inocuidade de um grande número de espécies, as leveduras são especificamente usadas na indústria alimentícia como um agente de fermentação em panificação, fabrico de cerveja, produção de vinho ou destilação, ou como extratos para elementos nutricionais ou aromatizantes. Também podem ser usadas na produção industrial de bioetanol ou de moléculas de interesse como vitaminas, antibióticos, vacinas, enzimas ou hormônios esteroides, ou em processos de degradação de material celulósico.[002] Yeasts are used in a wide variety of industries. Due to the harmlessness of a large number of species, yeasts are specifically used in the food industry as a leavening agent in baking, brewing, wine production or distilling, or as extracts for nutritional or flavoring elements. They can also be used in the industrial production of bioethanol or molecules of interest such as vitamins, antibiotics, vaccines, enzymes or steroid hormones, or in cellulosic material degradation processes.
[003] A diversidade das aplicações industriais de leveduras significa que há uma constante demanda por cepas de levedura que têm características aprimoradas ou pelo menos que são adequadas para uma nova utilização ou novas condições de cultura.[003] The diversity of industrial applications of yeast means that there is a constant demand for yeast strains that have improved characteristics or at least that are suitable for a new use or new culture conditions.
[004] Para obter uma cepa que tem uma característica específica, uma pessoa versada na técnica pode utilizar reprodução sexual pelo cruzamento de duas cepas parentais que têm características de interesse e pela seleção de uma cepa híbrida que fornece a combinação desejada de características parentais. Esse método é, no entanto, aleatório e a etapa de seleção pode dispendiosa em termos de tempo.[004] To obtain a strain that has a specific characteristic, a person skilled in the art can utilize sexual reproduction by crossing two parental strains that have characteristics of interest and selecting a hybrid strain that provides the desired combination of parental characteristics. This method is, however, random and the selection step can be time-consuming.
[005] Alternativamente, a cepa também pode ser geneticamente modificada por uma técnica de DNA recombinante. Essa modificação pode, entretanto, atuar para reduzir seu uso, seja por razões legais, de saúde ou ambientais.[005] Alternatively, the strain can also be genetically modified by a recombinant DNA technique. This modification may, however, act to reduce their use, whether for legal, health or environmental reasons.
[006] Uma terceira alternativa consiste em provocar um reagrupamento de alelos paternais e maternais no genoma, durante a recombinação meiótica. A recombinação meiótica é uma troca de DNA entre cromossomas homólogos durante a meiose. A mesma é iniciada pela formação de quebras de filamento duplo em um ou o outro cromatídeo homólogo, seguido de reparo dessas quebras, utilizando como matriz, um cromatídeo do cromossoma homólogo. No entanto, as recombinações meióticas têm a desvantagem de serem aleatórias e não uniformes. De fato, os sítios de quebra de filamento duplo na origem dessas recombinações não são distribuídos homogeneamente no genoma. As denominadas regiões de "ponto de interesse (hotspot)" do cromossoma, onde a frequência de recombinação é alta, podem, então, ser distinguidas das denominadas regiões "frias" do cromossoma, em que a frequência de recombinação pode ser até 100 vezes menor.[006] A third alternative consists of causing a regrouping of paternal and maternal alleles in the genome, during meiotic recombination. Meiotic recombination is an exchange of DNA between homologous chromosomes during meiosis. It is initiated by the formation of double-strand breaks in one or the other homologous chromatid, followed by repair of these breaks, using a chromatid from the homologous chromosome as a matrix. However, meiotic recombinations have the disadvantage of being random and non-uniform. In fact, the double-strand break sites at the origin of these recombinations are not homogeneously distributed throughout the genome. The so-called "hotspot" regions of the chromosome, where the frequency of recombination is high, can then be distinguished from the so-called "cold" regions of the chromosome, where the frequency of recombination can be up to 100 times lower. .
[007] Spo11 é a proteína que catalisa as quebras de filamento duplo durante a meiose. A mesma atua como um dímero em cooperação com vários parceiros. Atualmente, os fatores que determinam a escolha de sítios de quebra de filamento duplo por Spo11 e seus parceiros permanecem mal compreendidos.[007] Spo11 is the protein that catalyzes double-strand breaks during meiosis. It acts as a dimer in cooperation with several partners. Currently, the factors that determine the choice of double-strand break sites by Spo11 and its partners remain poorly understood.
[008] O controle da formação de quebras de filamento duplo e, de fato, recombinações meióticas, é crucial para o desenvolvimento de técnicas de engenharia genérica. Mostrou- se recentemente que é possível modificar os sítios de formação de quebra de filamento duplo pela fusão de Spo11 com o domínio de ligação de DNA do ativador transcricional Gal4 (Pecina et al. , 2002 Cell, 111, 173-184). A proteína de fusão Gal4-Spo11 permite introduzir as quebras de filamento duplo nas denominadas regiões cromossômicas "frias", nos sítios de ligação de DNA de Gal4.[008] Controlling the formation of double strand breaks and, indeed, meiotic recombinations, is crucial for the development of generic engineering techniques. It has recently been shown that it is possible to modify double-strand break formation sites by fusing Spo11 with the DNA-binding domain of the transcriptional activator Gal4 (Pecina et al., 2002 Cell, 111, 173-184). The Gal4-Spo11 fusion protein allows the introduction of double-strand breaks in the so-called "cold" chromosomal regions, at the Gal4 DNA binding sites.
[009] No entanto, nessa última abordagem, a introdução de quebras de filamento duplo é condicionada pela presença de sítios de ligação de Gal4 e, desse modo, continua impossível a introdução de fenômenos de recombinação meiótica endereçada independentemente dos sítios de ligação específicos.[009] However, in this last approach, the introduction of double-strand breaks is conditioned by the presence of Gal4 binding sites and, therefore, it remains impossible to introduce meiotic recombination phenomena addressed independently of the specific binding sites.
[0010] O objetivo da presente invenção consiste em propor um método para induzir as recombinações meióticas endereçadas nas células eucarióticas, de preferência, em célula de plantas ou levedura, em qualquer região do genoma, independentemente de qualquer sítio de ligação conhecido e, notavelmente, nas denominadas regiões cromossômicas "frias".[0010] The objective of the present invention is to propose a method for inducing meiotic recombinations addressed in eukaryotic cells, preferably in plant or yeast cells, in any region of the genome, independently of any known binding site and, notably, in the so-called "cold" chromosomal regions.
[0011] Desse modo, de acordo com um primeiro aspecto, a presente invenção se refere a um método para induzir recombinações meióticas endereçadas em uma célula eucariótica que compreende[0011] Therefore, according to a first aspect, the present invention relates to a method for inducing targeted meiotic recombinations in a eukaryotic cell comprising
[0012] - introduzir na dita célula:[0012] - enter in said cell:
[0013] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[0013] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[0014] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 da proteína de fusão e uma sequência complementar à região cromossômica endereçada; e[0014] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain of the fusion protein and a sequence complementary to the chromosomal region addressed; It is
[0015] - induzir a dita célula a entrar na prófase meiótica I.[0015] - induce said cell to enter meiotic prophase I.
[0016] A proteína de fusão pode compreender adicionalmente uma sequência de sinal de localização nuclear.[0016] The fusion protein may additionally comprise a nuclear localization signal sequence.
[0017] De preferência, o domínio Cas9 da proteína de fusão é uma proteína Cas9 deficiente de nuclease.[0017] Preferably, the Cas9 domain of the fusion protein is a nuclease-deficient Cas9 protein.
[0018] O ácido nucleico que codifica a dita proteína de fusão pode ser colocado sob o controle de um promotor constitutivo, induzível ou específico de meiose.[0018] The nucleic acid encoding said fusion protein can be placed under the control of a constitutive, inducible or meiosis-specific promoter.
[0019] Um ou mais RNAs-guias adicionais que endereçam uma ou mais outras regiões cromossômicas, ou ácidos nucleicos que codificam ditos RNAs-guias adicionais, podem ser introduzidos na célula eucariótica.[0019] One or more additional guide RNAs that address one or more other chromosomal regions, or nucleic acids that encode said additional guide RNAs, can be introduced into the eukaryotic cell.
[0020] De preferência, a célula eucariótica é uma levedura. Desse modo, a levedura pode, então, ser induzida a entrar em prófase I pela transferência da mesma para o meio de esporulação.[0020] Preferably, the eukaryotic cell is a yeast. In this way, the yeast can then be induced to enter prophase I by transferring it to the sporulation medium.
[0021] Alternativamente, a célula eucariótica é uma célula de planta.[0021] Alternatively, the eukaryotic cell is a plant cell.
[0022] De preferência, a introdução da proteína de fusão, ou do ácido nucleico que codifica a mesma, e do gRNA(gRNAs), ou do ácido nucleico(ácidos nucleicos) que codifica a mesma, na dita célula é simultânea.[0022] Preferably, the introduction of the fusion protein, or the nucleic acid that encodes it, and the gRNA (gRNAs), or the nucleic acid (nucleic acids) that encodes the same, into said cell is simultaneous.
[0023] Alternativamente, a introdução da proteína de fusão, ou do ácido nucleico que codifica a mesma e do gRNA(gRNAs), ou do ácido nucleico(ácidos nucleicos) que codifica a mesma, na dita célula é sequencial.[0023] Alternatively, the introduction of the fusion protein, or the nucleic acid encoding it and the gRNA (gRNAs), or the nucleic acid (nucleic acids) encoding it, into said cell is sequential.
[0024] A introdução do ácido nucleico que codifica a proteína de fusão e do ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs) na dita célula também pode ser alcançada pelo cruzamento de duas células nas quais foram respectivamente introduzidas o ácido nucleico que codifica a proteína de fusão e o ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs).[0024] The introduction of the nucleic acid encoding the fusion protein and the nucleic acid(nucleic acids) encoding the gRNA(gRNAs) into said cell can also be achieved by crossing two cells into which the nucleic acid that encodes the fusion protein and the nucleic acid(nucleic acids) that encodes the gRNA(gRNAs).
[0025] A presente invenção está relacionada adicionalmente, de acordo com um segundo aspecto, a uma proteína de fusão como definido no método acima.[0025] The present invention further relates, according to a second aspect, to a fusion protein as defined in the method above.
[0026] De acordo com um terceiro aspecto, a presente invenção está relacionada adicionalmente a um ácido nucleico que codifica a proteína de fusão definida acima.[0026] According to a third aspect, the present invention further relates to a nucleic acid encoding the fusion protein defined above.
[0027] A presente invenção também está relacionada, de acordo com um quarto aspecto, a um cassete de expressão ou um vetor que compreende um ácido nucleico como definido acima.[0027] The present invention also relates, according to a fourth aspect, to an expression cassette or a vector comprising a nucleic acid as defined above.
[0028] De preferência, o vetor é um plasmídeo que compreende uma origem de replicação bacteriana, um cassete de expressão que compreende um ácido nucleico como definido acima, um ou mais marcadores de seleção e/ou uma ou mais sequências que permitem a inserção endereçada do vetor, do cassete de expressão ou do ácido nucleico no genoma de célula hospedeira. Em particular, o plasmídeo compreende uma origem de replicação bacteriana, de preferência, a origem ColE1, um cassete de expressão que compreende um ácido nucleico como definido acima sob o controle de um promotor, de preferência, o promotor de ADH1, um terminador, de preferência, o terminador de ADH1, um ou mais marcadores de seleção, de preferência, marcadores de resistência como o gene para resistência a canamicina ou a ampicilina, uma ou mais sequências que permitem a inserção endereçada do vetor, do cassete de expressão ou do ácido nucleico no genoma de célula hospedeira, de preferência, no locus TRP1 do genoma de uma levedura. De preferência, o plasmídeo compreende, ou consiste em, uma sequência de nucleotídeos selecionada a partir de SEQ ID NO: 1 e SEQ ID NO: 2.[0028] Preferably, the vector is a plasmid comprising a bacterial origin of replication, an expression cassette comprising a nucleic acid as defined above, one or more selection markers and/or one or more sequences that allow targeted insertion of the vector, expression cassette or nucleic acid in the host cell genome. In particular, the plasmid comprises a bacterial origin of replication, preferably the ColE1 origin, an expression cassette comprising a nucleic acid as defined above under the control of a promoter, preferably the ADH1 promoter, a terminator, preferably, the ADH1 terminator, one or more selection markers, preferably resistance markers such as the gene for kanamycin or ampicillin resistance, one or more sequences that allow targeted insertion of the vector, expression cassette or acid nucleic acid in the host cell genome, preferably in the TRP1 locus of the yeast genome. Preferably, the plasmid comprises, or consists of, a nucleotide sequence selected from SEQ ID NO: 1 and SEQ ID NO: 2.
[0029] De acordo com um quinto aspecto, a presente invenção também se refere a uma célula hospedeira que compreende uma proteína de fusão, um ácido nucleico, um cassete ou um vetor como definido acima.[0029] According to a fifth aspect, the present invention also relates to a host cell comprising a fusion protein, a nucleic acid, a cassette or a vector as defined above.
[0030] De preferência, a célula hospedeira é uma célula eucariótica, com mais preferência, uma célula de levedura, planta, fúngica ou animal e, particularmente, de preferência, a célula hospedeira é uma célula de planta ou uma célula de levedura.[0030] Preferably, the host cell is a eukaryotic cell, more preferably, a yeast, plant, fungal or animal cell, and particularly preferably, the host cell is a plant cell or a yeast cell.
[0031] De preferência, a célula hospedeira é uma célula de levedura, com mais preferência, uma levedura selecionada a partir do grupo que consiste em Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus(também chamado Saccharomyces carlsbergensis), e os híbridos obtidos a partir de pelo menos uma cepa que pertence a uma dessas espécies e, particularmente, de preferência, a célula hospedeira é Saccharomyces cerevisiae.[0031] Preferably, the host cell is a yeast cell, more preferably, a yeast selected from the group consisting of Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus (also called Saccharomyces carlsbergensis), and hybrids obtained from at least one strain belonging to one of these species and, particularly, preferably, the host cell is Saccharomyces cerevisiae.
[0032] Alternativamente, a célula hospedeira é uma célula de planta, com mais preferência, uma célula de planta selecionada a partir do grupo que consiste em arroz, trigo, soja, maís, tomate, Arabidopsis thaliana, cevada, colza, algodão, cana-de-açúcar e beterraba e, particularmente, de preferência, a dita célula hospedeira é uma célula de arroz.[0032] Alternatively, the host cell is a plant cell, more preferably, a plant cell selected from the group consisting of rice, wheat, soybeans, corn, tomatoes, Arabidopsis thaliana, barley, rapeseed, cotton, sugarcane -sugar and beet, and particularly preferably, said host cell is a rice cell.
[0033] A presente invenção está relacionada adicionalmente a, em um sexto aspecto, um método para gerar variantes de um organismo eucariótico, com a exceção de humanos, que compreende:[0033] The present invention further relates to, in a sixth aspect, a method for generating variants of a eukaryotic organism, other than humans, which comprises:
[0034] - introduzir em uma célula do dito organismo:[0034] - introduce into a cell of said organism:
[0035] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[0035] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[0036] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 e uma sequência complementar a uma região cromossômica endereçada; e[0036] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain and a sequence complementary to an addressed chromosomal region ; It is
[0037] - induzir a dita célula a entrar na prófase meiótica I;[0037] - inducing said cell to enter meiotic prophase I;
[0038] - obter uma célula ou células que têm a recombinação(recombinações) desejada(desejadas) na região cromossômica endereçada(regiões cromossômicas endereçadas); e[0038] - obtain a cell or cells that have the desired recombination (recombinations) in the addressed chromosomal region (addressed chromosomal regions); It is
[0039] - gerar uma variante do organismo da dita célula recombinante.[0039] - generating a variant of the organism of said recombinant cell.
[0040] De preferência, o organismo eucariótico é uma levedura ou uma planta, com mais preferência, uma levedura, notavelmente uma cepa de levedura de interesse industrial.[0040] Preferably, the eukaryotic organism is a yeast or a plant, more preferably, a yeast, notably a strain of yeast of industrial interest.
[0041] Em um sétimo aspecto, a presente invenção também está relacionada a um método para identificar ou localizar as informações genéticas que codificam uma característica de interesse em um genoma de célula eucariótica que compreende:[0041] In a seventh aspect, the present invention also relates to a method for identifying or locating genetic information encoding a characteristic of interest in a eukaryotic cell genome comprising:
[0042] - introduzir na célula eucariótica:[0042] - introduce into the eukaryotic cell:
[0043] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[0043] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[0044] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 e uma sequência complementar a uma região cromossômica endereçada; e[0044] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain and a sequence complementary to an addressed chromosomal region ; It is
[0045] - induzir a dita célula a entrar na prófase meiótica I;[0045] - inducing said cell to enter meiotic prophase I;
[0046] - obter uma célula ou células que têm a recombinação(recombinações) desejada(desejadas) na região cromossômica endereçada(regiões cromossômicas endereçadas); e[0046] - obtain a cell or cells that have the desired recombination (recombinations) in the addressed chromosomal region (addressed chromosomal regions); It is
[0047] - analisar os genótipos e fenótipos das células recombinantes a fim de identificar ou localizar as informações genéticas que codificam a característica de interesse.[0047] - analyze the genotypes and phenotypes of recombinant cells in order to identify or locate the genetic information that encodes the characteristic of interest.
[0048] De preferência, a célula eucariótica é uma levedura ou uma planta, com mais preferência, uma levedura, notavelmente uma cepa de levedura de interesse industrial.[0048] Preferably, the eukaryotic cell is a yeast or a plant, more preferably, a yeast, notably a strain of yeast of industrial interest.
[0049] De preferência, a característica de interesse é um trato de interesse quantitativo (QTL).[0049] Preferably, the characteristic of interest is a quantitative tract of interest (QTL).
[0050] A presente invenção está relacionada adicionalmente a, em um oitavo aspecto, um kit que compreende uma proteína de fusão, um ácido nucleico, um cassete, um vetor ou uma célula hospedeira como definido acima.[0050] The present invention further relates to, in an eighth aspect, a kit comprising a fusion protein, a nucleic acid, a cassette, a vector or a host cell as defined above.
[0051] Finalmente, em um nono aspecto, a presente invenção está relacionada ao uso de um kit como definido acima para implantar um método como definido acima, em particular, para (i) induzir as recombinações meióticas endereçadas em uma célula eucariótica, (ii) gerar variantes de um organismo eucariótico, e/ou (iii) identificar ou localizar as informações genéticas que codificam uma característica de interesse em um genoma de célula eucariótica.[0051] Finally, in a ninth aspect, the present invention relates to the use of a kit as defined above to implement a method as defined above, in particular, to (i) induce targeted meiotic recombinations in a eukaryotic cell, (ii ) generate variants of a eukaryotic organism, and/or (iii) identify or locate the genetic information that encodes a characteristic of interest in a eukaryotic cell genome.
[0052] Figura 1: Diagrama que representa os plasmídeos P1 (SEQ ID NO: 1) e P2 (SEQ ID NO: 2) da fusão de SpCas9-Spo11 ou SpCas9*-Spo11. P1 e P2 codificam respectivamente a expressão de NLS-SpCas9-Spo11 e NLS-SpCas9*- Spo11 na levedura. Os blocos pretos representam o promotor de ADH1 de constitutivo (pADH1) e o terminador de ADH1 (tADH1). A seta indica a direção de transcrição sob o controle do promotor de ADH1.[0052] Figure 1: Diagram representing plasmids P1 (SEQ ID NO: 1) and P2 (SEQ ID NO: 2) of the SpCas9-Spo11 or SpCas9*-Spo11 fusion. P1 and P2 respectively encode the expression of NLS-SpCas9-Spo11 and NLS-SpCas9*- Spo11 in yeast. Black blocks represent the constitutive ADH1 promoter (pADH1) and the ADH1 terminator (tADH1). The arrow indicates the direction of transcription under the control of the ADH1 promoter.
[0053] Figura 2: Diagrama que representa os plasmídeos de expressão de gRNA em células de levedura. (A) Diagrama do plasmídeo que contém um único cassete de expressão de gRNA para endereçar uma única região do genoma de levedura. RE indica o sítio de restrição em que a sequência que determina a especificidade (SDS) do gRNA é inserida pelo método Gibson. O promotor e o terminador (Term) são dependentes de RNA polimerase III. A seta no promotor indica a direção de transcrição da sequência. Um cassete de expressão de gRNA contém um gRNA flanqueado por um promotor e um terminador. (B) Diagrama do plasmídeo que contém diversos cassetes de expressão de gRNA para endereçar múltiplas regiões do genoma de levedura (endereçamento multiplexado). Os vários cassetes de gRNA são distinguidos por sua sequência que determina a especificidade (SDS). Os mesmos foram introduzidos sucessivamente no sítio de clonagem múltipla (MCS) por técnicas de ligação/clonagem convencionais.[0053] Figure 2: Diagram representing gRNA expression plasmids in yeast cells. (A) Diagram of the plasmid containing a single gRNA expression cassette to address a single region of the yeast genome. RE indicates the restriction site into which the sequence that determines the specificity (SDS) of the gRNA is inserted by the Gibson method. The promoter and terminator (Term) are dependent on RNA polymerase III. The arrow on the promoter indicates the direction of transcription of the sequence. A gRNA expression cassette contains a gRNA flanked by a promoter and a terminator. (B) Diagram of the plasmid containing several gRNA expression cassettes to address multiple regions of the yeast genome (multiplexed addressing). The various gRNA cassettes are distinguished by their specificity-determining sequence (SDS). They were successively introduced into the multiple cloning site (MCS) by conventional ligation/cloning techniques.
[0054] Figura 3: Diagrama que representa o plasmídeo P1 (SEQ ID NO: 1).[0054] Figure 3: Diagram representing the P1 plasmid (SEQ ID NO: 1).
[0055] Figura 4: Diagrama que representa o plasmídeo P2 (SEQ ID NO: 2).[0055] Figure 4: Diagram representing the P2 plasmid (SEQ ID NO: 2).
[0056] Figura 5: Viabilidade de esporos derivados da esporulação de cepas que expressam ou não expressam a proteína de fusão SpCas9*-Spo11. O crescimento de esporos derivados de meiose das cepas diploides SPO11/SPO11 (ORD7339), spo11/spo11 (AND2822), spoll/spoll dCAS9-SPO11/0 (AND2820) e spoll/spoll dCAS9-SPOll/dCAS9-SPOll (AND2823).[0056] Figure 5: Viability of spores derived from the sporulation of strains that do or do not express the SpCas9*-Spo11 fusion protein. Growth of meiosis-derived spores of the diploid strains SPO11/SPO11 (ORD7339), spo11/spo11 (AND2822), spoll/spoll dCAS9-SPO11/0 (AND2820), and spoll/spoll dCAS9-SPOll/dCAS9-SPOll (AND2823).
[0057] Figura 6: O endereçamento de DSBs meióticas pela proteína de fusão SpCas9*-Spo11 e um RNA-guia específico para a região YCR048W. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda. Os quadrados pretos indicam os sítios de DSB naturais. O triângulo preto indica os sítios de DSB endereçados pelo RNA-guia UAS1-YCR048W. A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0057] Figure 6: Addressing meiotic DSBs by the SpCas9*-Spo11 fusion protein and a guide RNA specific for the YCR048W region. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe. Black squares indicate natural DSB sites. The black triangle indicates the DSB sites addressed by the UAS1-YCR048W guide RNA. The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0058] Figura 7: O endereçamento de DSBs meióticas pela proteína de fusão SpCas9*-Spo11 e duas RNAs-guias específicas para a região YCR048W. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda. Os quadrados pretos indicam os sítios de DSB naturais. O triângulo preto indica os sítios de DSB endereçados pelo RNA-guia UAS1-YCR048W. O círculo preto indica os sítios de DSB endereçados pelo RNA-guia UAS2-YCR048W. A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0058] Figure 7: Addressing meiotic DSBs by the SpCas9*-Spo11 fusion protein and two guide RNAs specific to the YCR048W region. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe. Black squares indicate natural DSB sites. The black triangle indicates the DSB sites addressed by the UAS1-YCR048W guide RNA. The black circle indicates the DSB sites addressed by the UAS2-YCR048W guide RNA. The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0059] Figura 8: O endereçamento de DSBs meióticas pela proteína de fusão SpCas9*-Spo11 e um RNA-guia específico para a região GAL2. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda. A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0059] Figure 8: Addressing meiotic DSBs by the SpCas9*-Spo11 fusion protein and a guide RNA specific for the GAL2 region. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe. The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0060] Figura 9: O endereçamento de DSBs meióticas pela proteína de fusão SpCas9*-Spo11 e um RNA-guia específico para a região SWC3. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda (triângulo hachurado). A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0060] Figure 9: Addressing meiotic DSBs by the SpCas9*-Spo11 fusion protein and a guide RNA specific for the SWC3 region. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe (hatched triangle). The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0061] Figura 10: Endereçamento multiplexado de DSBs meióticas pela proteína de fusão SpCas9*-Spo11 e diversos RNAs- guias específicos para a região GAL2. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda (triângulo hachurado). A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0061] Figure 10: Multiplexed addressing of meiotic DSBs by the SpCas9*-Spo11 fusion protein and several guide RNAs specific to the GAL2 region. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe (hatched triangle). The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0062] Figura 11: Estímulo de recombinação meiótica pela proteína SpCas9*-SPO11 e um RNA-guia na região-alvo GAL2. (A) Diagrama do teste genético para detectar os recombinantes no sítio GAL2. (B) Teste para recombinação genética no locus GAL2.[0062] Figure 11: Stimulation of meiotic recombination by the SpCas9*-SPO11 protein and a guide RNA in the GAL2 target region. (A) Diagram of the genetic test to detect recombinants at the GAL2 site. (B) Test for genetic recombination at the GAL2 locus.
[0063] Figura 12: O endereçamento de DSBs meióticas pela proteína SpCas9*-Spo11 e um RNA-guia específico para a sequência de codificação de gene de PUT4. À direita do gel, um gráfico indica a posição dos genes (regiões de codificação, setas cinzas) e a posição da sonda (triângulo hachurado). A porcentagem de DSBs corresponde à razão entre a intensidade de sinal do fragmento considerado e o sinal total da faixa.[0063] Figure 12: The addressing of meiotic DSBs by the SpCas9*-Spo11 protein and a guide RNA specific for the PUT4 gene coding sequence. To the right of the gel, a graph indicates the position of the genes (coding regions, gray arrows) and the position of the probe (hatched triangle). The percentage of DSBs corresponds to the ratio between the signal intensity of the fragment considered and the total signal of the band.
[0064] Figura 13: Sequências dos gRNAs usados. Nos caracteres maiúsculos e minúsculos são respectivamente indicadas a sequência que determina a especificidade do gRNA (20 nucleotídeos de comprimento) e a sequência que constitui a estrutura do gRNA (“pega”, 82 nucleotídeos de comprimento).[0064] Figure 13: Sequences of the gRNAs used. The upper and lower case characters respectively indicate the sequence that determines the specificity of the gRNA (20 nucleotides long) and the sequence that constitutes the structure of the gRNA (“handle”, 82 nucleotides long).
[0065] Figura 14: Diagrama da construção para expressar a proteína dCas9-Spo11 de fusão no arroz. pZmUbi e tNOS correspondem, respectivamente, ao promotor e ao terminador usados nessa construção.[0065] Figure 14: Diagram of the construct to express the dCas9-Spo11 fusion protein in rice. pZmUbi and tNOS correspond, respectively, to the promoter and terminator used in this construct.
[0066] O sistema Repetições Palindrômicas Curtas Agrupadas e Regularmente Interespaçadas (CRISPR)-Cas9 é um sistema de defesa bacteriano contra DNA exógeno. Esse sistema se encontra essencialmente na associação de uma proteína Cas9 e um RNA-“guia” (gRNA ou sgRNA) responsável pela especificidade do sítio de clivagem. O mesmo pode ser usado para criar as quebras de filamento duplo de DNA (DSBs) nos sítios endereçados pelo sistema CRISPR/Cas9. Esse sistema já foi usado para engenharia endereçada do genoma em células eucarióticas (consulte, por exemplo, o pedido de patente EP2764103), células notavelmente humanas (Cong L et al., 2013, Science 339(6121):819-823; Mali P et al., 2013, Science, 339(6121):823-826; Cho SW et al., 2013, Nature Biotechnology 31(3):230-232), células de rato (Li D, et al., 2013, Nature Biotechnology, 31(8):681-683; WO 2014/089290), células de camundongo (Wang H et al., 2013, Cell, 153(4):910-918), células de coelho (Yang D et al., 2014, Journal of Molecular Cell Biology, 6(1):97-99), células de sapo (Nakayama T et al. , 2013, Genesis, 51(12):835-843), células de peixe (Hwang WY et al. , 2013, Nature Biotechnology, 31(3):227-229), célula de plantas (Shan Q et al., 2013, Nature Biotechnology, 31(8):686-688; Jiang W et al., 2013, Nucleic Acids Research, 41(20):e188), células de drosofila (Yu Z et al., 2013, Genetics, 195(1):289- 291), células de nematodo (Friedland AE et al., 2013, Nature Methods, 10(8):741-743), células de levedura (DiCarlo J, et al., 2013, Genome engineering in Saccharomyces cerevisiae com uso de sistemas CRISPR-Cas. Nucleic Acids Research 41(7):4336- 4343), mas também células bacterianas (Jiang W et al., 2013, Nature Biotechnology, 31(3):233-239). Por outro lado, esse sistema nunca foi usado para endereçar os sítios de recombinação meiótica em qualquer organismo.[0066] The Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR)-Cas9 system is a bacterial defense system against exogenous DNA. This system is essentially found in the association of a Cas9 protein and a “guide” RNA (gRNA or sgRNA) responsible for the specificity of the cleavage site. It can be used to create DNA double-strand breaks (DSBs) at sites addressed by the CRISPR/Cas9 system. This system has already been used for targeted genome engineering in eukaryotic cells (see, for example, patent application EP2764103), notably human cells (Cong L et al., 2013, Science 339(6121):819-823; Mali P et al., 2013, Science, 339(6121):823-826; Cho SW et al., 2013, Nature Biotechnology 31(3):230-232), rat cells (Li D, et al., 2013, Nature Biotechnology, 31(8):681-683; WO 2014/089290), mouse cells (Wang H et al., 2013, Cell, 153(4):910-918), rabbit cells (Yang D et al. ., 2014, Journal of Molecular Cell Biology, 6(1):97-99), frog cells (Nakayama T et al., 2013, Genesis, 51(12):835-843), fish cells (Hwang WY et al., 2013, Nature Biotechnology, 31(3):227-229), plant cell (Shan Q et al., 2013, Nature Biotechnology, 31(8):686-688; Jiang W et al., 2013 , Nucleic Acids Research, 41(20):e188), drosophila cells (Yu Z et al., 2013, Genetics, 195(1):289- 291), nematode cells (Friedland AE et al., 2013, Nature Methods, 10(8):741-743), yeast cells (DiCarlo J, et al., 2013, Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems. Nucleic Acids Research 41(7):4336- 4343), but also bacterial cells (Jiang W et al., 2013, Nature Biotechnology, 31(3):233-239). On the other hand, this system has never been used to address the sites of meiotic recombination in any organism.
[0067] Os inventores mostraram que é possível modificar o sistema CRISPR-Cas9 a fim de induzir as recombinações meióticas endereçadas em uma célula eucariótica e, em particular, em uma levedura. Os mesmos, de fato, mostraram que a expressão combinada de uma proteína Spo11-Cas9 de fusão e um ou mais RNAs-guias possibilitou endereçar a ação do transesterase Spo11 que é responsável pelas quebras de filamento duplo durante a meiose. O reparo dessas quebras usando como matriz um cromatídeo do cromossoma homólogo induz os fenômenos de recombinação desejados.[0067] The inventors have shown that it is possible to modify the CRISPR-Cas9 system in order to induce targeted meiotic recombinations in a eukaryotic cell and, in particular, in yeast. They, in fact, showed that the combined expression of a Spo11-Cas9 fusion protein and one or more guide RNAs made it possible to address the action of the Spo11 transesterase, which is responsible for double-strand breaks during meiosis. The repair of these breaks using a chromatid from the homologous chromosome as a matrix induces the desired recombination phenomena.
[0068] Desse modo, a presente invenção se refere a um método para induzir recombinações meióticas endereçadas em uma célula eucariótica que compreende[0068] Thus, the present invention relates to a method for inducing targeted meiotic recombinations in a eukaryotic cell comprising
[0069] - introduzir na dita célula:[0069] - enter in said cell:
[0070] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[0070] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[0071] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 da proteína de fusão e uma sequência complementar à região cromossômica endereçada; e[0071] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain of the fusion protein and a sequence complementary to the chromosomal region addressed; It is
[0072] - induzir a dita célula a entrar na prófase meiótica I.[0072] - induce said cell to enter meiotic prophase I.
[0073] Como usado no presente documento, o termo “célula eucariótica” se refere a uma célula de levedura, planta, fúngica ou animal, em particular, uma célula de mamífero como uma célula de camundongo ou uma célula de rato, ou uma célula de inseto. A célula eucariótica é, de preferência, não humana e/ou não embrionária.[0073] As used herein, the term “eukaryotic cell” refers to a yeast, plant, fungal or animal cell, in particular, a mammalian cell such as a mouse cell or a rat cell, or a cell of insect. The eukaryotic cell is preferably non-human and/or non-embryonic.
[0074] De acordo com uma modalidade particular, a célula eucariótica é uma célula de levedura, em particular, uma levedura de interesse industrial. As leveduras exemplificativas de interesse incluem, mas não são limitadas a, leveduras do gênero Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia ou Candida, bem como os híbridos obtidos a partir de uma cepa que pertencem a um desses gêneros.[0074] According to a particular embodiment, the eukaryotic cell is a yeast cell, in particular, a yeast of industrial interest. Exemplary yeasts of interest include, but are not limited to, yeasts of the genus Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia or Candida, as well as hybrids obtained from a strain belonging to one of these genera.
[0075] De preferência, a levedura de interesse pertence ao gênero Saccharomyces. A mesma pode, notavelmente, pertencer a uma espécie selecionada a partir do grupo que consiste em Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus e Saccharomyces pastorianus(também chamado de Saccharomyces carlsbergensis), ou é um híbrido obtido a partir de uma cepa que pertence a uma dessas espécies como, por exemplo, um híbrido S. cerevisiae/S. paradoxus ou um híbrido S. cerevisiae/S. uvarum.[0075] Preferably, the yeast of interest belongs to the genus Saccharomyces. It may, notably, belong to a species selected from the group consisting of Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus and Saccharomyces pastorianus(also called of Saccharomyces carlsbergensis), or is a hybrid obtained from a strain that belongs to one of these species, such as, for example, a S. cerevisiae/S. paradoxus or a hybrid S. cerevisiae/S. uvarum.
[0076] De acordo com uma outra modalidade particular, a célula eucariótica é uma célula fúngica, em particular, uma célula fúngica de interesse industrial. Os fungos exemplificativos incluem, porém sem limitação, células fúngicas filamentosas. Os fungos filamentosos incluem fungos que pertencem às subdivisões Eumycota e Oomycota. As células fúngicas filamentosas podem ser selecionadas a partir do grupo que consiste em células Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filobasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium ou Trametes.[0076] According to another particular embodiment, the eukaryotic cell is a fungal cell, in particular, a fungal cell of industrial interest. Exemplary fungi include, but are not limited to, filamentous fungal cells. Filamentous fungi include fungi that belong to the Eumycota and Oomycota subdivisions. Filamentous fungal cells can be selected from the group consisting of Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filobasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora cells , Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium or Trametes.
[0077] Ainda de acordo com uma outra modalidade particular, a célula eucariótica é uma célula de planta, em particular, uma célula de planta de interesse agronômico. As plantas exemplificativas incluem, porém sem limitação, arroz, trigo, soja, maís, tomate, Arabidopsis thaliana, cevada, colza, algodão, cana-de-açúcar e beterraba. De acordo com uma modalidade preferencial, a célula eucariótica é uma célula de arroz.[0077] According to yet another particular embodiment, the eukaryotic cell is a plant cell, in particular, a plant cell of agronomic interest. Exemplary plants include, but are not limited to, rice, wheat, soybeans, corn, tomatoes, Arabidopsis thaliana, barley, rapeseed, cotton, sugar cane and beets. According to a preferred embodiment, the eukaryotic cell is a rice cell.
[0078] De preferência, a célula eucariótica é heterozigoto para o(s) gene(genes) endereçado(endereçados) pelo(pelos) RNA-guia(RNA-guias).[0078] Preferably, the eukaryotic cell is heterozygous for the gene(s) addressed by the guide RNA.
[0079] Como usado no presente documento, o termo “proteína de fusão” se refere a uma proteína quimérica que compreende pelo menos dois domínios derivados da combinação de diferentes proteínas ou fragmentos de proteína. O ácido nucleico que codifica essa proteína é obtido pela recombinação das regiões que codificam as proteínas ou fragmentos de proteína de modo que estejam na fase e sejam transcritas no mesmo mRNA. Os vários domínios da proteína de fusão podem ser diretamente adjacentes ou podem ser separados pela ligação de sequências (ligantes) que introduzem uma certa flexibilidade estrutural na construção.[0079] As used herein, the term “fusion protein” refers to a chimeric protein that comprises at least two domains derived from the combination of different proteins or protein fragments. The nucleic acid that encodes this protein is obtained by recombining the regions that encode proteins or protein fragments so that they are in phase and are transcribed into the same mRNA. The various domains of the fusion protein can be directly adjacent or can be separated by the binding of sequences (linkers) that introduce a certain structural flexibility into the construct.
[0080] A proteína de fusão usada na presente invenção compreende um domínio Cas9 e um domínio Spo11.[0080] The fusion protein used in the present invention comprises a Cas9 domain and a Spo11 domain.
[0081] O domínio Cas9 é o domínio da proteína de fusão que tem capacidade para interagir com os RNAs-guias e para endereçar a atividade de nuclease do domínio Spo11 para a direção de uma determinada região cromossômica. O domínio Cas9 pode consistir em uma proteína Cas9 (também chamada de Csn1 ou Csx12), do tipo selvagem ou modificada, ou um fragmento dessa proteína com capacidade para interagir com os RNAs-guias. A proteína Cas9 pode ser notavelmente modificada a fim de modular sua atividade enzimática. Desse modo, a atividade de nuclease da proteína Cas9 pode ser modificada ou inativada. A proteína Cas9 também pode ser truncada para remover os domínios de proteína não essenciais para as funções da proteína de fusão, em particular, os domínios de proteína Cas9 que não são necessários para interação com os RNAs-guias.[0081] The Cas9 domain is the fusion protein domain that has the ability to interact with guide RNAs and to direct the nuclease activity of the Spo11 domain towards a specific chromosomal region. The Cas9 domain may consist of a wild-type or modified Cas9 protein (also called Csn1 or Csx12), or a fragment of this protein capable of interacting with guide RNAs. The Cas9 protein can be notably modified in order to modulate its enzymatic activity. In this way, the nuclease activity of the Cas9 protein can be modified or inactivated. The Cas9 protein can also be truncated to remove protein domains not essential for the functions of the fusion protein, in particular, Cas9 protein domains that are not required for interaction with guide RNAs.
[0082] A proteína Cas9 ou fragmento da mesma como usado na presente invenção pode ser obtida a partir de qualquer proteína Cas9 conhecida (Makarova et al., 2008, Nat. Rev. Microbiol., 9, páginas 466-477). As proteínas Cas9 exemplificativas que podem ser usadas na presente invenção incluem, porém sem limitação, as proteínas Cas9 de Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, Caldicellulosiruptor bescii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsonii, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, ou Acaryochloris marina. Outras proteínas Cas9 que podem ser usadas na presente invenção são também descritas no artigo de Makarova et al. (Makarova et al. , 2008, Nat. Rev. Microbiol., 9, páginas 466-477). De preferência, o domínio Cas9 compreende, ou consiste em, a proteína Cas9 de Streptococcus pyogenes(número de entrada de NCBI: WP_010922251.1, SEQ ID NO: 8) ou um fragmento da mesma com capacidade para interagir com os RNAs-guias.[0082] The Cas9 protein or fragment thereof as used in the present invention can be obtained from any known Cas9 protein (Makarova et al., 2008, Nat. Rev. Microbiol., 9, pages 466-477). Exemplary Cas9 proteins that may be used in the present invention include, but are not limited to, Cas9 proteins from Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp., Nocardiopsis dassonvillei, Streptomyces pristinaespiralis, Streptomyces viridochromogenes, Streptosporangium roseum, Alicyclobacillus acidocaldarius, Bacillus pseudomycoides, Bacillus selenitireducens, Exiguobacterium sibiricum, Lactobacillus delbrueckii, Lactobacillus salivarius, Microscilla marina, Burkholderiales bacterium, Polaromonas naphthalenivorans, Polaromonas sp., Crocosphaera watsonii, Cyanothece sp., Microcystis aeruginosa, Synechococcus sp., Acetohalobium arabaticum, Ammonifex degensii, llulosiruptor bescii, Candidatus Desulforudis, Clostridium botulinum, Clostridium difficile, Finegoldia magna, Natranaerobius thermophilus, Pelotomaculum thermopropionicum, Acidithiobacillus caldus, Acidithiobacillus ferrooxidans, Allochromatium vinosum, Marinobacter sp., Nitrosococcus halophilus, Nitrosococcus watsonii, Pseudoalteromonas haloplanktis, Ktedonobacter racemifer, Methanohalobium evestigatum, Anabaena variabilis, Nodularia spumigena, Nostoc sp., Arthrospira maxima, Arthrospira platensis, Arthrospira sp., Lyngbya sp., Microcoleus chthonoplastes, Oscillatoria sp., Petrotoga mobilis, Thermosipho africanus, or Acaryochloris marina. Other Cas9 proteins that can be used in the present invention are also described in the article by Makarova et al. (Makarova et al., 2008, Nat. Rev. Microbiol., 9, pages 466-477). Preferably, the Cas9 domain comprises, or consists of, the Streptococcus pyogenes Cas9 protein (NCBI accession number: WP_010922251.1, SEQ ID NO: 8) or a fragment thereof capable of interacting with guide RNAs.
[0083] De acordo com uma modalidade particular, o domínio Cas9 consiste em uma proteína Cas9 integral, de preferência, a proteína Cas9 de Streptococcus pyogenes.[0083] According to a particular embodiment, the Cas9 domain consists of an integral Cas9 protein, preferably the Cas9 protein from Streptococcus pyogenes.
[0084] Em geral, as proteínas Cas9 compreendem dois domínios de nuclease: um domínio relacionado a um domínio RuvC e um domínio relacionado a um domínio de HNH. Esses dois domínios cooperam para criar as quebras de filamento duplo de DNA (Jinek et al. , Science, 337: 816-821). Cada um desses domínios de nuclease pode ser inativado por deleção, inserção ou substituição de acordo com técnicas bem conhecidas por uma pessoa versada na técnica como mutagênese direcionada, mutagênese de PCR ou síntese de gene total. Desse modo, o domínio RuvC pode ser inativado, por exemplo, pela substituição D10A e o domínio de HNH pode ser inativado, por exemplo, pela substituição H840A (Jinek et al., Science, 337: 816-821), em que as posições indicadas são aquelas de SEQ ID NO: 8.[0084] In general, Cas9 proteins comprise two nuclease domains: a domain related to a RuvC domain and a domain related to an HNH domain. These two domains cooperate to create DNA double-strand breaks (Jinek et al., Science, 337: 816-821). Each of these nuclease domains can be inactivated by deletion, insertion or replacement according to techniques well known to a person skilled in the art such as targeted mutagenesis, PCR mutagenesis or total gene synthesis. Thus, the RuvC domain can be inactivated, for example, by the D10A substitution and the HNH domain can be inactivated, for example, by the H840A substitution (Jinek et al., Science, 337: 816-821), in which the positions indicated are those of SEQ ID NO: 8.
[0085] Nas sequências de peptídeo descritas nesse documento, os aminoácidos são representados por seu código de uma letra de acordo com a seguinte nomenclatura: C: cisteína; D: ácido aspártico; E: ácido glutâmico; F: fenilalanina; G: glicina; H: histidina; I: isoleucina; K: lisina; L: leucina; M: metionina; N: asparagina; P: prolina; Q: glutamina; R: arginina; S: serina; T: treonina; V: valina; W: triptofano e Y: tirosina.[0085] In the peptide sequences described in this document, amino acids are represented by their one-letter code according to the following nomenclature: C: cysteine; D: aspartic acid; E: glutamic acid; F: phenylalanine; G: glycine; H: histidine; I: isoleucine; K: lysine; L: leucine; M: methionine; N: asparagine; P: proline; Q: glutamine; A: arginine; S: serine; T: threonine; V: valine; W: tryptophan and Y: tyrosine.
[0086] De acordo com uma modalidade, o domínio Cas9 é deficiente em pelo menos uma atividade de nuclease. Esse domínio pode ser obtido pela inativação de pelo menos um domínio de nuclease da proteína Cas9 como descrito acima.[0086] According to one embodiment, the Cas9 domain is deficient in at least one nuclease activity. This domain can be obtained by inactivating at least one nuclease domain of the Cas9 protein as described above.
[0087] De acordo com uma modalidade particular, o domínio Cas9 compreende, ou consiste em, uma proteína Cas9 ou um fragmento de proteína Cas9, que carece da atividade de nuclease (também chamada de Cas9* ou dCas9). Essa forma cataliticamente inativa pode ser obtida pela inativação dos dois domínios de nuclease da proteína Cas9 como mencionado acima, por exemplo, pela introdução das duas mutações de ponto que substituem o aspartato na posição 10 e a histidina na posição 840 por alaninas.[0087] According to a particular embodiment, the Cas9 domain comprises, or consists of, a Cas9 protein or a Cas9 protein fragment, which lacks nuclease activity (also called Cas9* or dCas9). This catalytically inactive form can be obtained by inactivating the two nuclease domains of the Cas9 protein as mentioned above, for example, by introducing the two point mutations that replace the aspartate at position 10 and the histidine at position 840 with alanines.
[0088] De acordo com uma modalidade preferencial, o domínio Cas9 compreende, ou consiste em, uma proteína Cas9, de preferência, a proteína Cas9 de Streptococcus pyogenes (spCas9), que carece de atividade de nuclease (spCas9*).[0088] According to a preferred embodiment, the Cas9 domain comprises, or consists of, a Cas9 protein, preferably the Cas9 protein from Streptococcus pyogenes (spCas9), which lacks nuclease activity (spCas9*).
[0089] De acordo com uma modalidade particular, o domínio Cas9 compreende, ou consiste em, a sequência apresentada em SEQ ID NO: 8, em que o aspartato na posição 10 e a histidina na posição 840 foram substituídos por alaninas.[0089] According to a particular embodiment, the Cas9 domain comprises, or consists of, the sequence presented in SEQ ID NO: 8, in which the aspartate at position 10 and histidine at position 840 have been replaced by alanines.
[0090] Spo11 é uma proteína relacionada à subunidade A catalítica de um topoisomerase tipo II presente em arquebactéria (Bergerat et al. ,Nature, vol. 386, página 414 7). A mesma catalisa as quebras de filamento duplo de DNA que iniciam as recombinações meióticas. A mesma é uma proteína altamente conservada para a qual existem homólogos em todos os eucariotas. Spo11 é ativo como um dímero formado de duas subunidades, cada uma das quais dividem um filamento de DNA. Embora essencial, Spo11 não atua sozinha para gerar quebras de filamento duplo durante a meiose. Na levedura S. cerevisiae, por exemplo, a mesma coopera com proteínas Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 e Spp1 e com outros parceiros descritos nos artigos por Keeney et al. (2001 Curr. Top. Dev. Biol, 52, páginas 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, páginas 200-211) e Acquaviva et al. (2013 Science, 339, páginas 215-8). No entanto, mostrou-se recentemente que o endereçamento de Spo11 para um determinado sítio é suficiente para iniciar o processo de recombinação meiótica (Pecina et al., 2002 Cell, 111, 173-184). Deve-se notar que diversos homólogos de proteína Spo11 podem coexistir na mesma célula, notavelmente em plantas. De preferência, a proteína Spo11 é uma das proteínas Spo11 da célula eucariótica de interesse.[0090] Spo11 is a protein related to the catalytic A subunit of a type II topoisomerase present in archaea (Bergerat et al., Nature, vol. 386, page 414 7). It catalyzes the DNA double-strand breaks that initiate meiotic recombinations. It is a highly conserved protein for which homologues exist in all eukaryotes. Spo11 is active as a dimer made up of two subunits, each of which shares a strand of DNA. Although essential, Spo11 does not act alone to generate double-strand breaks during meiosis. In the yeast S. cerevisiae, for example, it cooperates with proteins Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 and Spp1 and with other partners described in the articles by Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pages 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pages 200-211) and Acquaviva et al. (2013 Science, 339, pages 215-8). However, it has recently been shown that targeting Spo11 to a particular site is sufficient to initiate the process of meiotic recombination (Pecina et al., 2002 Cell, 111, 173-184). It should be noted that several Spo11 protein homologs can coexist in the same cell, notably in plants. Preferably, the Spo11 protein is one of the Spo11 proteins of the eukaryotic cell of interest.
[0091] O domínio Spo11 da proteína de fusão Cas9- Spo11 é, em geral, o domínio responsável pelas quebras de filamento duplo. Esse domínio pode consistir em uma proteína Spo11 ou fragmento da mesma com capacidade para induzir quebras de filamento duplo de DNA.[0091] The Spo11 domain of the Cas9-Spo11 fusion protein is, in general, the domain responsible for double-strand breaks. This domain may consist of a Spo11 protein or a fragment thereof with the ability to induce DNA double-strand breaks.
[0092] A proteína Spo11 ou fragmento da mesma como usado na presente invenção pode ser obtida a partir de qualquer proteína Spo11 como a proteína Spo11 de Saccharomyces cerevisiae (Gene ID: 856364, número de entrada de NCBI: NP_011841 (SEQ ID NO: 9) Esposito and Esposito, Genetics, 1969, 61, páginas 79-89), as proteínas AtSpo11-1 e AtSpo11-2 de Arabidopsis thaliana (Grelon M. et al., 2001, Embo J., 20, páginas 589-600), a proteína murina mSpo11 (Baudat F et al., Molecular Cell, 2000, 6, páginas 989-998), a proteína Spo11 de C. elegans ou a proteína Spo11 de drosofila meiW68 (McKim et al., 1998, Genes Dev, 12(18), páginas 2932-42). Certamente, esses exemplos não são limitativos e qualquer proteína Spo11 conhecida pode ser usada no método de acordo com a invenção.[0092] The Spo11 protein or fragment thereof as used in the present invention can be obtained from any Spo11 protein such as the Spo11 protein of Saccharomyces cerevisiae (Gene ID: 856364, NCBI accession number: NP_011841 (SEQ ID NO: 9 ) Esposito and Esposito, Genetics, 1969, 61, pages 79-89), the AtSpo11-1 and AtSpo11-2 proteins from Arabidopsis thaliana (Grelon M. et al., 2001, Embo J., 20, pages 589-600) , the murine mSpo11 protein (Baudat F et al., Molecular Cell, 2000, 6, pages 989-998), the C. elegans Spo11 protein or the Drosophila meiW68 Spo11 protein (McKim et al., 1998, Genes Dev, 12(18), pages 2932-42). Of course, these examples are not limiting and any known Spo11 protein can be used in the method according to the invention.
[0093] De acordo com uma modalidade preferencial, o domínio Spo11 compreende, ou consiste em, uma proteína Spo11, de preferência, uma proteína Spo11 de Saccharomyces cerevisiae, como, por exemplo, a proteína que tem a sequência SEQ ID NO: 9.[0093] According to a preferred embodiment, the Spo11 domain comprises, or consists of, a Spo11 protein, preferably a Spo11 protein from Saccharomyces cerevisiae, such as, for example, the protein having the sequence SEQ ID NO: 9.
[0094] De acordo com uma modalidade particular, o domínio Spo11 é deficiente de nuclease. Em particular, o domínio Spo11 pode compreender, ou consistir em, a proteína mutante Spo11-Y135F, uma proteína mutante sem capacidade para induzir quebras de filamento duplo de DNA (Neale MJ, 2002, Molecular Cell, 9, 835-846). A posição indicada é aquela da SEQ ID NO: 9.[0094] According to a particular embodiment, the Spo11 domain is nuclease deficient. In particular, the Spo11 domain may comprise, or consist of, the Spo11-Y135F mutant protein, a mutant protein lacking the ability to induce DNA double-strand breaks (Neale MJ, 2002, Molecular Cell, 9, 835-846). The position indicated is that of SEQ ID NO: 9.
[0095] A capacidade de a proteína de fusão de acordo com a invenção induzir as quebras de filamento duplo de DNA pode se originar do domínio Cas9 ou do domínio Spo11. Desse modo, a proteína de fusão compreende pelo menos um domínio, Cas9 ou Spo11, que tem atividade de nuclease, de preferência, o domínio Spo11.[0095] The ability of the fusion protein according to the invention to induce DNA double-strand breaks may originate from the Cas9 domain or the Spo11 domain. Thus, the fusion protein comprises at least one domain, Cas9 or Spo11, which has nuclease activity, preferably the Spo11 domain.
[0096] De acordo com uma modalidade particular, diversas proteínas de fusão de acordo com a invenção que compreende vários domínios Spo11 podem ser introduzidas na mesma célula. Em particular, quando diversos homólogos Spo11 existem na célula eucariótica de interesse, as várias proteínas de fusão podem, cada uma, compreender um homólogo Spo11 diferente. A título de exemplo, as duas proteínas de fusão de acordo com a invenção que compreendem respectivamente os domínios Spo11-1 e Spo11-2 de Arabidopsis thaliana podem ser introduzidas na mesma célula, de preferência, na mesma célula Arabidopsis thaliana. Ainda a título de exemplo, uma ou mais proteínas de fusão de acordo com a invenção que compreendem os domínios Spo11-1, Spo11-2, Spo11-3 e/ou Spo11-4 de arroz podem ser introduzidas na mesma célula, de preferência, na mesma célula de arroz. Numerosos homólogos Spo11 foram identificados em várias espécies, em particular, em espécies de planta (Sprink T e Hartung F, Frontiers in Plant Science, 2014, Vol. 5, artigo 214, doi: 10.3389/fpls.2014.00214; Shingu Y et al., BMC Mol Biol, 2012, doi: 10.1186/1471-2199-13-1). Uma pessoa versada na técnica pode identificar prontamente os homólogos Spo11 em uma determinada espécie, notavelmente por meio de técnicas de bioinformática bem conhecidas.[0096] According to a particular embodiment, several fusion proteins according to the invention comprising several Spo11 domains can be introduced into the same cell. In particular, when several Spo11 homologs exist in the eukaryotic cell of interest, the various fusion proteins may each comprise a different Spo11 homolog. By way of example, the two fusion proteins according to the invention which respectively comprise the Arabidopsis thaliana Spo11-1 and Spo11-2 domains can be introduced into the same cell, preferably the same Arabidopsis thaliana cell. Still by way of example, one or more fusion proteins according to the invention comprising the rice Spo11-1, Spo11-2, Spo11-3 and/or Spo11-4 domains can be introduced into the same cell, preferably, in the same rice cell. Numerous Spo11 homologs have been identified in several species, in particular, in plant species (Sprink T and Hartung F, Frontiers in Plant Science, 2014, Vol. 5, article 214, doi: 10.3389/fpls.2014.00214; Shingu Y et al. , BMC Mol Biol, 2012, doi: 10.1186/1471-2199-13-1). A person skilled in the art can readily identify Spo11 homologs in a given species, notably through well-known bioinformatics techniques.
[0097] A proteína de fusão de acordo com a invenção compreende um domínio Spo11 e um domínio Cas9 como definido acima.[0097] The fusion protein according to the invention comprises a Spo11 domain and a Cas9 domain as defined above.
[0098] De acordo com uma modalidade, o domínio Spo11 está no sítio de terminal N e o domínio Cas9 está no sítio de terminal C da proteína de fusão. De acordo com uma outra modalidade, o domínio Spo11 está no sítio de terminal C e o domínio Cas9 está no sítio de terminal N da proteína de fusão.[0098] According to one embodiment, the Spo11 domain is at the N-terminal site and the Cas9 domain is at the C-terminal site of the fusion protein. According to another embodiment, the Spo11 domain is at the C-terminal site and the Cas9 domain is at the N-terminal site of the fusion protein.
[0099] A proteína de fusão também pode compreender uma sequência de sinal de localização nuclear (NLS). As sequências de NLS são bem conhecidas a uma pessoa versada na técnica e, em geral, compreendem uma curta sequência de aminoácidos básicos. A título de exemplo, a sequência de NLS pode compreender a sequência PKKKRKV (SEQ ID NO: 3). A sequência de NLS pode estar presente na extremidade de terminal N, na extremidade de terminal C ou em uma região interna da proteína de fusão, de preferência, na extremidade de terminal N da proteína de fusão.[0099] The fusion protein may also comprise a nuclear localization signal (NLS) sequence. NLS sequences are well known to a person skilled in the art and generally comprise a short sequence of basic amino acids. By way of example, the NLS sequence may comprise the sequence PKKKRKV (SEQ ID NO: 3). The NLS sequence may be present at the N-terminal end, at the C-terminal end or in an internal region of the fusion protein, preferably at the N-terminal end of the fusion protein.
[00100] A proteína de fusão também pode compreender um domínio de penetração de célula adicional, isto é, um domínio que facilita a entrada da proteína de fusão na célula. Esse tipo de domínio é bem conhecido por uma pessoa versada na técnica e pode compreender, por exemplo, uma sequência de peptídeo de penetração derivada da proteína HIV-1 TAT como GRKKRRQRRRPPQPKKKRKV (SEQ ID NO: 4), derivada da sequência de TLM do vírus de hepatite B humana como PLSSIFSRIGDPPKKKRKV (SEQ ID NO: 5) ou uma sequência de peptídeo de poliarginina. Esse domínio de penetração de célula pode estar presente na extremidade de terminal N ou na extremidade de terminal C ou pode estar dentro da proteína de fusão, de preferência, na extremidade de terminal N.[00100] The fusion protein may also comprise an additional cell penetration domain, that is, a domain that facilitates entry of the fusion protein into the cell. This type of domain is well known to a person skilled in the art and may comprise, for example, a penetrating peptide sequence derived from the HIV-1 TAT protein such as GRKKRRQRRRPPQPKKKRKV (SEQ ID NO: 4), derived from the TLM sequence of the virus. of human hepatitis B as PLSSIFSRIGDPPKKKRKV (SEQ ID NO: 5) or a polyarginine peptide sequence. Such a cell-penetrating domain may be present at the N-terminal end or the C-terminal end or may be within the fusion protein, preferably at the N-terminal end.
[00101] A proteína de fusão pode compreender adicionalmente uma ou mais sequências de ligação (ligantes) entre os domínios Cas9 e Spo11 e, opcionalmente, entre esses domínios e os outros domínios da proteína como a sequência de sinal de localização nuclear ou o domínio de penetração de célula. O comprimento desses ligantes é prontamente ajustável por uma pessoa versada na técnica. Em geral, essas sequências compreendem entre 10 e 20 aminoácidos, de preferência, cerca de 15 aminoácidos e, com mais preferência, 12 aminoácidos. Os ligantes entre os vários domínios podem ter comprimentos idênticos ou diferentes.[00101] The fusion protein may additionally comprise one or more binding sequences (linkers) between the Cas9 and Spo11 domains and, optionally, between these domains and other domains of the protein such as the nuclear localization signal sequence or the cell penetration. The length of these linkers is readily adjustable by a person skilled in the art. In general, such sequences comprise between 10 and 20 amino acids, preferably about 15 amino acids, and more preferably 12 amino acids. The linkers between the various domains can be of identical or different lengths.
[00102] De acordo com uma modalidade particular, a proteína de fusão compreende, ou consiste em, sucessivamente, a extremidade de terminal N para a extremidade de terminal C: um sinal de localização nuclear, um primeiro ligante (ligante1), um domínio Cas9, um segundo ligante (ligante2) e um domínio Spo11.[00102] According to a particular embodiment, the fusion protein comprises, or consists of, successively, the N-terminal end to the C-terminal end: a nuclear localization signal, a first linker (ligand1), a Cas9 domain , a second linker (ligand2) and a Spo11 domain.
[00103] De acordo com uma outra modalidade particular, a proteína de fusão compreende, ou consiste em, sucessivamente, da extremidade de terminal N para a extremidade de terminal C: um sinal de localização nuclear, um primeiro ligante (ligante1), um domínio Spo11, um segundo ligante (ligante2) e um domínio Cas9.[00103] According to another particular embodiment, the fusion protein comprises, or consists of, successively, from the N-terminal end to the C-terminal end: a nuclear localization signal, a first linker (linker1), a domain Spo11, a second ligand (ligand2) and a Cas9 domain.
[00104] A proteína de fusão pode compreender adicionalmente uma etiqueta que é uma sequência de aminoácidos definida. Essa etiqueta pode ser notavelmente usada para detectar a expressão da proteína de fusão, para identificar as proteínas que interagem com a proteína de fusão ou para distinguir os sítios de ligação da proteína de fusão no genoma. A detecção da etiqueta fixada à proteína de fusão pode ser executada com um anticorpo específico para a dita etiqueta ou por meio de qualquer outra técnica bem conhecida a uma pessoa versada na técnica. A identificação das proteínas que interagem com a proteína de fusão pode ser executada, por exemplo, por técnicas de coimunoprecipitação. A caracterização dos sítios de ligação da proteína de fusão no genoma pode ser executada, por exemplo, por imunoprecipitação, imunoprecipitação de cromatina acoplada a PCR quantitativa em tempo real (ChlP- qPCR), imunoprecipitação de cromatina acoplada a técnicas de sequenciamento (ChIP-Seq), cartografia com uso de mapeamento de oligonucleotídeo (oligo) ou qualquer outra técnica bem conhecida a uma pessoa versada na técnica.[00104] The fusion protein may additionally comprise a tag that is a defined amino acid sequence. This tag can notably be used to detect fusion protein expression, to identify proteins that interact with the fusion protein, or to distinguish fusion protein binding sites in the genome. Detection of the tag attached to the fusion protein can be performed with an antibody specific to said tag or by means of any other technique well known to a person skilled in the art. The identification of proteins that interact with the fusion protein can be performed, for example, by coimmunoprecipitation techniques. Characterization of fusion protein binding sites in the genome can be performed, for example, by immunoprecipitation, chromatin immunoprecipitation coupled to real-time quantitative PCR (ChlP-qPCR), chromatin immunoprecipitation coupled to sequencing techniques (ChIP-Seq ), cartography using oligonucleotide mapping (oligo) or any other technique well known to a person skilled in the art.
[00105] Essa etiqueta pode estar presente na extremidade de terminal N da proteína de fusão, na extremidade de terminal C da proteína de fusão, ou em uma posição não terminal na proteína de fusão. De preferência, a etiqueta está presente na extremidade de terminal C da proteína de fusão. A proteína de fusão pode compreender uma ou mais etiquetas, que podem ser idênticas ou diferentes.[00105] This tag may be present at the N-terminal end of the fusion protein, at the C-terminal end of the fusion protein, or in a non-terminal position on the fusion protein. Preferably, the tag is present at the C-terminal end of the fusion protein. The fusion protein may comprise one or more tags, which may be identical or different.
[00106] As etiquetas, como usado na presente invenção, podem ser selecionadas a partir das variadas etiquetas bem conhecidas por uma pessoa versada na técnica. Em particular, as etiquetas usadas na presente invenção podem ser etiquetas de peptídeo e/ou etiquetas de proteína. De preferência, as etiquetas usadas na presente invenção são etiquetas de peptídeo. As etiquetas de peptídeo exemplificativas que podem ser usadas na presente invenção incluem, porém sem limitação, etiquetas que consiste em repetições de pelo menos seis histidinas (His), em particular, etiquetas que consistem em seis ou oito histidinas, bem como Sinalização (Flag), poliglutamato, hemaglutinina (HA), calmodulina, Strep, E-etiqueta, myc, V5, Xpress, VSV, S- etiqueta, Avi, SBP, Softag 1, Softag 2, Softag 3, isopetag, SpyTag e etiquetas de tetracisteína e combinações dos mesmos. As etiquetas de proteína exemplificativas que podem ser usadas na presente invenção incluem, porém sem limitação, etiquetas de glutationa S-transferase (GST), proteína A de Staphylococcus aureus, Nus A, proteína de ligação de quitina (CBP), tioredoxina, proteína de ligação de maltose (MBP), proteína carreadora de carboxila de biotina (BCCP), e fragmento constante de imunoglobulina (Fc), em que as etiquetas compreendem um proteína fluorescente como proteína fluorescente verde (GFP), proteína fluorescente vermelha (RFP), proteína fluorescente ciano (CFP) ou proteína fluorescente amarela (YFP), e combinações das mesmas.[00106] Labels, as used in the present invention, can be selected from a variety of labels well known to a person skilled in the art. In particular, the tags used in the present invention can be peptide tags and/or protein tags. Preferably, the tags used in the present invention are peptide tags. Exemplary peptide tags that can be used in the present invention include, but are not limited to, tags consisting of repeats of at least six histidines (His), in particular, tags consisting of six or eight histidines, as well as Flag. , polyglutamate, hemagglutinin (HA), calmodulin, Strep, E-tag, myc, V5, Xpress, VSV, S-tag, Avi, SBP, Softag 1, Softag 2, Softag 3, isopetag, SpyTag and tetracysteine tags and combinations of the same. Exemplary protein tags that may be used in the present invention include, but are not limited to, glutathione S-transferase (GST) tags, Staphylococcus aureus protein A, Nus A, chitin binding protein (CBP), thioredoxin, maltose binding protein (MBP), biotin carboxyl carrier protein (BCCP), and immunoglobulin constant fragment (Fc), wherein the tags comprise a fluorescent protein such as green fluorescent protein (GFP), red fluorescent protein (RFP), protein cyan fluorescent protein (CFP) or yellow fluorescent protein (YFP), and combinations thereof.
[00107] De acordo com uma modalidade preferencial, a proteína de fusão compreende uma etiqueta que consiste em seis histidinas e/ou um ou mais motivos Flag, de preferência, três motivos Flag. De acordo com uma modalidade particular, a proteína de fusão compreende uma etiqueta que consiste em seis histidinas e três motivos Flag.[00107] According to a preferred embodiment, the fusion protein comprises a tag consisting of six histidines and/or one or more Flag motifs, preferably three Flag motifs. According to a particular embodiment, the fusion protein comprises a tag consisting of six histidines and three Flag motifs.
[00108] Alternativamente, o domínio Spo11 da proteína de fusão Cas9-Spo11 pode ser substituído por um dos parceiros Spo11 com capacidade para recrutar Spo11, isto é, uma proteína que forma um complexo com Spo11 e, desse modo, induz a formação de quebras de filamento duplo. Esse parceiro pode ser selecionado a partir das proteínas citadas nos artigos de Keeney et al. (2001 Curr. Top. Dev. Biol, 52, páginas 1-53), Smith et al.(Curr. Opin. Genet. Dev, 1998, 8, páginas 200 211) e Acquaviva et al. (2013 Science, 339, páginas 215-8), e mais particularmente, do grupo que consiste em Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1, Hop1, Red1, Mek1, Set1 e Spp1. De preferência, o parceiro que substitui o domínio Spo11 é Mei4 ou Spp1.[00108] Alternatively, the Spo11 domain of the Cas9-Spo11 fusion protein can be replaced by one of the Spo11 partners capable of recruiting Spo11, i.e., a protein that forms a complex with Spo11 and thereby induces the formation of cleavages. double filament. This partner can be selected from the proteins mentioned in the articles by Keeney et al. (2001 Curr. Top. Dev. Biol, 52, pages 1-53), Smith et al. (Curr. Opin. Genet. Dev, 1998, 8, pages 200 211) and Acquaviva et al. (2013 Science, 339, pages 215-8), and more particularly, the group consisting of Rec102, Rec103/Sk18, Rec104, Rec114, Mer1, Mer2/Rec107, Mei4, Mre2/Nam8, Mre11, Rad50, Xrs2/Nbs1 , Hop1, Red1, Mek1, Set1 and Spp1. Preferably, the partner replacing the Spo11 domain is Mei4 or Spp1.
[00109] Todas as modalidades descritas para a proteína de fusão Cas9-Spo11 também se aplicam às proteínas de fusão em que o domínio Spo11 é substituído por um de seus parceiros.[00109] All modalities described for the Cas9-Spo11 fusion protein also apply to fusion proteins in which the Spo11 domain is replaced by one of its partners.
[00110] A proteína de fusão como descrito acima pode ser introduzida na célula em forma de proteína, notavelmente em forma madura ou em forma precursora, de preferência, em forma madura, ou na forma de um ácido nucleico que codifica a dita proteína.[00110] The fusion protein as described above can be introduced into the cell in protein form, notably in mature form or in precursor form, preferably in mature form, or in the form of a nucleic acid encoding said protein.
[00111] Quando a proteína de fusão é introduzida na célula em forma de proteína, os grupos de proteção podem ser adicionados nas extremidades de terminal C e/ou N a fim de aprimorar a resistência da proteína de fusão a peptidases. Por exemplo, o grupo de proteção na extremidade de terminal N pode ser uma acilação ou uma acetilação e o grupo de proteção na extremidade de terminal C pode ser uma amidação ou uma esterificação. A ação da protease também pode ser impedida pelo uso de aminoácidos que têm a configuração D, a ciclização da proteína pela formação de pontes de dissulfeto, anéis lactama ou ligações entre as extremidades de terminal N e C. A proteína de fusão da invenção também podem compreender ligações de pseudopeptídeo que substituem as ligação de peptídeo “convencionais” (CONH) e que conferem resistência aumentada a peptidases, como CHOH-CH2, NHCO, CH2-O, CH2CH2, CO- CH2, N-N, CH=CH, CH2NH, e CH2-S. A proteína de fusão também pode compreender um ou mais aminoácidos que são aminoácidos raros, notavelmente hidroxiprolina, hidroxilisina, alohidroxilisina, 6-N-metilisina, N-etilglicina, N- metilglicina, N-etilasparagina, alo-isoleucina, N- metilisoleucina, N-metilvalina, piroglutamina, ácido aminobutírico; ou aminoácidos sintéticos, notavelmente, ornitina, norleucina, norvalina e cicloexil-alanina.[00111] When the fusion protein is introduced into the cell in protein form, protecting groups can be added at the C- and/or N-terminal ends in order to improve the resistance of the fusion protein to peptidases. For example, the protecting group at the N-terminal end may be an acylation or acetylation and the protecting group at the C-terminal end may be an amidation or an esterification. The action of the protease can also be prevented by the use of amino acids that have the D configuration, cyclization of the protein by the formation of disulfide bonds, lactam rings or bonds between the N- and C-terminal ends. The fusion protein of the invention can also be prevented. understand pseudopeptide linkages that replace “conventional” peptide linkages (CONH) and that confer increased resistance to peptidases such as CHOH-CH2, NHCO, CH2-O, CH2CH2, CO-CH2, N-N, CH=CH, CH2NH, and CH2-S. The fusion protein may also comprise one or more amino acids that are rare amino acids, notably hydroxyproline, hydroxylysine, allohydroxylysine, 6-N-methyllysine, N-ethylglycine, N-methylglycine, N-ethylsparagine, allo-isoleucine, N-methylisoleucine, N -methylvaline, pyroglutamine, aminobutyric acid; or synthetic amino acids, notably, ornithine, norleucine, norvaline, and cyclohexyl-alanine.
[00112] A proteína de fusão de acordo com a invenção pode ser obtida por síntese química convencional (fase sólida ou fase líquida homogênea) ou por síntese enzimática (Kullmann W, Enzymatic peptide synthesis, 1987, CRC Press, Flórida, EUA). A mesma também pode ser obtida por um método que consiste no crescimento de uma célula hospedeira que expressa um ácido nucleico que codifica a proteína de fusão e que recupera a dita proteína dessas células ou do meio de cultura.[00112] The fusion protein according to the invention can be obtained by conventional chemical synthesis (solid phase or homogeneous liquid phase) or by enzymatic synthesis (Kullmann W, Enzymatic peptide synthesis, 1987, CRC Press, Florida, USA). It can also be obtained by a method that consists of growing a host cell that expresses a nucleic acid that encodes the fusion protein and recovering said protein from those cells or from the culture medium.
[00113] Como usado no presente pedido, o termo “RNA- guia” ou “gRNA” se refere a uma molécula de RNA com capacidade para interagir com o domínio Cas9 da proteína de fusão a fim de guia a mesma para a direção de uma região cromossômica alvo.[00113] As used in the present application, the term “guide RNA” or “gRNA” refers to an RNA molecule capable of interacting with the Cas9 domain of the fusion protein in order to guide it in the direction of a target chromosomal region.
[00114] Cada gRNA compreende duas regiões:[00114] Each gRNA comprises two regions:
[00115] - uma primeira região (comumente chamada de região de “SDS”), na extremidade 5‘ do gRNA, que é complementar à região cromossômica alvo e que imita o crRNA do sistema CRISPR endógeno, e[00115] - a first region (commonly called the “SDS” region), at the 5' end of the gRNA, which is complementary to the target chromosomal region and which mimics the crRNA of the endogenous CRISPR system, and
[00116] - uma segunda região (comumente chamada de região de “manuseio”), na extremidade 3' do gRNA, que imita as interações de par de base entre o crRNA de ativação em trans (tracrRNA) e o crRNA do sistema CRISPR endógeno e tem uma estrutura em haste-alça de filamento duplo que termina na direção 3 ‘ com uma sequência essencialmente com filamento simples. Essa segunda região é essencial para a ligação do gRNA ao domínio Cas9 da proteína de fusão.[00116] - a second region (commonly called the “handling” region), at the 3' end of the gRNA, which mimics the base pair interactions between the trans-activating crRNA (tracrRNA) and the endogenous CRISPR system crRNA and has a double-stranded stem-loop structure that terminates in the 3' direction with an essentially single-stranded sequence. This second region is essential for the binding of the gRNA to the Cas9 domain of the fusion protein.
[00117] A primeira região do gRNA varia de acordo com a sequência cromossômica endereçada. Por outro lado, as regiões de manuseio dos vários gRNAs usados podem ser idênticas ou diferentes. De acordo com uma modalidade particular, a região de manuseio compreende, ou consiste em, a sequência 3‘ de 82 nucleotídeos das sequências SEQ ID NO: 10 a 16 (sequência em letras minúsculas na Figura 13).[00117] The first region of the gRNA varies according to the chromosomal sequence addressed. On the other hand, the handling regions of the various gRNAs used can be identical or different. According to a particular embodiment, the handling region comprises, or consists of, the 3' sequence of 82 nucleotides of sequences SEQ ID NO: 10 to 16 (sequence in lowercase letters in Figure 13).
[00118] A região de SDS do gRNA, que é complementar à região cromossômica alvo, geralmente compreende entre 10 e 25 nucleotídeos. De preferência, essa região tem um comprimento de 19, 20 ou 21 nucleotídeos e, particularmente, de preferência, 20 nucleotídeos.[00118] The SDS region of the gRNA, which is complementary to the target chromosomal region, generally comprises between 10 and 25 nucleotides. Preferably, this region is 19, 20 or 21 nucleotides long, and particularly preferably 20 nucleotides.
[00119] A segunda região do gRNA tem uma estrutura em haste-alça (ou grampo). Os comprimentos da haste e do laço podem variar. De preferência, o laço tem um comprimento de 3 a 10 nucleotídeos e a haste tem um comprimento de 6 a 20 nucleotídeos. A haste pode ter opcionalmente regiões incompatíveis (que formam “protuberâncias”) de 1 a 10 nucleotídeos. De preferência, o total comprimento dessa região de manuseio é 50 a 100 nucleotídeos e, mais particularmente, de preferência 82 nucleotídeos.[00119] The second region of the gRNA has a stem-loop (or hairpin) structure. Rod and loop lengths may vary. Preferably, the loop is 3 to 10 nucleotides long and the stem is 6 to 20 nucleotides long. The stem may optionally have incompatible regions (which form “bulges”) of 1 to 10 nucleotides. Preferably, the total length of this handling region is 50 to 100 nucleotides and, more particularly, preferably 82 nucleotides.
[00120] O total comprimento de um gRNA é, em geral, 50 a 140 nucleotídeos, de preferência, 80 a 125 nucleotídeos e, mais particularmente, de preferência 90 a 110 nucleotídeos. De acordo com uma modalidade particular, um gRNA como usado na presente invenção tem um comprimento de 102 nucleotídeos.[00120] The total length of a gRNA is, in general, 50 to 140 nucleotides, preferably 80 to 125 nucleotides and, more particularly, preferably 90 to 110 nucleotides. According to a particular embodiment, a gRNA as used in the present invention has a length of 102 nucleotides.
[00121] O gRNA é, de preferência, formado de uma única molécula de RNA que compreende os dois domínios. Alternativamente, o gRNA pode ser formado de duas moléculas de RNA distintas, em que a primeira molécula compreende a região de SDS e metade da haste da segunda região, e em que a segunda molécula compreende a segunda metade da haste do gRNA. Desse modo, o emparelhamento das duas moléculas de RNA por suas sequências complementares na haste, forma um gRNA funcional.[00121] The gRNA is, preferably, formed from a single RNA molecule that comprises the two domains. Alternatively, the gRNA can be formed from two distinct RNA molecules, wherein the first molecule comprises the SDS region and half of the stem of the second region, and wherein the second molecule comprises the second half of the stem of the gRNA. In this way, the pairing of the two RNA molecules by their complementary sequences in the stem forms a functional gRNA.
[00122] Uma pessoa versada na técnica pode, pelo uso de técnicas bem conhecidas, prontamente definir a sequência e a estrutura dos gRNAs de acordo com a região cromossômica a ser endereçada (consulte, por exemplo, o artigo de Di Carlo et al., Nucleic Acids Research 2013, 1-8).[00122] A person skilled in the art can, by use of well-known techniques, readily define the sequence and structure of gRNAs according to the chromosomal region to be addressed (see, for example, the article by Di Carlo et al., Nucleic Acids Research 2013, 1-8).
[00123] No método de acordo com a invenção, um ou mais gRNAs podem ser usados simultaneamente. Esses diferentes gRNAs podem endereçar regiões cromossômicas idênticas ou diferentes, de preferência, diferentes.[00123] In the method according to the invention, one or more gRNAs can be used simultaneously. These different gRNAs can address identical or different, preferably different, chromosomal regions.
[00124] Os gRNAs podem ser introduzidos na célula eucariótica como moléculas de gRNA maduro, como precursores, ou como um ou mais ácidos nucleicos que codificam os ditos gRNAs.[00124] gRNAs can be introduced into the eukaryotic cell as mature gRNA molecules, as precursors, or as one or more nucleic acids that encode said gRNAs.
[00125] Quando os gRNAs(gRNA) forem introduzidos na célula diretamente como moléculas de RNA (maduro ou precursor), esses gRNAs podem conter nucleotídeos modificados ou modificações químicas que permitem que os mesmos, por exemplo, aumentem sua resistência a nucleases e, sendo assim, aumentem sua vida útil na célula. Os mesmos podem incluir notavelmente pelo menos um nucleotídeo não natural ou modificado como, por exemplo, em que um nucleotídeo compreende uma base modificada, como inosina, metil-5-deoxicitidina, dimetilamino-5- deoxiuridina, deoxiuridina, diamino-2,6-purina, bromo-5- deoxiuridina ou qualquer outra base modificada que permite hibridização. Os gRNAs usados de acordo com a invenção também podem ser modificados na ligação de internucleotídeo como, por exemplo, fosforotioatos, H-fosfonatos ou alquil-fosfonatos, ou na espinha dorsal como, por exemplo, alfa-oligonucleotídeos, 2‘-O-alquil-ribose ou ácido nucleico peptídico (PNA) (Egholm et al., 1992 J. Am. Chem. Soc., 114,1895-1897).[00125] When gRNAs (gRNA) are introduced into the cell directly as RNA molecules (mature or precursor), these gRNAs may contain modified nucleotides or chemical modifications that allow them, for example, to increase their resistance to nucleases and, being thus, increase their useful life in the cell. They may notably include at least one non-natural or modified nucleotide such as, for example, wherein a nucleotide comprises a modified base, such as inosine, methyl-5-deoxycytidine, dimethylamino-5-deoxyuridine, deoxyuridine, diamino-2,6- purine, bromo-5-deoxyuridine or any other modified base that allows hybridization. The gRNAs used according to the invention can also be modified at the internucleotide linkage such as, for example, phosphorothioates, H-phosphonates or alkyl phosphonates, or at the backbone such as, for example, alpha-oligonucleotides, 2'-O-alkyl -ribose or peptide nucleic acid (PNA) (Egholm et al., 1992 J. Am. Chem. Soc., 114,1895-1897).
[00126] Os gRNAs podem ser RNA natural, RNA sintético ou RNA produzido por técnicas de recombinação. Esses gRNAs podem ser preparados por quaisquer métodos conhecidos a uma pessoa versada na técnica como, por exemplo, síntese química, técnicas de amplificação ou transcrição in vivo.[00126] gRNAs can be natural RNA, synthetic RNA or RNA produced by recombination techniques. These gRNAs can be prepared by any methods known to a person skilled in the art, such as, for example, chemical synthesis, amplification techniques or in vivo transcription.
[00127] De acordo com uma modalidade, o método compreende introduzir, na célula eucariótica, a proteína de fusão e um ou mais gRNAs com capacidade para endereçar a ação da proteína de fusão na direção de uma determinada região cromossômica. A proteína e os gRNAs podem ser introduzidos no citoplasma ou no núcleo da célula eucariótica por qualquer método conhecido a uma pessoa versada na técnica, por exemplo, por microinjeção. A proteína de fusão pode ser notavelmente introduzida na célula como um elemento de um complexo de RNA de proteína que compreende pelo menos um gRNA.[00127] According to one embodiment, the method comprises introducing, into the eukaryotic cell, the fusion protein and one or more gRNAs capable of directing the action of the fusion protein in the direction of a certain chromosomal region. The protein and gRNAs can be introduced into the cytoplasm or nucleus of the eukaryotic cell by any method known to a person skilled in the art, for example, by microinjection. The fusion protein can notably be introduced into the cell as one element of a protein-RNA complex comprising at least one gRNA.
[00128] De acordo com uma outra modalidade, o método compreende introduzir, na célula eucariótica, a proteína de fusão e um ou mais ácidos nucleicos que codificam um ou mais gRNAs.[00128] According to another embodiment, the method comprises introducing, into the eukaryotic cell, the fusion protein and one or more nucleic acids that encode one or more gRNAs.
[00129] Ainda de acordo com uma outra modalidade, o método compreende introduzir, na célula eucariótica, um ácido nucleico que codifica a proteína de fusão e um ou mais gRNAs.[00129] According to yet another embodiment, the method comprises introducing, into the eukaryotic cell, a nucleic acid that encodes the fusion protein and one or more gRNAs.
[00130] Ainda de acordo com uma outra modalidade, o método compreende introduzir, na célula eucariótica, um ácido nucleico que codifica a proteína de fusão e um ou mais ácidos nucleicos que codificam um ou mais gRNAs.[00130] According to yet another embodiment, the method comprises introducing, into the eukaryotic cell, a nucleic acid that encodes the fusion protein and one or more nucleic acids that encode one or more gRNAs.
[00131] A proteína de fusão, ou o ácido nucleico que codifica a dita proteína de fusão, e o gRNA(gRNAs), ou o ácido nucleico(ácidos nucleicos) que codifica o dito gRNA(gRNAs), podem ser introduzidos na célula simultânea ou sequencialmente.[00131] The fusion protein, or the nucleic acid encoding said fusion protein, and the gRNA(gRNAs), or the nucleic acid(nucleic acids) encoding said gRNA(gRNAs), can be introduced into the cell simultaneously or sequentially.
[00132] Alternativamente e, mais particularmente, em relação às células de planta, o ácido nucleico que codifica a proteína de fusão e o ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs) podem ser introduzidos em uma célula pelo cruzamento de duas células nas quais foram respectivamente introduzidos o ácido nucleico que codifica a proteína de fusão e o ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs).[00132] Alternatively, and more particularly in relation to plant cells, the nucleic acid encoding the fusion protein and the nucleic acid (nucleic acids) encoding the gRNA (gRNAs) can be introduced into a cell by crossing two cells into which the nucleic acid encoding the fusion protein and the nucleic acid (nucleic acids) encoding the gRNA (gRNAs) were respectively introduced.
[00133] Alternativamente e, mais particularmente, em relação às células de planta, o ácido nucleico que codifica a proteína de fusão e o ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs) podem ser introduzidos em uma célula por mitose de uma célula na qual o ácido nucleico que codifica a proteína de fusão e o ácido nucleico(ácidos nucleicos) que codifica o gRNA(gRNAs) foram anteriormente introduzidos.[00133] Alternatively, and more particularly in relation to plant cells, the nucleic acid encoding the fusion protein and the nucleic acid (nucleic acids) encoding the gRNA (gRNAs) can be introduced into a cell by mitosis of a cell into which the nucleic acid encoding the fusion protein and the nucleic acid (nucleic acids) encoding the gRNA (gRNAs) have previously been introduced.
[00134] Nas modalidades em que a proteína de fusão e/ou o gRNA(gRNAs) são introduzidos na célula eucariótica como um ácido nucleico que codifica a dita proteína e/ou dito(ditos) gRNA(gRNAs), a expressão do dito ácidos nucleicos possibilita a produção da proteína de fusão e/ou do gRNA(gRNAs) na célula.[00134] In embodiments in which the fusion protein and/or gRNA(gRNAs) are introduced into the eukaryotic cell as a nucleic acid encoding said protein and/or said gRNA(gRNAs), the expression of said acids nucleic acids enable the production of the fusion protein and/or gRNA(gRNAs) in the cell.
[00135] No contexto da invenção, por “ácido nucleico” entende-se qualquer molécula à base de DNA ou RNA. Essas moléculas podem ser sintéticas ou semissintéticas, recombinantes, opcionalmente amplificadas ou clonadas em vetores, quimicamente modificadas, que compreendem bases não naturais ou nucleotídeos modificados que compreendem, por exemplo, uma ligação modificada, uma base de pirimidina ou purina modificada ou um açúcar modificado. De preferência, o uso de códons é otimizado de acordo com a natureza da célula eucariótica.[00135] In the context of the invention, “nucleic acid” means any molecule based on DNA or RNA. These molecules may be synthetic or semi-synthetic, recombinant, optionally amplified or cloned into vectors, chemically modified, comprising non-natural bases or modified nucleotides comprising, for example, a modified bond, a modified pyrimidine or purine base or a modified sugar. Preferably, codon usage is optimized according to the nature of the eukaryotic cell.
[00136] Os ácidos nucleicos que codificam a proteína de fusão e aqueles que codificam os gRNAs podem ser colocados sob o controle de promotores idênticos ou diferentes, que podem ser constitutivos ou induzíveis, em particular, promotores específicos de meiose. De acordo com uma modalidade preferencial, os ácidos nucleicos são colocados sob o controle de promotores constitutivos como o promotor de ADH1 ou os promotores pRPR1 e SNR52 dependentes de RNA polimerase III, com mais preferência, o promotor pRPR1.[00136] The nucleic acids encoding the fusion protein and those encoding the gRNAs can be placed under the control of identical or different promoters, which can be constitutive or inducible, in particular, meiosis-specific promoters. According to a preferred embodiment, the nucleic acids are placed under the control of constitutive promoters such as the ADH1 promoter or the RNA polymerase III-dependent pRPR1 and SNR52 promoters, more preferably, the pRPR1 promoter.
[00137] A natureza do promotor também pode depender da natureza da célula eucariótica. De acordo com uma modalidade particular, a célula eucariótica é uma célula de planta, de preferência, uma célula de arroz, e os ácidos nucleicos são colocados sob o controle de um promotor selecionado a partir dos promotores de ubiquitina de maís (pZmUbi) e os promotores U3 e U6 de polimerase III. De acordo com uma modalidade preferencial, o ácido nucleico que codifica a proteína de fusão é colocado sob o controle do promotor pZmUbi e os ácidos nucleicos que codificam os gRNAs são colocados sob o controle do promotor U3 ou U6, de preferência, o promotor U3.[00137] The nature of the promoter may also depend on the nature of the eukaryotic cell. According to a particular embodiment, the eukaryotic cell is a plant cell, preferably a rice cell, and the nucleic acids are placed under the control of a promoter selected from the maize ubiquitin promoters (pZmUbi) and the polymerase III U3 and U6 promoters. According to a preferred embodiment, the nucleic acid encoding the fusion protein is placed under the control of the pZmUbi promoter and the nucleic acids encoding the gRNAs are placed under the control of the U3 or U6 promoter, preferably the U3 promoter.
[00138] Os ácidos nucleicos que codificam a proteína de fusão e o gRNA(gRNAs) podem estar dispostos na mesma construção, em particular, no mesmo vetor de expressão, ou em construções distintas. Alternativamente, os ácidos nucleicos podem ser inseridos no genoma da célula eucariótica em regiões idênticas ou iguais. De acordo com uma modalidade preferencial, os ácidos nucleicos que codificam a proteína de fusão e o gRNA(gRNAs) estão dispostos no mesmo vetor de expressão.[00138] The nucleic acids encoding the fusion protein and the gRNA(gRNAs) may be arranged in the same construct, in particular, in the same expression vector, or in distinct constructs. Alternatively, nucleic acids can be inserted into the eukaryotic cell genome in identical or identical regions. According to a preferred embodiment, the nucleic acids encoding the fusion protein and the gRNA (gRNAs) are arranged in the same expression vector.
[00139] Os ácidos nucleicos como descrito acima podem ser introduzidos na célula eucariótica por qualquer método conhecido a uma pessoa versada na técnica, em particular, por microinjeção, transfecção, eletroporação e biolística.[00139] Nucleic acids as described above can be introduced into the eukaryotic cell by any method known to a person skilled in the art, in particular, by microinjection, transfection, electroporation and biolistics.
[00140] Opcionalmente, a expressão ou a atividade da proteína Spo11 endógena da célula eucariótica pode ser suprimida a fim de controlar melhor os fenômenos de recombinação meiótica. Essa inativação pode ser executada por técnicas bem conhecidas a uma pessoa versada na técnica, notavelmente pela inativação do gene que codifica a proteína Spo11 endógena ou pela inibição de sua expressão por meio de RNA interferente.[00140] Optionally, the expression or activity of the eukaryotic cell's endogenous Spo11 protein can be suppressed in order to better control the phenomena of meiotic recombination. This inactivation can be carried out by techniques well known to a person skilled in the art, notably by inactivating the gene encoding the endogenous Spo11 protein or by inhibiting its expression by means of interfering RNA.
[00141] Após a introdução, na célula eucariótica, a proteína de fusão e um ou mais gRNAs, ou ácidos nucleicos que codificam a mesma, o método de acordo com a invenção compreende induzir a dita célula para entrar na prófase meiótica I.[00141] After introducing, into the eukaryotic cell, the fusion protein and one or more gRNAs, or nucleic acids that encode it, the method according to the invention comprises inducing said cell to enter meiotic prophase I.
[00142] Essa indução pode ser feita de acordo com vários métodos bem conhecidos por uma pessoa versada na técnica.[00142] This induction can be done according to various methods well known to a person skilled in the art.
[00143] A título de exemplo, quando a célula eucariótica é uma célula de camundongo, as células podem ser induzidas para entrar na prófase meiótica I pela adição de ácido retinóico (Bowles J et al., 2006, Science, 312(5773), páginas 596-600).[00143] By way of example, when the eukaryotic cell is a mouse cell, the cells can be induced to enter meiotic prophase I by the addition of retinoic acid (Bowles J et al., 2006, Science, 312(5773), pages 596-600).
[00144] Quando a célula eucariótica for uma célula de planta, a indução de meiose é executada de acordo com um processo natural. De acordo com uma modalidade particular, após a transformação de um calo que compreende uma ou mais células de planta, uma planta é regenerada e colocada em condições que promovem a indução de uma fase reprodutiva e, desse modo, do processo meiótico. Essas condições são bem conhecidas por uma pessoa versada na técnica.[00144] When the eukaryotic cell is a plant cell, the induction of meiosis is carried out according to a natural process. According to a particular embodiment, after transformation of a callus comprising one or more plant cells, a plant is regenerated and placed in conditions that promote the induction of a reproductive phase and, thereby, the meiotic process. These conditions are well known to a person skilled in the art.
[00145] Quando a célula eucariótica é uma levedura, essa indução pode ser executada pela transferência da levedura para o meio de esporulação, em particular, do meio rico para o meio de esporulação, em que o dito meio de esporulação carece, de preferência, de uma fonte de carbono fermentável ou uma fonte de nitrogênio, e pela incubação das leveduras no meio de esporulação por um período de tempo suficiente para induzir as quebras de filamento duplo dependentes de Spo11. A iniciação do ciclo meiótico depende de diversos sinais: a presença dos dois alelos de tipo correspondente MATa e MATα, a ausência de uma fonte de nitrogênio e uma fonte de carbono fermentável.[00145] When the eukaryotic cell is a yeast, this induction can be carried out by transferring the yeast to the sporulation medium, in particular, from the rich medium to the sporulation medium, wherein said sporulation medium preferably lacks from a fermentable carbon source or a nitrogen source, and by incubating the yeast in the sporulation medium for a period of time sufficient to induce Spo11-dependent double-strand breaks. The initiation of the meiotic cycle depends on several signals: the presence of the two type-corresponding alleles MATa and MATα, the absence of a nitrogen source and a fermentable carbon source.
[00146] Como usado nesse documento, o termo “meio rico” se refere a um meio de cultura que compreende uma fonte de carbono fermentável e uma fonte de nitrogênio bem como todos os elementos nutritivos necessários para que as leveduras se multipliquem por divisão mitótica. Esse meio pode ser prontamente selecionado por uma pessoa versada na técnica e pode, por exemplo, ser selecionado a partir do grupo que consiste em meio YPD (1% de extrato de levedura, 2% de bactopeptona e 2% de glicose), meio YPG (1% de extrato de levedura, 2% de bactopeptona e 3% de glicerol) e meio sintético completo (SC) (Treco e Lundblad, 2001, Curr. Protocol. Mol. Biol., Capítulo 13, Unidade 13.1).[00146] As used in this document, the term “rich medium” refers to a culture medium that comprises a fermentable carbon source and a nitrogen source as well as all the nutritional elements necessary for yeast to multiply by mitotic division. Such a medium can be readily selected by a person skilled in the art and can, for example, be selected from the group consisting of YPD medium (1% yeast extract, 2% bactopeptone and 2% glucose), YPG medium (1% yeast extract, 2% bactopeptone and 3% glycerol) and synthetic complete medium (SC) (Treco and Lundblad, 2001, Curr. Protocol. Mol. Biol., Chapter 13, Unit 13.1).
[00147] Como usado nesse documento, o termo “meio de esporulação” se refere a qualquer meio que induz as células de levedura a entrar na prófase meiótica sem o crescimento vegetativo, em particular, um meio de cultura que não compreende uma fonte de carbono fermentável ou uma fonte de nitrogênio, mas que compreende uma fonte de carbono que pode ser metabolizada por respiração, como acetato. Esse meio pode ser prontamente selecionado por uma pessoa versada na técnica e pode, por exemplo, ser selecionado a partir do grupo que consiste em 1% de meio KAc (Wu e Lichten, 1994, Science, 263, páginas 515-518), meio SPM (Kassir e Simchen, 1991, Meth. Enzymol., 194, 94-110) e os meios de esporulação descritos no artigo de Sherman (Sherman, Meth. Enzymol., 1991, 194, 3-21).[00147] As used herein, the term “sporulation medium” refers to any medium that induces yeast cells to enter meiotic prophase without vegetative growth, in particular, a culture medium that does not comprise a carbon source fermentable or a nitrogen source, but comprising a carbon source that can be metabolized by respiration, such as acetate. Such a medium can be readily selected by a person skilled in the art and can, for example, be selected from the group consisting of 1% KAc medium (Wu and Lichten, 1994, Science, 263, pages 515-518), medium SPM (Kassir and Simchen, 1991, Meth. Enzymol., 194, 94-110) and the sporulation media described in Sherman's article (Sherman, Meth. Enzymol., 1991, 194, 3-21).
[00148] De acordo com uma modalidade preferencial, antes de serem incubadas no meio de esporulação, as células são cultivadas durante alguns ciclos de divisão em um meio de pré-esporulação de modo que obtenha esporulação eficaz e síncrona. O meio de pré-esporulação pode ser prontamente selecionado por uma pessoa versada na técnica. Por exemplo, esse meio pode ser meio SPS (Wu e Lichten, 1994, Science, 263, páginas 515-518).[00148] According to a preferred embodiment, before being incubated in the sporulation medium, the cells are cultivated for a few division cycles in a pre-sporulation medium so as to obtain effective and synchronous sporulation. The pre-sporulation medium can be readily selected by one skilled in the art. For example, this medium may be SPS medium (Wu and Lichten, 1994, Science, 263, pages 515-518).
[00149] A escolha dos meios (meio rico, meio de pré- esporulação, meio de esporulação) depende das características fisiológicas e genéticas da cepa de levedura, notavelmente se essa cepa for auxotrófica para um ou mais compostos.[00149] The choice of media (rich medium, pre-sporulation medium, sporulation medium) depends on the physiological and genetic characteristics of the yeast strain, notably if that strain is auxotrophic for one or more compounds.
[00150] Uma vez que a célula está envolvida na prófase meiótica I, o processo meiótico pode continuar até as quatro células-filha que têm as recombinações exigidas serem produzidas.[00150] Once the cell is involved in meiotic prophase I, the meiotic process can continue until the four daughter cells that have the required recombinations are produced.
[00151] Alternativamente, quando a célula eucariótica é uma levedura e, em particular, uma levedura do gênero Saccharomyces, as células podem ser retornadas para as condições de crescimento a fim de recomeçar um processo mitótico. Esse fenômeno, chamado “retomada de crescimento” ou “RTG”, foi anteriormente descrito no pedido de patente WO 2014/083142 e ocorre quando as células que entraram em meiose em resposta a uma deficiência nutricional são colocadas na presença de um carbono e fonte de nitrogênio após a formação de quebras de filamento duplo dependentes de Spo11, mas antes da primeira divisão meiótica (Honigberg e Esposito, Proc. Nat. Acad. Sci USA, 1994, 91, 6559-6563). Sob essas condições, as mesmas param de progredir através dos estágios de diferenciação meiótica para recomeçar um modo de crescimento mitótico enquanto induzem as recombinações desejadas durante o reparo das quebras de filamento duplo causado por Spo11 (Sherman e Roman, Genetics, 1963, 48, 255-261; Esposito e Esposito, Proc. Nat. Acad. Sci, 1974, 71, páginas 3172-3176; Zenvirth et al., Genes to Cells, 1997, 2, páginas 487-498).[00151] Alternatively, when the eukaryotic cell is a yeast and, in particular, a yeast of the genus Saccharomyces, the cells can be returned to growth conditions in order to restart a mitotic process. This phenomenon, called “resumption of growth” or “RTG”, was previously described in patent application WO 2014/083142 and occurs when cells that have entered meiosis in response to a nutritional deficiency are placed in the presence of a carbon and energy source. nitrogen after the formation of Spo11-dependent double-strand breaks but before the first meiotic division (Honigberg and Esposito, Proc. Nat. Acad. Sci USA, 1994, 91, 6559-6563). Under these conditions, they stop progressing through the stages of meiotic differentiation to resume a mitotic mode of growth while inducing the desired recombinations during the repair of double-strand breaks caused by Spo11 (Sherman and Roman, Genetics, 1963, 48, 255 -261; Esposito and Esposito, Proc. Nat. Sci, 1974, 71, pages 3172-3176;
[00152] O método pode compreender adicionalmente obter uma célula ou células que têm a(as) recombinação(recombinações) desejada(desejadas).[00152] The method may further comprise obtaining a cell or cells that have the desired recombination(s).
[00153] O método de acordo com a invenção pode ser usado em todas as aplicações em que é desejado aprimorar e controlar os fenômenos de recombinação meiótica. Em particular, a invenção possibilita a associação, preferencialmente, de traços genéticos de interesse. Essa associação preferencial possibilita, por um lado, a redução do tempo necessário para selecionar os mesmos e, por outro lado, geração de combinações naturais possíveis, mas improváveis. Por último, de acordo com a modalidade selecionada, os organismos obtidos por esse método podem ser considerados como organismos não geneticamente modificados (non-GMO).[00153] The method according to the invention can be used in all applications in which it is desired to improve and control the phenomena of meiotic recombination. In particular, the invention enables the association, preferably, of genetic traits of interest. This preferential association makes it possible, on the one hand, to reduce the time needed to select them and, on the other hand, to generate possible, but unlikely, natural combinations. Finally, depending on the modality selected, the organisms obtained by this method can be considered as non-genetically modified organisms (non-GMO).
[00154] De acordo com um outro aspecto, a presente invenção se refere a um método para gerar variantes de um organismo eucariótico, com a exceção de humanos, de preferência, uma levedura ou uma planta, com mais preferência, uma levedura, notavelmente, uma cepa de levedura de interesse industrial, que compreende[00154] According to another aspect, the present invention relates to a method for generating variants of a eukaryotic organism, with the exception of humans, preferably, a yeast or a plant, more preferably, a yeast, notably, a strain of yeast of industrial interest, which comprises
[00155] - introduzir em uma célula do dito organismo:[00155] - introduce into a cell of said organism:
[00156] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[00156] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[00157] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 e uma sequência complementar a uma região cromossômica endereçada; e[00157] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain and a sequence complementary to an addressed chromosomal region ; It is
[00158] - induzir a dita célula a entrar na prófase meiótica I;[00158] - inducing said cell to enter meiotic prophase I;
[00159] - obter uma célula ou células que têm a recombinação(recombinações) desejada(desejadas) na região cromossômica endereçada(regiões cromossômicas endereçadas); e[00159] - obtain a cell or cells that have the desired recombination (recombinations) in the addressed chromosomal region (addressed chromosomal regions); It is
[00160] - gerar uma variante do organismo da dita célula recombinante.[00160] - generating a variant of the organism of said recombinant cell.
[00161] Nesse método, o termo “variante” deve ser entendido amplamente para se referir a um organismo que tem pelo menos uma diferença de fenótipo ou genótipo dos organismos progenitores.[00161] In this method, the term “variant” should be understood broadly to refer to an organism that has at least one difference in phenotype or genotype from the parent organisms.
[00162] As células recombinantes podem ser obtidas permitindo-se que a meiose continue até os esporos serem obtidos, ou, no caso de leveduras, retornando-se as células para condições de crescimento após a indução de quebras de filamento duplo a fim de resumir um processo mitótico.[00162] Recombinant cells can be obtained by allowing meiosis to continue until spores are obtained, or, in the case of yeast, by returning the cells to growth conditions after inducing double-strand breaks in order to summarize a mitotic process.
[00163] Quando a célula eucariótica é uma célula de planta, uma variante da planta pode ser gerada por fusão de gametas de planta, em que pelo menos um dos gametas é uma célula recombinante pelo método de acordo com a invenção.[00163] When the eukaryotic cell is a plant cell, a plant variant can be generated by fusion of plant gametes, wherein at least one of the gametes is a recombinant cell by the method according to the invention.
[00164] A presente invenção também está relacionada a um método para identificar ou localizar as informações genéticas que codificam uma característica de interesse no genoma de uma célula eucariótica, de preferência, uma levedura, que compreende:[00164] The present invention also relates to a method for identifying or locating genetic information encoding a characteristic of interest in the genome of a eukaryotic cell, preferably a yeast, which comprises:
[00165] - introduzir na célula eucariótica:[00165] - introduce into the eukaryotic cell:
[00166] a) uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11, ou um ácido nucleico que codifica a dita proteína de fusão; e[00166] a) a fusion protein comprising a Cas9 domain and a Spo11 domain, or a nucleic acid encoding said fusion protein; It is
[00167] b) um ou mais RNAs-guias ou um ou mais ácidos nucleicos que codificam os ditos RNAs-guias, ditos RNAs-guias que compreendem uma estrutura de RNA para se ligar ao domínio Cas9 e uma sequência complementar a uma região cromossômica endereçada; e[00167] b) one or more guide RNAs or one or more nucleic acids encoding said guide RNAs, said guide RNAs comprising an RNA structure for binding to the Cas9 domain and a sequence complementary to an addressed chromosomal region ; It is
[00168] - induzir a dita célula a entrar na prófase meiótica I;[00168] - inducing said cell to enter meiotic prophase I;
[00169] - obter uma célula ou células que têm a recombinação(recombinações) desejada(desejadas) na região cromossômica endereçada(regiões cromossômicas endereçadas); e[00169] - obtain a cell or cells that have the desired recombination (recombinations) in the addressed chromosomal region (addressed chromosomal regions); It is
[00170] - analisar os genótipos e fenótipos das células recombinantes de modo a identificar ou localizar as informações genéticas que codificam as características de interesse.[00170] - analyze the genotypes and phenotypes of recombinant cells in order to identify or locate the genetic information that encodes the characteristics of interest.
[00171] De preferência, a característica de interesse é um trato de interesse quantitativo (QTL).[00171] Preferably, the trait of interest is a quantitative tract of interest (QTL).
[00172] De acordo com um outro aspecto, a presente invenção se refere a uma proteína de fusão que compreende um domínio Cas9 e um domínio Spo11 como descrito acima.[00172] According to another aspect, the present invention relates to a fusion protein comprising a Cas9 domain and a Spo11 domain as described above.
[00173] A presente invenção também está relacionada a um ácido nucleico que codifica a dita proteína de fusão de acordo com a invenção.[00173] The present invention also relates to a nucleic acid encoding said fusion protein according to the invention.
[00174] O ácido nucleico de acordo com a invenção pode estar na forma de DNA e/ou RNA com filamento duplo ou com filamento único. De acordo com uma modalidade preferencial, o ácido nucleico é uma molécula de DNA isolada, sintetizada por técnicas recombinantes bem conhecidas a uma pessoa versada na técnica. O ácido nucleico de acordo com a invenção pode ser deduzido a partir da sequência da proteína de fusão de acordo com a invenção e o uso de códons pode ser apropriado de acordo com a célula hospedeira em que o ácido nucleico deve ser transcrito.[00174] The nucleic acid according to the invention can be in the form of double-stranded or single-stranded DNA and/or RNA. According to a preferred embodiment, the nucleic acid is an isolated DNA molecule, synthesized by recombinant techniques well known to a person skilled in the art. The nucleic acid according to the invention can be deduced from the sequence of the fusion protein according to the invention and the use of codons can be appropriate according to the host cell in which the nucleic acid is to be transcribed.
[00175] A presente invenção está relacionada adicionalmente a um cassete de expressão que compreende um ácido nucleico de acordo com a invenção operacionalmente ligada às sequências necessárias a sua expressão. Notavelmente, o ácido nucleico pode estar sob o controle de um promotor que permite sua expressão em uma célula hospedeira. Em geral, um cassete de expressão compreende, ou consiste em, um promotor para iniciar a transcrição, um ácido nucleico de acordo com a invenção, e um terminador de transcrição.[00175] The present invention further relates to an expression cassette comprising a nucleic acid according to the invention operably linked to the sequences necessary for its expression. Notably, the nucleic acid can be under the control of a promoter that allows its expression in a host cell. In general, an expression cassette comprises, or consists of, a promoter for initiating transcription, a nucleic acid according to the invention, and a transcription terminator.
[00176] O termo “cassete de expressão” se refere a uma construção de ácido nucleico que compreende uma região de codificação e uma região de regulação, operacionalmente ligada. A expressão “operacionalmente ligada” indica que os elementos são combinados de modo que a expressão da sequência de codificação esteja sob o controle do promotor transcricional. Tipicamente, a sequência de promotor é colocada a montante do gene de interesse, em uma distância do mesmo compatível com o controle de sua expressão. As sequências de espaçador podem estar presentes, entre os elementos reguladores e o gene, visto que não impedem a expressão. O cassete de expressão também pode compreender pelo menos uma sequência de ativação (“melhorador”) operacionalmente ligada ao promotor.[00176] The term “expression cassette” refers to a nucleic acid construct that comprises a coding region and a regulatory region, operably linked. The expression “operationally linked” indicates that the elements are combined so that expression of the coding sequence is under the control of the transcriptional promoter. Typically, the promoter sequence is placed upstream of the gene of interest, at a distance from it compatible with controlling its expression. Spacer sequences may be present between the regulatory elements and the gene, as they do not impede expression. The expression cassette may also comprise at least one activation sequence (“enhancer”) operably linked to the promoter.
[00177] Uma ampla variedade de promotores que pode ser usada para a expressão de genes de interesse em células hospedeiras ou organismos está à disposição de uma pessoa versada na técnica. Os mesmos incluem promotores constitutivos bem como promotores induzíveis que são ativados ou suprimidos por estímulo químico ou físico exógeno.[00177] A wide variety of promoters that can be used for the expression of genes of interest in host cells or organisms are available to a person skilled in the art. They include constitutive promoters as well as inducible promoters that are activated or suppressed by exogenous chemical or physical stimuli.
[00178] De preferência, o ácido nucleico de acordo com a invenção é colocado sob o controle de um promotor constitutivo ou um promotor específico de meiose.[00178] Preferably, the nucleic acid according to the invention is placed under the control of a constitutive promoter or a meiosis-specific promoter.
[00179] Os promotores específicos de meiose exemplificativos que podem ser usados no contexto da presente invenção incluem, porém sem limitação, promotores Spo11 endógenos, promotores dos parceiros Spo11 para formar quebras de filamento duplo, o promotor Rec8 (Murakami & Nicolas, 2009, Mol. Cell. Biol, 29, 3500-16), ou o promotor Spo13 (Malkova et al., 1996, Genetics, 143, 741-754).[00179] Exemplary meiosis-specific promoters that can be used in the context of the present invention include, but are not limited to, endogenous Spo11 promoters, promoters of Spo11 partners to form double-strand breaks, the Rec8 promoter (Murakami & Nicolas, 2009, Mol . Cell. Biol, 29, 3500-16), or the Spo13 promoter (Malkova et al., 1996, Genetics, 143, 741-754).
[00180] Outros promotores induzíveis também podem ser usados como o promotor de estradiol (Carlile & Amon, 2008 Cell, 133, 280-91), o promotor de metionina (Care et al., 1999, Molecular Microb 34, 792-798), promotores induzidos por choque de calor, metais, esteroides, antibióticos e álcool.[00180] Other inducible promoters can also be used such as the estradiol promoter (Carlile & Amon, 2008 Cell, 133, 280-91), the methionine promoter (Care et al., 1999, Molecular Microb 34, 792-798) , promoters induced by heat shock, metals, steroids, antibiotics and alcohol.
[00181] Os promotores constitutivos que podem ser usados no contexto da presente invenção são, a título de exemplo não limitativo: o promotor de gene precoce imediato de citomegalovírus (CMV), o promotor de vírus símio (SV40), o promotor tardio principal de adenovírus, o promotor de vírus de sarcoma Rous (RSV), o promotor de vírus tumoral mamário de camundongo (MMTV), o promotor de fosfoglicerato quinase (PGK), o promotor de ED1-alfa de fator de alongamento, promotores de ubiquitina, promotores de actina, promotores de tubulina, promotores de imunoglobulina, promotor de álcool desidrogenase 1 (ADH1), promotores dependentes de RNA polimerase III como o U6, U3, H1, 7SL, pRPR1 (“Ribonuclease P RNA 1”), promotores SNR52 (“RNA 52 nuclear pequeno”), ou o promotor pZmUbi.[00181] The constitutive promoters that can be used in the context of the present invention are, by way of non-limiting example: the cytomegalovirus (CMV) immediate early gene promoter, the simian virus (SV40) promoter, the major late gene promoter of adenovirus, the Rous sarcoma virus (RSV) promoter, the mouse mammary tumor virus (MMTV) promoter, the phosphoglycerate kinase (PGK) promoter, the elongation factor ED1-alpha promoter, ubiquitin promoters, promoters actin promoters, tubulin promoters, immunoglobulin promoters, alcohol dehydrogenase 1 (ADH1) promoter, RNA polymerase III-dependent promoters such as U6, U3, H1, 7SL, pRPR1 (“Ribonuclease P RNA 1”), SNR52 promoters (“ small nuclear RNA”), or the pZmUbi promoter.
[00182] O terminador de transcrição pode ser prontamente selecionado por uma pessoa versada na técnica. De preferência, esse terminador é RPR1t, a sequência de flanqueamento 3' do gene Saccharomyces cerevisiae SUP4 ou o terminador de nopalina sintase (tNOS).[00182] The transcription terminator can be readily selected by a person skilled in the art. Preferably, this terminator is RPR1t, the 3' flanking sequence of the Saccharomyces cerevisiae SUP4 gene or the nopaline synthase (tNOS) terminator.
[00183] A presente invenção está relacionada adicionalmente a um vetor de expressão que compreende um ácido nucleico ou um cassete de expressão de acordo com a invenção. Esse vetor de expressão pode ser usado para transformar uma célula hospedeira e para expressar o ácido nucleico de acordo com a invenção na dita célula. Os vetores podem ser construídos por técnicas de biologia molecular convencionais, bem conhecidas a uma pessoa versada na técnica.[00183] The present invention further relates to an expression vector comprising a nucleic acid or an expression cassette according to the invention. Such an expression vector can be used to transform a host cell and to express the nucleic acid according to the invention in said cell. Vectors can be constructed by conventional molecular biology techniques well known to a person skilled in the art.
[00184] Vantajosamente, o vetor de expressão compreende elementos reguladores para expressar o ácido nucleico de acordo com a invenção. Esses elementos podem compreender, por exemplo, promotores de transcrição, ativadores de transcrição, sequências de terminador, códons de iniciação e códons de terminação. Os métodos para selecionar esses elementos como uma função da célula hospedeira em que a expressão é desejada são bem conhecidos a uma pessoa versada na técnica.[00184] Advantageously, the expression vector comprises regulatory elements for expressing the nucleic acid according to the invention. These elements may comprise, for example, transcription promoters, transcription activators, terminator sequences, initiation codons and termination codons. Methods for selecting such elements as a function of the host cell in which expression is desired are well known to a person skilled in the art.
[00185] Em uma modalidade particular, o vetor de expressão compreende um ácido nucleico que codifica a proteína de fusão de acordo com a invenção, colocada sob o controle de um promotor constitutivo, de preferência, o promotor de ADH1 (pADH1). O mesmo também pode compreender uma sequência de terminador como o terminador de ADH1 (tADH1).[00185] In a particular embodiment, the expression vector comprises a nucleic acid encoding the fusion protein according to the invention, placed under the control of a constitutive promoter, preferably the ADH1 promoter (pADH1). It may also comprise a terminator sequence such as the ADH1 terminator (tADH1).
[00186] O vetor de expressão pode compreender uma ou mais origens bacterianas ou eucarióticas de replicação. O vetor de expressão pode, em particular, incluir uma origem de bacteriana de replicação funcional em E. coli como a origem ColE1 de replicação. Alternativamente, o vetor pode compreender uma origem eucariótica de replicação, de preferência funcional em S. cerevisiae.[00186] The expression vector may comprise one or more bacterial or eukaryotic origins of replication. The expression vector may, in particular, include a bacterial origin of replication functional in E. coli as the ColE1 origin of replication. Alternatively, the vector may comprise a eukaryotic origin of replication, preferably functional in S. cerevisiae.
[00187] O vetor pode compreender adicionalmente elementos que permitem que sua seleção em uma célula hospedeira bacteriana ou eucariótica como, por exemplo, um gene de resistência a antibiótico ou um gene de seleção que garante a complementação do respectivo gene deletado no genoma de célula hospedeira. Tais elementos são bem conhecidos por uma pessoa versada na técnica e são extensivamente descritos na literatura.[00187] The vector may additionally comprise elements that allow its selection in a bacterial or eukaryotic host cell, such as, for example, an antibiotic resistance gene or a selection gene that ensures the complementation of the respective deleted gene in the host cell genome. . Such elements are well known to a person skilled in the art and are extensively described in the literature.
[00188] Em uma modalidade particular, o vetor de expressão compreende um ou mais genes de resistência a antibiótico, de preferência, um gene para resistência a ampicilina, canamicina, higromicina, geneticina e/ou nourseotricina.[00188] In a particular embodiment, the expression vector comprises one or more antibiotic resistance genes, preferably a gene for resistance to ampicillin, kanamycin, hygromycin, geneticin and/or nourseothricin.
[00189] O vetor de expressão também pode compreender uma ou mais sequências que permitem a inserção endereçada do vetor, do cassete de expressão ou do ácido nucleico no genoma de uma célula hospedeira. De preferência, a inserção é executada em um gene cuja inativação permite a seleção das células hospedeiras que integraram o vetor, o cassete ou o ácido nucleico, como o locus TRP1.[00189] The expression vector may also comprise one or more sequences that allow targeted insertion of the vector, expression cassette or nucleic acid into the genome of a host cell. Preferably, the insertion is performed in a gene whose inactivation allows the selection of host cells that have integrated the vector, cassette or nucleic acid, such as the TRP1 locus.
[00190] O vetor pode ser circular ou linear, de filamento simples ou duplo. O mesmo é vantajosamente selecionado a partir de plasmídeos, fagos, fagomídeos, vírus, cosmídeos e cromossomas artificiais. De preferência, o vetor é um plasmídeo.[00190] The vector can be circular or linear, single or double stranded. It is advantageously selected from plasmids, phages, phagemids, viruses, cosmids and artificial chromosomes. Preferably, the vector is a plasmid.
[00191] A presente invenção está relacionada, em particular, a um vetor, de preferência, um plasmídeo, que compreende uma origem de replicação bacteriana, de preferência, a origem ColE1, um ácido nucleico como definido acima sob o controle de um promotor, de preferência, um promotor constitutivo como o promotor de ADH1, um terminador, de preferência, o terminador de ADH1, um ou mais marcadores de seleção, de preferência, marcadores de resistência como o gene para resistência a canamicina ou a ampicilina, e uma ou mais sequências que permitem inserção endereçada do vetor, o cassete de expressão ou o ácido nucleico no genoma de célula hospedeira, de preferência, no locus TRP1 do genoma de uma levedura.[00191] The present invention relates, in particular, to a vector, preferably a plasmid, which comprises a bacterial origin of replication, preferably the ColE1 origin, a nucleic acid as defined above under the control of a promoter, preferably, a constitutive promoter such as the ADH1 promoter, a terminator, preferably the ADH1 terminator, one or more selection markers, preferably resistance markers such as the gene for kanamycin or ampicillin resistance, and one or more more sequences that allow targeted insertion of the vector, the expression cassette or the nucleic acid into the host cell genome, preferably into the TRP1 locus of the yeast genome.
[00192] Em uma modalidade particular, o ácido nucleico de acordo com a invenção realizada pelo vetor codifica uma proteína de fusão que compreende uma ou mais etiquetas, de preferência, que compreende uma etiqueta que consiste em seis histidinas e/ou um ou mais motivos Flag, de preferência, três motivos Flag. De preferência, a etiqueta ou etiquetas são terminação C.[00192] In a particular embodiment, the nucleic acid according to the invention carried out by the vector encodes a fusion protein comprising one or more tags, preferably comprising a tag consisting of six histidines and/or one or more motifs Flag, preferably three Flag motifs. Preferably, the tag or tags are C-terminated.
[00193] De acordo com uma modalidade particular, o vetor de expressão é o plasmídeo P1 que tem a sequência de nucleotídeos SEQ ID NO: 1 ou o plasmídeo P2 que tem a sequência de nucleotídeos SEQ ID NO: 2.[00193] According to a particular embodiment, the expression vector is the P1 plasmid that has the nucleotide sequence SEQ ID NO: 1 or the P2 plasmid that has the nucleotide sequence SEQ ID NO: 2.
[00194] A presente invenção também está relacionada ao uso de um ácido nucleico, um cassete de expressão ou um vetor de expressão de acordo com a invenção para transformar ou transfectar uma célula. A célula hospedeira pode ser transformada/transfectada de uma maneira estável ou transitória e o ácido nucleico, o cassete ou o vetor pode estar contido na célula como um epíssomo ou pode ser integrado no genoma de célula hospedeira.[00194] The present invention also relates to the use of a nucleic acid, an expression cassette or an expression vector according to the invention to transform or transfect a cell. The host cell may be transformed/transfected in a stable or transient manner and the nucleic acid, cassette or vector may be contained in the cell as an episome or may be integrated into the host cell genome.
[00195] A presente invenção está relacionada a uma célula hospedeira que compreende uma proteína de fusão, um ácido nucleico, um cassete de expressão ou um vetor de expressão de acordo com a invenção.[00195] The present invention relates to a host cell comprising a fusion protein, a nucleic acid, an expression cassette or an expression vector according to the invention.
[00196] De preferência, a célula é uma célula eucariótica, em particular, uma célula de levedura, planta, fúngica ou animal. Particularmente de preferência, a célula hospedeira é uma célula de levedura. Em uma modalidade particular, a célula hospedeira é não humana e/ou não embrionária.[00196] Preferably, the cell is a eukaryotic cell, in particular, a yeast, plant, fungal or animal cell. Particularly preferably, the host cell is a yeast cell. In a particular embodiment, the host cell is non-human and/or non-embryonic.
[00197] De acordo com uma modalidade particular, a célula eucariótica é uma célula de levedura, em particular, uma levedura de interesse industrial. As leveduras exemplificativas de interesse incluem, mas não são limitadas a, leveduras do gênero Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia ou Candida, bem como os híbridos obtidos a partir de uma cepa que pertencem a um desses gêneros.[00197] According to a particular embodiment, the eukaryotic cell is a yeast cell, in particular, a yeast of industrial interest. Exemplary yeasts of interest include, but are not limited to, yeasts of the genus Saccharomyces sensu stricto, Schizosaccharomyces, Yarrowia, Hansenula, Kluyveromyces, Pichia or Candida, as well as hybrids obtained from a strain belonging to one of these genera.
[00198] De preferência, a levedura de interesse pertence ao gênero Saccharomyces, de preferência, uma levedura selecionada a partir do grupo que consiste em Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus(também chamada Saccharomyces carlsbergensis), e os híbridos obtidos a partir de pelo menos uma cepa que pertence a uma dessas espécies, com mais preferência, a dita célula hospedeira eucariótica é Saccharomyces cerevisiae.[00198] Preferably, the yeast of interest belongs to the genus Saccharomyces, preferably a yeast selected from the group consisting of Saccharomyces cerevisiae, Saccharomyces bayanus, Saccharomyces castelli, Saccharomyces eubayanus, Saccharomyces kluyveri, Saccharomyces kudriavzevii, Saccharomyces mikatae, Saccharomyces uvarum, Saccharomyces paradoxus, Saccharomyces pastorianus (also called Saccharomyces carlsbergensis), and hybrids obtained from at least one strain belonging to one of these species, more preferably, said eukaryotic host cell is Saccharomyces cerevisiae.
[00199] De acordo com uma outra modalidade particular, a célula eucariótica é uma célula fúngica, em particular, uma célula fúngica de interesse industrial. Os fungos exemplificativos incluem, porém sem limitação, células fúngicas filamentosas. Os fungos filamentosos incluem fungos que pertencem às subdivisões Eumycota e Oomycota. As células fúngicas filamentosas podem ser selecionadas a partir do grupo que consiste em células Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filobasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora, Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium ou Trametes.[00199] According to another particular embodiment, the eukaryotic cell is a fungal cell, in particular, a fungal cell of industrial interest. Exemplary fungi include, but are not limited to, filamentous fungal cells. Filamentous fungi include fungi that belong to the Eumycota and Oomycota subdivisions. Filamentous fungal cells can be selected from the group consisting of Trichoderma, Acremonium, Aspergillus, Aureobasidium, Bjerkandera, Ceriporiopsis, Chrysosporium, Coprinus, Coriolus, Cryptococcus, Filobasidium, Fusarium, Humicola, Magnaporthe, Mucor, Myceliophthora, Neocallimastix, Neurospora cells , Paecilomyces, Penicillium, Phanerochaete, Phlebia, Piromyces, Pleurotus, Schizophyllum, Talaromyces, Thermoascus, Thielavia, Tolypocladium or Trametes.
[00200] Em uma outra modalidade preferencial, a célula é uma célula de planta, de preferência, uma célula de planta selecionada a partir do grupo que consiste em arroz, trigo, soja, maís, tomate, Arabidopsis thaliana, cevada, colza, algodão, cana-de-açúcar e beterraba, com mais preferência, a dita célula hospedeira eucariótica é uma célula de arroz.[00200] In another preferred embodiment, the cell is a plant cell, preferably a plant cell selected from the group consisting of rice, wheat, soybeans, corn, tomatoes, Arabidopsis thaliana, barley, rapeseed, cotton , sugar cane and beet, more preferably, said eukaryotic host cell is a rice cell.
[00201] A presente invenção também está relacionada ao uso da proteína de fusão, do ácido nucleico, do cassete de expressão ou do vetor de expressão de acordo com a invenção para (i) induzir as recombinações meióticas endereçadas em uma célula eucariótica, (ii) gerar variantes de um organismo eucariótico, e/ou (iii) identificar ou localizar as informações genéticas que codificam uma característica de interesse em um genoma de célula eucariótica.[00201] The present invention also relates to the use of the fusion protein, nucleic acid, expression cassette or expression vector according to the invention to (i) induce targeted meiotic recombinations in a eukaryotic cell, (ii ) generate variants of a eukaryotic organism, and/or (iii) identify or locate the genetic information that encodes a characteristic of interest in a eukaryotic cell genome.
[00202] A presente invenção está relacionada adicionalmente a um kit que compreende uma proteína de fusão, um ácido nucleico, um cassete de expressão ou um vetor de expressão de acordo com a invenção, ou uma célula hospedeira transformada ou transfectada com um ácido nucleico, um cassete de expressão ou um vetor de expressão de acordo com a invenção. A mesma também está relacionada ao uso do dito kit para implantar um método de acordo com a invenção, em particular, para (i) induzir as recombinações meióticas endereçadas em uma célula eucariótica, (ii) gerar variantes de um organismo eucariótico, e/ou (iii) identificar ou localizar as informações genéticas que codificam uma característica de interesse em um genoma de célula eucariótica.[00202] The present invention further relates to a kit comprising a fusion protein, a nucleic acid, an expression cassette or an expression vector according to the invention, or a host cell transformed or transfected with a nucleic acid, an expression cassette or an expression vector according to the invention. It also relates to the use of said kit to implement a method according to the invention, in particular, to (i) induce the addressed meiotic recombinations in a eukaryotic cell, (ii) generate variants of a eukaryotic organism, and/or (iii) identify or locate the genetic information that encodes a characteristic of interest in a eukaryotic cell genome.
[00203] Os métodos de acordo com a invenção podem ser métodos in vitro, in vivo ou ex vivo.[00203] The methods according to the invention can be in vitro, in vivo or ex vivo methods.
[00204] Os seguintes exemplos são apresentados com finalidades ilustrativas e não limitativas.[00204] The following examples are presented for illustrative and non-limiting purposes.
[00205] O gene SpCas9 que codifica a proteína Cas9 é proveniente da cepa bacteriana Streptococcus pyogenes. A forma cataliticamente inativa de SpCas9 (SpCas9*) é distinguida da SpCas9 por mutações de dois pontos: o aspartato na posição 10 e a histidina na posição 840 foram ambos substituídos por alaninas (Asp1^Ala1 e His 4 ^Ala 4 ).[00205] The SpCas9 gene that encodes the Cas9 protein comes from the bacterial strain Streptococcus pyogenes. The catalytically inactive form of SpCas9 (SpCas9*) is distinguished from SpCas9 by two-point mutations: the aspartate at position 10 and histidine at position 840 have both been replaced by alanines (Asp1^Ala1 and His 4 ^Ala 4 ).
[00206] Por causa de variações na frequência de uso de códons genéticos entre Streptococcus pyogenes e Saccharomyces cerevisiae, as sequências de genes SpCas9 e SpCas9* foram adaptadas a fim de otimizar sua expressão em levedura (yeast_optim_SpCas9 e yeast_optim_SpCas9*). As sequências de aminoácidos das duas proteínas não foram modificadas.[00206] Because of variations in the frequency of use of genetic codons between Streptococcus pyogenes and Saccharomyces cerevisiae, the SpCas9 and SpCas9* gene sequences were adapted in order to optimize their expression in yeast (yeast_optim_SpCas9 and yeast_optim_SpCas9*). The amino acid sequences of the two proteins were not modified.
[00207] A manipulação das sequências yeast_optim_SpCas9 e yeast_optim_SpCas9* possibilitou fundir as proteínas SpCas9 e SpCas9* com um sinal de localização nuclear (NLS) associado a um ligante de terminal N (ligante 1) e a um segundo ligante de terminal C (ligante 2) (que separará as proteínas SpCas9 e SpCas9* da proteína Spo11 na construção final). As sequências de nucleotídeos obtidas dessa forma e que codificam as sequências de proteínas NLS-ligantel—SpCas9- ligante2 e NLS—ligantel-SpCas9*-ligante2foram, então, clonadas em um plasmídeo integrativo, que contém a forma completa da proteína Spo11 de Saccharomyces cerevisiae marcada com uma sequência que codifica o motivo 6xHis-3*Flag duplo de terminal C e cuja expressão é controlada pelo promotor constitutivo pADH1. As construções de plasmídeo resultantes, P1 e P2, dessa forma, contiveram assim a fusão em fase do terminal N de NLS-ligantel-SpCas9-ligante2 e NLS-ligantel- SpCas9*-ligante2 à proteína Spo11. Consequentemente, P1 e P2 permitiram respectivamente a expressão constitutiva em levedura das proteínas de fusão NLS-SpCas9-Spo11-6xHis-3xFlag (SEQ ID NO: 6) e NLS-SpCas9*-Spo11-6xHis-3xFlag (SEQ ID NO: 7) (Figura 1).[00207] The manipulation of the yeast_optim_SpCas9 and yeast_optim_SpCas9* sequences made it possible to fuse the SpCas9 and SpCas9* proteins with a nuclear localization signal (NLS) associated with an N-terminal ligand (ligand 1) and a second C-terminal ligand (ligand 2 ) (which will separate the SpCas9 and SpCas9* proteins from the Spo11 protein in the final construct). The nucleotide sequences obtained in this way and encoding the protein sequences NLS-ligandel—SpCas9-ligand2 and NLS—ligantel-SpCas9*-ligand2 were then cloned into an integrative plasmid, which contains the complete form of the Spo11 protein from Saccharomyces cerevisiae marked with a sequence that encodes the C-terminal double 6xHis-3*Flag motif and whose expression is controlled by the constitutive pADH1 promoter. The resulting plasmid constructs, P1 and P2, thus contained the N-terminal in-phase fusion of NLS-ligandel-SpCas9-ligand2 and NLS-ligandel-SpCas9*-ligand2 to the Spo11 protein. Consequently, P1 and P2 respectively allowed the constitutive expression in yeast of the fusion proteins NLS-SpCas9-Spo11-6xHis-3xFlag (SEQ ID NO: 6) and NLS-SpCas9*-Spo11-6xHis-3xFlag (SEQ ID NO: 7) (Figure 1).
[00208] Começando com um plasmídeo de 2 microns (2μ) (Farzadfard F et al., 2013, ACS Synth. Biol., 2, páginas 604 613; DiCarlo JE et al., 2013, Nucleic Acids Res., 41(7), páginas 4336-4343) que contém a região de manuseio (82 nucleotídeos) de um RNA-guia (gRNA), colocado sob o controle de um promotor constitutivo dependente de RNA polimerase III como pRPR1 ou SNR52, o vetor de expressão para um único gRNA de 102 nucleotídeos foi construído por clonagem da sequência de determinação de especificidade de 20 nucleotídeos (região SDS) do gRNA em um sítio de restrição localizado imediatamente em 5‘ da sequência que codifica a região de manuseio do vetor linearizado, pelo método de montagem Gibson (Figura 2A).[00208] Starting with a 2 micron (2μ) plasmid (Farzadfard F et al., 2013, ACS Synth. Biol., 2, pages 604 613; DiCarlo JE et al., 2013, Nucleic Acids Res., 41(7 ), pages 4336-4343) which contains the handling region (82 nucleotides) of a guide RNA (gRNA), placed under the control of a constitutive RNA polymerase III-dependent promoter such as pRPR1 or SNR52, the expression vector for a A single 102-nucleotide gRNA was constructed by cloning the 20-nucleotide specificity determination sequence (SDS region) of the gRNA into a restriction site located immediately 5' of the sequence encoding the linearized vector handling region, by the assembly method. Gibson (Figure 2A).
[00209] Esse vetor de expressão conteve uma sequência que compreende vários sítios de restrição exclusivos (sítio de clonagem múltipla (MCS)) a jusante do terminador (RPR1t ou sequência de flanqueamento 3‘ de SUP4). Também, a fim de obter um sistema que permite o endereçamento multiplexado de sítios de recombinação meiótica, vários cassetes de expressão de gRNA foram inseridos no vetor de expressão em seu MCS. Os cassetes de expressão de gRNA consistem em um promotor constitutivo dependente de RNA polimerase III (pRPR1 ou SNR52), do gRNA específico e de um terminador (RPR1t ou a sequência de flanqueamento 3' de SUP4). Esses cassetes de expressão de gRNA foram primeiramente clonados formando vetores de expressão de gRNA exclusivos (consulte acima), então, foram amplificados por PCR antes de serem clonados sucessivamente no sítio de clonagem múltipla (MCS) do vetor de expressão para um único gRNA por técnicas de inserção/ligação convencionais (Figura 2B). Essa estratégia termina na concatenação de vários cassetes de gRNA em um único vetor de expressão.[00209] This expression vector contained a sequence comprising several unique restriction sites (multiple cloning site (MCS)) downstream of the terminator (RPR1t or SUP4 3' flanking sequence). Also, in order to obtain a system that allows multiplexed addressing of meiotic recombination sites, several gRNA expression cassettes were inserted into the expression vector in its MCS. The gRNA expression cassettes consist of a constitutive RNA polymerase III-dependent promoter (pRPR1 or SNR52), the specific gRNA and a terminator (RPR1t or the 3' flanking sequence of SUP4). These gRNA expression cassettes were first cloned into unique gRNA expression vectors (see above), then were amplified by PCR before being successively cloned into the multiple cloning site (MCS) of the expression vector for a single gRNA by techniques conventional insertion/ligation method (Figure 2B). This strategy ends in the concatenation of several gRNA cassettes into a single expression vector.
[00210] A fim de introduzir as fusões de NLS-SpCas9- Spo11 ou NLS—SpCas9*—Spo11 no locus TRP1 cromossômico, as cepas da levedura Saccharomyces cerevisiae foram transformadas por choque térmico com os vetores linearizados P1 ou P2. Essas proteínas de fusão, que portam etiqueta 3*Flag de terminal C, foram colocadas sob o controle do promotor constitutivo de ADH1. Após a transformação, as células foram plaqueadas em placas de Petri que contêm meio seletivo (adaptado para os marcadores de seleção carregados pelos plasmídeos P1 e P2) a fim de selecionar os transformantes integraram a fusão em seu genoma.[00210] In order to introduce the NLS-SpCas9-Spo11 or NLS—SpCas9*—Spo11 fusions into the chromosomal TRP1 locus, Saccharomyces cerevisiae yeast strains were transformed by heat shock with the linearized P1 or P2 vectors. These fusion proteins, which carry a C-terminal 3*Flag tag, were placed under the control of the constitutive ADH1 promoter. After transformation, the cells were plated in Petri dishes containing selective medium (adapted for the selection markers carried by the P1 and P2 plasmids) in order to select the transformants that integrated the fusion into their genome.
[00211] O vetor de expressão para o gRNA (gRNAs) foi, então, introduzido nas cepas de levedura diploides que expressam as proteínas de fusão NLS-SpCas9-Spo11 ou NLS- SpCas9*-Spo11 por transformação por choque térmico. As células foram, então, plaqueadas em meio seletivo para os marcadores de seleção para os plasmídeos de expressão de gRNA. Os plasmídeos de expressão de gRNA compreenderam uma origem de 2 microns (2μ) de replicação que os permitiu serem mantidos com um número de cópia alto em cada célula de levedura (50-100 cópias/célula).[00211] The expression vector for the gRNA (gRNAs) was then introduced into diploid yeast strains expressing the NLS-SpCas9-Spo11 or NLS-SpCas9*-Spo11 fusion proteins by heat shock transformation. The cells were then plated in medium selective for the selection markers for the gRNA expression plasmids. The gRNA expression plasmids comprised a 2 micron (2μ) origin of replication that allowed them to be maintained at a high copy number in each yeast cell (50-100 copies/cell).
[00212] A formação de rupturas meióticas de filamento duplo geradas de uma maneira simples ou multiplexada pelas proteínas de fusão SpCas9-Spo11 ou SpCas9*-Spo11 nos sítios genômicos endereçados por gRNAs múltiplos e simples é, então, detectada por análise Southern Blot de DNA genômico extraído a partir de células diploides crescidas em meio de esporulação.[00212] The formation of double-stranded meiotic breaks generated in a single or multiplexed manner by the SpCas9-Spo11 or SpCas9*-Spo11 fusion proteins at the genomic sites addressed by multiple and single gRNAs is then detected by DNA Southern Blot analysis genomics extracted from diploid cells grown in sporulation medium.
[00213] Os inventores analisaram a viabilidade de esporos derivados de meiose das seguintes cepas diploides de Saccharomyces cerevisiae:[00213] The inventors analyzed the viability of spores derived from meiosis of the following diploid strains of Saccharomyces cerevisiae:
[00214] - uma cepa SPO11/SPO11 (ORD7339) que compreende duas cópias do alelo do tipo selvagem do gene SPO11,[00214] - a SPO11/SPO11 strain (ORD7339) comprising two copies of the wild-type allele of the SPO11 gene,
[00215] - uma cepa spo11/spo11 (AND2822) que compreende duas cópias do alelo mutado do gene SPO11. Esse alelo mutado corresponde ao alelo do tipo selvagem em que um marcador genético que inativa totalmente o gene foi inserido,[00215] - a spo11/spo11 strain (AND2822) comprising two copies of the mutated allele of the SPO11 gene. This mutated allele corresponds to the wild-type allele in which a genetic marker that completely inactivates the gene has been inserted,
[00216] - uma cepa spo11/spo11 dCAS9-SPO11/0 (AND2820) que compreende duas cópias do alelo mutado do gene SPO11 e uma cópia do gene que codifica a proteína de fusão SpCas9*-Spo11 integrada em uma das duas cópias de cromossoma IV no locus TRP1, e[00216] - a spo11/spo11 strain dCAS9-SPO11/0 (AND2820) comprising two copies of the mutated allele of the SPO11 gene and one copy of the gene encoding the SpCas9*-Spo11 fusion protein integrated into one of the two chromosome copies IV at the TRP1 locus, and
[00217] - uma cepa spo11/spo11 dCAS9-SPO11/dCAS9- SPO11 (AND2823) que compreende duas cópias do alelo mutado do gene SPO11 e duas cópias do gene que codifica a proteína de fusão SpCas9*-Spo11 integrada em ambas as cópias de cromossoma IV no locus TRP1.[00217] - a spo11/spo11 dCAS9-SPO11/dCAS9-SPO11 (AND2823) strain comprising two copies of the mutated allele of the SPO11 gene and two copies of the gene encoding the SpCas9*-Spo11 fusion protein integrated into both copies of chromosome IV at the TRP1 locus.
[00218] Os resultados apresentados na Figura 5 mostram que a expressão da proteína de fusão SpCas9*-Spo11 complementa a inviabilidade de esporos derivados de esporulação cepas inativadas por gene SPO11.[00218] The results presented in Figure 5 show that expression of the SpCas9*-Spo11 fusion protein complements the inviability of spores derived from sporulating strains inactivated by the SPO11 gene.
[00219] O cassete de expressão SpCas9*-Spo11 (dCAS9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia de UAS1-YCR048W (sgRNA) (SEQ ID NO: 10) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito na Figura 2A. O gene de fusão que porta a construção de dCAS9-SPO11 foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção dCAS9-SPO11 foi confirmada por Southern blot.[00219] The SpCas9*-Spo11 (dCAS9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The UAS1-YCR048W guide RNA (sgRNA) (SEQ ID NO: 10) was expressed by the multicopy replication (non-integrative) plasmid as described in Figure 2A. The fusion gene carrying the dCAS9-SPO11 construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. Integration of the cassette carrying the dCAS9-SPO11 construct was confirmed by Southern blot.
[00220] As seguintes cepas foram usadas:[00220] The following strains were used:
[00221] - SPO11/SPO11 (ORD7304),[00221] - SPO11/SPO11 (ORD7304),
[00222] - SPO11/SPO11 que expressa o RNA-guia UAS1- YCR48W (sgRNA) (ANT2524),[00222] - SPO11/SPO11 that expresses the UAS1-YCR48W guide RNA (sgRNA) (ANT2524),
[00223] - spo11/spo11 dCAS9-SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2527),[00223] - spo11/spo11 dCAS9-SPO11/0 which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2527),
[00224] - spo11/spo11 dCAS9-SPO11/0 que expressa o RNA-guia UAS1-YCR48W (sgRNA) (ANT2528), e[00224] - spo11/spo11 dCAS9-SPO11/0 that expresses the UAS1-YCR48W guide RNA (sgRNA) (ANT2528), and
[00225] - spo11/spo11 dCAS9-SPO11/dCAS9—SPO11 que expressa o RNA-guia UAS1-YCR48W (sgRNA) (ANT2529).[00225] - spo11/spo11 dCAS9-SPO11/dCAS9—SPO11 expressing the UAS1-YCR48W guide RNA (sgRNA) (ANT2529).
[00226] As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pela enzima de restrição AseI. O DNA foi sondado com um fragmento interno para o locus YCR048W. As bandas foram quantificadas com o uso do software ImageJ.[00226] Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by AseI restriction enzyme. The DNA was probed with an internal fragment for the YCR048W locus. Bands were quantified using ImageJ software.
[00227] Os resultados apresentados na Figura 6 mostram que a expressão da construção SpCas9*-Spo11 (dCAS9- SPO11) induz rupturas meióticas de filamento duplo de DNA (DSBs) nos sítios de clivagem naturais da proteína Spo11 (região YCR043C-YCR048W do cromossoma III (DSBs I a VI simbolizadas por quadrados pretos na Figura 6) e no sítio UAS1[00227] The results presented in Figure 6 show that expression of the construct SpCas9*-Spo11 (dCAS9-SPO11) induces meiotic DNA double-strand breaks (DSBs) at the natural cleavage sites of the Spo11 protein (YCR043C-YCR048W region of the chromosome III (DSBs I to VI symbolized by black squares in Figure 6) and at the UAS1 site
[00228] O cassete de expressão SpCas9*-Spo11 (dCAS9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia (sgRNA) UAS1-YCR048W ou UAS2-YCR048W (SEQ ID NO: 11) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito na Figura 2A. O gene de fusão que porta a construção de dCAS9-SPO11 foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção dCAS9-SPO11 foi confirmada por Southern blot.[00228] The SpCas9*-Spo11 (dCAS9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The guide RNA (sgRNA) UAS1-YCR048W or UAS2-YCR048W (SEQ ID NO: 11) was expressed by the multicopy replication (non-integrative) plasmid as described in Figure 2A. The fusion gene carrying the dCAS9-SPO11 construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. Integration of the cassette carrying the dCAS9-SPO11 construct was confirmed by Southern blot.
[00229] As seguintes cepas foram usadas:[00229] The following strains were used:
[00230] - SPO11/SPO11 (ORD7304),[00230] - SPO11/SPO11 (ORD7304),
[00231] - SPO11/SPO11 que expressa o RNA-guia UAS1- YCR048W (sgRNA) (ANT2524),[00231] - SPO11/SPO11 that expresses the UAS1-YCR048W guide RNA (sgRNA) (ANT2524),
[00232] - SPO11/SPO11 dCAS9—SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2518),[00232] - SPO11/SPO11 dCAS9—SPO11/0 which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2518),
[00233] - SPO11/SPO11 dCAS9—SPO11/0 que expressa o RNA-guia UAS1-YCR048W (sgRNA) (ANT2519),[00233] - SPO11/SPO11 dCAS9—SPO11/0 expressing the UAS1-YCR048W guide RNA (sgRNA) (ANT2519),
[00234] - SPO11/SPO11 dCAS9-SPO11/dCAS9-SPO11 que expressa o RNA-guia UAS1-YCR48W (sgRNA) (ANT2522),[00234] - SPO11/SPO11 dCAS9-SPO11/dCAS9-SPO11 expressing the UAS1-YCR48W guide RNA (sgRNA) (ANT2522),
[00235] - SPO11/SPO11 dCAS9-SPO11/0 que expressa o RNA-guia UAS2-YCR048W (sgRNA) (ANT2520),[00235] - SPO11/SPO11 dCAS9-SPO11/0 expressing the UAS2-YCR048W guide RNA (sgRNA) (ANT2520),
[00236] - SPO11/SPO11 dCAS9-SPO11/dCAS9-SPO11 que expressa o RNA-guia UAS2-YCR048W (sgRNA) (ANT2523), e[00236] - SPO11/SPO11 dCAS9-SPO11/dCAS9-SPO11 that expresses the UAS2-YCR048W guide RNA (sgRNA) (ANT2523), and
[00237] - spoll/spoll dCAS9-SPO11/0 que expressa o RNA-guia UAS1-YCR048W (sgRNA) (ANT2528).[00237] - spoll/spoll dCAS9-SPO11/0 that expresses the UAS1-YCR048W guide RNA (sgRNA) (ANT2528).
[00238] As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pelas enzimas de restrição AseI e SacI. O DNA foi sondado com um fragmento interno para o locus YCR048W. As bandas foram quantificadas com o uso do software ImageJ.[00238] Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by AseI and SacI restriction enzymes. The DNA was probed with an internal fragment for the YCR048W locus. Bands were quantified using ImageJ software.
[00239] Os resultados apresentados na Figura 7 indicam que a expressão da construção dCAS9-SPO11 induz rupturas meióticas de filamento duplo de DNA (DSBs) nos sítios de clivagem naturais da proteína Spoil (região YCR047C-YCR048W do cromossoma III (DSBs V e VI simbolizadas por quadrados) e no sítio UAS1-YCR048W (DSB VII simbolizada por um triângulo) endereçado pelo RNA-guia UAS1-YCR048W na região de codificação 5‘ do gene YCR048W e no sítio UAS2-YCR048W (DSB VIII simbolizada por um círculo) endereçado pelo RNA-guia UAS2- YCR048W na região de codificação 3‘ do gene YCR048W. Esses resultados mostram que o endereçamento é eficaz nas cepas que portam o gene do tipo selvagem SPO11 ou o gene mutado SPO11.[00239] The results presented in Figure 7 indicate that expression of the dCAS9-SPO11 construct induces meiotic DNA double-strand breaks (DSBs) at the natural cleavage sites of the Spoil protein (YCR047C-YCR048W region of chromosome III (DSBs V and VI symbolized by squares) and at the UAS1-YCR048W site (DSB VII symbolized by a triangle) addressed by the UAS1-YCR048W guide RNA in the 5' coding region of the YCR048W gene and at the UAS2-YCR048W site (DSB VIII symbolized by a circle) addressed by the UAS2-YCR048W guide RNA in the 3' coding region of the YCR048W gene. These results show that targeting is effective in strains carrying the wild-type SPO11 gene or the mutated SPO11 gene.
[00240] O cassete de expressão SpCas9*-Spo11 (dCAS9- SPOll) foi integrado no locus TRPl cromossômico (cromossoma IV). o RNA-guia (sgRNA) UAS D/E-GAL2 (SEQ ID NO: 12) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito na Figura 2A. O gene de fusão que porta a construção de dCAS9-SPOll foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção dCAS9-SPOll foi confirmada por Southern blot.[00240] The SpCas9*-Spo11 (dCAS9-SPOll) expression cassette was integrated into the chromosomal TRPl locus (chromosome IV). the UAS D/E-GAL2 guide RNA (sgRNA) (SEQ ID NO: 12) was expressed by the multicopy replication (non-integrative) plasmid as described in Figure 2A. The fusion gene carrying the dCAS9-SPOll construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. The integration of the cassette carrying the dCAS9-SPOll construct was confirmed by Southern blot.
[00241] As seguintes cepas foram usadas:[00241] The following strains were used:
[00242] - SPO11/SPO11 (ORD7304),[00242] - SPO11/SPO11 (ORD7304),
[00243] - spoll/spoll GAL4/GAL4 dCAS9—SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2527),[00243] - spoll/spoll GAL4/GAL4 dCAS9—SPO11/0 which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2527),
[00244] - spoll/spoll gal4/gal4 dCAS9-SPO11/0 que expressa o manuseio de RNA-guia (ANT2536) (ambos os alelos do gene GAL4 são mutados e, dessa forma, inativos),[00244] - spoll/spoll gal4/gal4 dCAS9-SPO11/0 expressing guide RNA handling (ANT2536) (both alleles of the GAL4 gene are mutated and thus inactive),
[00245] - spoll/spoll GAL4/GAL4 dCAS9—SPOll/0 que expressa o RNA-guia UAS D/E-GAL2 (ANT2530), e[00245] - spoll/spoll GAL4/GAL4 dCAS9—SPOll/0 that expresses the UAS guide RNA D/E-GAL2 (ANT2530), and
[00246] - spoll/spoll gal4/gal4 dCAS9-SPOll/0 que expressa o RNA-guia UAS D/E-GAL2 (ANT2533).[00246] - spoll/spoll gal4/gal4 dCAS9-SPOll/0 that expresses the UAS guide RNA D/E-GAL2 (ANT2533).
[00247] As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pela enzima de restrição XbaI. O DNA foi sondado com a porção terminal do gene GAL2. As bandas foram quantificadas com o uso do software ImageJ.[00247] Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by the XbaI restriction enzyme. The DNA was probed with the terminal portion of the GAL2 gene. Bands were quantified using ImageJ software.
[00248] Os resultados apresentados na Figura 8 mostram que a expressão da construção dCAS9-SPO11 induz rupturas meióticas de filamento duplo de DNA (DSBs) no sítio UAS D/E do promotor de gene GAL2 endereçado pelo RNA-guia UAS D/E-GAL2.[00248] The results presented in Figure 8 show that expression of the dCAS9-SPO11 construct induces meiotic DNA double-strand breaks (DSBs) at the UAS D/E site of the GAL2 gene promoter addressed by the UAS D/E- guide RNA. GAL2.
[00249] O cassete de expressão SpCAS9*-SPO11 (dCas9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia (sgRNASWC3) SWC3 (SEQ ID NO: 13) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito acima (Figura 2A). O gene de fusão que porta a construção SpCAS9*-SPO11 foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção SpCAS9*-SPO11 foi confirmada por Southern blot.[00249] The SpCAS9*-SPO11 (dCas9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The guide RNA (sgRNASWC3) SWC3 (SEQ ID NO: 13) was expressed by the multicopy replication (non-integrative) plasmid as described above (Figure 2A). The fusion gene carrying the SpCAS9*-SPO11 construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. Integration of the cassette carrying the SpCAS9*-SPO11 construct was confirmed by Southern blot.
[00250] As seguintes cepas foram usadas:[00250] The following strains were used:
[00251] -SPO11/SPO11 (ORD7304),[00251] -SPO11/SPO11 (ORD7304),
[00252] -spo11/spo11 SpCAS9*-SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2527),[00252] -spo11/spo11 SpCAS9*-SPO11/0 which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2527),
[00253] -spo11/spo11 SpCAS9*-SPO11/0 que expressa o RNA-guia (sgRNASWC3) SWC3 (ANT2564).[00253] -spo11/spo11 SpCAS9*-SPO11/0 expressing the guide RNA (sgRNASWC3) SWC3 (ANT2564).
[00254] -As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pelas enzimas de restrição PacI e AvrII. O DNA foi sondado com um fragmento interno para o locus SPO7. As bandas foram quantificadas com o uso do software ImageJ.[00254] -Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by the restriction enzymes PacI and AvrII. The DNA was probed with an internal fragment for the SPO7 locus. Bands were quantified using ImageJ software.
[00255] -Os resultados apresentados na Figura 9 mostram que a expressão da construção SpCAS9*-Spo11 induz rupturas meióticas de filamento duplo de DNA (DSBs) nos sítios de clivagem naturais da proteína Spoil (região SIN8-SWC3) do cromossoma I (DSBs I, II e III simbolizadas por quadrados pretos na Figura 9) e no sítio de endereço (DSBs IV simbolizadas por um círculo) pelo RNA-guia SWC3 (sgRNASWC3) e localizado na região de codificação do gene SWC3.[00255] -The results presented in Figure 9 show that expression of the SpCAS9*-Spo11 construct induces meiotic DNA double-strand breaks (DSBs) at the natural cleavage sites of the Spoil protein (SIN8-SWC3 region) of chromosome I (DSBs I, II and III symbolized by black squares in Figure 9) and at the address site (DSBs IV symbolized by a circle) by the SWC3 guide RNA (sgRNASWC3) and located in the coding region of the SWC3 gene.
[00256] O cassete de expressão SpCAS9*-Spo11 (dCas9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia UAS-A (sgRNA UAS-A ) (SEQ ID NO: 14), o RNA-guia UAS-B (sgRNA UAS-B ) (SEQ ID NO: 15) e o RNA-guia UAS-D/E (sgRNA UAS- D/E) (SEQ ID NO: 12) foram expressados individualmente e em multiplex (Multi-gRNAs) pelo plasmídeo de replicação multicópias (não integrativo) como descrito acima (Figura 2A). O gene de fusão que porta a construção SpCAS9*-SPO11 foi expressado sob o controle do promotor constitutivo de ADH1. Os RNAs-guias foram expressados sob o controle do promotor RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção SpCAS9*-SPO11 foi confirmada por Southern blot.[00256] The SpCAS9*-Spo11 (dCas9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The UAS-A guide RNA (UAS-A sgRNA) (SEQ ID NO: 14), the UAS-B guide RNA (UAS-B sgRNA) (SEQ ID NO: 15) and the UAS-D/guide RNA E (UAS-D/E sgRNA) (SEQ ID NO: 12) were expressed individually and in multiplex (Multi-gRNAs) by the multicopy (non-integrative) replication plasmid as described above (Figure 2A). The fusion gene carrying the SpCAS9*-SPO11 construct was expressed under the control of the constitutive ADH1 promoter. Guide RNAs were expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. Integration of the cassette carrying the SpCAS9*-SPO11 construct was confirmed by Southern blot.
[00257] As seguintes cepas foram usadas:[00257] The following strains were used:
[00258] - spoll/spoll GAL4/GAL4 SpCAS9*-SPO11/0que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2527),[00258] - spoll/spoll GAL4/GAL4 SpCAS9*-SPO11/0which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2527),
[00259] - spoll/spoll GAL4/GAL4 SpCAS9*-SPO11/0 que expressa o RNA-guia UAS-A (sgRNA UAS-A ) (ANT2532),[00259] - spoll/spoll GAL4/GAL4 SpCAS9*-SPO11/0 that expresses the UAS-A guide RNA (UAS-A sgRNA) (ANT2532),
[00260] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 que expressa o RNA-guia UAS-A (sgRNA UAS-A ) (ANT2534),[00260] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 that expresses the UAS-A guide RNA (UAS-A sgRNA) (ANT2534),
[00261] - spoll/spoll GAL4/GAL4 SpCAS9*—SPOll/0 que expressa o RNA-guia UAS-D/E (sgRNAUAS-D/E) (ANT2530),[00261] - spoll/spoll GAL4/GAL4 SpCAS9*—SPOll/0 that expresses the UAS-D/E guide RNA (sgRNAUAS-D/E) (ANT2530),
[00262] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 que expressa o RNA-guia UAS-D/E (sgRNAUAS-D/E) (ANT2533),[00262] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 that expresses the UAS-D/E guide RNA (sgRNAUAS-D/E) (ANT2533),
[00263] - spoll/spoll GAL4/GAL4 SpCAS9*—SPOll/0 que expressa em multiplex o RNA-guia UAS-A (sgRNAUAS-A), o RNA-guia UAS-B (sgRNAUAS-B) e o RNA-guia UAS-D/E (sgRNAUAS-D/E) (Multi- gRNAs) (ANT2551),[00263] - spoll/spoll GAL4/GAL4 SpCAS9*—SPOll/0 that expresses in multiplex the UAS-A guide RNA (sgRNAUAS-A), the UAS-B guide RNA (sgRNAUAS-B) and the guide RNA UAS-D/E (sgRNAUAS-D/E) (Multi-gRNAs) (ANT2551),
[00264] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 que expressa em multiplex o RNA-guia UAS-A (sgRNAUAS-A), o RNA-guia UAS-B (sgRNA UAS-B ) e o RNA-guia UAS-D/E (sgRNA UAS—D/E ) (Multi- gRNAs) (ANT2552).[00264] - spoll/spoll gal4/gal4 SpCAS9*-SPOll/0 that expresses in multiplex the UAS-A guide RNA (sgRNAUAS-A), the UAS-B guide RNA (sgRNA UAS-B) and the RNA- UAS-D/E guide (UAS—D/E sgRNA) (Multi-gRNAs) (ANT2552).
[00265] As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pela enzima de restrição XbaI. O DNA foi sondado com a porção terminal do gene GAL2. As bandas foram quantificadas com o uso do software ImageJ.[00265] Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by the XbaI restriction enzyme. The DNA was probed with the terminal portion of the GAL2 gene. Bands were quantified using ImageJ software.
[00266] Os resultados apresentados na Figura 10 indicam que a expressão da construção SpCAS9*-Spo11 (dCas9- SPO11) induz rupturas meióticas de filamento duplo de DNA (DSBs) nos sítios de endereço no promotor de gene GAL2 no cromossoma XII pelo(s) RNA-guia(s). Em particular, a coexpressão de Sp Cas9*-Spo11 com os sgRNAs individuais sgRNA UAS- A e sgRNAUAS—D/E leva à geração de DSBs, respectivamente, nos sítios UAS-A e UAS—D/E. De maneira interessante, o endereçamento e Sp Cas9*-Spo11 pela coexpressão de sgRNA UAS-A , sgRNAUAS-B e sgRNAUAS—D/E leva à formação de DSBs multiplex nos vários sítios de endereço.[00266] The results presented in Figure 10 indicate that expression of the construct SpCAS9*-Spo11 (dCas9-SPO11) induces meiotic DNA double-strand breaks (DSBs) at the address sites in the GAL2 gene promoter on chromosome XII by the ) guide RNA(s). In particular, coexpression of Sp Cas9*-Spo11 with the individual sgRNAs sgRNA UAS- A and sgRNAUAS—D/E leads to the generation of DSBs, respectively, at the UAS-A and UAS—D/E sites. Interestingly, addressing Sp Cas9*-Spo11 by coexpression of sgRNA UAS-A , sgRNAUAS-B , and sgRNAUAS—D/E leads to the formation of multiplex DSBs at the various address sites.
[00267] A fim de detectar os cruzamentos induzidos pela expressão de CRISPR/SpCas9*-Spo11, os cassetes NatMX e HphMX (que conferem respectivamente resistência à nourseotricina e à higromicina) foram trans inseridos a montante e a jusante do gene GAL2 em células diploides (consulte a Figura 11A).[00267] In order to detect crossovers induced by the expression of CRISPR/SpCas9*-Spo11, the NatMX and HphMX cassettes (which respectively confer resistance to nourseothricin and hygromycin) were trans inserted upstream and downstream of the GAL2 gene in diploid cells (see Figure 11A).
[00268] O cassete de expressão SpCAS9*-Spo11 (dCAS9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia UAS—D/E (sgRNA UAS-D/E ) (SEQ ID NO: 12) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito acima (Figura 2A). A expressão multiplex do RNA-guia UAS-A (sgRNA UAS-A ) (SEQ ID NO: 14), do RNA-guia UAS-B (sgRNA UAS-B ) (SEQ ID NO: 15) e do RNA-guia UAS- D/E (sgRNA UAS—D/E ) (SEQ ID NO: 12) foi executada a partir do mesmo plasmídeo de expressão de RNA-guia descrito acima (Multi- gRNAs). O gene de fusão que porta a construção SpCAS9*-SPO11 foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção SpCAS9*-SPO11foi confirmada por Southern blot.[00268] The SpCAS9*-Spo11 (dCAS9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The UAS—D/E guide RNA (UAS-D/E sgRNA) (SEQ ID NO: 12) was expressed by the multicopy (non-integrative) replication plasmid as described above (Figure 2A). Multiplex expression of UAS-A guide RNA (UAS-A sgRNA) (SEQ ID NO: 14), UAS-B guide RNA (UAS-B sgRNA) (SEQ ID NO: 15) and UAS guide RNA - D/E (UAS—D/E sgRNA) (SEQ ID NO: 12) was performed from the same guide RNA expression plasmid described above (Multi-gRNAs). The fusion gene carrying the SpCAS9*-SPO11 construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. The integration of the cassette carrying the SpCAS9*-SPO11 construct was confirmed by Southern blot.
[00269] As seguintes cepas foram usadas:[00269] The following strains were used:
[00270] - SPO11/SPO11 pEMP46::NatMX/0 tGAL2::KanMX/0 (ANT2527),[00270] - SPO11/SPO11 pEMP46::NatMX/0 tGAL2::KanMX/0 (ANT2527),
[00271] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2539),[00271] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 which expresses the handling guide RNA, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2539),
[00272] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expressa o RNA-guia UAS-D/E (sgRNAUAS-D/E) (ANT2540),[00272] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 expressing the UAS-D/E guide RNA (sgRNAUAS-D/E) (ANT2540),
[00273] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 que expressa em multiplex o RNA-guia UAS-A (sgRNA UAS-A ), o RNA-guia UAS-B (sgRNA UAS-B ) e o RNA-guia UAS-D/E (sgRNA UAS—D/E) (Multi-gRNAs) (ANT2557).[00273] - spo11/spo11 pEMP46::NatMX/0 tGAL2::KanMX/0 SpCAS9*-SPO11/0 that expresses in multiplex the UAS-A guide RNA (UAS-A sgRNA), the UAS-B guide RNA (sgRNA UAS-B ) and the guide RNA UAS-D/E (sgRNA UAS—D/E) (Multi-gRNAs) (ANT2557).
[00274] Após a esporulação, os tétrades compostos de 4 esporos foram dissecados e os esporos genotipados após a germinação para segregação de nourseotricina e higromicina. O número de tétrades que mostram um ditipo parental (PD) foi comparado com aqueles que mostram um tetratipo (T) e um ditipo não parental (NPD). A distância genética em centiMorgans foi determinada de acordo com a fórmula cM = 100(T+6NPD)/2(PD+T+NPD). O aumento no número de tetratipos nas células que expressam SpCAS9*-SPO11 (cepas ANT2540 e ANT2557) foi testado estatisticamente com o teste de Fisher pelo cálculo do valor p em relação às células que coexpressam SpCAS9*-SPO11 e o manuseio de RNA-guia (cepa ANT2539).[00274] After sporulation, the tetrads composed of 4 spores were dissected and the spores genotyped after germination for segregation of nourseothricin and hygromycin. The number of tetrads showing a parental ditype (PD) was compared with those showing a tetratype (T) and a non-parental ditype (NPD). The genetic distance in centiMorgans was determined according to the formula cM = 100(T+6NPD)/2(PD+T+NPD). The increase in the number of tetratypes in cells expressing SpCAS9*-SPO11 (strains ANT2540 and ANT2557) was statistically tested with Fisher's test by calculating the p-value in relation to cells coexpressing SpCAS9*-SPO11 and handling guide RNA (strain ANT2539).
[00275] Os resultados apresentados na Figura 11B mostram que a expressão da construção SpCas9*-SPO11 (dCAS9- SPO11) estimula a recombinação meiótica na região de endereço GAL2.[00275] The results presented in Figure 11B show that expression of the SpCas9*-SPO11 (dCAS9-SPO11) construct stimulates meiotic recombination in the GAL2 address region.
[00276] O cassete de expressão SpCAS9*-Spo11 (dCAS9- SPO11) foi integrado no locus TRP1 cromossômico (cromossoma IV). O RNA-guia PUT4 (sgRNAPUT4) (SEQ ID NO: 16) foi expressado pelo plasmídeo de replicação multicópias (não integrativo) como descrito acima (Figura 2A). O gene de fusão que porta a construção SpCAS9*-SPOll foi expressado sob o controle do promotor constitutivo de ADH1. O RNA-guia foi expressado sob o controle do promotor de RPR1 constitutivo. As células de levedura foram transformadas pelo método de eletroporação convencional. A integração do cassete que porta a construção SpCAS9*-SPOll foi confirmada por Southern blot.[00276] The SpCAS9*-Spo11 (dCAS9-SPO11) expression cassette was integrated into the chromosomal TRP1 locus (chromosome IV). The PUT4 guide RNA (sgRNAPUT4) (SEQ ID NO: 16) was expressed by the multicopy replication (non-integrative) plasmid as described above (Figure 2A). The fusion gene carrying the SpCAS9*-SPOll construct was expressed under the control of the constitutive ADH1 promoter. The guide RNA was expressed under the control of the constitutive RPR1 promoter. Yeast cells were transformed by conventional electroporation method. The integration of the cassette carrying the SpCAS9*-SPOll construct was confirmed by Southern blot.
[00277] As seguintes cepas foram usadas:[00277] The following strains were used:
[00278] - SPO11/SPO11 (ORD7304),[00278] - SPO11/SPO11 (ORD7304),
[00279] - spoll/spoll SpCAS9*-SPO11/0 que expressa o manuseio de RNA-guia, isto é, um RNA-guia sem a região SDS que é específica para o endereço cromossômico (ANT2527),[00279] - spoll/spoll SpCAS9*-SPO11/0 which expresses guide RNA handling, that is, a guide RNA without the SDS region that is specific for the chromosomal address (ANT2527),
[00280] - spoll/spoll SpCAS9*-SPO11/0 que expressa o RNA-guia PUT4 (sgRNAPUT4) (ANT2547).[00280] - spoll/spoll SpCAS9*-SPO11/0 that expresses the PUT4 guide RNA (sgRNAPUT4) (ANT2547).
[00281] As células foram coletadas após a transferência para o meio de esporulação (1% de KAc) e foram tomadas nos tempos indicados (horas). As cepas são homozigóticas para deleção do gene SAE2 que inibe o reparo de rupturas de filamento duplo de DNA (DSBs). A acumulação de DSBs foi detectada por Southern blot após a digestão de DNA genômico pelas enzimas de restrição BamHI e XhoI. O DNA foi sondado com um fragmento interno para o locus CIN1. As bandas foram quantificadas com o uso do software ImageJ.[00281] Cells were collected after transfer to sporulation medium (1% KAc) and were taken at the indicated times (hours). The strains are homozygous for deletion of the SAE2 gene that inhibits the repair of DNA double-strand breaks (DSBs). The accumulation of DSBs was detected by Southern blot after digestion of genomic DNA by the restriction enzymes BamHI and XhoI. The DNA was probed with an internal fragment for the CIN1 locus. Bands were quantified using ImageJ software.
[00282] Os resultados apresentados na Figura 12 mostram que a expressão da construção SpCAS9*-SPO11 (dCas9- SPO11) induz rupturas meióticas de filamento duplo de DNA (DSBs) nos sítios de clivagem naturais da proteína Spo11 (região PYK2 - PUT4) do cromossoma XV (DSBs I, II, III e V simbolizadas por quadrados pretos na Figura 11) e no sítio de endereço (DSBs IV simbolizadas por um triângulo preto) pelo RNA-guia PUT4 (sgRNAPUT4) e localizado na região de codificação do gene PUT4.[00282] The results presented in Figure 12 show that expression of the construct SpCAS9*-SPO11 (dCas9-SPO11) induces meiotic DNA double-strand breaks (DSBs) at the natural cleavage sites of the Spo11 protein (PYK2 - PUT4 region) of the chromosome .
[00283] Os resultados apresentados nas Figuras 5 a 12 mostram que:[00283] The results presented in Figures 5 to 12 show that:
[00284] - a expressão da proteína de fusão SpCas9*- Spoil (dCAS9-SPO11) complementa a inviabilidade de esporos derivados de esporulação de cepas inativadas pelo gene SPO11,[00284] - expression of the SpCas9*- Spoil fusion protein (dCAS9-SPO11) complements the inviability of spores derived from sporulation of strains inactivated by the SPO11 gene,
[00285] - a expressão da proteína de fusão SpCas9*- Spoil (dCAS9-SPO11) induz a formação de rupturas meióticas de filamento duplo em sítios de DSB naturais,[00285] - expression of the SpCas9*- Spoil fusion protein (dCAS9-SPO11) induces the formation of double-stranded meiotic breaks at natural DSB sites,
[00286] - a coexpressão da proteína de fusão SpCas9*- Spoil (dCAS9-SPO11) e de um gRNA induz a formação de rupturas meióticas de filamento duplo em sítios de DSB naturais e no sítio de endereço,[00286] - co-expression of the SpCas9*- Spoil fusion protein (dCAS9-SPO11) and a gRNA induces the formation of double-stranded meiotic breaks at natural DSB sites and at the address site,
[00287] - a coexpressão da proteína de fusão SpCas9*- Spoil (dCAS9-SPO11) e de gRNA multiplexado induz a formação de rupturas meióticas de filamento duplo (DSBs) nos vários sítios de endereço, e[00287] - co-expression of the SpCas9*- Spoil fusion protein (dCAS9-SPO11) and multiplexed gRNA induces the formation of meiotic double-strand breaks (DSBs) at the various address sites, and
[00288] - o endereçamento é eficaz nas cepas que têm a SPO11 do tipo selvagem e o antecedente de gene mutado SPO11tic.[00288] - addressing is effective in strains that have wild-type SPO11 and the SPO11tic mutated gene background.
[00289] O Cas9 é uma proteína de origem procariótica, os códons usados são otimizados para a espécie de planta na qual a proteína deve ser expressada. Os códons da proteína Cas9 de Streptococcus pyogenes são, dessa forma, otimizados para sua expressão em arroz (consulte Miao et al., Cell Research, 2013, páginas 1-4). Adicionalmente, a proteína Cas9 é inativada por mutação de dois sítios catalíticos, RuvC e HNH (Asp"^Ala"e His 4^Ala 4). A forma cataliticamente inativa de SpCas9 é chamada de SpCas9* ou dCas9.[00289] Cas9 is a protein of prokaryotic origin, the codons used are optimized for the plant species in which the protein must be expressed. The codons of the Streptococcus pyogenes Cas9 protein are thus optimized for its expression in rice (see Miao et al., Cell Research, 2013, pages 1-4). Additionally, the Cas9 protein is inactivated by mutation of two catalytic sites, RuvC and HNH (Asp"^Ala" and His 4^Ala 4). The catalytically inactive form of SpCas9 is called SpCas9* or dCas9.
[00290] Primeiramente, o códon de parada dCas9 é removido e um ligante é adicionado em fase na extremidade de terminal C de dCas9. O ligante pode ser uma sequência já conhecida na literatura para uso na espécie de planta em questão ou uma sequência otimizada. O ligante CCGGAATTTATGGCCATGGAGGCCCCGGGGATCCGT (SEQ ID NO: 17) usado em levedura é também compatível com o uso em arroz.[00290] First, the dCas9 stop codon is removed and a linker is added in phase at the C-terminal end of dCas9. The ligand may be a sequence already known in the literature for use in the plant species in question or an optimized sequence. The ligand CCGGAATTTATGGCCATGGAGGCCCCGGGGATCCGT (SEQ ID NO: 17) used in yeast is also compatible with use in rice.
[00291] Um sinal de localização nuclear (NLS) é também adicionado na extremidade de terminal N de dCas9. Opcionalmente, um ligante pode ser adicionado entre o NLS e dCas9, como, por exemplo, a sequência GGTATTCATGGAGTTCCTGCTGCG (SEQ ID NO: 18).[00291] A nuclear localization signal (NLS) is also added at the N-terminal end of dCas9. Optionally, a linker can be added between the NLS and dCas9, such as, for example, the sequence GGTATTCATGGAGTTCCTGCTGCG (SEQ ID NO: 18).
[00292] A sequência de SPO11 é, então, adicionada em fase na extremidade de terminal C da construção de NLS-dCas9- Ligante. É possível usar uma sequência de DNA complementar (cDNA), de DNA genômico (gDNA) ou uma sequência de DNA complementar com adição de vários íntrons. É possível usar SPO11-1 e/ou SPO11-2 de arroz.[00292] The SPO11 sequence is then added in-phase at the C-terminal end of the NLS-dCas9-Linker construct. You can use a complementary DNA sequence (cDNA), genomic DNA (gDNA), or a complementary DNA sequence with the addition of several introns. It is possible to use SPO11-1 and/or SPO11-2 from rice.
[00293] O terminador de nopalina sintase (tNOS), adaptado para o arroz, é adicionado em fase à construção NLS- dCas9-Ligante-SPO11.[00293] The nopaline synthase (tNOS) terminator, adapted for rice, is added in phase to the NLS-dCas9-Ligante-SPO11 construct.
[00294] O promotor de ubiquitina de maís pZmUbi1 (Christensen AH et al., 1992, Plant Mol Biol, 18(4), páginas 675-689 ou Christensen AH e Quail PH, 1995, Transgenic Res, 5(3), páginas 213-218), é um promotor que permite a expressão ubíqua e forte em arroz.[00294] The maize ubiquitin promoter pZmUbi1 (Christensen AH et al., 1992, Plant Mol Biol, 18(4), pages 675-689 or Christensen AH and Quail PH, 1995, Transgenic Res, 5(3), pages 213-218), is a promoter that allows for ubiquitous and strong expression in rice.
[00295] Para transformação estável de células de arroz, a transfecção é executada com um vetor binário, por exemplo, o vetor binário pCAMBIA5300 que porta um gene de resistência à higromicina interrompido por um íntron do gene catalase. Esse gene de resistência torna possível selecionar de modo eficaz, em um meio seletivo, os indivíduos que integraram dCas9-SPO11 em seu genoma. Esse vetor também contém um gene de resistência à canamicina, que facilita a clonagem e a manipulação em hospedeiros bacterianos.[00295] For stable transformation of rice cells, transfection is performed with a binary vector, for example, the pCAMBIA5300 binary vector that carries a hygromycin resistance gene interrupted by an intron of the catalase gene. This resistance gene makes it possible to effectively select, in a selective environment, individuals who have integrated dCas9-SPO11 into their genome. This vector also contains a kanamycin resistance gene, which facilitates cloning and manipulation in bacterial hosts.
[00296] A respeito da região de “manuseio” do RNA- guia (gRNA), a sequência “nativa” da bactéria S. pyogenes é usada. A região SDS que determina a especificidade do gRNA é selecionada como uma função da zona de interesse a ser endereçada com o uso de software livremente disponível na Internet (por exemplo, CRISPR PLANT).[00296] Regarding the “handling” region of the guide RNA (gRNA), the “native” sequence of the bacteria S. pyogenes is used. The SDS region that determines gRNA specificity is selected as a function of the zone of interest to be addressed using software freely available on the Internet (e.g., CRISPR PLANT).
[00297] O RNA-guia é colocado sob o controle do promotor U3 de polimerase III de arroz (consulte Miao et al. Cell Research, 2013, páginas 1-4). Alternativamente, o mesmo é colocado sob o controle do promotor U6.[00297] The guide RNA is placed under the control of the rice polymerase III U3 promoter (see Miao et al. Cell Research, 2013, pages 1-4). Alternatively, it is placed under the control of the U6 promoter.
[00298] - Vetor binário único[00298] - Single binary vector
[00299] A construção que compreende o RNA-guia colocado sob o controle do promotor U3 é integrado no vetor que compreende dCAS9-SPO11.[00299] The construct comprising the guide RNA placed under the control of the U3 promoter is integrated into the vector comprising dCAS9-SPO11.
[00300] - Vetores binários separados[00300] - Separate binary vectors
[00301] A fim de endereçar várias regiões, os RNAs- guias são transportados por um vetor separado, um vetor binário que porta uma resistência à geneticina (pCAMBIA2300), que torna possível aplicar uma seleção dupla para a presença do T-DNA de dCas9-SPO11 e do T-DNA de gRNA.[00301] In order to address multiple regions, the guide RNAs are carried by a separate vector, a binary vector carrying geneticin resistance (pCAMBIA2300), which makes it possible to apply a double selection for the presence of the dCas9 T-DNA -SPO11 and gRNA T-DNA.
[00302] Várias estratégias de transformação são possíveis:[00302] Several transformation strategies are possible:
[00303] Cotransformação: Começando com dois vetores binários, um que porta dCas9-SPO11 e o outro o gRNA(gRNAs). Os mesmos são introduzidos na mesma cepa bacteriana ou em duas cepas bacterianas diferentes que são, então, misturadas antes da cocultura com as células de planta.[00303] Cotransformation: Starting with two binary vectors, one that carries dCas9-SPO11 and the other the gRNA (gRNAs). They are introduced into the same bacterial strain or into two different bacterial strains which are then mixed before co-culture with the plant cells.
[00304] Transformações sequenciais: Os transformantes estáveis que portam o construto dCas9-SPO11 são produzidos e suas sementes usadas para produzir calos que são, então, usados para transformação com o construto de gRNA por Agrobacterium ou por bombardeio.[00304] Sequential transformations: Stable transformants carrying the dCas9-SPO11 construct are produced and their seeds used to produce calli which are then used for transformation with the gRNA construct by Agrobacterium or by bombardment.
[00305] Transformações independentes: As plantas que portam dCAS9-SPO11 sem um guia e as plantas que portam gRNAs sozinho são geradas. Os transformantes estáveis são, então, cruzados com a finalidade de produzir múltiplas combinações.[00305] Independent transformations: Plants carrying dCAS9-SPO11 without a guide and plants carrying gRNAs alone are generated. The stable transformants are then crossed in order to produce multiple combinations.
[00306] A transformação de arroz é executada a partir de calos de embriões de semente madura de acordo com o protocolo detalhado em Sallaud C et al., 2003, Theor Appl Genet, 106(8), páginas 1396-1408.[00306] Rice transformation is performed from mature seed embryo callus according to the protocol detailed in Sallaud C et al., 2003, Theor Appl Genet, 106(8), pages 1396-1408.
[00307] Uso da tecnologia dCas9-SPO11 para induzir uma recombinação endereçado em SPO11 do tipo selvagem[00307] Use of dCas9-SPO11 technology to induce targeted recombination in wild-type SPO11
[00308] A proteína de fusão dCas9-Spo11 é produzida com a proteína nativa Spo11 (SPO11-1 ou SPO11-2), como gDNA ou cDNA.[00308] The dCas9-Spo11 fusion protein is produced with the native Spo11 protein (SPO11-1 or SPO11-2), as gDNA or cDNA.
[00309] - por transformação direta de calos derivados de sementes F1: os calos são induzidos a partir de embriões de semente F1 madura obtidos por castração e fertilização manual entre duas linhas parentais de interesse agronômico. Os calos são transformados simultaneamente com o T-DNA ou T-DNAs que porta dCas9-SPO11 e o gRNA(gRNAs) (cotransformação). Os transformantes sem gRNA ou com um gRNA que endereça uma outra região são usados como controles para testar a eficácia do sistema. A análise de recombinação é executada nas plantas F2.[00309] - by direct transformation of callus derived from F1 seeds: calli are induced from mature F1 seed embryos obtained by castration and manual fertilization between two parental lines of agronomic interest. Calli are transformed simultaneously with T-DNA or T-DNAs carrying dCas9-SPO11 and gRNA(gRNAs) (cotransformation). Transformants without gRNA or with a gRNA that addresses another region are used as controls to test the effectiveness of the system. Recombination analysis is performed on F2 plants.
[00310] - por transformação separada de calos de cada parente: uma linhagem é transformada estável e homozigoticamente com o construto dCas9-SPO11 e cruzada com a outra linhagem que porta o gRNA(gRNAs) com inserção heterozigótica. As plantas F1 que portam ambos os construtos ou apenas o construto dCas9-SPO11 são selecionadas. As recombinações no locus endereçado (loci) são quantificadas nas populações de F2 derivadas dos dois tipos de plantas.[00310] - by separate transformation of calli from each relative: one lineage is transformed stably and homozygously with the dCas9-SPO11 construct and crossed with the other lineage that carries the gRNA(gRNAs) with heterozygous insertion. F1 plants carrying both constructs or just the dCas9-SPO11 construct are selected. Recombinations at the addressed locus (loci) are quantified in F2 populations derived from the two plant types.
[00311] Uso da tecnologia dCAS9-SPO11 para induzir uma recombinação endereçada em spo11 mutante[00311] Use of dCAS9-SPO11 technology to induce targeted recombination in mutant spo11
[00312] Uma das linhagens parentais (sementes transportadas por um heterozigoto SPO11/spo11) é transformada com o construto dCas9-SPO11 e os homozigotos de plantas para o transgene e a mutação spo11 são obtidos em geração de T1. A segunda linhagem parental (sementes transportadas por um heterozigoto SPO11/spo11) é transformada com o construto que porta o gRNA(gRNAs). As plantas heterozigóticas para o construto de gRNA e a mutação spo11 são obtidas em geração de T1. Os dois tipos de plantas são cruzados: 4 genótipos de sementes de F1 são obtidos, todos portando o construto dCas9- SPO11, mas portando ou não o gRNA e produzindo ou não SPO11 endógena. A análise de recombinação é executada nas populações F2.[00312] One of the parental lines (seeds carried by a SPO11/spo11 heterozygote) is transformed with the dCas9-SPO11 construct and plant homozygotes for the transgene and the spo11 mutation are obtained in T1 generation. The second parental line (seeds carried by a SPO11/spo11 heterozygote) is transformed with the construct carrying the gRNA (gRNAs). Plants heterozygous for the gRNA construct and the spo11 mutation are obtained in T1 generation. The two types of plants are crossed: 4 genotypes of F1 seeds are obtained, all carrying the dCas9-SPO11 construct, but carrying or not the gRNA and producing or not endogenous SPO11. Recombination analysis is performed on the F2 populations.
Claims (5)
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR1550707 | 2015-01-29 | ||
| FR1555725 | 2015-06-22 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| BR122024004319A2 true BR122024004319A2 (en) | 2024-05-21 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20220162647A1 (en) | Method for inducing targeted meiotic recombinations | |
| AU2018320864B2 (en) | Organelle genome modification using polynucleotide guided endonuclease | |
| EP3080275B1 (en) | Method of selection of transformed diatoms using nuclease | |
| JP7011590B2 (en) | Protected DNA template and method of use for increased intracellular gene recombination and homologous recombination | |
| AU2003251286B2 (en) | Targeted chromosomal mutagenesis using zinc finger nucleases | |
| EP3625340A1 (en) | Genome editing system | |
| CN110799205A (en) | Inducible, tunable and multiplexed human gene regulation using CRISPR-Cpf1 | |
| KR20180002852A (en) | Guide RNA / Cas endonuclease system | |
| JP2016539653A (en) | Cas9 nuclease platform for genome manipulation of microalgae | |
| TW200815593A (en) | Zinc finger nuclease-mediated homologous recombination | |
| BR112012018249A2 (en) | target genomic change | |
| US20240263157A1 (en) | Use of a fusion protein for inducing genetic modifications by targeted meiotic recombination | |
| US20230174960A1 (en) | Use of a deficient fusion protein for nuclease activity so as to induce meiotic recombinations | |
| WO2021004456A1 (en) | Improved genome editing system and use thereof | |
| AU2023288913A1 (en) | Induction of meiotic recombination using a crispr system | |
| BR122024004319A2 (en) | FUSION PROTEIN COMPRISING A CAS9 PROTEIN AND A SPO11 PROTEIN, AND HOST CELL COMPRISING THE FUSION PROTEIN | |
| WO2025206382A1 (en) | Nucleic acid cleavage enzyme, nucleic acid, vector, nucleic acid modification kit, method for modifying nucleic acid, method for producing variant, method for expressing gene, eukaryotic cell, vector or dna fragment, kit, and method for producing genetically engineered eukaryotic cell | |
| FR3032203A1 (en) | METHOD FOR INDUCING TARGETED MEIOTIC RECOMBINATIONS | |
| Jia et al. | Characterization of Arabidopsis thaliana NHEJ mutants |