RU2816764C1 - Production of sialylated oligosaccharides in bacillus cells - Google Patents
Production of sialylated oligosaccharides in bacillus cells Download PDFInfo
- Publication number
- RU2816764C1 RU2816764C1 RU2022107329A RU2022107329A RU2816764C1 RU 2816764 C1 RU2816764 C1 RU 2816764C1 RU 2022107329 A RU2022107329 A RU 2022107329A RU 2022107329 A RU2022107329 A RU 2022107329A RU 2816764 C1 RU2816764 C1 RU 2816764C1
- Authority
- RU
- Russia
- Prior art keywords
- bacillus
- bacillus cell
- sialyltransferase
- genetically engineered
- cell
- Prior art date
Links
- 241000193830 Bacillus <bacterium> Species 0.000 title claims abstract description 285
- 229920001542 oligosaccharide Polymers 0.000 title claims abstract description 111
- 150000002482 oligosaccharides Chemical class 0.000 title claims abstract description 111
- 238000004519 manufacturing process Methods 0.000 title claims description 44
- 230000000694 effects Effects 0.000 claims abstract description 72
- 108090000141 Sialyltransferases Proteins 0.000 claims abstract description 69
- 102000003838 Sialyltransferases Human genes 0.000 claims abstract description 69
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 66
- 230000006696 biosynthetic metabolic pathway Effects 0.000 claims abstract description 38
- TXCIAUNLDRJGJZ-BILDWYJOSA-N CMP-N-acetyl-beta-neuraminic acid Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@]1(C(O)=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-BILDWYJOSA-N 0.000 claims abstract description 33
- 108010060845 lactose permease Proteins 0.000 claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000012217 deletion Methods 0.000 claims abstract description 16
- 230000037430 deletion Effects 0.000 claims abstract description 16
- 230000002779 inactivation Effects 0.000 claims abstract description 13
- 230000001771 impaired effect Effects 0.000 claims abstract description 3
- 108050006002 RNA polymerase sigma factor FliA Proteins 0.000 claims abstract 2
- 210000004027 cell Anatomy 0.000 claims description 290
- 235000014469 Bacillus subtilis Nutrition 0.000 claims description 72
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 claims description 68
- 241000588724 Escherichia coli Species 0.000 claims description 61
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 claims description 46
- 239000008101 lactose Substances 0.000 claims description 46
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 claims description 33
- DVGKRPYUFRZAQW-UHFFFAOYSA-N 3 prime Natural products CC(=O)NC1OC(CC(O)C1C(O)C(O)CO)(OC2C(O)C(CO)OC(OC3C(O)C(O)C(O)OC3CO)C2O)C(=O)O DVGKRPYUFRZAQW-UHFFFAOYSA-N 0.000 claims description 20
- 238000000855 fermentation Methods 0.000 claims description 19
- 230000004151 fermentation Effects 0.000 claims description 19
- CILYIEBUXJIHCO-UHFFFAOYSA-N 102778-91-6 Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC2C(C(O)C(O)OC2CO)O)OC(CO)C1O CILYIEBUXJIHCO-UHFFFAOYSA-N 0.000 claims description 16
- CILYIEBUXJIHCO-UITFWXMXSA-N N-acetyl-alpha-neuraminyl-(2->3)-beta-D-galactosyl-(1->4)-beta-D-glucose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O[C@H](CO)[C@@H]1O CILYIEBUXJIHCO-UITFWXMXSA-N 0.000 claims description 16
- OIZGSVFYNBZVIK-UHFFFAOYSA-N N-acetylneuraminosyl-D-lactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O OIZGSVFYNBZVIK-UHFFFAOYSA-N 0.000 claims description 16
- 244000063299 Bacillus subtilis Species 0.000 claims description 15
- 108010005774 beta-Galactosidase Proteins 0.000 claims description 13
- 241000894007 species Species 0.000 claims description 13
- TYALNJQZQRNQNQ-JLYOMPFMSA-N alpha-Neup5Ac-(2->6)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@H](O)[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@H](O)O[C@@H]2CO)O)O1 TYALNJQZQRNQNQ-JLYOMPFMSA-N 0.000 claims description 12
- TYALNJQZQRNQNQ-UHFFFAOYSA-N #alpha;2,6-sialyllactose Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OCC1C(O)C(O)C(O)C(OC2C(C(O)C(O)OC2CO)O)O1 TYALNJQZQRNQNQ-UHFFFAOYSA-N 0.000 claims description 10
- 101100325906 Bacillus subtilis (strain 168) ganA gene Proteins 0.000 claims description 9
- 230000037361 pathway Effects 0.000 claims description 9
- 230000002829 reductive effect Effects 0.000 claims description 8
- 108010064886 beta-D-galactoside alpha 2-6-sialyltransferase Proteins 0.000 claims description 7
- 101150021436 yesZ gene Proteins 0.000 claims description 7
- 101100325905 Bacillus licheniformis (strain ATCC 14580 / DSM 13 / JCM 2505 / CCUG 7422 / NBRC 12200 / NCIMB 9375 / NCTC 10341 / NRRL NRS-1264 / Gibson 46) lacA gene Proteins 0.000 claims description 5
- 101100447641 Cellvibrio japonicus (strain Ueda107) ganB gene Proteins 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 4
- 210000000130 stem cell Anatomy 0.000 claims description 2
- 102000005936 beta-Galactosidase Human genes 0.000 claims 2
- 238000000605 extraction Methods 0.000 claims 1
- 230000028070 sporulation Effects 0.000 abstract description 7
- 239000000126 substance Substances 0.000 abstract description 5
- 239000002773 nucleotide Substances 0.000 description 94
- 125000003729 nucleotide group Chemical group 0.000 description 92
- 230000014509 gene expression Effects 0.000 description 57
- SQVRNKJHWKZAKO-PFQGKNLYSA-N N-acetyl-beta-neuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-PFQGKNLYSA-N 0.000 description 42
- 102000039446 nucleic acids Human genes 0.000 description 35
- 108020004707 nucleic acids Proteins 0.000 description 35
- 150000007523 nucleic acids Chemical class 0.000 description 35
- 108020004705 Codon Proteins 0.000 description 34
- 230000015572 biosynthetic process Effects 0.000 description 33
- 239000013612 plasmid Substances 0.000 description 31
- 102000004190 Enzymes Human genes 0.000 description 28
- 108090000790 Enzymes Proteins 0.000 description 28
- 229940088598 enzyme Drugs 0.000 description 28
- 108090000765 processed proteins & peptides Proteins 0.000 description 28
- BRGMHAYQAZFZDJ-PVFLNQBWSA-N N-Acetylglucosamine 6-phosphate Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-PVFLNQBWSA-N 0.000 description 27
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 26
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 26
- 230000003834 intracellular effect Effects 0.000 description 25
- 102000004196 processed proteins & peptides Human genes 0.000 description 25
- 108020004414 DNA Proteins 0.000 description 23
- 102000053602 DNA Human genes 0.000 description 23
- 229920001184 polypeptide Polymers 0.000 description 23
- 102000004169 proteins and genes Human genes 0.000 description 23
- 239000000758 substrate Substances 0.000 description 23
- 241000589875 Campylobacter jejuni Species 0.000 description 22
- 238000006243 chemical reaction Methods 0.000 description 22
- 108090000340 Transaminases Proteins 0.000 description 20
- 239000002609 medium Substances 0.000 description 20
- GSXOAOHZAIYLCY-UHFFFAOYSA-N D-F6P Natural products OCC(=O)C(O)C(O)C(O)COP(O)(O)=O GSXOAOHZAIYLCY-UHFFFAOYSA-N 0.000 description 19
- 108030002652 Glucosamine-1-phosphate N-acetyltransferases Proteins 0.000 description 19
- 108010035265 N-acetylneuraminate synthase Proteins 0.000 description 19
- 108700026244 Open Reading Frames Proteins 0.000 description 19
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 19
- 108010061048 UDPacetylglucosamine pyrophosphorylase Proteins 0.000 description 19
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 19
- 102100029954 Sialic acid synthase Human genes 0.000 description 18
- 102000003929 Transaminases Human genes 0.000 description 18
- BGWGXPAPYGQALX-ARQDHWQXSA-N beta-D-fructofuranose 6-phosphate Chemical compound OC[C@@]1(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BGWGXPAPYGQALX-ARQDHWQXSA-N 0.000 description 18
- 230000002255 enzymatic effect Effects 0.000 description 18
- 239000000203 mixture Substances 0.000 description 18
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 17
- 125000005629 sialic acid group Chemical group 0.000 description 17
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 16
- 150000001720 carbohydrates Chemical class 0.000 description 16
- 229950006780 n-acetylglucosamine Drugs 0.000 description 16
- 235000020256 human milk Nutrition 0.000 description 15
- 230000000813 microbial effect Effects 0.000 description 15
- 108010032867 phosphoglucosamine mutase Proteins 0.000 description 15
- 238000013518 transcription Methods 0.000 description 15
- 230000035897 transcription Effects 0.000 description 15
- 101710091363 UDP-N-acetylglucosamine 2-epimerase Proteins 0.000 description 14
- 210000000349 chromosome Anatomy 0.000 description 14
- 229930182830 galactose Natural products 0.000 description 14
- 238000012546 transfer Methods 0.000 description 14
- 108010043841 Glucosamine 6-Phosphate N-Acetyltransferase Proteins 0.000 description 13
- LFTYTUAZOPRMMI-CFRASDGPSA-N UDP-N-acetyl-alpha-D-glucosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-CFRASDGPSA-N 0.000 description 13
- LFTYTUAZOPRMMI-UHFFFAOYSA-N UNPD164450 Natural products O1C(CO)C(O)C(O)C(NC(=O)C)C1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-UHFFFAOYSA-N 0.000 description 13
- 238000013519 translation Methods 0.000 description 13
- 102000002740 Glucosamine 6-Phosphate N-Acetyltransferase Human genes 0.000 description 12
- 150000002772 monosaccharides Chemical group 0.000 description 12
- 102100026189 Beta-galactosidase Human genes 0.000 description 11
- 102000004879 Racemases and epimerases Human genes 0.000 description 11
- 108090001066 Racemases and epimerases Proteins 0.000 description 11
- 108091006161 SLC17A5 Proteins 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 238000004520 electroporation Methods 0.000 description 11
- 230000010354 integration Effects 0.000 description 11
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 10
- 230000001588 bifunctional effect Effects 0.000 description 10
- 239000001963 growth medium Substances 0.000 description 10
- 230000009466 transformation Effects 0.000 description 10
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 9
- 108090000364 Ligases Proteins 0.000 description 9
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 9
- XHMJOUIAFHJHBW-VFUOTHLCSA-N glucosamine 6-phosphate Chemical compound N[C@H]1[C@H](O)O[C@H](COP(O)(O)=O)[C@H](O)[C@@H]1O XHMJOUIAFHJHBW-VFUOTHLCSA-N 0.000 description 9
- 210000004251 human milk Anatomy 0.000 description 9
- 101150019075 neuA gene Proteins 0.000 description 9
- 238000003786 synthesis reaction Methods 0.000 description 9
- OIZGSVFYNBZVIK-FHHHURIISA-N 3'-sialyllactose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O OIZGSVFYNBZVIK-FHHHURIISA-N 0.000 description 8
- 229920001817 Agar Polymers 0.000 description 8
- 102000003960 Ligases Human genes 0.000 description 8
- 239000006137 Luria-Bertani broth Substances 0.000 description 8
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 8
- 239000002253 acid Substances 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 150000001413 amino acids Chemical group 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000001717 pathogenic effect Effects 0.000 description 8
- 101150074810 siaT gene Proteins 0.000 description 8
- 241000894006 Bacteria Species 0.000 description 7
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 7
- OVRNDRQMDRJTHS-OZRXBMAMSA-N N-acetyl-beta-D-mannosamine Chemical compound CC(=O)N[C@@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-OZRXBMAMSA-N 0.000 description 7
- 239000003242 anti bacterial agent Substances 0.000 description 7
- 150000002016 disaccharides Chemical class 0.000 description 7
- 101150037328 ganA gene Proteins 0.000 description 7
- -1 nucleotide-activated sialic acid Chemical class 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- 229940062827 2'-fucosyllactose Drugs 0.000 description 6
- HWHQUWQCBPAQQH-UHFFFAOYSA-N 2-O-alpha-L-Fucosyl-lactose Natural products OC1C(O)C(O)C(C)OC1OC1C(O)C(O)C(CO)OC1OC(C(O)CO)C(O)C(O)C=O HWHQUWQCBPAQQH-UHFFFAOYSA-N 0.000 description 6
- HWHQUWQCBPAQQH-BWRPKUOHSA-N 2-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O HWHQUWQCBPAQQH-BWRPKUOHSA-N 0.000 description 6
- 241000193744 Bacillus amyloliquefaciens Species 0.000 description 6
- 108700010070 Codon Usage Proteins 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- SNFSYLYCDAVZGP-UHFFFAOYSA-N UNPD26986 Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C(O)C1O SNFSYLYCDAVZGP-UHFFFAOYSA-N 0.000 description 6
- YMJBYRVFGYXULK-QZABAPFNSA-N alpha-D-glucosamine 1-phosphate Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O YMJBYRVFGYXULK-QZABAPFNSA-N 0.000 description 6
- 229940088710 antibiotic agent Drugs 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 239000008103 glucose Substances 0.000 description 6
- 238000009776 industrial production Methods 0.000 description 6
- 230000004060 metabolic process Effects 0.000 description 6
- DTBNBXWJWCWCIK-UHFFFAOYSA-K phosphonatoenolpyruvate Chemical compound [O-]C(=O)C(=C)OP([O-])([O-])=O DTBNBXWJWCWCIK-UHFFFAOYSA-K 0.000 description 6
- 238000003752 polymerase chain reaction Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 108010008005 sugar-phosphatase Proteins 0.000 description 6
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 5
- 101100162670 Bacillus subtilis (strain 168) amyE gene Proteins 0.000 description 5
- 101100245749 Campylobacter jejuni subsp. jejuni serotype O:23/36 (strain 81-176) pseF gene Proteins 0.000 description 5
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 5
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 5
- 229930195725 Mannitol Natural products 0.000 description 5
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 5
- BRGMHAYQAZFZDJ-ZTVVOAFPSA-N N-acetyl-D-mannosamine 6-phosphate Chemical compound CC(=O)N[C@@H]1C(O)O[C@H](COP(O)(O)=O)[C@@H](O)[C@@H]1O BRGMHAYQAZFZDJ-ZTVVOAFPSA-N 0.000 description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- QUOQJNYANJQSDA-MHQSSNGYSA-N Sialyllacto-N-tetraose a Chemical compound O1C([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)O[C@@H]1[C@@H](O)[C@H](OC2[C@H]([C@H](OC3[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@@H]1O QUOQJNYANJQSDA-MHQSSNGYSA-N 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 238000007792 addition Methods 0.000 description 5
- 229910052799 carbon Inorganic materials 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 101150001899 lacY gene Proteins 0.000 description 5
- IEQCXFNWPAHHQR-UHFFFAOYSA-N lacto-N-neotetraose Natural products OCC1OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC1OC(CO)C(O)C(O)C1O IEQCXFNWPAHHQR-UHFFFAOYSA-N 0.000 description 5
- 239000000594 mannitol Substances 0.000 description 5
- 235000010355 mannitol Nutrition 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 229930029653 phosphoenolpyruvate Natural products 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000003753 real-time PCR Methods 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 230000032258 transport Effects 0.000 description 5
- RPSBVJXBTXEJJG-RAMSCCQBSA-N 6-Sialyl-N-acetyllactosamine Chemical compound O[C@@H]1[C@@H](NC(=O)C)C(O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO[C@@]2(O[C@H]([C@H](NC(C)=O)[C@@H](O)C2)[C@H](O)[C@H](O)CO)C(O)=O)O1 RPSBVJXBTXEJJG-RAMSCCQBSA-N 0.000 description 4
- ULGZDMOVFRHVEP-RWJQBGPGSA-N Erythromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@@](C)(O)[C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 ULGZDMOVFRHVEP-RWJQBGPGSA-N 0.000 description 4
- 101100025757 Escherichia coli O6:H1 (strain CFT073 / ATCC 700928 / UPEC) nanT1 gene Proteins 0.000 description 4
- RJTOFDPWCJDYFZ-SPVZFZGWSA-N Lacto-N-triaose Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O RJTOFDPWCJDYFZ-SPVZFZGWSA-N 0.000 description 4
- 108091005804 Peptidases Proteins 0.000 description 4
- SFMRPVLZMVJKGZ-JRZQLMJNSA-N Sialyllacto-N-tetraose b Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]2O)O)O1 SFMRPVLZMVJKGZ-JRZQLMJNSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- AXQLFFDZXPOFPO-UHFFFAOYSA-N UNPD216 Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC(C1O)C(O)C(CO)OC1OC1C(O)C(O)C(O)OC1CO AXQLFFDZXPOFPO-UHFFFAOYSA-N 0.000 description 4
- ZSLZBFCDCINBPY-ZSJPKINUSA-N acetyl-CoA Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCSC(=O)C)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZSLZBFCDCINBPY-ZSJPKINUSA-N 0.000 description 4
- AXQLFFDZXPOFPO-UNTPKZLMSA-N beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O([C@@H]1O[C@H](CO)[C@H](O)[C@@H]([C@H]1O)O[C@H]1[C@@H]([C@H]([C@H](O)[C@@H](CO)O1)O[C@H]1[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O1)O)NC(=O)C)[C@H]1[C@H](O)[C@@H](O)[C@H](O)O[C@@H]1CO AXQLFFDZXPOFPO-UNTPKZLMSA-N 0.000 description 4
- MSWZFWKMSRAUBD-UHFFFAOYSA-N beta-D-galactosamine Natural products NC1C(O)OC(CO)C(O)C1O MSWZFWKMSRAUBD-UHFFFAOYSA-N 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 238000005119 centrifugation Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 235000021472 generally recognized as safe Nutrition 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- USIPEGYTBGEPJN-UHFFFAOYSA-N lacto-N-tetraose Natural products O1C(CO)C(O)C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(=O)C)C1OC1C(O)C(CO)OC(OC(C(O)CO)C(O)C(O)C=O)C1O USIPEGYTBGEPJN-UHFFFAOYSA-N 0.000 description 4
- 229940062780 lacto-n-neotetraose Drugs 0.000 description 4
- 101150048598 nanT gene Proteins 0.000 description 4
- RBMYDHMFFAVMMM-PLQWBNBWSA-N neolactotetraose Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@H]([C@H](O)CO)[C@H](O)[C@@H](O)C=O)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O RBMYDHMFFAVMMM-PLQWBNBWSA-N 0.000 description 4
- 230000007935 neutral effect Effects 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- SXMGGNXBTZBGLU-UHFFFAOYSA-N sialyllacto-n-tetraose c Chemical compound OCC1OC(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)C(NC(=O)C)C(O)C1OC(C(C(O)C1O)O)OC1COC1(C(O)=O)CC(O)C(NC(C)=O)C(C(O)C(O)CO)O1 SXMGGNXBTZBGLU-UHFFFAOYSA-N 0.000 description 4
- 150000004043 trisaccharides Chemical class 0.000 description 4
- 229960004799 tryptophan Drugs 0.000 description 4
- 108010062110 water dikinase pyruvate Proteins 0.000 description 4
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 3
- AUNPEJDACLEKSC-ZAYDSPBTSA-N 3-fucosyllactose Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O AUNPEJDACLEKSC-ZAYDSPBTSA-N 0.000 description 3
- WJPIUUDKRHCAEL-UHFFFAOYSA-N 3FL Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(O)C1O WJPIUUDKRHCAEL-UHFFFAOYSA-N 0.000 description 3
- 241000193738 Bacillus anthracis Species 0.000 description 3
- 241000194108 Bacillus licheniformis Species 0.000 description 3
- 101100449690 Bacillus licheniformis (strain ATCC 14580 / DSM 13 / JCM 2505 / CCUG 7422 / NBRC 12200 / NCIMB 9375 / NCTC 10341 / NRRL NRS-1264 / Gibson 46) blaSE gene Proteins 0.000 description 3
- 101100043757 Bacillus subtilis (strain 168) bpr gene Proteins 0.000 description 3
- 101100043755 Bacillus subtilis (strain 168) epr gene Proteins 0.000 description 3
- 101100238373 Bacillus subtilis (strain 168) mpr gene Proteins 0.000 description 3
- 101100460774 Bacillus subtilis (strain 168) nprB gene Proteins 0.000 description 3
- 101100049732 Bacillus subtilis (strain 168) wprA gene Proteins 0.000 description 3
- 108010078791 Carrier Proteins Proteins 0.000 description 3
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 3
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 3
- 101100381938 Dichelobacter nodosus bprV gene Proteins 0.000 description 3
- 101710089384 Extracellular protease Proteins 0.000 description 3
- 102000004894 Glutamine-fructose-6-phosphate transaminase (isomerizing) Human genes 0.000 description 3
- 108090001031 Glutamine-fructose-6-phosphate transaminase (isomerizing) Proteins 0.000 description 3
- 241000606768 Haemophilus influenzae Species 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- 101000588377 Homo sapiens N-acylneuraminate cytidylyltransferase Proteins 0.000 description 3
- FZLJPEPAYPUMMR-FMDGEEDCSA-N N-acetyl-alpha-D-glucosamine 1-phosphate Chemical compound CC(=O)N[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(O)=O FZLJPEPAYPUMMR-FMDGEEDCSA-N 0.000 description 3
- 108060005182 N-acylglucosamine 2-epimerase Proteins 0.000 description 3
- 102100031349 N-acylneuraminate cytidylyltransferase Human genes 0.000 description 3
- 241000588650 Neisseria meningitidis Species 0.000 description 3
- 241000606856 Pasteurella multocida Species 0.000 description 3
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 3
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 3
- 239000004365 Protease Substances 0.000 description 3
- 101710149136 Protein Vpr Proteins 0.000 description 3
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 241000192581 Synechocystis sp. Species 0.000 description 3
- 108090000992 Transferases Proteins 0.000 description 3
- 101150009206 aprE gene Proteins 0.000 description 3
- RCQTVEFBFUNTGM-UHFFFAOYSA-N bacillibactin Natural products CC1OC(=O)C(NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(C)OC(=O)C(NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(C)OC(=O)C1NC(=O)CNC(=O)C1=CC=CC(O)=C1O RCQTVEFBFUNTGM-UHFFFAOYSA-N 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 229960002685 biotin Drugs 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 239000011616 biotin Substances 0.000 description 3
- 229940041514 candida albicans extract Drugs 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- RCQTVEFBFUNTGM-BDVHUIKKSA-N corynebactin Chemical compound N([C@@H]1C(=O)O[C@@H]([C@@H](C(=O)O[C@H](C)[C@H](NC(=O)CNC(=O)C=2C(=C(O)C=CC=2)O)C(=O)O[C@@H]1C)NC(=O)CNC(=O)C=1C(=C(O)C=CC=1)O)C)C(=O)CNC(=O)C1=CC=CC(O)=C1O RCQTVEFBFUNTGM-BDVHUIKKSA-N 0.000 description 3
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 3
- FCIROHDMPFOSFG-LAVSNGQLSA-N disialyllacto-N-tetraose Chemical compound O1[C@@H]([C@H](O)[C@H](O)CO)[C@H](NC(=O)C)[C@@H](O)C[C@@]1(C(O)=O)OC[C@@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@]3(O[C@H]([C@H](NC(C)=O)[C@@H](O)C3)[C@H](O)[C@H](O)CO)C(O)=O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@H]3[C@@H]([C@@H](O)C(O)O[C@@H]3CO)O)O[C@H](CO)[C@@H]2O)O)O1 FCIROHDMPFOSFG-LAVSNGQLSA-N 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 229960002442 glucosamine Drugs 0.000 description 3
- 101150100121 gna1 gene Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- JCQLYHFGKNRPGE-FCVZTGTOSA-N lactulose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 JCQLYHFGKNRPGE-FCVZTGTOSA-N 0.000 description 3
- 229960000511 lactulose Drugs 0.000 description 3
- PFCRQPBOOFTZGQ-UHFFFAOYSA-N lactulose keto form Natural products OCC(=O)C(O)C(C(O)CO)OC1OC(CO)C(O)C(O)C1O PFCRQPBOOFTZGQ-UHFFFAOYSA-N 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 235000013557 nattō Nutrition 0.000 description 3
- 101150098382 neuB gene Proteins 0.000 description 3
- 101150039807 neuC gene Proteins 0.000 description 3
- 101150112117 nprE gene Proteins 0.000 description 3
- 101150067185 ppsA gene Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000600 sorbitol Substances 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 150000004044 tetrasaccharides Chemical class 0.000 description 3
- 239000012138 yeast extract Substances 0.000 description 3
- 101150030737 yvmC gene Proteins 0.000 description 3
- BRGMHAYQAZFZDJ-UHFFFAOYSA-N (5-acetamido-3,4,6-trihydroxyoxan-2-yl)methyl dihydrogen phosphate Chemical compound CC(=O)NC1C(O)OC(COP(O)(O)=O)C(O)C1O BRGMHAYQAZFZDJ-UHFFFAOYSA-N 0.000 description 2
- KFEUJDWYNGMDBV-UHFFFAOYSA-N (N-Acetyl)-glucosamin-4-beta-galaktosid Natural products OC1C(NC(=O)C)C(O)OC(CO)C1OC1C(O)C(O)C(O)C(CO)O1 KFEUJDWYNGMDBV-UHFFFAOYSA-N 0.000 description 2
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 2
- MSWZFWKMSRAUBD-IVMDWMLBSA-N 2-amino-2-deoxy-D-glucopyranose Chemical compound N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O MSWZFWKMSRAUBD-IVMDWMLBSA-N 0.000 description 2
- ODDPRQJTYDIWJU-UHFFFAOYSA-N 3'-beta-D-galactopyranosyl-lactose Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(OC2C(OC(O)C(O)C2O)CO)OC(CO)C1O ODDPRQJTYDIWJU-UHFFFAOYSA-N 0.000 description 2
- ZPEFXARQZVAHGO-DCSYEGIMSA-N 3,3'-neotrehalosadiamine Chemical compound O[C@@H]1[C@@H](N)[C@H](O)[C@@H](CO)O[C@@H]1O[C@H]1[C@H](O)[C@@H](N)[C@H](O)[C@@H](CO)O1 ZPEFXARQZVAHGO-DCSYEGIMSA-N 0.000 description 2
- VLKSXJAPRDAENT-OWGHDAAGSA-N 3-[(3r,6r,9s,16s,19r,22s,25s)-3,9-bis(2-amino-2-oxoethyl)-16-[(1r)-1-hydroxyethyl]-19-(hydroxymethyl)-6-[(4-hydroxyphenyl)methyl]-13-octyl-2,5,8,11,15,18,21,24-octaoxo-1,4,7,10,14,17,20,23-octazabicyclo[23.3.0]octacosan-22-yl]propanoic acid Chemical compound C([C@H]1NC(=O)[C@H](CC(N)=O)NC(=O)CC(NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]2CCCN2C(=O)[C@@H](CC(N)=O)NC1=O)CCCCCCCC)C1=CC=C(O)C=C1 VLKSXJAPRDAENT-OWGHDAAGSA-N 0.000 description 2
- RCIPRGNHNAEGHR-ZLHAWHIKSA-N 3-[(3s,6s,13s,16r,19r,22r,25r,28s)-6,13,19,22-tetrakis(2-amino-2-oxoethyl)-16-(hydroxymethyl)-25-[(4-hydroxyphenyl)methyl]-10-(11-methyltridecyl)-2,5,8,12,15,18,21,24,27-nonaoxo-1,4,7,11,14,17,20,23,26-nonazabicyclo[26.3.0]hentriacontan-3-yl]propanamide Chemical compound C([C@H]1NC(=O)[C@@H]2CCCN2C(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CC(NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](CO)NC(=O)[C@@H](CC(N)=O)NC(=O)[C@@H](CC(N)=O)NC1=O)CCCCCCCCCCC(C)CC)C1=CC=C(O)C=C1 RCIPRGNHNAEGHR-ZLHAWHIKSA-N 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- TXXYYOUBDOAQDT-UHFFFAOYSA-N 4-nitro-1-(phenylmethoxymethyl)imidazole Chemical compound C1=NC([N+](=O)[O-])=CN1COCC1=CC=CC=C1 TXXYYOUBDOAQDT-UHFFFAOYSA-N 0.000 description 2
- 108700016166 Bacillus subtilis sboA Proteins 0.000 description 2
- XFOUAXMJRHNTOP-UHFFFAOYSA-N Bacilysin Natural products CC(N)C(=O)NC(C(O)=O)CC1CCC(=O)C2OC12 XFOUAXMJRHNTOP-UHFFFAOYSA-N 0.000 description 2
- 108010062877 Bacteriocins Proteins 0.000 description 2
- 241001135228 Bacteroides ovatus Species 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- AFWTZXXDGQBIKW-UHFFFAOYSA-N C14 surfactin Natural products CCCCCCCCCCCC1CC(=O)NC(CCC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)O1 AFWTZXXDGQBIKW-UHFFFAOYSA-N 0.000 description 2
- TXCIAUNLDRJGJZ-UHFFFAOYSA-N CMP-N-acetyl neuraminic acid Natural products O1C(C(O)C(O)CO)C(NC(=O)C)C(O)CC1(C(O)=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(N=C(N)C=C2)=O)O1 TXCIAUNLDRJGJZ-UHFFFAOYSA-N 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- SGGJJTTZBRPIKP-GGQKFFLHSA-N C\C=C1/NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(C)=O)[C@@H](C)OC1=O)C(C)C Chemical compound C\C=C1/NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](Cc2ccccc2)NC(=O)[C@@H](CC(C)C)NC(=O)[C@@H](Cc2ccccc2)NC(C)=O)[C@@H](C)OC1=O)C(C)C SGGJJTTZBRPIKP-GGQKFFLHSA-N 0.000 description 2
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 2
- ZUWUQYGHRURWCL-UHFFFAOYSA-N Difficidin Natural products CC1CC=CC=CC=CCCCC(OP(O)(O)=O)C(C)=CC=CCC(CCC(C)=CC=C)OC(=O)CC1=C ZUWUQYGHRURWCL-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101100186924 Escherichia coli neuC gene Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000606822 Haemophilus parahaemolyticus Species 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- TVVLIFCVJJSLBL-SEHWTJTBSA-N Lacto-N-fucopentaose V Chemical compound O[C@H]1C(O)C(O)[C@H](C)O[C@H]1OC([C@@H](O)C=O)[C@@H](C(O)CO)O[C@H]1[C@H](O)[C@@H](OC2[C@@H](C(OC3[C@@H](C(O)C(O)[C@@H](CO)O3)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](O)[C@@H](CO)O1 TVVLIFCVJJSLBL-SEHWTJTBSA-N 0.000 description 2
- 101100186921 Legionella pneumophila subsp. pneumophila (strain Philadelphia 1 / ATCC 33152 / DSM 7513) neuB gene Proteins 0.000 description 2
- 108010045656 Mycobacillin Proteins 0.000 description 2
- KFEUJDWYNGMDBV-LODBTCKLSA-N N-acetyllactosamine Chemical compound O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KFEUJDWYNGMDBV-LODBTCKLSA-N 0.000 description 2
- HESSGHHCXGBPAJ-UHFFFAOYSA-N N-acetyllactosamine Natural products CC(=O)NC(C=O)C(O)C(C(O)CO)OC1OC(CO)C(O)C(O)C1O HESSGHHCXGBPAJ-UHFFFAOYSA-N 0.000 description 2
- 102000002307 N-acylglucosamine 2-epimerase Human genes 0.000 description 2
- 108091000080 Phosphotransferase Proteins 0.000 description 2
- 241000831652 Salinivibrio sharmensis Species 0.000 description 2
- 241000193985 Streptococcus agalactiae Species 0.000 description 2
- 108010056079 Subtilisins Proteins 0.000 description 2
- 102000005158 Subtilisins Human genes 0.000 description 2
- 108010066353 TL 119 Proteins 0.000 description 2
- 101100111413 Thermoanaerobacter pseudethanolicus (strain ATCC 33223 / 39E) lacZ gene Proteins 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- PGAVKCOVUIYSFO-XVFCMESISA-N UTP Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-XVFCMESISA-N 0.000 description 2
- ZUWUQYGHRURWCL-XUIVTPDHSA-N [(4e,6e,12z,14z,16e)-7,19-dimethyl-2-[(3e)-3-methylhexa-3,5-dienyl]-20-methylidene-22-oxo-1-oxacyclodocosa-4,6,12,14,16-pentaen-8-yl] dihydrogen phosphate Chemical compound CC1C\C=C\C=C/C=C\CCCC(OP(O)(O)=O)\C(C)=C\C=C\CC(CC\C(C)=C\C=C)OC(=O)CC1=C ZUWUQYGHRURWCL-XUIVTPDHSA-N 0.000 description 2
- 229940100228 acetyl coenzyme a Drugs 0.000 description 2
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- FZIVHOUANIQOMU-YIHIYSSUSA-N alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)O[C@H](CO)[C@H]2O)NC(C)=O)O[C@H](CO)[C@H](O)[C@@H]1O FZIVHOUANIQOMU-YIHIYSSUSA-N 0.000 description 2
- CMQZRJBJDCVIEY-JEOLMMCMSA-N alpha-L-Fucp-(1->3)-[beta-D-Galp-(1->4)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](CO)O[C@@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)[C@@H]1NC(C)=O CMQZRJBJDCVIEY-JEOLMMCMSA-N 0.000 description 2
- DUKURNFHYQXCJG-JEOLMMCMSA-N alpha-L-Fucp-(1->4)-[beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)[C@@H](NC(C)=O)[C@H](O[C@@H]2[C@H]([C@H](O[C@@H]3[C@H](OC(O)[C@H](O)[C@H]3O)CO)O[C@H](CO)[C@@H]2O)O)O[C@@H]1CO DUKURNFHYQXCJG-JEOLMMCMSA-N 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 230000003698 anagen phase Effects 0.000 description 2
- 108010026917 bacillibactin Proteins 0.000 description 2
- 108700023668 bacilysin Proteins 0.000 description 2
- XFOUAXMJRHNTOP-PFQXTLEHSA-N bacilysin Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)C[C@@H]1CCC(=O)[C@@H]2O[C@H]12 XFOUAXMJRHNTOP-PFQXTLEHSA-N 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- ODDPRQJTYDIWJU-OAUIKNEUSA-N beta-D-Galp-(1->3)-beta-D-Galp-(1->4)-beta-D-Glcp Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@H](O[C@@H](O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O ODDPRQJTYDIWJU-OAUIKNEUSA-N 0.000 description 2
- 230000002210 biocatalytic effect Effects 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- RKLXDNHNLPUQRB-TVJUEJKUSA-N chembl564271 Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]2C(C)SC[C@H](N[C@@H](CC(N)=O)C(=O)NC(=O)[C@@H](NC2=O)CSC1C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NC(=C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H]1NC(=O)C(=C\C)/NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H]2NC(=O)CNC(=O)[C@@H]3CCCN3C(=O)[C@@H](NC(=O)[C@H]3N[C@@H](CC(C)C)C(=O)NC(=O)C(=C)NC(=O)CC[C@H](NC(=O)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC=4C5=CC=CC=C5NC=4)CSC3)C(O)=O)C(C)SC2)C(C)C)C(C)SC1)C1=CC=CC=C1 RKLXDNHNLPUQRB-TVJUEJKUSA-N 0.000 description 2
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 229960003276 erythromycin Drugs 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- CUOJDWBMJMRDHN-VIHUIGFUSA-N fengycin Chemical compound C([C@@H]1C(=O)N[C@H](C(=O)OC2=CC=C(C=C2)C[C@@H](C(N[C@@H](C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCC(N)=O)C(=O)N1)[C@@H](C)O)=O)NC(=O)[C@@H](CCCN)NC(=O)[C@H](CCC(O)=O)NC(=O)C[C@H](O)CCCCCCCCCCCCC)[C@@H](C)CC)C1=CC=C(O)C=C1 CUOJDWBMJMRDHN-VIHUIGFUSA-N 0.000 description 2
- 108010002015 fengycin Proteins 0.000 description 2
- 235000013350 formula milk Nutrition 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 101150073660 glmM gene Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229940047650 haemophilus influenzae Drugs 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 101150086432 lacA gene Proteins 0.000 description 2
- 229930191176 lacto-N-biose Natural products 0.000 description 2
- FZIVHOUANIQOMU-UHFFFAOYSA-N lacto-N-fucopentaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)OC(CO)C2O)NC(C)=O)OC(CO)C(O)C1O FZIVHOUANIQOMU-UHFFFAOYSA-N 0.000 description 2
- FKADDOYBRRMBPP-UHFFFAOYSA-N lacto-N-fucopentaose II Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(NC(C)=O)C(OC2C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C2O)O)OC1CO FKADDOYBRRMBPP-UHFFFAOYSA-N 0.000 description 2
- CMQZRJBJDCVIEY-UHFFFAOYSA-N lacto-N-fucopentaose III Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(O)C(O)C(CO)O2)O)C(CO)OC(OC2C(C(OC3C(OC(O)C(O)C3O)CO)OC(CO)C2O)O)C1NC(C)=O CMQZRJBJDCVIEY-UHFFFAOYSA-N 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- NTIBMIIYTKPBNR-UHFFFAOYSA-N methoxymethyl 2-hydroxybenzoate Chemical compound COCOC(=O)C1=CC=CC=C1O NTIBMIIYTKPBNR-UHFFFAOYSA-N 0.000 description 2
- 238000013048 microbiological method Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- MGMBOQJARKXIAL-LCLLRQAKSA-N mycobacillin Chemical compound C([C@H]1C(=O)N[C@@H](CO)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](C(N[C@H](CCC(=O)N[C@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@H](CC(O)=O)C(=O)N2CCC[C@H]2C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CCC(=O)N[C@@H](CC=2C=CC(O)=CC=2)C(=O)N[C@@H](CC(O)=O)C(=O)N1)C(O)=O)C(O)=O)=O)CC(C)C)C1=CC=C(O)C=C1 MGMBOQJARKXIAL-LCLLRQAKSA-N 0.000 description 2
- 108700030603 mycosubtiline Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 229940051027 pasteurella multocida Drugs 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 102000020233 phosphotransferase Human genes 0.000 description 2
- CUOJDWBMJMRDHN-UHFFFAOYSA-N plipastatin Chemical compound N1C(=O)C(CCC(N)=O)NC(=O)C2CCCN2C(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)O)NC(=O)C(NC(=O)C(CCCN)NC(=O)C(CCC(O)=O)NC(=O)CC(O)CCCCCCCCCCCCC)CC(C=C2)=CC=C2OC(=O)C(C(C)CC)NC(=O)C1CC1=CC=C(O)C=C1 CUOJDWBMJMRDHN-UHFFFAOYSA-N 0.000 description 2
- 108010069329 plipastatin Proteins 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 229930188204 rhizocticin Natural products 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 108010045452 sublancin 168 Proteins 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 108010082567 subtilin Proteins 0.000 description 2
- NRQODXJXWWUXFE-LYQFAKRDSA-N subtilosin a Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]([C@@H](C)CC)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]1N(C(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CO)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CNC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC=2C3=CC=CC=C3NC=2)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)CN)[C@@H](C)O)[C@@H](C)CC)C(C)C)CCC1 NRQODXJXWWUXFE-LYQFAKRDSA-N 0.000 description 2
- NJGWOFRZMQRKHT-UHFFFAOYSA-N surfactin Natural products CC(C)CCCCCCCCCC1CC(=O)NC(CCC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(CC(O)=O)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)O1 NJGWOFRZMQRKHT-UHFFFAOYSA-N 0.000 description 2
- NJGWOFRZMQRKHT-WGVNQGGSSA-N surfactin C Chemical compound CC(C)CCCCCCCCC[C@@H]1CC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)O1 NJGWOFRZMQRKHT-WGVNQGGSSA-N 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 239000012137 tryptone Substances 0.000 description 2
- HDTRYLNUVZCQOY-UHFFFAOYSA-N α-D-glucopyranosyl-α-D-glucopyranoside Natural products OC1C(O)C(O)C(CO)OC1OC1C(O)C(O)C(O)C(CO)O1 HDTRYLNUVZCQOY-UHFFFAOYSA-N 0.000 description 1
- KIUKXJAPPMFGSW-DNGZLQJQSA-N (2S,3S,4S,5R,6R)-6-[(2S,3R,4R,5S,6R)-3-Acetamido-2-[(2S,3S,4R,5R,6R)-6-[(2R,3R,4R,5S,6R)-3-acetamido-2,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-2-carboxy-4,5-dihydroxyoxan-3-yl]oxy-5-hydroxy-6-(hydroxymethyl)oxan-4-yl]oxy-3,4,5-trihydroxyoxane-2-carboxylic acid Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](O[C@H]3[C@@H]([C@@H](O)[C@H](O)[C@H](O3)C(O)=O)O)[C@H](O)[C@@H](CO)O2)NC(C)=O)[C@@H](C(O)=O)O1 KIUKXJAPPMFGSW-DNGZLQJQSA-N 0.000 description 1
- LJJBSCMJXPZTOP-VBBGBFMKSA-N (2s)-2,5-diamino-5-oxopentanoic acid;[(2r,3r,4s)-2,3,4,6-tetrahydroxy-5-oxohexyl] dihydrogen phosphate Chemical compound OC(=O)[C@@H](N)CCC(N)=O.OCC(=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O LJJBSCMJXPZTOP-VBBGBFMKSA-N 0.000 description 1
- BOMLFNUKROBVFG-HDKZTWHISA-N (3R,4R,5S,6R)-3-(hexadecylamino)-6-(hydroxymethyl)oxane-2,4,5-triol Chemical compound CCCCCCCCCCCCCCCCN[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O BOMLFNUKROBVFG-HDKZTWHISA-N 0.000 description 1
- HORYNJCIACQHGZ-BHVWUGLYSA-N 1-[(3R,4R,5S,6R)-3-amino-2,4-dihydroxy-6-(hydroxymethyl)-5-[(2S,3R,4S,5R,6R)-3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxyoxan-2-yl]ethanone Chemical compound C(C)(=O)C1(O)[C@H](N)[C@@H](O)[C@H](O[C@H]2[C@H](O)[C@@H](O)[C@@H](O)[C@H](O2)CO)[C@H](O1)CO HORYNJCIACQHGZ-BHVWUGLYSA-N 0.000 description 1
- 241000007909 Acaryochloris Species 0.000 description 1
- 241001468163 Acetobacterium woodii Species 0.000 description 1
- 101710184263 Alkaline serine protease Proteins 0.000 description 1
- 108030003358 Alpha-N-acetylneuraminyl-2,3-beta-galactosyl-1,3-N-acetylgalactosaminide 6-alpha-sialyltransferases Proteins 0.000 description 1
- 239000004382 Amylase Substances 0.000 description 1
- 108010065511 Amylases Proteins 0.000 description 1
- 102000013142 Amylases Human genes 0.000 description 1
- 241000193375 Bacillus alcalophilus Species 0.000 description 1
- 108010016529 Bacillus amyloliquefaciens ribonuclease Proteins 0.000 description 1
- 241000006382 Bacillus halodurans Species 0.000 description 1
- 101100221537 Bacillus subtilis (strain 168) comK gene Proteins 0.000 description 1
- 101100007262 Bacillus subtilis (strain 168) comS gene Proteins 0.000 description 1
- 244000075779 Bacillus subtilis subsp natto Species 0.000 description 1
- 241000770536 Bacillus thermophilus Species 0.000 description 1
- 241000193388 Bacillus thuringiensis Species 0.000 description 1
- 241000962950 Bacteroides ovatus ATCC 8483 Species 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241000168061 Butyrivibrio proteoclasticus Species 0.000 description 1
- JSWKNDSDVHJUKY-MNVIWFPGSA-N CC[C@@H](C)[C@@H]1NC(=O)[C@@H]2CS[C@@H](C)[C@@H](NC(=O)[C@@H]3CS[C@@H](C)[C@@H](NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@@H]4NC(=O)[C@@H]([NH3+])CS[C@H]4C)C(=O)N[C@@H](CC(C)C)C(=O)N4CCC[C@H]4C(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N3)C(=O)N[C@@H](CC(C)C)C(=O)NC([C@H](C)S\C=C/NC1=O)C(=O)NC(=C)C(=O)N[C@@H](CCC([O-])=O)C(=O)N2 Chemical compound CC[C@@H](C)[C@@H]1NC(=O)[C@@H]2CS[C@@H](C)[C@@H](NC(=O)[C@@H]3CS[C@@H](C)[C@@H](NC(=O)[C@H](Cc4ccccc4)NC(=O)[C@@H]4NC(=O)[C@@H]([NH3+])CS[C@H]4C)C(=O)N[C@@H](CC(C)C)C(=O)N4CCC[C@H]4C(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](C(C)C)C(=O)N3)C(=O)N[C@@H](CC(C)C)C(=O)NC([C@H](C)S\C=C/NC1=O)C(=O)NC(=C)C(=O)N[C@@H](CCC([O-])=O)C(=O)N2 JSWKNDSDVHJUKY-MNVIWFPGSA-N 0.000 description 1
- 241000661436 Candidatus Scalindua Species 0.000 description 1
- 102100035882 Catalase Human genes 0.000 description 1
- 108010053835 Catalase Proteins 0.000 description 1
- 240000001817 Cereus hexagonus Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 229910021591 Copper(I) chloride Inorganic materials 0.000 description 1
- 101710120485 Cyclo(L-leucyl-L-leucyl) synthase Proteins 0.000 description 1
- 101710116120 Cyclo(L-tyrosyl-L-tyrosyl) synthase Proteins 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000003849 Cytochrome P450 Human genes 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 101710088194 Dehydrogenase Proteins 0.000 description 1
- 241001135747 Desulfobacula toluolica Species 0.000 description 1
- 241001407023 Desulfotignum phosphitoxidans Species 0.000 description 1
- 108010016626 Dipeptides Proteins 0.000 description 1
- 101150013191 E gene Proteins 0.000 description 1
- 241000617590 Escherichia coli K1 Species 0.000 description 1
- VTLYFUHAOXGGBS-UHFFFAOYSA-N Fe3+ Chemical compound [Fe+3] VTLYFUHAOXGGBS-UHFFFAOYSA-N 0.000 description 1
- 241000192125 Firmicutes Species 0.000 description 1
- 206010016952 Food poisoning Diseases 0.000 description 1
- 208000019331 Foodborne disease Diseases 0.000 description 1
- 229930091371 Fructose Natural products 0.000 description 1
- 239000005715 Fructose Substances 0.000 description 1
- RFSUNEUAIZKAJO-ARQDHWQXSA-N Fructose Chemical compound OC[C@H]1O[C@](O)(CO)[C@@H](O)[C@@H]1O RFSUNEUAIZKAJO-ARQDHWQXSA-N 0.000 description 1
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 1
- 102000006471 Fucosyltransferases Human genes 0.000 description 1
- 108010019236 Fucosyltransferases Proteins 0.000 description 1
- 241000605986 Fusobacterium nucleatum Species 0.000 description 1
- 101710185468 Glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 1
- 102100033429 Glutamine-fructose-6-phosphate aminotransferase [isomerizing] 1 Human genes 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 229930186217 Glycolipid Natural products 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241000006448 Halorhabdus tiamatea Species 0.000 description 1
- 241000590002 Helicobacter pylori Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- 101001010029 Lactobacillus helveticus Putative phosphotransferase enzyme IIA component Proteins 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- 241000202987 Methanobrevibacter Species 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- SQVRNKJHWKZAKO-LUWBGTNYSA-N N-acetylneuraminic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)CC(O)(C(O)=O)O[C@H]1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-LUWBGTNYSA-N 0.000 description 1
- 102100034977 N-acylglucosamine 2-epimerase Human genes 0.000 description 1
- SUHQNCLNRUAGOO-UHFFFAOYSA-N N-glycoloyl-neuraminic acid Natural products OCC(O)C(O)C(O)C(NC(=O)CO)C(O)CC(=O)C(O)=O SUHQNCLNRUAGOO-UHFFFAOYSA-N 0.000 description 1
- FDJKUWYYUZCUJX-UHFFFAOYSA-N N-glycolyl-beta-neuraminic acid Natural products OCC(O)C(O)C1OC(O)(C(O)=O)CC(O)C1NC(=O)CO FDJKUWYYUZCUJX-UHFFFAOYSA-N 0.000 description 1
- FDJKUWYYUZCUJX-KVNVFURPSA-N N-glycolylneuraminic acid Chemical compound OC[C@H](O)[C@H](O)[C@@H]1O[C@](O)(C(O)=O)C[C@H](O)[C@H]1NC(=O)CO FDJKUWYYUZCUJX-KVNVFURPSA-N 0.000 description 1
- 206010051606 Necrotising colitis Diseases 0.000 description 1
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 1
- 241000080590 Niso Species 0.000 description 1
- 241000424623 Nostoc punctiforme Species 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- JOIQQNUVTASCEM-UHFFFAOYSA-N O.[Na].[Na].C(C=C/C(=O)O)(=O)O Chemical compound O.[Na].[Na].C(C=C/C(=O)O)(=O)O JOIQQNUVTASCEM-UHFFFAOYSA-N 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241000493790 Photobacterium leiognathi Species 0.000 description 1
- 101710100421 Plantazolicin Proteins 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 101710176049 Probable glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- XLJLYVFWFVRDFG-UHFFFAOYSA-N Pulcherrimin Natural products C1=C2C(OC=3C(C4=O)=C(O)C=C(C=3)OC)=C4OCC2=C2OCOC2=C1 XLJLYVFWFVRDFG-UHFFFAOYSA-N 0.000 description 1
- 101710198235 Putative glutamine-fructose-6-phosphate aminotransferase [isomerizing] Proteins 0.000 description 1
- 101710198273 RNA polymerase sigma factor SigF Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 241000589180 Rhizobium Species 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- 241000220286 Sedum Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 208000007107 Stomach Ulcer Diseases 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- HDTRYLNUVZCQOY-WSWWMNSNSA-N Trehalose Natural products O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-WSWWMNSNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- LFTYTUAZOPRMMI-ZYQOOJPVSA-N UDP-N-acetyl-alpha-D-mannosamine Chemical compound O1[C@H](CO)[C@@H](O)[C@H](O)[C@H](NC(=O)C)[C@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 LFTYTUAZOPRMMI-ZYQOOJPVSA-N 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000607626 Vibrio cholerae Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 241000606834 [Haemophilus] ducreyi Species 0.000 description 1
- RCITVHFNWJIDNA-UHFFFAOYSA-K [NH4+].[NH4+].[NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O Chemical compound [NH4+].[NH4+].[NH4+].[Fe+3].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O.[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O RCITVHFNWJIDNA-UHFFFAOYSA-K 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 150000004716 alpha keto acids Chemical class 0.000 description 1
- HDTRYLNUVZCQOY-LIZSDCNHSA-N alpha,alpha-trehalose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 HDTRYLNUVZCQOY-LIZSDCNHSA-N 0.000 description 1
- HXXFSFRBOHSIMQ-VFUOTHLCSA-N alpha-D-glucose 1-phosphate Chemical compound OC[C@H]1O[C@H](OP(O)(O)=O)[C@H](O)[C@@H](O)[C@@H]1O HXXFSFRBOHSIMQ-VFUOTHLCSA-N 0.000 description 1
- RQNFGIWYOACERD-OCQMRBNYSA-N alpha-L-Fucp-(1->4)-[alpha-L-Fucp-(1->2)-beta-D-Galp-(1->3)]-beta-D-GlcpNAc-(1->3)-beta-D-Galp-(1->4)-D-Glcp Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]1[C@H](O[C@H]2[C@@H]([C@@H](CO)O[C@@H](O[C@@H]3[C@H]([C@H](O[C@@H]4[C@H](OC(O)[C@H](O)[C@H]4O)CO)O[C@H](CO)[C@@H]3O)O)[C@@H]2NC(C)=O)O[C@H]2[C@H]([C@H](O)[C@H](O)[C@H](C)O2)O)O[C@H](CO)[C@H](O)[C@@H]1O RQNFGIWYOACERD-OCQMRBNYSA-N 0.000 description 1
- 101150069712 amyA gene Proteins 0.000 description 1
- 235000019418 amylase Nutrition 0.000 description 1
- 238000005571 anion exchange chromatography Methods 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000009360 aquaculture Methods 0.000 description 1
- 244000144974 aquaculture Species 0.000 description 1
- 244000052616 bacterial pathogen Species 0.000 description 1
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical class COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 description 1
- IEQCXFNWPAHHQR-YKLSGRGUSA-N beta-D-Gal-(1->4)-beta-D-GlcNAc-(1->3)-beta-D-Gal-(1->4)-D-Glc Chemical compound O([C@H]1[C@H](O)[C@H]([C@@H](O[C@@H]1CO)O[C@@H]1[C@H]([C@H](O[C@@H]2[C@H](OC(O)[C@H](O)[C@H]2O)CO)O[C@H](CO)[C@@H]1O)O)NC(=O)C)[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O IEQCXFNWPAHHQR-YKLSGRGUSA-N 0.000 description 1
- HMQPEDMEOBLSQB-RCBHQUQDSA-N beta-D-Galp-(1->3)-alpha-D-GlcpNAc Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 HMQPEDMEOBLSQB-RCBHQUQDSA-N 0.000 description 1
- DLRVVLDZNNYCBX-ZZFZYMBESA-N beta-melibiose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@H](O)O1 DLRVVLDZNNYCBX-ZZFZYMBESA-N 0.000 description 1
- 230000027455 binding Effects 0.000 description 1
- 238000010352 biotechnological method Methods 0.000 description 1
- 238000013452 biotechnological production Methods 0.000 description 1
- 230000004641 brain development Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 108010089934 carbohydrase Proteins 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 238000005277 cation exchange chromatography Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013522 chelant Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000003930 cognitive ability Effects 0.000 description 1
- 210000003022 colostrum Anatomy 0.000 description 1
- 235000021277 colostrum Nutrition 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- OXBLHERUFWYNTN-UHFFFAOYSA-M copper(I) chloride Chemical compound [Cu]Cl OXBLHERUFWYNTN-UHFFFAOYSA-M 0.000 description 1
- 108700001679 corynebactin Proteins 0.000 description 1
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 238000011026 diafiltration Methods 0.000 description 1
- 235000015872 dietary supplement Nutrition 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 208000000718 duodenal ulcer Diseases 0.000 description 1
- 238000000909 electrodialysis Methods 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000000369 enteropathogenic effect Effects 0.000 description 1
- 239000000147 enterotoxin Substances 0.000 description 1
- 231100000655 enterotoxin Toxicity 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 244000053095 fungal pathogen Species 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 101150111330 glmU gene Proteins 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 150000002337 glycosamines Chemical class 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 229940037467 helicobacter pylori Drugs 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229920002674 hyaluronan Polymers 0.000 description 1
- 229960003160 hyaluronic acid Drugs 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 239000003501 hydroponics Substances 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000002917 insecticide Substances 0.000 description 1
- 238000002743 insertional mutagenesis Methods 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000037041 intracellular level Effects 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- ZKLLSNQJRLJIGT-UYFOZJQFSA-N keto-D-fructose 1-phosphate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C(=O)COP(O)(O)=O ZKLLSNQJRLJIGT-UYFOZJQFSA-N 0.000 description 1
- GSXOAOHZAIYLCY-HSUXUTPPSA-N keto-D-fructose 6-phosphate Chemical compound OCC(=O)[C@@H](O)[C@H](O)[C@H](O)COP(O)(O)=O GSXOAOHZAIYLCY-HSUXUTPPSA-N 0.000 description 1
- 230000006651 lactation Effects 0.000 description 1
- RQNFGIWYOACERD-UHFFFAOYSA-N lacto-N-Difucosylhexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC4C(OC(O)C(O)C4O)CO)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O RQNFGIWYOACERD-UHFFFAOYSA-N 0.000 description 1
- 229930187367 lacto-N-difucohexaose Natural products 0.000 description 1
- OQIUPKPUOLIHHS-UHFFFAOYSA-N lacto-N-difucohexaose I Natural products OC1C(O)C(O)C(C)OC1OC1C(OC2C(C(CO)OC(OC3C(C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C3O)O)C2NC(C)=O)OC2C(C(O)C(O)C(C)O2)O)OC(CO)C(O)C1O OQIUPKPUOLIHHS-UHFFFAOYSA-N 0.000 description 1
- RJTOFDPWCJDYFZ-UHFFFAOYSA-N lacto-N-triose Natural products CC(=O)NC1C(O)C(O)C(CO)OC1OC1C(O)C(OC(C(O)CO)C(O)C(O)C=O)OC(CO)C1O RJTOFDPWCJDYFZ-UHFFFAOYSA-N 0.000 description 1
- 229960001375 lactose Drugs 0.000 description 1
- 229920006008 lipopolysaccharide Polymers 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- DKHGMERMDICWDU-GHDNBGIDSA-N menaquinone-4 Chemical compound C1=CC=C2C(=O)C(C/C=C(C)/CC/C=C(C)/CC/C=C(C)/CCC=C(C)C)=C(C)C(=O)C2=C1 DKHGMERMDICWDU-GHDNBGIDSA-N 0.000 description 1
- 108010067215 mersacidin Proteins 0.000 description 1
- 238000012269 metabolic engineering Methods 0.000 description 1
- 230000037353 metabolic pathway Effects 0.000 description 1
- 238000001471 micro-filtration Methods 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 108010009719 mutanolysin Proteins 0.000 description 1
- 101150087123 nat gene Proteins 0.000 description 1
- 208000004995 necrotizing enterocolitis Diseases 0.000 description 1
- 239000002417 nutraceutical Substances 0.000 description 1
- 235000021436 nutraceutical agent Nutrition 0.000 description 1
- 235000015097 nutrients Nutrition 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 201000006195 perinatal necrotizing enterocolitis Diseases 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- SKALCVOFYPVXLA-IBHRWLNOSA-N plantazolicin Chemical compound N([C@@H]([C@@H](C)CC)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC=C(N=1)C=1OC(C)[C@H](N=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)C([C@@H](C)CC)NC(=O)C(=C(O1)C)N=C1C(=C(O1)C)N=C1C(N=1)=CSC=1C(=C(O1)C)N=C1C1=CSC([C@H](CCCNC(N)=N)N(C)C)=N1 SKALCVOFYPVXLA-IBHRWLNOSA-N 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 1
- 239000003910 polypeptide antibiotic agent Substances 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920000053 polysorbate 80 Polymers 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- XENTWZJLVFFYPY-UHFFFAOYSA-L pulcherrimin Chemical compound CC(C)CC1=C2O[Fe]O[N+]2=C(CC(C)C)C2=[N+]1O[Fe]O2 XENTWZJLVFFYPY-UHFFFAOYSA-L 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 239000001054 red pigment Substances 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 238000001223 reverse osmosis Methods 0.000 description 1
- 239000009754 rhamnogalacturonan I Substances 0.000 description 1
- 101150067544 sigF gene Proteins 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008174 sterile solution Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000004809 thin layer chromatography Methods 0.000 description 1
- 231100000033 toxigenic Toxicity 0.000 description 1
- 230000001551 toxigenic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 239000011573 trace mineral Substances 0.000 description 1
- 235000013619 trace mineral Nutrition 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940118696 vibrio cholerae Drugs 0.000 description 1
- 239000011728 vitamin K2 Substances 0.000 description 1
- 208000008918 voyeurism Diseases 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 1
- 229910000368 zinc sulfate Inorganic materials 0.000 description 1
- 239000011686 zinc sulphate Substances 0.000 description 1
- 235000009529 zinc sulphate Nutrition 0.000 description 1
Images
Abstract
Description
Настоящее изобретение относится к области техники генной инженерии, в частности, к генной инженерии клеток Bacillus для получения сиалированных олигосахаридов в указанных клетках Bacillus, к ферментативной продукции сиалированных олигосахаридов с использованием указанных клеток Bacillus и к применению полученных таким образом сиалированных олигосахаридов.The present invention relates to the field of genetic engineering, in particular to the genetic engineering of Bacillus cells to produce sialylated oligosaccharides in said Bacillus cells, to the enzymatic production of sialylated oligosaccharides using said Bacillus cells and to the use of the sialylated oligosaccharides thus obtained.
Предшествующий уровень техникиPrior Art
Человеческое грудное молоко обеспечивает детей грудного возраста всеми питательными веществами, в которых они нуждаются для здорового роста и развития. Сахариды, которые присутствуют в человеческом грудном молоке, представляют собой его основной компонент, превосходя жиры и белки. Помимо лактозы, которая служит источником энергии, человеческое грудное молоко содержит молекулы более сложных сахаридов, а именно, олигосахаридов. На сегодняшний день в человеческом грудном молоке идентифицировано приблизительно 200 структурно отличающихся олигосахаридов. Данные олигосахариды обнаружены в значимых концентрациях только в человеческом молоке, и они суммарно известны как олигосахариды грудного молока (ОГМ). Указанные ОГМ основаны на дисахариде - лактозе (состоящей из группировки глюкозы (Glc) и группировки галактозы (Gal)) и несут дополнительные остатки моносахаридов, которые основаны на N-ацетил-глюкозамине (GlcNAc), фукозе (Fuc), сиаловой кислоте/N-ацетилнейраминовой кислоте (NeuNAc) и/или галактозе (Gal). Концентрация и состав ОГМ в человеческом грудном молоке варьирует среди индивидуумов и на протяжении периода лактации от вплоть до 20 г/л в молозиве до 5-10 г/л в зрелом молоке.Human breast milk provides infants with all the nutrients they need for healthy growth and development. Sugars, which are present in human breast milk, represent its main component, surpassing fats and proteins. In addition to lactose, which serves as a source of energy, human breast milk contains molecules of more complex saccharides, namely oligosaccharides. To date, approximately 200 structurally distinct oligosaccharides have been identified in human breast milk. These oligosaccharides are found in significant concentrations only in human milk, and they are collectively known as human milk oligosaccharides (HMOs). These HGMs are based on the disaccharide lactose (consisting of a glucose group (Glc) and a galactose group (Gal)) and carry additional monosaccharide residues that are based on N-acetyl-glucosamine (GlcNAc), fucose (Fuc), sialic acid/N- acetylneuraminic acid (NeuNAc) and/or galactose (Gal). The concentration and composition of HMOs in human breast milk varies among individuals and throughout the lactation period, from up to 20 g/L in colostrum to 5-10 g/L in mature milk.
Значимое число ОГМ несет одну группировку NeuNAc. Среди данных сиалированных олигосахаридов грудного молока (СОГМ), 3'-сиалиллактоза, 6'-сиалиллактоза, сиалиллакто-N-тетраоза а, сиалиллакто-N-тетраоза b, сиалиллакто-N-тетраоза с и дисиалиллакто-N-тетраоза представляют собой наиболее распространенные члены в человеческом грудном молоке.A significant number of OGMs carry one NeuNAc group. Among these sialylated human milk oligosaccharides (HOMS), 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c and disialyllacto-N-tetraose are the most common members in human breast milk.
Сиаловые кислоты (Sia) представляют собой семейство отрицательно заряженных моносахаридов с каркасом из девяти атомов углерода. Более чем 50 форм данных α-кетокислот обнаружено в природе. Наиболее распространенной сиаловой кислотой, по-видимому, является N-ацетилнейраминовая кислота (NANA -от англ. N-acetylneuraminic acid, NeuNAc, Neu5Ac).Sialic acids (Sia) are a family of negatively charged monosaccharides with a backbone of nine carbon atoms. More than 50 forms of these α-keto acids have been found in nature. The most common sialic acid appears to be N-acetylneuraminic acid (NANA - N-acetylneuraminic acid, NeuNAc, Neu5Ac).
Сиаловые кислоты находятся в качестве концевых моносахаридных группировок гликанов, которые находятся в гликоконъюгатах (гликопротеины и гликолипиды) на поверхности клеток позвоночных и высших беспозвоночных. Сиаловые кислоты являются компонентами липополисахаридов и капсульных полисахаридов патогенных бактерий, включая Escherichia coli K1, Haemophilus influenzae, Haemophilus ducreyi, Pateurella multocida, Neisseria gonorrhoeae, Neisseria meningitidis, Campylobacter jejuni и Streptococcus agalactiae.Sialic acids are found as terminal monosaccharide groups of glycans that are found in glycoconjugates (glycoproteins and glycolipids) on the surface of vertebrate and higher invertebrate cells. Sialic acids are components of lipopolysaccharides and capsular polysaccharides of pathogenic bacteria, including Escherichia coli K1, Haemophilus influenzae, Haemophilus ducreyi, Pateurella multocida, Neisseria gonorrhoeae, Neisseria meningitidis, Campylobacter jejuni and Streptococcus agalactiae.
Наблюдали, что сиалированные ОГМ поддерживают устойчивость грудного ребенка к энтеропатогенным бактериям и вирусам. Что интересно, недавние исследования, кроме того, продемонстрировали защитное действие длинноцепочечных СОГМ в отношении некротического энтероколита, который является одним из наиболее распространенных и смертельных заболеваний у недоношенных новорожденных. Кроме того, показано, что сиалированные олигосахариды нейтрализуют энтеротоксины разных патогенных микробов, включая Escherichia coli, Vibrio cholerae и Salmonella. Кроме того, обнаружено, что сиалированные олигосахариды препятствуют колонизации кишечника Helicobacter pylori и, вследствие этого, предотвращают или ингибируют язвы желудка и двенадцатиперстной кишки. Кроме того, полагают, что сиалированные олигосахаирды поддерживают развитие головного мозга младенца и его когнитивные способности.It has been observed that sialylated HGMs support the infant's resistance to enteropathogenic bacteria and viruses. Interestingly, recent studies have also demonstrated a protective effect of long-chain SOGM against necrotizing enterocolitis, which is one of the most common and fatal diseases in preterm infants. In addition, sialylated oligosaccharides have been shown to neutralize enterotoxins from a variety of pathogenic microbes, including Escherichia coli, Vibrio cholerae and Salmonella. In addition, sialylated oligosaccharides have been found to inhibit colonization of the intestine by Helicobacter pylori and consequently prevent or inhibit gastric and duodenal ulcers. In addition, sialylated oligosaccharides are believed to support infant brain development and cognitive abilities.
Благодаря известной пользе от ОГМ, главным образом сиалированных ОГМ, экономически целесообразный способ их получения является желательным, таким образом, чтобы данные сиалированные олигосахариды или по меньшей мере некоторые из данных сиалированных олигосахаридов стали доступными в качестве добавки к детским питательным смесям.Due to the known benefits of HMOs, primarily sialylated HMOs, an economically viable method for preparing them is desirable such that these sialylated oligosaccharides, or at least some of these sialylated oligosaccharides, become available as an additive to infant formulas.
Ограниченная доступность грудного молока для целей, отличных от грудного вскармливания грудного ребенка, и сложности получения чистых фракций отдельных олигосахаридов грудного молока из природных источников привели к разработке химических путей их синтеза. Однако, и химический синтез, и биокаталитические подходы in-vitro оказались коммерчески нерациональными. Кроме того, в частности химический синтез олигосахаридов грудного молока включает применение нескольких вредных химических веществ, которые накладывают риск загрязнения конечного продукта.The limited availability of human milk for purposes other than infant breastfeeding and the difficulty of obtaining pure fractions of individual human milk oligosaccharides from natural sources have led to the development of chemical routes for their synthesis. However, both chemical synthesis and in-vitro biocatalytic approaches have proven to be commercially unsustainable. In addition, the chemical synthesis of human milk oligosaccharides in particular involves the use of several harmful chemicals that pose a risk of contamination of the final product.
В качестве альтернативы химическому и биокаталитическому синтезу in-vitro разработано ферментативное получение ОГМ. На сегодняшний день, рекомбинантные клетки Escherichia coli используют для микробной продукции некоторых ОГМ в промышленном масштабе.As an alternative to chemical and biocatalytic synthesis in-vitro, the enzymatic production of OGM has been developed. Today, recombinant Escherichia coli cells are used for the microbial production of certain HMOs on an industrial scale.
Однако, род Escherichia coli включает патогенные члены, а также непатогенные члены. Несмотря на то, что для микробной продукции ОГМ используют непатогенные штаммы Е. coli, такие непатогенные Е. coli не считают безопасными для изготовления продуктов, которые предназначены для потребления человеком во множестве областей. Это мешает одобрению контролирующими органами ОГМ, изготавливаемых современными биотехнологическими способами, для потребления человеком в указанных областях. Таким образом, микробные клетки родов, которые расценивались бы как безопасные для потребления человеком или расценивались бы как безопасные при использовании в получении соединений для потребления человеком в таких областях, необходимы для изготовления сахаридов, которые предназначены для потребления человеком, например, олигосахаридов грудного молока, в частности, для потребления грудными детьми. Применение продуктивных штаммов, считающихся безопасными, уменьшает, по меньшей мере предположительно, проблемы в отношении вероятности рисков для здоровья человека, обусловленных сахаридом, и будет облегчать их одобрение контролирующими органами в большинстве областей.However, the genus Escherichia coli includes pathogenic members as well as non-pathogenic members. Although non-pathogenic E. coli strains are used for HGM microbial production, such non-pathogenic E. coli are not considered safe for the manufacture of products intended for human consumption in a variety of applications. This prevents regulatory approval of HGMs produced by modern biotechnological methods for human consumption in these areas. Thus, microbial cells of genera that would be considered safe for human consumption or would be considered safe when used in the preparation of compounds for human consumption in such areas are needed for the manufacture of saccharides that are intended for human consumption, for example, human milk oligosaccharides, in particularly for consumption by infants. The use of productive strains considered safe will, at least presumably, reduce concerns regarding the likelihood of human health risks posed by the saccharide and will facilitate their regulatory approval in most areas.
Проблема решается посредством использования бактериальных клеток рода Bacillus для получения сиалированных олигосахаридов, в частности сиалированных ОГМ. Бактериальные клетки некоторых видов рода Bacillus уже расцениваются как безопасные для потребления человеком или для получения соединений/пищи для потребления человеком. Следовательно, предложены клетки Bacillus вида и/или штаммов, которые обычно расцениваются как безопасные для получения сиалированных олигосахаридов, в частности, для получения сиалированных олигосахаридов грудного молока.The problem is solved by using bacterial cells of the genus Bacillus to produce sialylated oligosaccharides, in particular sialylated OGM. Bacterial cells of some species of the genus Bacillus are already considered safe for human consumption or for the production of compounds/food for human consumption. Accordingly, Bacillus cells of species and/or strains are provided which are generally regarded as safe for the production of sialylated oligosaccharides, in particular for the production of sialylated oligosaccharides in breast milk.
Бактерии рода Bacillus являются грамположительными, палочковидными, образующими эндоспоры микробными клетками или аэробных, или факультативно анаэробных видов. Род Bacillus принадлежит к типу Фирмикуты. Геном членов рода Bacillus имеет тенденцию к парам оснований А-Т в своей частоте использования кодона. Виды Bacillus почти повсеместно распространены в природе. Например, они могут быть найдены в почве (В. subtilis), а также встречаются в экстремальных условиях окружающей среды, таких как высокий рН (В. alcalophilus), высокая температура (В. thermophilus) или высокое содержание солей (В, halodurans).Bacteria of the genus Bacillus are gram-positive, rod-shaped, endospore-forming microbial cells of either aerobic or facultative anaerobic species. The genus Bacillus belongs to the phylum Firmicutes. The genome of members of the genus Bacillus tends toward A-T base pairs in its codon usage frequency. Bacillus species are almost ubiquitous in nature. For example, they can be found in soil (B. subtilis) and are also found in extreme environmental conditions such as high pH (B. alcalophilus), high temperature (B. thermophilus) or high salt content (B. halodurans).
Род Bacillus включает 266 видов, имеющих название, которые включают свободноживущие виды, а также паразитарные патогенные виды. Два вида Bacillus считаются значимыми с медицинской точки зрения: В. anthracis, который вызывает сибирскую язву, и В. cereus, который вызывает пищевое отравление. Третий вид, В. thuringiensis, является важным патогеном насекомых, продуцирующим токсин, который может уничтожать насекомых. Таким образом, он используется в качестве инсектицида для борьбы с насекомыми-вредителями.The genus Bacillus contains 266 named species, which include free-living species as well as parasitic pathogenic species. Two species of Bacillus are considered medically significant: B. anthracis, which causes anthrax, and B. cereus, which causes food poisoning. The third species, B. thuringiensis, is an important insect pathogen that produces a toxin that can kill insects. Thus, it is used as an insecticide to control insect pests.
Из-за их статуса GRAS (от англ. generally recognized as safe - общепризнан безопасным), несколько видов Bacillus, например, В. amyloliquefaciens, В. licheniformis и B. subtilis, используются в биотехнологическом получении разных белков и соединений, используемых в пищевой и фармацевтической промышленности.Due to their GRAS (generally recognized as safe) status, several Bacillus species, such as B. amyloliquefaciens, B. licheniformis and B. subtilis, are used in the biotechnological production of various proteins and compounds used in food and pharmaceutical industry.
Bacillus amyloliquefaciens является источником рестриктазы BamHI и также синтезирует природный белок - антибиотик барназу. Кроме того, В. amyloliquefaciens продуцирует плантазолицин, антибиотик с селективной активностью в отношении В.anthracis. Альфа-амилаза из В. amyloliquefaciens часто используется в гидролизе крахмала. В. amyloliquefaciens также является источником субтилизина, который катализирует распад белков.Bacillus amyloliquefaciens is a source of the BamHI restriction enzyme and also synthesizes a natural protein, the antibiotic barnase. In addition, B. amyloliquefaciens produces plantazolicin, an antibiotic with selective activity against B. anthracis. Alpha-amylase from B. amyloliquefaciens is often used in starch hydrolysis. B. amyloliquefaciens is also a source of subtilisin, which catalyzes the breakdown of proteins.
Bacillus amyloliquefaciens представляет собой бактерию-колонизатора корней, которая используется для того, чтобы бороться с некоторыми патогенами корней растений в сельском хозяйстве, водной культуре и гидропонике, поскольку она оказывает действие против бактериальных и грибковых патогенов и может предотвращать инфицирование в результате конкурентного исключения или вытеснения нежелательного патогена в конкурентной борьбе.Bacillus amyloliquefaciens is a root colonizing bacterium that is used to control some plant root pathogens in agriculture, aquaculture and hydroponics as it has antibacterial and fungal pathogens and can prevent infection through competitive exclusion or displacement of unwanted pathogen in competition.
Ее высокая способность секретировать щелочную сериновую протеазу сделала B. licheniformis одной из наиболее важных бактерий в промышленном производстве фермента. Субтилизин Carlsberg, секретируемый В. licheniformis, используют в качестве протеазы для моющих средств, и он продается под торговым названием Alcalase®.Its high ability to secrete alkaline serine protease has made B. licheniformis one of the most important bacteria in the industrial production of the enzyme. Carlsberg subtilisin, secreted by B. licheniformis, is used as a protease for detergents and is sold under the trade name Alcalase®.
Bacillus subtilis представляет собой бактерию, позитивную в отношении каталазы, которая обнаружена в почве и желудочно-кишечном тракте жвачных животных и человека. В. subtilis и вещества, происходящие из данной бактерии, не содержащей эндотоксин, оценивались разными авторитетными органами в отношении их безопасности и пользы в применении в пищевой продукции. В Соединенных Штатах ферменты карбогидраза и протеаза из В. subtilis общепризнаны безопасными (GRAS) Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA - от англ. Food and Drug Administration). Bacillus subtilis также присвоен статус «квалифицированной презумпции безопасности» Европейским агентством по безопасности продуктов питания.Bacillus subtilis is a catalase-positive bacterium that is found in the soil and gastrointestinal tract of ruminants and humans. B. subtilis and substances derived from this endotoxin-free bacterium have been evaluated by various authorities for their safety and benefit in food applications. In the United States, the carbohydrase and protease enzymes from B. subtilis are generally recognized as safe (GRAS) by the US Food and Drug Administration (FDA). Bacillus subtilis has also been given "qualified presumption of safety" status by the European Food Safety Authority.
Кроме того, нетоксигенные и непатогенные штаммы В. subtilis обычно используются в пищевой промышленности. Например, ферментированные соевые бобы в виде натто часто потребляют в Японии, и они содержат вплоть до 108 жизнеспособных клеток В. subtilis на грамм. Натто признают за их вклад в здоровую флору кишечника и поглощение витамина K2. Продукт натто и В. subtilis var. natto в качестве его основного компонента представляют собой FOSHU (от англ. Foods for Specified Health Use - пищевые продукты, специально используемые для поддержания здоровья), одобренные министерством здравоохранения, труда и социальной защиты Японии как эффективные для сохранения здоровья.In addition, non-toxigenic and non-pathogenic strains of B. subtilis are commonly used in the food industry. For example, fermented soybeans in the form of natto are often consumed in Japan and contain up to 10 8 viable B. subtilis cells per gram. Natto is recognized for its contribution to healthy gut flora and vitamin K2 absorption. The product of natto and B. subtilis var. natto as its main component are FOSHU (Foods for Specified Health Use), approved by the Ministry of Health, Labor and Welfare of Japan as effective in maintaining health.
С В. subtilis легко работать, она быстро растет, и условия культивирования являются простыми. Рекомбинантные штаммы В. subtilis используют в продукции полигидроксиалканолатов, гиалуроновой кислоты и разных ферментов, таких как амилаза и протеазы.B. subtilis is easy to work with, grows quickly, and culture conditions are simple. Recombinant strains of B. subtilis are used in the production of polyhydroxyalkanolates, hyaluronic acid and various enzymes such as amylase and proteases.
С природными изолятами В. subtilis дикого типа сложно работать, по сравнению с лабораторными штаммами, которые подвергались процессам одомашнивания на основе мутагенеза и селекции. Данные одомашненные штаммы часто обладают улучшенными способностями к развитию природной компетентности (поглощению и интеграции ДНК окружающей среды), улучшенными способностями к росту и потере способностей, необходимых «в дикой природе». В В. subtilis линейная ДНК, а также мультимерные формы плазмидной ДНК активно поглощаются природными компетентными клетками.Natural isolates of wild-type B. subtilis are difficult to work with compared to laboratory strains that have been subjected to domestication processes based on mutagenesis and selection. These domesticated strains often have improved abilities to develop natural competence (uptake and integration of environmental DNA), improved growth abilities, and loss of abilities required "in the wild." In B. subtilis, linear DNA, as well as multimeric forms of plasmid DNA, are actively taken up by natural competent cells.
В определенных физиологических условиях маленькая субпопуляция клеток В. subtilis становится компетентной. В В. subtilis природная компетентность регулируется сложной регуляторной сетью. Ключевые регуляторы в данной сети представляют собой, среди прочих, мастер регулятор компетентности СоmK и транскрипционный мастер регулятор споруляции SpoOA. Эффективность трансформации клеток В. subtilis и возможно эффективность интеграции ДНК в их геном можно улучшать посредством генной инженерии. Это может быть достигнуто посредством эктопической интеграции экспрессионной кассеты, содержащей регулируемый промотор (например, промотор, индуцируемый маннитом ) и гены comK и comS, в геном В. subtilis. Дополнительно, данная стратегия обеспечивает трансформацию В. subtilis за счет природной компетентности с использованием сложной среды (например, LB).Under certain physiological conditions, a small subpopulation of B. subtilis cells becomes competent. In B. subtilis, natural competence is regulated by a complex regulatory network. Key regulators in this network are, among others, the master competence regulator ComK and the transcriptional master sporulation regulator SpoOA. The efficiency of transformation of B. subtilis cells and possibly the efficiency of DNA integration into their genome can be improved through genetic engineering. This can be achieved through ectopic integration of an expression cassette containing a regulated promoter (e.g. mannitol inducible promoter ) and the comK and comS genes into the B. subtilis genome. Additionally, this strategy enables transformation of B. subtilis through natural competence using a complex environment (eg, LB).
Для продукции сиалированных олигосахаридов клетки Bacillus можно генетически конструировать разными способами.Bacillus cells can be genetically engineered in a variety of ways to produce sialylated oligosaccharides.
Термин «генетически сконструированный», в том виде, в котором он используется в данном документе, относится к модификации генетического состава клетки Bacillus с использованием методов молекулярной биологии. Модификация генетического состава клетки Bacillus может включать перенос генов в пределах и/или через видовые связи, вставку, удаление, замену и/или модификацию нуклеотидов, триплетов, генов, открытых рамок считывания, промоторов, энхансеров, терминаторов и других нуклеотидных последовательностей, опосредуя и/или контролируя экспрессию генов. Модификация генетического состава клетки Bacillus нацелена на создание генетически сконструированной клетки, обладающей конкретными, желательными свойствами. Генетически сконструированные клетки Bacillus могут содержать один или более генов, которые отсутствуют в нативной (не генетически сконструированной) форме клетки. Методики введения экзогенных молекул нуклеиновой кислоты и/или осуществления вставки экзогенных молекул нуклеиновой кислоты (рекомбинантных, гетерологичных) в наследуемую информацию клетки Bacillus для вставки, удаления или изменения нуклеотидной последовательности генетической информации клетки известны квалифицированному специалисту. Генетически сконструированные клетки Bacillus могут содержать один или более генов, которые находятся в нативной форме клетки, где указанные гены модифицированы и повторно введены в клетку Bacillus искусственными средствами. Термин «генетически сконструированный» также охватывает клетки Bacillus, которые содержат молекулу нуклеиновой кислоты, являющуюся эндогенной в отношении клетки, и которая модифицирована без удаления молекулы нуклеиновой кислоты из клетки. Такие модификации включают модификации, полученные в результате замены генов, сайт-специфичных мутаций, и родственные методики.The term "genetically engineered", as used herein, refers to the modification of the genetic composition of a Bacillus cell using molecular biology techniques. Modification of the genetic composition of a Bacillus cell may include gene transfer within and/or across species relationships, insertion, deletion, substitution and/or modification of nucleotides, triplets, genes, open reading frames, promoters, enhancers, terminators and other nucleotide sequences, mediating and/ or by controlling gene expression. Modification of the genetic makeup of a Bacillus cell aims to create a genetically engineered cell that has specific, desirable properties. Genetically engineered Bacillus cells may contain one or more genes that are not present in the native (non-genetically engineered) form of the cell. Methods for introducing exogenous nucleic acid molecules and/or inserting exogenous nucleic acid molecules (recombinant, heterologous) into the inherited information of a Bacillus cell to insert, delete or change the nucleotide sequence of the genetic information of the cell are known to a qualified specialist. Genetically engineered Bacillus cells may contain one or more genes that are found in the native form of the cell, wherein said genes are modified and reintroduced into the Bacillus cell by artificial means. The term “genetically engineered” also includes Bacillus cells that contain a nucleic acid molecule that is endogenous to the cell and that is modified without removing the nucleic acid molecule from the cell. Such modifications include modifications resulting from gene replacement, site-specific mutations, and related techniques.
Интеграция гена и/или (одновременная) инактивация гена посредством нарушения или удаления может быть достигнута посредством гомологичной рекомбинации. Для эффективной гомологичной рекомбинации по меньшей мере 400-500 п. н. гомологичных плечей необходимы в В. subtilis.Gene integration and/or (simultaneous) gene inactivation through disruption or deletion can be achieved through homologous recombination. For efficient homologous recombination, at least 400-500 bp. homologous arms are required in B. subtilis.
Еще одним способом направленного конструирования генома является система CRISPR-Cas9. Данный быстрый и безмаркерный инструмент редактирования генома может быть использован для крупномасштабных геномных делеций, маленьких и больших вставок ДНК, сайленсинга генов посредством введения стоп-кодона, а также введения точечных мутаций. Никаких предварительных модификаций генома не требуется для «бесшовного» редактирования генома посредством CRISPR-Cas9.Another method for targeted genome design is the CRISPR-Cas9 system. This fast, marker-free genome editing tool can be used for large-scale genomic deletions, small and large DNA insertions, gene silencing via stop codons, and point mutations. No prior genome modifications are required for seamless genome editing via CRISPR-Cas9.
Случайную хромосомную интеграцию генов и инсерционный мутагенез можно проводить, используя модифицированный транспозон mariner. Данная система не проявляет тенденцию к горячим точкам в В. subtilis, одновременно демонстрируя высокую эффективность в случайной эктопической интеграции.Random chromosomal gene integration and insertional mutagenesis can be carried out using a modified mariner transposon. This system does not tend to hotspot in B. subtilis while demonstrating high efficiency in random ectopic integration.
Несмотря на то, что виды Bacillus используют для промышленного производства ферментов, на сегодняшний день клетки Bacillus не внедрялись для промышленного производства олигосахаридов, в частности промышленного производства сиалированных олигосахаридов.Although Bacillus species are used for the industrial production of enzymes, to date Bacillus cells have not been introduced into the industrial production of oligosaccharides, in particular the industrial production of sialylated oligosaccharides.
В китайской патентной заявке CN 108410787 А раскрыты рекомбинантные клетки Bacillus subtilis, которые синтезируют лактил-N-неотетраозу. Указанные рекомбинантные клетки В. subtilis имеют ген лактозопермеазы, который интегрируют в геном клетки. Кроме того, указанная клетка Bacillus, которая несет плазмиду, содержащую ген β-1,3-N-глюкозаминтрансферазы и ген β-1,4-галактозилтрансферазы. Клетки В. subtilis можно культивировать в присутствии экзогенной лактозы и они синтезируют лактил-N-неотетраозу при титрах вплоть до примерно 1 г/л, что слишком мало для экономически целесообразного промышленного производства.Chinese patent application CN 108410787 A discloses recombinant Bacillus subtilis cells that synthesize lactyl-N-neotetraose. These recombinant B. subtilis cells have a lactose permease gene, which is integrated into the cell genome. In addition, said Bacillus cell which carries a plasmid containing a β-1,3-N-glucosamine transferase gene and a β-1,4-galactosyltransferase gene. B. subtilis cells can be cultured in the presence of exogenous lactose and synthesize lactyl-N-neotetraose at titers as low as about 1 g/L, which is too low for economical industrial production.
В китайской патентной заявке CN 109735479 А раскрыты рекомбинантные клетки Bacillus subtilis для осуществления синтеза 2'-фукозиллактозы, где уровень экспрессии фермента-транспортера лактозы повышен, и где клетка экспрессирует фукозокиназу, фосфатгуанинтрансферазу и фукозилтрансферазу. Сообщалось, что выход 2'-фукозиллактозы в ферментационной среде составлял от 0,424 г/л до 1,042 г/л.Chinese patent application CN 109735479 A discloses recombinant Bacillus subtilis cells to carry out the synthesis of 2'-fucosyllactose, where the expression level of lactose transporter enzyme is increased, and where the cell expresses fucosokinase, phosphate guanine transferase and fucosyltransferase. The yield of 2'-fucosyllactose in the fermentation medium was reported to range from 0.424 g/L to 1.042 g/L.
Несмотря на то, что во множестве патентных заявок упоминается Bacillus в качестве рода, который, как считается, подходит для продукции нейтральных олигосахаридов, таких как лакто-N-неотетраоза или 2'-фукозиллактоза, никакого применения Bacillus для продукций сиалированных олигосахаридов, в частности сиалированных олигосахаридов грудного молока, еще не было реализовано, предположительно из-за значительных усилий в модификации метаболизма, которые требуются для реализации необходимых путей биосинтеза для продукции ОГМ в Bacillus. Тогда как указанная выше В. subtilis для продукции LNnT зависит от субстратов-доноров, которые встречаются в природе в клетках В. subtilis, продукция сиалированного олигосахарида в Bacillus требует реализации гетерологичного метаболического пути в клетке для обеспечения субстрата-донора, а именно СМР (от англ. Cytidine Monophosphatase - цитидинмонофосфат)-NeuNAc, который является крайне важным для синтеза сиалированных олигосахаридов.Although numerous patent applications mention Bacillus as a genus believed to be suitable for the production of neutral oligosaccharides such as lacto-N-neotetraose or 2'-fucosyllactose, there is no application of Bacillus for the production of sialylated oligosaccharides, in particular sialylated human milk oligosaccharides has not yet been realized, presumably due to the significant metabolic modification efforts required to implement the necessary biosynthetic pathways for HGM production in Bacillus. While the above B. subtilis production of LNnT depends on donor substrates that occur naturally in B. subtilis cells, the production of sialylated oligosaccharide in Bacillus requires the implementation of a heterologous metabolic pathway in the cell to provide the donor substrate, namely SMP (from the English Cytidine Monophosphatase - cytidine monophosphate)-NeuNAc, which is extremely important for the synthesis of sialylated oligosaccharides.
Цель была достигнута посредством предоставления клетки Bacillus, в которой имеется лактозопермеаза для импортирования экзогенной лактозы в клетку, путь биосинтеза CMP-NeuNAc для внутриклеточного образования нуклеотид-активируемой сиаловой кислоты, а именно, цитидинмонофосфат-N-ацетилнейраминовой кислоты (CMP-NeuNAc), в качестве субстрата-донора для группировки сиаловой кислоты, и сиалилтрансфераза для переноса группировки сиаловой кислоты с CMP-NeuNAc на субстрат-акцептор. Культивация таких клеток Bacillus в присутствии экзогенной лактозы делает возможной продукцию желательного сиалированного олигосахарида.The goal was achieved by providing the Bacillus cell, which has a lactose permease to import exogenous lactose into the cell, the CMP-NeuNAc biosynthetic pathway for the intracellular production of nucleotide-activated sialic acid, namely cytidine monophosphate-N-acetylneuraminic acid (CMP-NeuNAc), as a donor substrate for the sialic acid moiety, and a sialyltransferase to transfer the sialic acid moiety from CMP-NeuNAc to the acceptor substrate. Cultivation of such Bacillus cells in the presence of exogenous lactose allows the production of the desired sialylated oligosaccharide.
Краткое изложение сущности изобретенияSummary of the invention
Согласно первому аспекту предложена неспорообразующая бактериальная клетка рода Bacillus для получения сиалированного олигосахарида, где в клетке Bacillus имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to the first aspect, a non-spore-forming bacterial cell of the genus Bacillus is proposed for the production of sialylated oligosaccharide, wherein the Bacillus cell has a lactose permease, a CMP-NeuNAc biosynthetic pathway and a sialyltransferase.
Согласно второму аспекту предложено применение неспорообразующей бактериальной клетки рода Bacillus согласно первому аспекту для получения сиалированного олигосахарида.According to the second aspect, the use of a non-spore-forming bacterial cell of the genus Bacillus according to the first aspect is proposed for the production of sialylated oligosaccharide.
Согласно третьему аспекту предложен способ получения сиалированного олигосахарида, включающий:According to a third aspect, there is provided a method for producing a sialylated oligosaccharide, comprising:
- предоставление неспорообразующей бактериальной клетки рода Bacillus, где в указанной клетке Bacillus имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза;- providing a non-spore-forming bacterial cell of the genus Bacillus, wherein said Bacillus cell contains lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase;
- культивирование клетки Bacillus в культуральной среде, содержащей лактозу, и в условиях, которые являются пермиссивными в отношении клетки Bacillus, с продукцией сиалированного олигосахарида, и- culturing the Bacillus cell in a culture medium containing lactose and under conditions that are permissive to the Bacillus cell, producing sialylated oligosaccharide, and
- возможно, извлечение сиалированного олигосахарида из культуральной среды и/или клетки Bacillus.- possibly extracting the sialylated oligosaccharide from the culture medium and/or Bacillus cells.
Согласно четвертому аспекту предложены сиалированные олигосахариды, которые были продуцированы клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to a fourth aspect, sialylated oligosaccharides are provided that have been produced by a Bacillus cell that contains lactose permease, the CMP-NeuNAc biosynthetic pathway, and sialyltransferase.
Согласно пятому аспекту предложено применение сиалированного олигосахарида, который был продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза, для изготовления питательной композиции.According to a fifth aspect, there is proposed the use of a sialylated oligosaccharide that has been produced by a Bacillus cell that has lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase, for the manufacture of a nutritional composition.
Согласно шестому аспекту предложены питательные композиции, содержащие по меньшей мере один сиалированный олигосахарид, который продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to a sixth aspect, nutritional compositions are provided comprising at least one sialylated oligosaccharide that is produced by a Bacillus cell that contains lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase.
Описание графических материаловDescription of graphic materials
На фиг. 1 проиллюстрированы разные воплощения пути биосинтеза CMP-NeuNAc, который осуществляется в клетке Bacillus для получения сиалированного олигосахарида.In fig. 1 illustrates various embodiments of the CMP-NeuNAc biosynthetic pathway that occurs in a Bacillus cell to produce a sialylated oligosaccharide.
Подробное описаниеDetailed description
Согласно первому аспекту предложена неспорообразующая бактериальная клетка рода Bacillus для получения сиалированного олигосахарида. Для того, чтобы иметь способность продуцировать сиалированный олигосахарид, клетка Bacillus должна предоставлять сиалилтрансферазе субстрат-донор, содержащий группировку сиаловой кислоты, и субстрат-акцептор, представляющий собой дисахарид или олигосахарид, таким образом, чтобы сиалилтрансфераза могла переносить группировку сиаловой кислоты от субстрата-донора на указанный субстрат-акцептор, с образованием, вследствие этого, сиалированного олигосахарида.According to a first aspect, a non-spore-forming bacterial cell of the genus Bacillus is provided for the production of sialylated oligosaccharide. In order to be able to produce a sialylated oligosaccharide, the Bacillus cell must provide the sialyltransferase with a donor substrate containing a sialic acid moiety and an acceptor substrate that is a disaccharide or oligosaccharide, such that the sialyltransferase can transfer the sialic acid moiety from the donor substrate to said substrate-acceptor, resulting in the formation of a sialylated oligosaccharide.
Следует понимать, что сиалированный олигосахарид, который предназначена продуцировать указанная клетка Bacillus, представляет собой целевой сиалированный олигосахарид, тогда как другие сиалированные олигосахариды, которые могут быть образованы за счет разнородности сиалилтрансферазы во время продукции желательного сиалированного олигосахарида в клетке Bacillus, считаются нежелательными сиалированными олигосахаридами или побочными продуктами.It should be understood that the sialylated oligosaccharide that the specified Bacillus cell is intended to produce is the desired sialylated oligosaccharide, while other sialylated oligosaccharides that may be formed due to sialyltransferase heterogeneity during the production of the desired sialylated oligosaccharide in the Bacillus cell are considered undesired sialylated oligosaccharides or by-products. products.
Клетка Bacillus для получения сиалированного олигосахарида представляет собой неспорообразующую клетку Bacillus. Клетки Bacillus дикого типа могут образовывать споры. Считают, что споруляция, а именно, процесс образования спор, у бактерий представляет собой реакцию бактериальной клетки, которая инициирует программу развития, приводящую к образованию дочерних клеток отличной морфологии и направления развития. Споруляцию Bacillus исследовали как основную модель дифференцировки клеток. Во время споруляции палочковидная клетка Bacillus делится ассиметрично, что приводит, вследствие этого, к получению двух генетически идентичных клеток с разной морфологией и направлениями развития.The Bacillus cell for producing the sialylated oligosaccharide is a non-sporulating Bacillus cell. Wild-type Bacillus cells can form spores. It is believed that sporulation, namely the process of spore formation, in bacteria is a reaction of a bacterial cell that initiates a developmental program leading to the formation of daughter cells of different morphology and developmental direction. Bacillus sporulation has been studied as a major model of cell differentiation. During sporulation, the rod-shaped Bacillus cell divides asymmetrically, resulting in the production of two genetically identical cells with different morphologies and developmental directions.
Однако, при промышленном получении не желательно, если бактериальный штамм - продуцент образует споры во время ферментативной продукции целевого продукта. Таким образом, предпочтительно использовать клетки Bacillus для получения сиалированных олигосахаридов, которые не способны образовывать споры. Такие клетки Bacillus называются «неспорообразующими».However, during industrial production, it is not desirable if the producing bacterial strain forms spores during the enzymatic production of the target product. Thus, it is preferable to use Bacillus cells to produce sialylated oligosaccharides that are unable to form spores. Such Bacillus cells are called "non-spore-forming".
В одном воплощении неспорообразующая клетка Bacillus для получения сиалированного олигосахарида происходила из одного из штаммов В. subtilis, перечисленных в Таблице 1.In one embodiment, the non-sporulating Bacillus cell to produce the sialylated oligosaccharide was from one of the B. subtilis strains listed in Table 1.
В некоторых воплощениях клетка Bacillus генетически сконструирована так, чтобы стать неспорообразующей, например, посредством делеции или функциональной инактивации SpoOA. SpoOA представляет собой ДНК-связывающий белок, который влияет, напрямую или опосредовано, на экспрессию более чем 500 генов на протяжении ранней стадии споруляции. Подходящая функциональная инактивация SpoOA включает делецию участка фосфорилирования, где фосфотрансферазы SpoOF и SpoOB фосфорилируют SpoOA. Делеция или функциональная инактивация участка фосфорилирования фосфотрансферазы SpoOF и SpoOB приводит к функциональной инактивации SpoOA и, вследствие этого, нарушает способность клетки Bacillus образовывать споры. В качестве альтернативы, ген или нуклеотидная последовательность, кодирующая SpoOA, или часть гена или нуклеотидной последовательности, кодирующей SpoOA, могут быть удалены из генома клетки Bacillus.In some embodiments, the Bacillus cell is genetically engineered to become nonspore-forming, for example, through deletion or functional inactivation of SpoOA. SpoOA is a DNA-binding protein that influences, directly or indirectly, the expression of more than 500 genes during early sporulation. Suitable functional inactivation of SpoOA involves deletion of the phosphorylation site where the phosphotransferases SpoOF and SpoOB phosphorylate SpoOA. Deletion or functional inactivation of the phosphorylation site of the phosphotransferases SpoOF and SpoOB results in functional inactivation of SpoOA and consequently impairs the ability of the Bacillus cell to form spores. Alternatively, the gene or nucleotide sequence encoding SpoOA, or part of the gene or nucleotide sequence encoding SpoOA, can be deleted from the genome of the Bacillus cell.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена(ов), кодирующего(их) фактор сигма SigE (sigE) и/или фактор сигма SigF (sigF). Факторы сигма SigE и SigF представляют собой транскрипционные факторы, которые участвуют в экспрессии генов, которые кодируют белки, которые участвуют в ранней фазе споруляции.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered by deletion or functional inactivation of the gene(s) encoding the sigma factor SigE (sigE) and/or the sigma factor SigF (sigF). The sigma factors SigE and SigF are transcription factors that are involved in the expression of genes that encode proteins that are involved in the early phase of sporulation.
Делеция или функциональная инактивация SpoOA, SigE и/или SigF нарушает способность клетки Bacillus образовывать споры. Такая неспорообразующая клетка Bacillus может быть использована в качестве предшественника для образования клетки Bacillus, которая способна продуцировать сиалированный олигосахарид.Deletion or functional inactivation of SpoOA, SigE and/or SigF impairs the ability of the Bacillus cell to form spores. Such a non-sporulating Bacillus cell can be used as a precursor to form a Bacillus cell that is capable of producing sialylated oligosaccharide.
Клетки Bacillus дикого типа как не синтезируют лактозу внутриклеточно, так и не поглощают экзогенную лактозу. Однако, лактоза представляет собой субстрат-акцептор для группировки сиаловой кислоты посредством сиалилтрансферазы, акцептирующей лактозу, в образовании некоторых сиалированных олигосахаридов, таких как 3'-сиалилактоза (3-SL) или 6'-сиалилактоза (3-SL). Следовательно, для того, чтобы иметь способность продуцировать такие сиалированные олигосахариды, клетка Bacillus должна обладать способностью предоставления лактозы сиалилтрансферазе, акцептирующей лактозу, или посредством образования лактозы внутриклеточно и/или посредством поглощения лактозы извне. Корме того, лактоза обычно представляет собой дисахаридную группировку, которую несет большая часть, если не все, сиалированных ОГМ. Следовательно, поглощение лактозы также требуется для биосинтеза сиалированных ОГМ, отличных от трисахаридов, а именно, когда субстрат-акцептор для группировки NeuNAc представляет собой олигосахарид, а не дисахарид лактозу.Wild-type Bacillus cells neither synthesize lactose intracellularly nor absorb exogenous lactose. However, lactose is a substrate acceptor for sialic acid moiety via lactose-accepting sialyltransferase to form some sialylated oligosaccharides such as 3'-sialylactose (3-SL) or 6'-sialylactose (3-SL). Therefore, in order to have the ability to produce such sialylated oligosaccharides, the Bacillus cell must have the ability to provide lactose to lactose-accepting sialyltransferase, either by producing lactose intracellularly and/or by uptake of lactose externally. In addition, lactose is typically a disaccharide moiety that carries most, if not all, sialylated HMOs. Therefore, lactose uptake is also required for the biosynthesis of sialylated OGMs other than trisaccharides, namely when the acceptor substrate for the NeuNAc moiety is an oligosaccharide rather than the disaccharide lactose.
В одном воплощении в клетке Bacillus для продуцирования сиалированного олигосахарида имеется лактозопермеаза для поглощения экзогенной лактозы. Следовательно, клетка Bacillus может поглощать экзогенную лактозу. В качестве альтернативы, клетка Bacillus может быть генетически сконструирована для внутриклеточного синтеза лактозы из глюкозы и галактозы, таким образом, что не будет необходимым экзогенное поступление лактозы для получения сиалированного олигосахарида.In one embodiment, a lactose permease is present in the Bacillus cell to produce the sialylated oligosaccharide for the uptake of exogenous lactose. Therefore, the Bacillus cell can take up exogenous lactose. Alternatively, the Bacillus cell could be genetically engineered to synthesize lactose intracellularly from glucose and galactose such that exogenous supply of lactose would not be necessary to produce the sialylated oligosaccharide.
Термин «экзогенный» в отношении лактозы, в том виде, в котором он используется в данном документе, относится к лактозе, которая не происходит из клетки Bacillus для получения сиалированного олигосахарида, а именно, являясь внутриклеточно синтезированной указанной клеткой Bacillus, а которая происходит вне указанной клетки Bacillus, и которую добавляют к культуральной среде, в которой выращивают клетку Bacillus для получения сиалированного олигосахарида.The term "exogenous" with respect to lactose, as used herein, refers to lactose that does not originate from a Bacillus cell to produce the sialylated oligosaccharide, namely, being intracellularly synthesized by said Bacillus cell, but that originates outside of that Bacillus cells, and which is added to the culture medium in which the Bacillus cell is grown to obtain the sialylated oligosaccharide.
В некоторых воплощениях клетка Bacillus генетически сконструирована для того, чтобы иметь способность поглощать экзогенную лактозу, а именно генетически сконструирована так, чтобы содержать лактозопермеазу. Таким образом, в клетке Bacillus для получения сиалированного олигосахарида имеется гетерологичная лактозопермеаза. Подходящая гетерологичная лактозопермеаза представляет собой LacY Е. coli или ее функциональный вариант.In some embodiments, the Bacillus cell is genetically engineered to have the ability to take up exogenous lactose, namely, genetically engineered to contain lactose permease. Thus, the Bacillus cell has a heterologous lactose permease to produce sialylated oligosaccharide. A suitable heterologous lactose permease is E. coli LacY or a functional variant thereof.
Термин «гетерологичный», в том виде, в котором он используется в данном документе, в отношении белков, полипептидов, ферментов и транспортеров, а также в отношении молекул нуклеиновой кислоты, нуклеотидных последовательностей и/или генов, относится к молекуле, которая не является нативной в отношении вида клетки Bacillus, которая содержит указанную молекулу. Термин «ненативный» указывает на то, что указанная молекула отсутствует в клетке-предшественнике Bacillus, встречающейся в природе или дикого типа, а именно, в клетке Bacillus того же вида, который наиболее часто встречается в природе. Таким образом, «гетерологичная последовательность» или «гетерологичная нуклеиновая кислота» или «гетерологичный полипептид», в том виде, в котором он используется в данном документе, представляет собой последовательность или нуклеиновую кислоту или пептид, которые происходят из источника, являющегося чужеродным в отношении клетки Bacillus (например, из другого вида), или, если из того же источника, модифицированы по сравнению со своей исходной формой. Гетерологичная последовательность может быть стабильно введена, например, посредством трансфекции, трансформации, конъюгации или трансдукции, в геном микробной клетки-хозяина, таким образом, представляя генетически сконструированную клетку-хозяина. Можно применять методики, которые будут зависеть от клетки-хозяина, в которую должна быть введена последовательность. Разные методики известны специалисту в данной области, и например, раскрыты в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). Соответственно, «гетерологичный полипептид» представляет собой полипептид, который в природе не встречается в клетке, и «гетерологичная сиалилтрансфераза» представляет собой сиалилтрансферазу, которая не встречается в природе в микробной клетке.The term "heterologous", as used herein, in relation to proteins, polypeptides, enzymes and transporters, as well as in relation to nucleic acid molecules, nucleotide sequences and/or genes, refers to a molecule that is not native in relation to the type of Bacillus cell that contains the specified molecule. The term "non-native" indicates that the molecule is not present in a naturally occurring or wild-type Bacillus progenitor cell, namely a Bacillus cell of the same species that is most commonly found in nature. Thus, a “heterologous sequence” or “heterologous nucleic acid” or “heterologous polypeptide”, as used herein, is a sequence or nucleic acid or peptide that is derived from a source that is foreign to the cell Bacillus (eg from another species), or, if from the same source, modified from its original form. The heterologous sequence can be stably introduced, for example, by transfection, transformation, conjugation or transduction, into the genome of a microbial host cell, thereby representing a genetically engineered host cell. Techniques may be used that will depend on the host cell into which the sequence is to be introduced. Various techniques are known to one skilled in the art and, for example, are disclosed in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). Accordingly, a “heterologous polypeptide” is a polypeptide that does not naturally occur in a cell, and a “heterologous sialyltransferase” is a sialyltransferase that does not naturally occur in a microbial cell.
Термин «функциональный вариант», в том виде, в котором он используется в данном документе, в отношении ферментов и/или транспортных молекул, относится к белкам или полипептидам, обладающим такой же активностью (ферментативной, каталитической или транслоцирующей), что и референный фермент или молекула-транспортер, но который имеет аминокислотную последовательность, отличную от аминокислотной последовательности референсной молекулы фермента или транспортера. Таким образом, типичный вариант белка/полипептида отличается по аминокислотной последовательности от референсного белка/полипептида. Вариант и референсный белок/полипептид может отличаться по аминокислотной последовательности одной или более заменами, присоединениями и/или делециями в любой комбинации. Следовательно, термин «функциональный вариант» включает усеченные версии референсного белка/полипептида, которые обладают такой же активностью, как и референсный белок/полипептид. Замещенный или вставленный аминокислотный остаток может представлять собой или может не представлять собой аминокислотный остаток, кодируемый генетическим кодом. Вариант белка/полипептида может представлять собой встречающийся в природе, как например, аллельный вариант, или он может представлять собой вариант, который не известно, чтобы встречался в природе. Варианты белков/полипептидов, не встречающиеся в природе, могут быть созданы посредством методик мутагенеза, посредством прямого синтеза и посредством других методов генной инженерии, известных специалистам в данной области. В пределах объема настоящего раскрытия в термин «вариант» также включены белки и межвидовые гомологи, которые имеют аминокислотную последовательность, которая обладает более чем примерно 60%-ной идентичностью аминокислотных последовательностей, предпочтительно 65%-ной, 70%-ной, 75%-ной, 80%-ной, 85%-ной, 90%-ной, более предпочтительно 91%-ной, 92%-ной, 93%-ной, 94%-ной, 95%-ной, 96%-ной, 97%-ной, 98%-ной или 99%-ной или большей идентичностью аминокислотных последовательностей, предпочтительно, на протяжении области из по меньшей мере примерно 25, 50, 100, 200, 500, 1000 или более аминокислот, с референсным полипептидом.The term "functional variant", as used herein, in relation to enzymes and/or transport molecules, refers to proteins or polypeptides having the same activity (enzymatic, catalytic or translocation) as the reference enzyme or transporter molecule, but which has an amino acid sequence different from the amino acid sequence of the reference enzyme or transporter molecule. Thus, a typical protein/polypeptide variant differs in amino acid sequence from the reference protein/polypeptide. The variant and reference protein/polypeptide may differ in amino acid sequence by one or more substitutions, additions and/or deletions in any combination. Therefore, the term "functional variant" includes truncated versions of the reference protein/polypeptide that have the same activity as the reference protein/polypeptide. The substituted or inserted amino acid residue may or may not be an amino acid residue encoded by the genetic code. The protein/polypeptide variant may be a naturally occurring variant, such as an allelic variant, or it may be a variant that is not known to occur in nature. Variants of proteins/polypeptides not found in nature can be created through mutagenesis techniques, through direct synthesis, and through other genetic engineering techniques known to those skilled in the art. Within the scope of the present disclosure, the term "variant" also includes proteins and interspecies homologs that have an amino acid sequence that has greater than about 60% amino acid sequence identity, preferably 65%, 70%, 75% , 80%, 85%, 90%, more preferably 91%, 92%, 93%, 94%, 95%, 96%, 97% -th, 98% or 99% or greater amino acid sequence identity, preferably over a region of at least about 25, 50, 100, 200, 500, 1000 or more amino acids, with the reference polypeptide.
Термин «такая же активность», в том виде, в котором он используется в данном документе, относится к ферментативной, каталитической активности или активности транспортировки белка/полипептида лишь с точки зрения качества. Следовательно, «функциональный вариант» также включает варианты, которые обладают повышенной или пониженной активностью, по сравнению с активностью референсного белка/полипептида.The term “same activity”, as used herein, refers to the enzymatic, catalytic or transport activity of a protein/polypeptide only from a quality standpoint. Therefore, a “functional variant” also includes variants that have increased or decreased activity compared to the activity of the reference protein/polypeptide.
В разных воплощениях клетка Bacillus генетически сконструирована так, что содержит и экспрессирует нуклеотидную последовательность, которая кодирует лактозопермеазу, предпочтительно нуклеотидную последовательность, которая кодирует лактозопермеазу LacY E.coli (UniProtKB- Р02920) или ее функциональный вариант.In various embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a lactose permease, preferably a nucleotide sequence that encodes E. coli LacY lactose permease (UniProtKB-P02920) or a functional variant thereof.
Лактозопермеаза LacY Е. coli кодируется областью, кодирующей белок (а именно, открытая рамка считывания) гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1).E. coli LacY lactose permease is encoded by the protein coding region (namely, open reading frame) of the E. coli lacY gene (Gen Bank accession number: NP_414877.1).
Следовательно, в некоторых воплощениях клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, кодирующую область, кодирующую белок LacY Е. coli.Therefore, in some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence encoding a region encoding the E. coli LacY protein.
В некоторых воплощениях частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную лактозопермеазу, приспособлена к частоте использования кодона Bacillus. Частота использования кодона В. subtilis, например, необычна тем, что суммарное содержание GC ниже примерно 45%, содержание GC первой буквы данных кодонов выше примерно 51%, содержание CG второй буквы данных кодонов ниже примерно 36,1% и содержание CG третьей буквы данных кодонов ниже примерно 46%.In some embodiments, the codon usage frequency of the nucleotide sequence encoding the heterologous lactose permease is adjusted to the codon usage frequency of Bacillus. The codon usage frequency of B. subtilis, for example, is unusual in that the total GC content is below about 45%, the GC content of the first letter of these codons is above about 51%, the CG content of the second letter of these codons is below about 36.1%, and the CG content of the third letter of data codons below approximately 46%.
Для экспрессии лактозопермеазы клетка Bacillus содержит рекомбинантный ген лактозопермеазы, где нуклеотидная последовательность, которая кодирует лактозопермеазу, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию нуклеотидной последовательности, кодирующей лактозопермеазу.For expression of lactose permease, the Bacillus cell contains a recombinant lactose permease gene, wherein a nucleotide sequence that encodes lactose permease is operably linked to expression control sequences that mediate expression of the nucleotide sequence encoding lactose permease.
Термин «функционально связанный», в том виде, в котором он используется в данном документе, будет означать функциональную связь между нуклеотидной последовательностью, которая кодирует полипептид или белок (обычно называемой «областью, кодирующей белок», «открытой рамкой считывания» и иногда даже «геном») и второй нуклеотидной последовательностью (последовательностью контроля экспрессии, такой как промотор, сигнальная последовательность или ряд сайтов связывания транскрипционных факторов), которая влияет на транскрипцию и/или трансляцию нуклеотидной последовательности, которая кодирует полипептид или белок. Соответственно, термин «промотор» обозначает последовательности дезоксирибонуклеиновой кислоты (ДНК), которые обычно «предшествуют» открытой рамке считывания в ДНК-полимере и обеспечивают сайт инициации транскрипции в мРНК. «Регуляторные» последовательности ДНК, также обычно расположенные «выше» (то есть, предшествуя) открытой рамки считывания в данном ДНК-полимере, связывают белки, которые определяют частоту (или скорость) инициации транскрипции. В совокупности называемые «промоторной/регуляторной» или «контрольной» ДНК-последовательностью, данные последовательности, которые предшествуют выбранной открытой рамке считывания (или серии открытых рамок считывания) в функциональном ДНК-полимере способствуют определению того, будет ли происходить транскрипция (и в конечном итоге экспрессия) открытой рамки считывания. Последовательности ДНК, которые «следуют за» геном в ДНК-полимере и обеспечивают сигнал для терминации транскрипции в мРНК, называются последовательностями, «терминирующими» транскрипцию.The term "operably linked", as used herein, will mean a functional relationship between a nucleotide sequence that encodes a polypeptide or protein (commonly referred to as a "protein coding region", "open reading frame" and sometimes even " genome") and a second nucleotide sequence (an expression control sequence such as a promoter, a signal sequence, or a series of transcription factor binding sites) that influences the transcription and/or translation of the nucleotide sequence that encodes the polypeptide or protein. Accordingly, the term “promoter” refers to the deoxyribonucleic acid (DNA) sequences that typically “precede” the open reading frame in the DNA polymer and provide the transcription initiation site in the mRNA. "Regulatory" DNA sequences, also usually located "upstream" (that is, preceding) the open reading frame in a given DNA polymer, bind proteins that determine the frequency (or rate) of transcription initiation. Collectively referred to as a "promoter/regulator" or "control" DNA sequence, the sequence data that precedes a selected open reading frame (or series of open reading frames) in a functional DNA polymer helps determine whether transcription will occur (and ultimately expression) open reading frame. DNA sequences that “follow” a gene in a DNA polymer and provide a signal to terminate transcription in mRNA are called transcription termination sequences.
Рекомбинантный ген лактозопермеазы может находиться, будучи интегрированным в хромосому Bacillus, или присутствовать в виде эписомальной версии на дополнительной плазмиде в клетке Bacillus.The recombinant lactose permease gene may be integrated into the Bacillus chromosome or present as an episomal version on an additional plasmid in the Bacillus cell.
Экспрессия гетерологичного гена лактозопермеазы в клетке Bacillus позволяет полученной клетке Bacillus поглощать извне поставляемую лактозу из культуральной среды. Поглощенная лактоза может затем служить субстратом-акцептором для группировки сиаловой кислоты, подлежащей переносу сиалилтрансферазой, акцептирующей лактозу (см. ниже в данном документе), например, в образовании 3'-SL или 6'-SL.Expression of a heterologous lactose permease gene in a Bacillus cell allows the resulting Bacillus cell to take up externally supplied lactose from the culture medium. The absorbed lactose can then serve as an acceptor substrate for a sialic acid moiety to be transferred by lactose-accepting sialyltransferase (see later herein), for example, to form a 3'-SL or 6'-SL.
Для получения сиалированного олигосахарида Bacillus должна иметь способность предоставлять субстрат-донор для переноса группировки NeuNAc на субстрат-акцептор. Типичным субстратом-донором для группировки NeuNAc является CMP-NeuNAc. Следовательно, клетка Bacillus должна уметь внутриклеточно продуцировать CMP-NeuNAc для продукции сиалированных олигосахаридов. В случае внутриклеточного биосинтеза CMP-NeuNAc в клетке Bacillus имеется путь биосинтеза CMP-NeuNAc (Фиг. 1). Таким образом, клетка Bacillus генетически сконструирована так, чтобы иметь путь биосинтеза CMP-NeuNAc.To produce a sialylated oligosaccharide, Bacillus must be able to provide a donor substrate for the transfer of the NeuNAc moiety to the acceptor substrate. A typical donor substrate for the NeuNAc moiety is CMP-NeuNAc. Therefore, the Bacillus cell must be able to produce CMP-NeuNAc intracellularly to produce sialylated oligosaccharides. In the case of intracellular biosynthesis of CMP-NeuNAc, the Bacillus cell has a CMP-NeuNAc biosynthesis pathway (Figure 1). Thus, the Bacillus cell is genetically engineered to have the CMP-NeuNAc biosynthetic pathway.
Путь биосинтеза CMP-NeuNAc включает путь утилизации NeuNAc или путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза de novo NeuNAc. Следовательно, в клетке Bacillus имеется путь биосинтеза CMP-NeuNAc, включающий путь утилизации NeuNAc и/или путь биосинтеза сиаловой кислоты.The CMP-NeuNAc biosynthesis pathway includes the NeuNAc recycling pathway or the sialic acid biosynthesis pathway for de novo intracellular biosynthesis of NeuNAc. Therefore, the Bacillus cell has a CMP-NeuNAc biosynthesis pathway, including a NeuNAc utilization pathway and/or a sialic acid biosynthesis pathway.
Путь утилизации NeuNAc включает поглощение экзогенной сиаловой кислоты клеткой Bacillus и превращение поглощенной сиаловой кислоты в CMP-NeuNAc. Для поглощения экзогенной NeuNAc в клетке Bacillus имеется транспортер сиаловой кислоты. В некоторых воплощениях генетически сконструированная клетка Bacillus генетически сконструирована таким образом, чтобы имелся транспорт сиаловой кислоты для поглощения экзогенной NeuNAc. Подходящий транспортер сиаловой кислоты представляет собой NanT Е. coli (UniProtKB Р41036). NanT Е. coli катализирует протон-зависимый симпорт сиаловой кислоты. NanT может транспортировать NeuNAc, а также родственные сиаловые кислоты N-гликолилнейраминовую кислоту (NeuNGc) и 3-кето-3-дезокси-D-глицеро-D-галактононовую кислоту (KDN). В одном воплощении в генетически сконструированной клетке Bacillus имеется NanT Е. coli или его функциональный вариант.The NeuNAc utilization pathway involves the uptake of exogenous sialic acid by the Bacillus cell and the conversion of the ingested sialic acid to CMP-NeuNAc. For the uptake of exogenous NeuNAc, the Bacillus cell has a sialic acid transporter. In some embodiments, the genetically engineered Bacillus cell is genetically engineered to have sialic acid transport to take up exogenous NeuNAc. A suitable sialic acid transporter is E. coli NanT (UniProtKB P41036). E. coli NanT catalyzes the proton-dependent symport of sialic acid. NanT can transport NeuNAc as well as the related sialic acids N-glycolylneuraminic acid (NeuNGc) and 3-keto-3-deoxy-D-glycero-D-galactonic acid (KDN). In one embodiment, the genetically engineered Bacillus cell contains E. coli NanT or a functional variant thereof.
В некоторых воплощениях клетка Bacillus генетически сконструирована таким образом, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует транспортер сиаловой кислоты для поглощения экзогенной NeuNAc, предпочтительно, нуклеотидную последовательность, которая кодирует NanT Е. coli или его функциональный вариант.In some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a sialic acid transporter for uptake of exogenous NeuNAc, preferably a nucleotide sequence that encodes E. coli NanT or a functional variant thereof.
NanT Е. coli кодируется белок-кодирующей областью гена папТ Е. coli. Следовательно, в некоторых воплощениях клетка Bacillus генетически сконструирована таким образом, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует транспортер сиаловой кислоты NanT Е. coli или его функциональный вариант.E. coli NanT is encoded by the protein-coding region of the E. coli naT gene. Therefore, in some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes the E. coli NanT sialic acid transporter or a functional variant thereof.
Для экспрессии транспортера сиаловой кислоты клетка Bacillus содержит рекомбинантный ген транспортера сиаловой кислоты, где нуклеотидная последовательность, которая кодирует транспортер сиаловой кислоты, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию нуклеотидной последовательности, кодирующей транспортер сиаловой кислоты.For expression of the sialic acid transporter, the Bacillus cell contains a recombinant sialic acid transporter gene, wherein a nucleotide sequence that encodes the sialic acid transporter is operably linked to expression control sequences that mediate expression of the nucleotide sequence encoding the sialic acid transporter.
Рекомбинантный ген транспортера сиаловой кислоты может присутствовать, будучи интегрированным в хромосому Bacillus, или присутствовать в виде эписомальной версии на дополнительной плазмиде в клетке Bacillus.The recombinant sialic acid transporter gene may be present integrated into the Bacillus chromosome, or present as an episomal version on an additional plasmid in the Bacillus cell.
В одном из воплощений частота использования кодона нуклеотидной последовательности, кодирующей транспортер сиаловой кислоты, адаптирована к частоте использования кодона Bacillus.In one embodiment, the codon frequency of the nucleotide sequence encoding the sialic acid transporter is adapted to the codon frequency of Bacillus.
В разных воплощениях путь биосинтеза CMP-NeuNAc включает путь биосинтеза сиаловой кислоты. Таким образом, в клетке Bacillus может иметься путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты. Путь биосинтеза сиаловой кислоты включает ферментативные активности глутамин:фруктозо-6-фосфатаминотрансферазы (Фиг. 1: ) и синтазы N-ацетилнейраминовой кислоты (тоже самое, что синтаза сиаловой кислоты) (Фиг. 1: ). Следовательно, в клетке Bacillus для получения сиалированного олигосахарида есть глутамин:фруктозо-6-фосфатаминотрансфераза и синтаза N-ацетилнейраминовой кислоты.In various embodiments, the CMP-NeuNAc biosynthetic pathway includes the sialic acid biosynthetic pathway. Thus, the Bacillus cell may have a sialic acid biosynthetic pathway for the intracellular biosynthesis of N-acetylneuraminic acid. The sialic acid biosynthetic pathway involves the enzymatic activities of glutamine:fructose-6-phosphate aminotransferase (Figure 1: ) and N-acetylneuraminic acid synthase (same as sialic acid synthase) (Figure 1: ). Therefore, the Bacillus cell requires glutamine:fructose-6-phosphate aminotransferase and N-acetylneuraminic acid synthase to produce sialylated oligosaccharide.
Фермент глутамин:фруктозо-6-фосфатаминотрансфераза (ЕС 2.6.1.16) катализирует превращение фруктозо-6-фосфата (Frc-6P) в глюкозамин-6-фосфат (GlcN-6P) с использованием глутамина (Фиг. 1: ). Обычно считается, что данная ферментативная реакция является первой стадией пути биосинтеза гексозамина. Альтернативными названиями глутамин:фруктозо-6-фосфатаминотрансферазы являются D-фруктозо-6-фосфатаминотрансфераза, GFAT, глюкозамин-6-фосфатсинтаза, гексозофосфатаминотрансфераза и L-глутамин-D-фруктозо-6-фосфатаминотрансфераза.The enzyme glutamine:fructose-6-phosphate aminotransferase (EC 2.6.1.16) catalyzes the conversion of fructose-6-phosphate (Frc-6P) to glucosamine-6-phosphate (GlcN-6P) using glutamine (Figure 1: ). This enzymatic reaction is generally believed to be the first step in the hexosamine biosynthetic pathway. Alternative names for glutamine:fructose-6-phosphate aminotransferase are D-fructose-6-phosphate aminotransferase, GFAT, glucosamine-6-phosphate synthase, hexosephosphate aminotransferase, and L-glutamine-D-fructose-6-phosphate aminotransferase.
В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется глутамин:фруктозо-6-фосфатаминотрансфераза, предпочтительно, гетерологичная глутамин:фруктозо-6-фосфатаминотрансфераза. Пример подходящей гетерологичной глутамин:фруктозо-6-фосфатаминотрансферазы происходит из Е. coli. Глутамин:фруктозо-6-фосфатаминотрансфераза Е. coli (UniProtKB - Р17169) обозначается GlmS. Следовательно, в клетке Bacillus имеется GlmS Е. coli или функциональный вариант GlmS Е. coli. Предпочтительно, функциональный вариант GlmS Е. coli представляет собой версию, которая демонстрирует значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата, по сравнению с ферментом дикого типа. Пример функционального варианта GlmS Е. coli, который демонстрирует значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата. Примеры функциональных вариантов GlmS Е. coli, которые демонстрируют значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата, представляют собой GlmS*54 и GlmS*, как описано в международной заявке №РСТ/ЕР2019/063669 (включена в данный документ посредством ссылки).In an additional and/or alternative embodiment, the genetically engineered Bacillus cell contains a glutamine:fructose-6-phosphate aminotransferase, preferably a heterologous glutamine:fructose-6-phosphate aminotransferase. An example of a suitable heterologous glutamine:fructose-6-phosphate aminotransferase comes from E. coli. Glutamine: fructose-6-phosphate aminotransferase from E. coli (UniProtKB - P17169) is designated GlmS. Therefore, the Bacillus cell contains E. coli GlmS or a functional variant of E. coli GlmS. Preferably, the functional E. coli GlmS variant is a version that exhibits significantly reduced sensitivity to glucosamine 6-phosphate inhibition compared to the wild type enzyme. An example of a functional E. coli GlmS variant that exhibits significantly reduced sensitivity to glucosamine 6-phosphate inhibition. Examples of E. coli GlmS functional variants that exhibit significantly reduced sensitivity to glucosamine-6-phosphate inhibition are GlmS*54 and GlmS*, as described in International Application No. PCT/EP2019/063669 (incorporated herein by reference).
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует глутамин:фуктозо-6-фосфатаминотрансферазу, предпочтительно глутамин:фруктозо-6-фосфатаминотрансферазу GlmS Е. coli, или нуклеотидную последовательность, кодирующую функциональный вариант GlmS Е. coli, который демонстрировал значимо пониженную чувствительность в отношении ингибирования глюкозамин-6-фосфата, по сравнению с ферментом дикого типа.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence that encodes a glutamine:fuctose-6-phosphate aminotransferase, preferably a glutamine:fructose-6-phosphate aminotransferase E. coli GlmS, or a nucleotide sequence encoding a functional variant E. coli GlmS, which showed significantly reduced sensitivity for glucosamine-6-phosphate inhibition compared to the wild-type enzyme.
Для экспрессии глутамин:фруктозо-6-фосфатаминотрансферазы клетка Bacillus содержит рекомбинантный ген глутамин:фруктозо-6-фосфатаминотрансферазы, где нуклеотидная последовательность, которая кодирует глутамин:фруктозо-6-фосфатаминотрансферазу, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию открытой рамки считывания глутамин:фруктозо-6-фосфатаминотрансферазы.For expression of glutamine:fructose-6-phosphate aminotransferase, the Bacillus cell contains a recombinant glutamine:fructose-6-phosphate aminotransferase gene, where the nucleotide sequence that encodes the glutamine:fructose-6-phosphate aminotransferase is operably linked to expression control sequences that mediate expression of the glutamine open reading frame : fructose-6-phosphate aminotransferase.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глутамин:фруктозо-6-фосфатаминотрансферазу, адаптирована до частоты использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glutamine:fructose-6-phosphate aminotransferase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген глутамин:фуктозо-6-фосфатаминотрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glutamine:fuctose-6-phosphate aminotransferase gene can be integrated into the Bacillus chromosome or carried as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтазу сиаловой кислоты. Синтаза сиаловой кислоты катализирует конденсацию N-ацетилманнозамина (ManNAc) и фосфоенолпирувата (ФЕП) с N-ацетилнейраминовой кислотой (NeuNAc) (Фиг. 1: ). Ферментативное образование NeuNAc представляет собой последнюю стадию пути биосинтеза сиаловой кислоты.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains sialic acid synthase. Sialic acid synthase catalyzes the condensation of N-acetylmannosamine (ManNAc) and phosphoenolpyruvate (PEP) with N-acetylneuraminic acid (NeuNAc) (Figure 1: ). The enzymatic formation of NeuNAc represents the last step in the sialic acid biosynthetic pathway.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтазу сиаловой кислоты или ее функциональный вариант, предпочтительно гетерологичную синтазу сиаловой кислоты. Примеры синтаз сиаловой кислоты известны из множества видов бактерий, таких как Campylobacter jejuni, Streptococcus agalactiae, Butyrivibrio proteoclasticus, Methanobrevibacter ruminatium, Acetobacterium woodii, Desulfobacula toluolica, Escherichia coli, Prevotella nigescens, Halorhabdus tiamatea, Desulfotignum phosphitoxidans или Candidatus Scalindua sp., Idomarina loihiensis, Fusobacterium nucleatum или Neisseria meningitidis. Примером подходящей синтазы сиаловой кислоты является синтаза N-ацетилнейраминовой кислоты NeuB С.jejuni, как кодируется геном пеиВ С.jejuni.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a sialic acid synthase or a functional variant thereof, preferably a heterologous sialic acid synthase. Examples of sialic acid synthases are known from many bacterial species, such as Campylobacter jejuni, Streptococcus agalactiae, Butyrivibrio proteoclasticus, Methanobrevibacter ruminatium, Acetobacterium woodii, Desulfobacula toluolica, Escherichia coli, Prevotella nigescens, Halorhabdus tiamatea, Desulfotignum phosphitoxidans or Candidatus Scalindua sp., Idomarina loihiensis, Fusobacterium nucleatum or Neisseria meningitidis. An example of a suitable sialic acid synthase is the C. jejuni N-acetylneuraminic acid synthase NeuB, as encoded by the C. jejuni neuB gene.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует синтазу N-ацетилнейраминовой кислоты. Следовательно, нуклеотидная последовательность, которая кодирует синтазу N-ацетилнейраминовой кислоты, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует синтазу N-ацетилнейраминовой кислоты в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности синтазы N-ацетилнейраминовой кислоты.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes N-acetylneuraminic acid synthase. Therefore, a nucleotide sequence that encodes N-acetylneuraminic acid synthase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylneuraminic acid synthase in a genetically engineered Bacillus cell with ensuring intracellular activity of N-acetylneuraminic acid synthase.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную синтазу N-ацетилнейраминовой кислоты, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylneuraminic acid synthase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген синтазы N-ацетилнейраминовой кислоты может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylneuraminic acid synthase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В одном воплощении путь биосинтеза сиаловой кислоты включает уридиндифосфат-N-ацетилглюкозамин (УДФ-GlcNAc) в качестве промежуточного соединения. В клетке Bacillus, имеющей путь биосинтеза сиаловой кислоты, который включает УДФ-GlcNAc в качестве промежуточного соединения, дополнительно имеется фосфоглюкозаминмутаза (Фиг. 1: ), глюкозамин-1-фосфат N-ацетилтрансфераза (Фиг. 1: ), N-ацетилглюкозамин-1-фосфатуридилтрансфераза (Фиг. 1 ) и УДФ-N-ацетилглюкозамин 2-эпимераза (Фиг. 1: ).In one embodiment, the sialic acid biosynthetic pathway includes uridine diphosphate-N-acetylglucosamine (UDP-GlcNAc) as an intermediate. The Bacillus cell, which has a sialic acid biosynthetic pathway that includes UDP-GlcNAc as an intermediate, additionally contains phosphoglucosamine mutase (Figure 1: ), glucosamine-1-phosphate N-acetyltransferase (Fig. 1: ), N-acetylglucosamine-1-phosphate uridyl transferase (Fig. 1 ) and UDP-N-acetylglucosamine 2-epimerase (Fig. 1: ).
Фосфоглюкозаминмутаза превращает глюкозамин-6-фосфат (GlcN-6P) в глюкозамин-1-фосфат (GlcN-1 Р).Phosphoglucosamine mutase converts glucosamine 6-phosphate (GlcN-6P) to glucosamine 1-phosphate (GlcN-1 P).
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована таким образом, чтобы содержать фосфоглюкозаминмутазу. Подходящая фосфоглюкозаминмутаза представляет собой фосфоглюкозаминмутазу GlmM Е. coli или ее функциональный вариант.Указанная GlmM Е. coli кодируется геном glmM Е. coli.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to contain phosphoglucosamine mutase. A suitable phosphoglucosamine mutase is E. coli phosphoglucosamine mutase GlmM or a functional variant thereof. Said E. coli GlmM is encoded by the E. coli glmM gene.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы в ней содержалась и экспрессировалась нуклеотидная последовательность, которая кодирует фосфоглюкозаминмутазу, предпочтительно, нуклеотидная последовательность, которая кодирует GlmM Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a phosphoglucosamine mutase, preferably a nucleotide sequence that encodes E. coli GlmM or a functional variant thereof.
Фосфоглюкозаминмутаза GlmM Е. coli кодируется белок-кодирующей областью гена glmM Е. coli. Следовательно, клетка Bacillus генетически сконструирована для содержания и экспрессии нуклеотидной последовательности, которая кодирует GlmM Е. coli.E. coli phosphoglucosamine mutase GlmM is encoded by the protein-coding region of the E. coli glmM gene. Therefore, the Bacillus cell is genetically engineered to contain and express the nucleotide sequence that encodes E. coli GlmM.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует фосфоглюкозаминмутазу. Следовательно, нуклеотидная последовательность, которая кодирует фосфоглюкозаминмутазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует фосфоглюкозаминмутазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности фосфоглюкозаминмутазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes a phosphoglucosamine mutase. Therefore, a nucleotide sequence that encodes a phosphoglucosamine mutase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of the nucleotide sequence that encodes a phosphoglucosamine mutase in a genetically engineered Bacillus cell to provide intracellular phosphoglucosamine mutase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную фосфоглюкозаминмутазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous phosphoglucosamine mutase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген фосфоглюкозаминмутазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant phosphoglucosamine mutase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
Глюкозамин-1-фосфат-N-ацетилтрансфераза катализирует перенос ацетильной группы с ацетил-коэнзима А на глюкозамин-1-фосфат (GlcN-1-P) с получением N-ацетилглюкозамин-1-фосфата (GlcNAc-1-P).Glucosamine-1-phosphate-N-acetyltransferase catalyzes the transfer of an acetyl group from acetyl-coenzyme A to glucosamine-1-phosphate (GlcN-1-P) to produce N-acetylglucosamine-1-phosphate (GlcNAc-1-P).
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать глюкозамин-1-фосфат-N-ацетилтрансферазу.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to contain glucosamine 1-phosphate N-acetyltransferase.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes glucosamine 1-phosphate N-acetyltransferase.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу. Следовательно, нуклеотидная последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности глюкозамин-1-фосфат-N-ацетилтрансферазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes glucosamine-1-phosphate-N-acetyltransferase. Therefore, a nucleotide sequence that encodes glucosamine-1-phosphate-N-acetyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes glucosamine-1-phosphate-N -acetyltransferase in a genetically engineered Bacillus cell to provide intracellular glucosamine-1-phosphate-N-acetyltransferase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глюкозамин-1-фосфат-N-ацетилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glucosamine-1-phosphate-N-acetyltransferase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген глюкозамин-1-фосфат-N-ацетилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glucosamine-1-phosphate-N-acetyltransferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
N-ацетилглюкозамин-1-фосфатуридилтрансфераза превращает N-ацетилглюкозамин-1-фосфат (GlcNAc-1-P) в УДФ-GlcNAc посредством переноса уридин-5-монофосфата (с уридин 5-трифосфата).N-acetylglucosamine-1-phosphate uridyltransferase converts N-acetylglucosamine-1-phosphate (GlcNAc-1-P) to UDP-GlcNAc by transferring uridine 5-monophosphate (from uridine 5-triphosphate).
В дополнительном и/или альтернативном воплощении клетка генетически сконструирована для того, чтобы иметь N-ацетилглюкозамин-1-фосфатуридилтрансферазу.In a further and/or alternative embodiment, the cell is genetically engineered to have N-acetylglucosamine-1-phosphate uridyl transferase.
В дополнительном и/или альтернативном воплощении клетка генетически сконструирована для того, чтобы содержать или экспрессировать нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу.In a further and/or alternative embodiment, the cell is genetically engineered to contain or express a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyl transferase.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyl transferase.
Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-1-фосфатуридилтрансферазы.Therefore, a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyltransferase in genetically engineered Bacillus cell to ensure intracellular activity of N-acetylglucosamine-1-phosphate uridyl transferase.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-1-фосфатуридилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-1-phosphate uridyl transferase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген N-ацетилглюкозамин-1-фосфатуридилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-1-phosphate uridyl transferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении глюкозамин-1-фосфат-N-ацетилтрансферазная активность и N-ацетилглюкозамин-1-фосфатуридилтрансферазная активность обеспечиваются бифункциональным ферментом. Примером таких бифункциональных ферментов является GlmU Е. coli. GlmU Е. coli катализирует по меньшей мере две последовательные реакции, которые превращают глюкозамин-1-фосфат в УДФ-GlcNAc (Фиг. 1: ). С-концевой домен катализирует перенос ацетильной группы с ацетил-коэнзима А на глюкозамин-1-фосфат (GlcN-1-P) с получением N-ацетилглюкозамин-1-фосфата (GlcNAc-1-P), который превращается в УДФ-GlcNAc посредством переноса уридин-5-монофосфата (с уридин 5-трифосфата), реакция, катализируемая N-концевым доменом.In an additional and/or alternative embodiment, the glucosamine-1-phosphate N-acetyltransferase activity and N-acetylglucosamine-1-phosphate uridyltransferase activity are provided by a bifunctional enzyme. An example of such bifunctional enzymes is E. coli GlmU. E. coli GlmU catalyzes at least two sequential reactions that convert glucosamine 1-phosphate to UDP-GlcNAc (Figure 1: ). The C-terminal domain catalyzes the transfer of an acetyl group from acetyl-coenzyme A to glucosamine-1-phosphate (GlcN-1-P) to produce N-acetylglucosamine-1-phosphate (GlcNAc-1-P), which is converted to UDP-GlcNAc by transfer of uridine 5-monophosphate (from uridine 5-triphosphate), a reaction catalyzed by the N-terminal domain.
Такой бифункциональный фермент также известен из Bacillus subtilis и Haemophilus influenzae.Such a bifunctional enzyme is also known from Bacillus subtilis and Haemophilus influenzae.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь гетерологичную бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу. Подходящим примером является GlmU Е. coli или ее функциональный вариант (включая GlmU Н. influenzae). Указанная GlmU Е. coli кодируется геном glmU Е. coli.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to have a heterologous bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate uridyltransferase. A suitable example is E. coli GlmU or a functional variant thereof (including H. influenzae GlmU). Said E. coli GlmU is encoded by the E. coli glmU gene.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать или сверхэкспрессировать нуклеотидную последовательность, которая кодирует указанный бифункциональный фермент, предпочтительно нуклеотидную последовательность, которая кодирует GlmU Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express or overexpress a nucleotide sequence that encodes said bifunctional enzyme, preferably a nucleotide sequence that encodes E. coli GlmU or a functional variant thereof.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-осфатуридилтрансферазу. Следовательно, нуклеотидная последовательность, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной глюкозамин-1-фосфат-N-ацетилтрансферазной активности и N-ацетилглюкозамин-1-фосфатуридилтрансферазной активности.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-osphaturidyltransferase. Therefore, a nucleotide sequence that encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate uridyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence, which encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase in a genetically engineered Bacillus cell to provide intracellular glucosamine-1-phosphate-N-acetyltransferase activity and N-acetylglucosamine-1-phosphate-uridyltransferase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген бифункциональной глюкозамин-1-фосфат-N-ацетилтрансферазы/N-ацетилглюкозамин-1-фосфатуридилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении путь биосинтеза сиаловой кислоты включает превращение УДФ-GlcNAc в N-ацетилманнозамин (ManNAc). Данное превращение может быть катализировано УДФ-N-ацетилглюкозамин-2-эимеазой, которая не только превращает УДФ-N-ацетилглюкозамин в УДФ-N-ацетилманнозамин, но одновременно высвобождает УДФ (Фиг. 1: ).In an additional and/or alternative embodiment, the sialic acid biosynthetic pathway involves the conversion of UDP-GlcNAc to N-acetylmannosamine (ManNAc). This conversion can be catalyzed by UDP-N-acetylglucosamine-2-eimease, which not only converts UDP-N-acetylglucosamine to UDP-N-acetylmannosamine, but simultaneously releases UDP (Figure 1: ).
Следовательно, клетка Bacillus содержит УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ.Therefore, the Bacillus cell contains UDP-N-acetylglucosamine-2-epimerase, which simultaneously releases UDP.
Подходящая УДФ-N-ацетилглюкозамин-2-эпимераза с сопутствующим высвобождением УДФ представляет собой УДФ-N-ацетилглюкозамин-2-эпимеразу NeuC Campylobacter jejuni, кодируемую геном пеиС С.jejuni.A suitable UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP is Campylobacter jejuni UDP-N-acetylglucosamine-2-epimerase NeuC, encoded by the C. jejuni neuC gene.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь УДФ-N-ацетилглюкозамин-2-эпимеразу с сопутствующим высвобождением УДФ.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to have UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ, предпочтительно чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует NeuC С, jejuni или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase that simultaneously releases UDP, preferably to contain and express a nucleotide sequence that encodes NeuC C , jejuni or a functional variant thereof.
УДФ-N-ацетилглюкозамин-2-эпимераза NeuC С.jejuni кодируется белок-кодирующей областью гена пеиС С.jejuni. Следовательно, клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует NeuC С.jejuni.C. jejuni UDP-N-acetylglucosamine-2-epimerase NeuC is encoded by the protein-coding region of the C. jejuni NeuC gene. Therefore, the Bacillus cell is genetically engineered to contain and express the nucleotide sequence that encodes C. jejuni NeuC.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу с сопутствующим высвобождением УДФ во время ее ферментативной реакции с высвобождением ManNAc. Следовательно, нуклеотидная последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует указанную УДФ-N-ацетилглюкозамин-2-эпимеразу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности УДФ-N-ацетилглюкозамин-2-эпимеразы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP during its enzymatic reaction to release ManNAc. Therefore, a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase, which simultaneously releases UDP, is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes said UDP -N-acetylglucosamine-2-epimerase in a genetically engineered Bacillus cell to provide intracellular UDP-N-acetylglucosamine-2-epimerase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную УДФ-N-ацетилглюкозамин-2-эпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous UDP-N-acetylglucosamine-2-epimerase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген УДФ-N-ацетилглюкозамин-2-эпимеразы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant UDP-N-acetylglucosamine-2-epimerase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В альтернативном воплощении в пути биосинтеза сиаловой кислоты используется N-ацетилглюкозамин-6-фосфат (GlcNAc-6-P) в качестве промежуточного соединения, но не используется УДФ-GlcNAc. В генетически сконструированной клетке Bacillus имеется путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты, в котором используется GlcNAc-6-P в качестве промежуточного соединения, имеется глюкозамин-6-фосфат-N-ацетилтрансфераза (Фиг. 1: ). В пути биосинтеза сиаловой кислоты, использующем глюкозамин-6-фосфат-N-ацетилтрансферазу для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты, не используется УДФ-GlcNAc для биосинтеза сиаловой кислоты.In an alternative embodiment, the sialic acid biosynthetic pathway uses N-acetylglucosamine-6-phosphate (GlcNAc-6-P) as an intermediate, but does not use UDP-GlcNAc. The genetically engineered Bacillus cell has a sialic acid biosynthetic pathway for the intracellular biosynthesis of N-acetylneuraminic acid, which uses GlcNAc-6-P as an intermediate, has glucosamine-6-phosphate-N-acetyltransferase (Figure 1: ). The sialic acid biosynthetic pathway, which uses glucosamine-6-phosphate-N-acetyltransferase for the intracellular biosynthesis of N-acetylneuraminic acid, does not use UDP-GlcNAc for the biosynthesis of sialic acid.
Путь биосинтеза сиаловой кислоты, использующий GlcNAc-6P, включает активности ферментов глутамин:фруктозо-6-фосфатаминотрансферазы (Фиг. 1: ) и синтазы N-ацетилнейраминовой кислоты (Фиг. 1: ). Указанный путь биосинтеза сиаловой кислоты дополнительно включает а) активности ферментов глюкозамин-6-фосфат-N-ацетилтрансферазы (Фиг. 1: ), N-ацетилглюкозамин-6-фосфатфосфатазы (Фиг. 1: ) и N-ацетилглюкозамин-2-эпимеразы (Фиг. 1: ) или b) активности ферментов глюкозамин-6-фосфат-N-ацетилтрансферазы (Фиг. 1: ), N-ацетилглюкозамин-6-фосфатэпимеразы (Фиг. 1: ) и N-ацетилманнозамин-6-фосфатфосфатазы (Фиг. 1: ). Таким образом, необязательно, чтобы генетически сконструированная клетка Bacillus обладала ферментативными активностями фосфоглюкозаминмутазы, N-ацетилглюкозамин-1-фосфатуридилтрансферазы и УДФ-N-ацетилглюкозамин 2-эпимеразы с сопутствующим высвобождением УДФ для внутриклеточного биосинтеза сиаловой кислоты. Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus, способная синтезировать сиаловую кислоту, не содержит одной или более активностей ферментов, выбранных из группы, состоящей из активностей ферментов фосфоглюкозаминмутазы, N-ацетилглюкозамин-1-фосфатуридилтрансферазы и УДФ N-ацетилглюкозамин-2-эпимеразы с сопутствующим высвобождением УДФ.The sialic acid biosynthetic pathway using GlcNAc-6P involves the activities of glutamine:fructose-6-phosphate aminotransferase enzymes (Figure 1: ) and N-acetylneuraminic acid synthase (Fig. 1: ). This pathway for the biosynthesis of sialic acid additionally includes a) the activity of the enzymes glucosamine-6-phosphate-N-acetyltransferase (Fig. 1: ), N-acetylglucosamine-6-phosphate phosphatase (Fig. 1: ) and N-acetylglucosamine-2-epimerase (Fig. 1: ) or b) the activity of glucosamine-6-phosphate-N-acetyltransferase enzymes (Figure 1: ), N-acetylglucosamine-6-phosphate epimerase (Fig. 1: ) and N-acetylmannosamine-6-phosphate phosphatase (Fig. 1: ). Thus, it is not necessary for a genetically engineered Bacillus cell to possess the enzymatic activities of phosphoglucosamine mutase, N-acetylglucosamine-1-phosphate-uridyltransferase and UDP-N-acetylglucosamine 2-epimerase with concomitant release of UDP for intracellular sialic acid biosynthesis. Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell capable of synthesizing sialic acid does not contain one or more enzyme activities selected from the group consisting of phosphoglucosamine mutase, N-acetylglucosamine-1-phosphate uridyl transferase, and UDP N-acetylglucosamine enzyme activities -2-epimerase with concomitant release of UDP.
В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется глюкозамин-6-фосфат-N-ацетилтрансферазная активность. Указанная глюкозамин-6-фосфат-N-ацетилтрансферазная активность превращает GlcN-6P в N-ацетилглюкозамин-6-фосфат (GlcNAc-6P). Примером глюкозамин-6-фосфат-N-ацетилтрансферазы является Gna1 Saccharomyces cerevisiae (UniProtKB - P43577).In a further and/or alternative embodiment, the genetically engineered Bacillus cell has glucosamine 6-phosphate N-acetyltransferase activity. This glucosamine 6-phosphate N-acetyltransferase activity converts GlcN-6P to N-acetylglucosamine 6-phosphate (GlcNAc-6P). An example of glucosamine 6-phosphate N-acetyltransferase is Saccharomyces cerevisiae Gna1 (UniProtKB - P43577).
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит глюкозамин-6-фосфат N-ацетилтрансферазу, предпочтительно, гетерологичную глюкозамин-6-фосфат-N-ацетилтрансферазу, более предпочтительно Gna1 из S. cerevisiae или ее функциональный вариант.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains a glucosamine 6-phosphate N-acetyltransferase, preferably a heterologous glucosamine 6-phosphate N-acetyltransferase, more preferably Gna1 from S. cerevisiae or a functional variant thereof.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую глюкозамин-6-фосфат-N-ацетилтрансферазу, предпочтительно, Gna1 S. cerevisiae, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности глюкозамин-1-фосфат-N-ацетилтрансферазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding glucosamine 6-phosphate N-acetyltransferase, preferably S. cerevisiae Gna1, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence influencing the transcription and/or translation of the specified nucleotide sequence in a genetically engineered Bacillus cell to ensure intracellular glucosamine-1-phosphate-N-acetyltransferase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глюкозамин-6-фосфат-N-ацетилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glucosamine-6-phosphate-N-acetyltransferase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген глюкозамин-6-фосфат-N-ацетилтрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glucosamine-6-phosphate-N-acetyltransferase gene can be integrated into the Bacillus chromosome or carried as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется N-ацетилглюкозамин-6-фосфатфосфатазная активность. Указанная N-ацетилглюкозамин-6-фосфатфосфатазная активность превращает GlcNAc-6P в N-ацетилглюкозамин (GlcNAc). Примерами N-ацетилглюкозамин-6-фосфатфосфатазы являются сахарофосфатазы HAD-подобного суперсемейства, которые катализируют превращение GlcNAc6P в GlcNAc. HAD-подобное суперсемейство ферментов названо в честь бактериального фермента -дегидрогеназы галогенокислоты и включает фосфатазы. Подходящая фосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc6P в GlcNAc, может быть выбрана из группы, состоящей из фруктозо-1-фосфатфосфатазы (YqaB, UniProtKB - Р77475) и альфа-D-глюкозо-1-фосфатфосфатазы (YihX, UniProtKB - P0A8Y3). Считают, что ферменты YqaB Е. coli и YihX E.coli также действуют на GlcNAc6P (Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-6-phosphate phosphatase activity. This N-acetylglucosamine 6-phosphate phosphatase activity converts GlcNAc-6P to N-acetylglucosamine (GlcNAc). Examples of N-acetylglucosamine-6-phosphate phosphatases are sugar phosphatases of the HAD-like superfamily, which catalyze the conversion of GlcNAc6P to GlcNAc. The HAD-like superfamily of enzymes is named after the bacterial enzyme halide dehydrogenase and includes phosphatases. A suitable HAD-like superfamily phosphatase catalyzing the conversion of GlcNAc6P to GlcNAc may be selected from the group consisting of fructose-1-phosphate phosphatase (YqaB, UniProtKB - P77475) and alpha-D-glucose-1-phosphate phosphatase (YihX, UniProtKB - P0A8Y3) . The E. coli YqaB and E. coli YihX enzymes are also thought to act on GlcNAc6P (Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).
В дополнительном и/или альтернативном воплощении сахарофосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, представляет собой гетерологичный фермент в генетически сконструированной клетке Bacillus. В дополнительном и/или альтернативном воплощении сахарофосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc6P в GlcNAc, выбрана из группы, состоящей из YqaB Е. coli, YihX Е. coli и их функциональных вариантов.In an additional and/or alternative embodiment, the HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc is a heterologous enzyme in a genetically engineered Bacillus cell. In an additional and/or alternative embodiment, the HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc6P to GlcNAc is selected from the group consisting of E. coli YqaB, E. coli YihX, and functional variants thereof.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, которая содержит и экспрессирует нуклеотидную последовательность, кодирующую сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc. В дополнительном и/или альтернативном воплощении нуклеотидная последовательность, кодирующая сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, представляет собой гетерологичную нуклеотидную последовательность. В дополнительном и/или альтернативном воплощении нуклеотидная последовательность, кодирующая сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, кодирует YqaB Е. coli или YihX Е. coli или функциональный вариант одного или двух данных ферментов.In an additional and/or alternative embodiment, the genetically engineered Bacillus cell contains a nucleic acid molecule that contains and expresses a nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc. In an additional and/or alternative embodiment, the nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc is a heterologous nucleotide sequence. In an additional and/or alternative embodiment, the nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc encodes E. coli YqaB or E. coli YihX or a functional variant of one or two of these enzymes.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатфосфатазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate phosphatase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген N-ацетилглюкозамин-6-фосфатфосфатазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-6-phosphate phosphatase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus обладает N-ацетилглюкозамин-2-эпимеразной активностью. N-ацетилглюкозамин-2-эпимераза (ЕС 5.1.3.8) представляет собой фермент, который катализирует превращение N-ацетилглюкозамина (GlcNAc) в N-ацетилманнозамин (ManNAc). Фермент представляет собой рацемазу, оказывающую действие на углеводы и их производные. Систематическое название данного класса ферментов представляет собой N-ацил-D-глюкозамин 2-эпимеразу. Данный фермент участвует в метаболизме аминосахаров и метаболизме нуклеотидных Сахаров, предпочтительно гетерологичная N-ацетилглюкозамин 2-эпимераза.In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-2-epimerase activity. N-acetylglucosamine-2-epimerase (EC 5.1.3.8) is an enzyme that catalyzes the conversion of N-acetylglucosamine (GlcNAc) to N-acetylmannosamine (ManNAc). The enzyme is a racemase that acts on carbohydrates and their derivatives. The systematic name for this class of enzymes is N-acyl-D-glucosamine 2-epimerase. This enzyme is involved in the metabolism of amino sugars and the metabolism of nucleotide sugars, preferably heterologous N-acetylglucosamine 2-epimerase.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-2-эпимеразу, предпочтительно гетерологичную N-ацетилглюкозамин-2-эпимеразу. Примеры N-ацетилглюкозамин-2-эпимераз описаны у Anabena variabilis, Acaryochloris sp., Nostoc sp., Nostoc punctiforme, Bacteroides ovatus или Synechocystis sp.Пример подходящей N-ацетилглюкозамин 2-эпимеразы представляет собой N-цетилглюкозамин 2-эпимеразу В. ovatus АТСС 8483 (UniProtKB - A7LVG6), как кодируется геном BACOVA_01816. Еще одним примером является N-ацетилглюкозамин 2-эпимераза Synechocystis sp.(штамм РСС 6803) (UniProtKB - Р74124), которая также известна, как ренин-связывающий белок и кодируется геном slr1975.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-2-epimerase, preferably a heterologous N-acetylglucosamine-2-epimerase. Examples of N-acetylglucosamine 2-epimerases are described in Anabena variabilis, Acaryochloris sp., Nostoc sp., Nostoc punctiforme, Bacteroides ovatus or Synechocystis sp. An example of a suitable N-acetylglucosamine 2-epimerase is B. ovatus ATCC N-cetylglucosamine 2-epimerase 8483 (UniProtKB - A7LVG6), as encoded by the BACOVA_01816 gene. Another example is N-acetylglucosamine 2-epimerase from Synechocystis sp. (strain PCC 6803) (UniProtKB - P74124), which is also known as renin-binding protein and is encoded by the slr1975 gene.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин 2-эимеразу, предпочтительно, N-ацетилглюкозамин-2-эпимеразу В. ovatus АТСС 8483 или Synechocystis sp.(штамм РСС 6803) или ее функциональный вариант.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence that encodes N-acetylglucosamine 2-eimerase, preferably N-acetylglucosamine 2-epimerase of B. ovatus ATCC 8483 or Synechocystis sp. (strain PCC 6803) or a functional variant thereof.
Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилглюкозамин-2-эпимеразу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-2-эпимеразу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-2-эпимеразы.Therefore, a nucleotide sequence that encodes N-acetylglucosamine-2-epimerase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-2-epimerase in genetically engineered Bacillus cell to ensure intracellular activity of N-acetylglucosamine-2-epimerase.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-2-эпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-2-epimerase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген N-ацетилглюкозамин-2-эпимеразы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-2-epimerase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется N-ацетилглюкозамин-6-фосфатэпимеразная активность и N-ацетилманнозамин-6-фосфатфосфатазная активность. N-ацетилглюкозамин-6-фосфатэпимераза превращает N-ацетилглюкозамин-6-фосфат (GlcNAc-6P) в N-ацетилмоннозамин-6-фосфат (ManNAc-6P), тогда как N-ацетилманнозамин-6-фосфатфосфатаза дефосфорилирует ManNAc-6P с получением N-ацетилмоннозамина (ManNAc). Обладание N-ацетилглюкозамин-6-фосфатэпимеразная активность и N-ацетилглюкозамин-6-фосфатфосфатазная активность обеспечивает дополнительный или альтернативный путь для обеспечения ManNAc для продукции Neu5Ac.In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-6-phosphate epimerase activity and N-acetylmannosamine-6-phosphate phosphatase activity. N-acetylglucosamine-6-phosphate epimerase converts N-acetylglucosamine-6-phosphate (GlcNAc-6P) to N-acetylmonnosamine-6-phosphate (ManNAc-6P), whereas N-acetylmannosamine-6-phosphate phosphatase dephosphorylates ManNAc-6P to produce N -acetylmonnosamine (ManNAc). Possession of N-acetylglucosamine-6-phosphate epimerase activity and N-acetylglucosamine-6-phosphate phosphatase activity provides an additional or alternative pathway to provide ManNAc for Neu5Ac production.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-6-фосфатэпимеразу. Примером подходящей N-ацетилглюкозамин-6-фосфатэпимеразы является NanE Е. coli (UniprotKB Р0А761), как кодируется геном папЕ Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-6-phosphate epimerase. An example of a suitable N-acetylglucosamine-6-phosphate epimerase is E. coli NanE (UniprotKB P0A761), as encoded by the E. coli paPE gene.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилглюкозамин-6-фосфатэпимеразу, предпочтительно нуклеотидную последовательность, кодирующую NanE E.coli или ее функциональный вариант.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylglucosamine-6-phosphate epimerase, preferably a nucleotide sequence encoding E. coli NanE or a functional variant thereof.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилглюкозамин-6-фосфатэпимеразу, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной микробной клетке с обеспечением внутриклеточной активности N-ацетилглюкозамин-2-фосфатэпимеразы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylglucosamine-6-phosphate epimerase, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence , affecting the transcription and/or translation of the specified nucleotide sequence in a genetically engineered microbial cell to ensure the intracellular activity of N-acetylglucosamine-2-phosphate epimerase.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатэпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate epimerase is adapted to the codon frequency of Bacillus.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-6-фосфатфосфатазу, которая превращает ManNAc-6P в ManNAc.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-6-phosphate phosphatase, which converts ManNAc-6P to ManNAc.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилманнозамин-6-фосфатфосфатазу. Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилгманнозамин-6-фосфатфосфатазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-6-фосфатфосфатазу, в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-6-фосфатфосфатазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylmannosamine 6-phosphate phosphatase. Therefore, a nucleotide sequence that encodes N-acetylglucosamine-6-phosphate phosphatase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-6-phosphate phosphatase, in genetically engineered Bacillus cell to provide intracellular N-acetylglucosamine-6-phosphate phosphatase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатфосфатазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate phosphatase is adapted to the codon frequency of Bacillus.
Рекомбинантный ген N-ацетилманнозамин-6-фосфатфосфатазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylmannosamine 6-phosphate phosphatase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В генетически сконструированной клетке Bacillus имеется активность синтетазы цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты (Фиг. 1: ) для переноса цитидин-5'-монофосфата на N-ацетилнейраминовую кислоту с образованием СМР-активированной N-ацетилнейраминовой кислоты (CMP-NeuNAc). Несколько синтетаз 5'-монофосфо-(СМР)-сиаловой кислоты известны в данной области и описаны, например, синтетазы 5'-монофосфо-(СМР)-сиаловой кислоты из Е. coli, Neisseria meningitidis, Campylobacter jejuni, Streptococcus sp.и т.д.The genetically engineered Bacillus cell has cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase activity (Figure 1: ) to transfer cytidine 5'-monophosphate to N-acetylneuraminic acid to form CMP-activated N-acetylneuraminic acid (CMP-NeuNAc). Several 5'-monophospho-(CMP)-sialic acid synthetases are known in the art and have been described, for example, 5'-monophospho-(CMP)-sialic acid synthetases from E. coli, Neisseria meningitidis, Campylobacter jejuni, Streptococcus sp., etc. .d.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, предпочтительно, гетерологичную синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, более предпочтительно N-ацетилнейраминатцитидилтрансферазу NeuA из С.jejuni. NeuA С.jejuni кодируется геном neuA С. jejuni.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises cytidine 5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, preferably a heterologous cytidine 5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, more preferably N-acetylneuraminate cytidyltransferase NeuA from C. jejuni. C. jejuni NeuA is encoded by the C. jejuni neuA gene.
Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной микробной клетке с обеспечением активности N-ацетилнейраминатцитидилтрансферазы.Thus, in a further and/or alternative embodiment, a genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence influencing the transcription and/or translation of the specified nucleotide sequence in a genetically engineered microbial cell to ensure N-acetylneuraminate cytidyl transferase activity.
В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon usage frequency of the nucleotide sequence encoding heterologous cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase is adapted to the Bacillus codon usage frequency.
Рекомбинантный ген синтетазы цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.
В генетически сконструированной клетке Bacillus имеется сиалилтрансфераза, предпочтительно гетерологичная сиалилтрансфераза и более предпочтительно сиалилтрансферазная активность, выбранная из группы, состоящей из α-2,3-сиалилтрансферазной активности, α-2,6-сиалилтрансферазной активности и/или α-2,8-сиалилтрансферазной активности. Сиалилтрансферазная активность может переносить группировку N-ацетилнейраминовой кислоты с CMP-NeuNAc на акцепторную молекулу, где указанная акцепторная молекула представляет собой молекулу сахарида, с получением сиалированного сахарида.The genetically engineered Bacillus cell contains a sialyltransferase, preferably a heterologous sialyltransferase and more preferably a sialyltransferase activity selected from the group consisting of α-2,3-sialyltransferase activity, α-2,6-sialyltransferase activity and/or α-2,8-sialyltransferase activity. Sialyltransferase activity can transfer the N-acetylneuraminic acid moiety from CMP-NeuNAc to an acceptor molecule, where the acceptor molecule is a saccharide molecule, to produce a sialylated saccharide.
В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка содержит по меньшей мере одну сиалилтрансферазу, предпочтительно по меньшей мере одну гетерологичную сиалилтрансферазу, где указанная сиалилтрансфераза может обладать α-2,3-сиалилтрансферазной активностью и/или α-2,6-сиалилтрансферазной активностью и/или α-2,8-сиалилтрансферазной активностью для переноса группировки NeuNAc с CMP-NeuNAc в качестве субстрата-донора на акцепторный сахарид. Иллюстративные сиалилтрансферазы и их гены идентифицированы в Таблице 2.In a further and/or alternative embodiment, the genetically engineered microbial cell contains at least one sialyltransferase, preferably at least one heterologous sialyltransferase, wherein said sialyltransferase may have α-2,3-sialyltransferase activity and/or α-2,6-sialyltransferase activity and/or α-2,8-sialyltransferase activity to transfer the NeuNAc moiety from CMP-NeuNAc as a donor substrate to an acceptor saccharide. Exemplary sialyltransferases and their genes are identified in Table 2.
Термин «сиалилтрансфераза», в том виде, в котором он используется в данном документе, относится к полипептидам, способным обладать сиалилтрансферазной активностью. «Сиалилтрансферазная активность» относится к переносу остатка сиаловой кислоты, предпочтительно остатка N-ацетилнейраминовой кислоты (Neu5Ac), с субстрата-донора на акцепторную молекулу. Термин «сиалилтрансфераза» включает функциональные фрагменты сиалилтрансфераз, описанных в данном документе, функциональные варианты сиалилтрансфераз, описанных в данном документе, и функциональные фрагменты функциональных вариантов. «Функциональный» в данном отношении означает, что фрагменты и/или варианты могут обладать сиалилтрансферазной активностью. Функциональные фрагменты сиалилтрансферазы охватывают усеченные версии сиалилтрансферазы, как кодируется их геном, встречающимся в природе, усеченная версия которого может обладать сиалилтрансферазной активностью. Примерами усеченных версий являются сиалилтрансферазы, которые не содержат так называемой лидерной последовательности, которая обычно направляет полипептид к конкретной внутриклеточной локализации. Обычно такие лидерные последовательности удаляют из полипептида во время его внутриклеточного транспорта, и они также отсутствуют в зрелой сиалилтрансферазе, встречающейся в природе.The term “sialyltransferase”, as used herein, refers to polypeptides capable of having sialyltransferase activity. "Sialyltransferase activity" refers to the transfer of a sialic acid residue, preferably an N-acetylneuraminic acid residue (Neu5Ac), from a donor substrate to an acceptor molecule. The term “sialyltransferase” includes functional fragments of the sialyltransferases described herein, functional variants of the sialyltransferases described herein, and functional fragments of functional variants. "Functional" in this regard means that the fragments and/or variants may have sialyltransferase activity. Functional sialyltransferase fragments comprise truncated versions of the sialyltransferase as encoded by their naturally occurring gene, the truncated version of which may have sialyltransferase activity. Examples of truncated versions are sialyltransferases, which do not contain the so-called leader sequence that usually directs the polypeptide to a specific subcellular location. Typically, such leader sequences are removed from the polypeptide during intracellular transport, and they are also absent from the mature sialyltransferase found in nature.
Гетерологичная сиалилтрансфераза может переносить остаток сиаловой кислоты с субстрата-донора на молекулу-акцептор. Термин «может» в отношении гетерологичной сиалилтрансферазы относится к сиалилтрансферазной активности гетерологичной сиалилтрансферазы и условию, что подходящие условия реакции требуются для гетерологичной сиалилтрансферазы для обладания ее ферментативной активностью. В отсутствии подходящих условий реакции гетерологичная сиалилтрансфераза не обладает своей ферментативной активностью, но сохраняет свою ферментативную активность и обладает своей ферментативной активностью, когда восстанавливают подходящие условия реакции. Подходящие условия реакции включают наличие подходящего субстрата-донора, наличие подходящих молекул-акцепторов, наличие существенных кофакторов, таких как, например, одновалентные или двухвалентные ионы, значение рН в соответствующем диапазоне, подходящую температуру и тому подобное. Не обязательно, чтобы оптимальные значения для каждого фактора, влияющего на ферментативную реакцию гетерологичной сиалилтрансферазы, были удовлетворены, но условия реакции должны быть такими, чтобы гетерологичная сиалилтрансфераза осуществляла свою ферментативную активность. Соответственно, термин «может» исключает любые условия, при которых ферментативная активность гетерологичной сиалилтрансферазы необратимо нарушена, и также исключено воздействие на гетерологичную сиалилтрансферазу любого такого условия. Напротив, термин «может» означает, что сиалилтрансфераза является ферментативно активной, а именно, обладает своей сиалилтрансферазной активностью, если пермиссивные условия реакции (где все требования, являющиеся необходимыми для того, чтобы сиалилтрансфераза реализовывала свою ферментативную активность) предоставлены сиалилтрансферазе.A heterologous sialyltransferase can transfer a sialic acid residue from a donor substrate to an acceptor molecule. The term “may” in relation to a heterologous sialyltransferase refers to the sialyltransferase activity of the heterologous sialyltransferase and the proviso that suitable reaction conditions are required for the heterologous sialyltransferase to have its enzymatic activity. In the absence of suitable reaction conditions, the heterologous sialyltransferase does not have its enzymatic activity, but retains its enzymatic activity and has its enzymatic activity when suitable reaction conditions are restored. Suitable reaction conditions include the presence of a suitable donor substrate, the presence of suitable acceptor molecules, the presence of significant cofactors such as, for example, monovalent or divalent ions, a pH value in the appropriate range, a suitable temperature, and the like. It is not necessary that the optimum values for each factor influencing the enzymatic reaction of the heterologous sialyltransferase be satisfied, but the reaction conditions must be such that the heterologous sialyltransferase performs its enzymatic activity. Accordingly, the term “may” excludes any conditions under which the enzymatic activity of the heterologous sialyltransferase is irreversibly impaired, and also excludes the heterologous sialyltransferase being affected by any such condition. In contrast, the term “may” means that the sialyltransferase is enzymatically active, namely, possesses its sialyltransferase activity if permissive reaction conditions (where all the requirements necessary for the sialyltransferase to exercise its enzymatic activity) are provided to the sialyltransferase.
Сиалилтрансферазы можно различить по типу связи с сахаром, которую они образуют. В том виде, в котором они используются в данном документе, термины «α-2,3-сиалилтрансфераза» и «α-2,3-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,3-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы. Аналогично, термины «α-2,6-сиалилтрансфераза» и «α-2,6-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,6-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы. Аналогично, термины «α-2,8-сиалилтрансфераза» и «α-2,8-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,8-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы.Sialyltransferases can be distinguished by the type of sugar bond they form. As used herein, the terms "α-2,3-sialyltransferase" and "α-2,3-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add a sialic acid residue to an α-2 ,3-bond to galactose, N-acetylgalactosamine or galactose or the N-acetylgalactosamine residue of the acceptor molecule. Similarly, the terms "α-2,6-sialyltransferase" and "α-2,6-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add an α-2,6-linked sialic acid residue to galactose, N-acetylgalactosamine or galactose or an N-acetylgalactosamine residue of an acceptor molecule. Likewise, the terms "α-2,8-sialyltransferase" and "α-2,8-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add an α-2,8-linked sialic acid residue to galactose, N-acetylgalactosamine or galactose or an N-acetylgalactosamine residue of an acceptor molecule.
Кроме того, генетически сконструированная клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, кодирующую гетерологичную сиалилтрансферазу. С этой целью нуклеотидная последовательность, кодирующая гетерологичную сиалилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, кодирующей гетерологичную сиалилтрансферазу, в генетически сконструированной клетке Bacillus с получением внутриклеточной сиалилтрансферазной активности.In addition, the genetically engineered Bacillus cell is genetically engineered to contain and express a nucleotide sequence encoding a heterologous sialyltransferase. To this end, a nucleotide sequence encoding a heterologous sialyltransferase is operably linked to at least one expression control sequence affecting the transcription and/or translation of said nucleotide sequence encoding a heterologous sialyltransferase in a genetically engineered Bacillus cell to produce intracellular sialyltransferase activity.
В еще одном воплощении гетерологичная сиалилтрансфераза может обладать α-2,6-сиалилтрансферазной активностью.In yet another embodiment, the heterologous sialyltransferase may have α-2,6-sialyltransferase activity.
В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus содержится и экспрессируется молекула нуклеиновой кислоты, которая содержит по меньшей мере одну нуклеотидную последовательность, кодирующую указанную гетерологичную сиалилтрансферазу, способную обладать α-2,6-сиалилтрансферазной активностью.In an additional and/or alternative embodiment, a genetically engineered Bacillus cell contains and expresses a nucleic acid molecule that contains at least one nucleotide sequence encoding said heterologous sialyltransferase capable of having α-2,6-sialyltransferase activity.
В дополнительном и/или альтернативном воплощении гетерологичная сиалилтрансфераза может обладать α-2,8-сиалилтрансферазной активностью. Примером гетерологичной сиалилтрансферазы, которая способна обладать α-2,8-сиалилтрансферазной активностью, является сиалилтрансфераза Cstll OH4384Campylobacter jejuni.In a further and/or alternative embodiment, the heterologous sialyltransferase may have α-2,8-sialyltransferase activity. An example of a heterologous sialyltransferase that is capable of α-2,8-sialyltransferase activity is the Campylobacter jejuni sialyltransferase Cstll OH4384.
Сиалилтрансфераза может переносить остаток сиаловой кислоты, например, остаток N-ацетилнейраминовой кислоты (Neu5Ac), от субстрата-донора, например, CMP-Neu5Ac, на акцепторную молекулу. Акцепторная молекула представляет собой молекулу сахарида, предпочтительно молекулу сахарида, изложенную в Таблице 3.A sialyltransferase can transfer a sialic acid residue, such as an N-acetylneuraminic acid residue (Neu5Ac), from a donor substrate, such as CMP-Neu5Ac, to an acceptor molecule. The acceptor molecule is a saccharide molecule, preferably a saccharide molecule set forth in Table 3.
В дополнительном и/или альтернативном воплощении в генетически сконструированной микробной клетке Bacillus содержится молекула нуклеиновой кислоты, которая содержит и экспрессирует по меньшей мере одну нуклеотидную последовательность, кодирующую указанную гетерологичную сиалилтрансферазу, способную обладать α-2,3-сиалилтрансферазной активностью.In an additional and/or alternative embodiment, the genetically engineered Bacillus microbial cell contains a nucleic acid molecule that contains and expresses at least one nucleotide sequence encoding said heterologous sialyltransferase capable of having α-2,3-sialyltransferase activity.
В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой моносахарид, предпочтительно моносахарид, выбранный из группы, состоящей из N-ацетилглюкозамина, галактозы и N-ацетилгалактозамина.In a further and/or alternative embodiment, the acceptor molecule is a monosaccharide, preferably a monosaccharide selected from the group consisting of N-acetylglucosamine, galactose and N-acetylgalactosamine.
В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой дисахарид, предпочтительно дисахарид, выбранный из группы, состоящей из лактозы, лактулозы, N-ацетиллактозамина, лакто-N-биозы, лактулозы и мелибиозы.In a further and/or alternative embodiment, the acceptor molecule is a disaccharide, preferably a disaccharide selected from the group consisting of lactose, lactulose, N-acetyllactosamine, lacto-N-biose, lactulose and melibiose.
В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой трисахарид, предпочтительно трисахарид, выбранный из группы, состоящей из рафинозы, лакто-N-триозы II, 2'-фукозиллактозы, 3-фукозиллактозы, 3'-сиалиллактозы, 6'-сиалиллактозы, 3'-сиалил-N-In an additional and/or alternative embodiment, the acceptor molecule is a trisaccharide, preferably a trisaccharide selected from the group consisting of raffinose, lacto-N-triose II, 2'-fucosyllactose, 3-fucosyllactose, 3'-sialyllactose, 6'-sialyllactose, 3'-sialyl-N-
ацетиллактозамина, 6'-сиалил-N-ацетиллактозамина, 3'-галактозиллактозы и 6'-галактозиллактозы.acetyllactosamine, 6'-sialyl-N-acetyllactosamine, 3'-galactosyllactose and 6'-galactosyllactose.
В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой тетрасахарид, предпочтительно тетрасахарид, выбранный из группы, состоящей из лакто-N-тетраозы, лакто-N-неотетраозы, 2'3-дифукозиллактозы, 3-фукозил-3'-сиалиллактозы и 3-фукозил-6'-сиалиллактозы.In an additional and/or alternative embodiment, the acceptor molecule is a tetrasaccharide, preferably a tetrasaccharide selected from the group consisting of lacto-N-tetraose, lacto-N-neotetraose, 2'3-difucosyllactose, 3-fucosyl-3'-sialyllactose and 3 -fucosyl-6'-sialyllactose.
В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой пентасахарид, предпочтительно пентасахарид, выбранный из группы, состоящей из сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, лакто-N-фукопентаозы I, лакто-N-фукопентаозы II, лакто-N-фукопентаозы III, лакто-N-фукопентаозы V, лакто-N-неофукопентаозы I и лакто-N-неофукопентаозы V.In an additional and/or alternative embodiment, the acceptor molecule is a pentasaccharide, preferably a pentasaccharide selected from the group consisting of sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, lacto-N-fucopentaose I, lacto-N-fucopentaose II, lacto-N-fucopentaose III, lacto-N-fucopentaose V, lacto-N-neofucopentaose I and lacto-N-neofucopentaose V.
Следует понимать, что клетка Bacillus, уже несущая один или более генов, кодирующих указанные ферменты образом, достаточным для продукции NeuNAc, CMP-NeuNAc и/или сиалированного сахарида, не нуждается в генетической модификации для совершения биосинтеза сиаловой кислоты и для переноса группировки сиаловой кислоты на акцептор-сахарид, но, тем не менее, может быть генетически сконструирована для изменения уровня экспрессии одного или более из указанных генов для повышения внутриклеточного уровня продуктов указанного одного или более генов, таких как, например, количество глутамин:фруктозо-6-фосфатаминотрансфеаза, глюкозамин-6-фосфат N-ацетилтрансфераза, N-ацетилглюкозамин-6-фосфатфосфатаза, N-ацетилглюкозамин 2-эпимераза и/или синтетаза N-ацетилнейраминовой кислоты, с повышением, таким образом, скорости биосинтеза Neu5Ac, и, как следствие, сиалированного сахарида, в генетически сконструированной клетке.It should be understood that a Bacillus cell already carrying one or more genes encoding these enzymes in a manner sufficient to produce NeuNAc, CMP-NeuNAc and/or sialylated saccharide does not require genetic modification to perform sialic acid biosynthesis and to transfer the sialic acid moiety to saccharide acceptor, but may nevertheless be genetically engineered to alter the expression level of one or more of said genes to increase the intracellular level of products of said one or more genes, such as, for example, the amount of glutamine: fructose-6-phosphate aminotransferase, glucosamine -6-phosphate N-acetyltransferase, N-acetylglucosamine-6-phosphate phosphatase, N-acetylglucosamine 2-epimerase and/or N-acetylneuraminic acid synthetase, thus increasing the rate of Neu5Ac biosynthesis, and, as a consequence, sialylated saccharide, in genetically engineered cell.
В некоторых воплощениях клетка Bacillus предназначена для применения в получении 3'-SL и генетически сконструирована для того, чтобы иметь лактозопермеазу, путь биосинтеза CMP-NeuNAc, в котором используется GlcN-1P в качестве промежуточного соединения, и α-2,3-сиалилтрансферазу.In some embodiments, a Bacillus cell is intended for use in the production of 3'-SL and is genetically engineered to have a lactose permease, a CMP-NeuNAc biosynthetic pathway that uses GlcN-1P as an intermediate, and an α-2,3-sialyltransferase.
В разных воплощениях клетка Bacillus предназначена для применения в получении 6'-SL и генетически сконструирована для того, чтобы иметь лактозопермеазу, путь биосинтеза CMP-NeuNAc, в котором используется GlcN-1P в качестве промежуточного соединения, и α-2,6-сиалилтрансферазу.In various embodiments, a Bacillus cell is intended for use in the production of 6'-SL and is genetically engineered to have a lactose permease, a CMP-NeuNAc biosynthetic pathway that uses GlcN-1P as an intermediate, and an α-2,6-sialyltransferase.
В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка Bacillus синтезирует больше ФЕП, чем клетка дикого типа. В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка генетически сконструирована для того, чтобы имелся усиленный путь биосинтеза ФЕП. Предпочтительно, генетически сконструированная микробная клетка генетически сконструирована для обладания повышенной активностью синтазы фосфоенолпирувата, например, в том, что ген ppsA, кодирующий фосфоенолпируватсинтазу, сверхэкспрессируется, и/или в том, что микроорганизмы, не встречающиеся в природе, содержат по меньшей мере одну дополнительную копию нуклеотидной последовательности, делающую возможной экспрессию фосфоенолпируватсинтазы или ее функционального варианта. Сверхэкспрессия ppsA усиливает внутриклеточный синтез ФЕП таким образом, что больше ФЕП доступно для продукции сиаловой кислоты. Например, подходящая фосфоенолпируватсинтаза представляет собой PpsA Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus microbial cell synthesizes more PEP than the wild type cell. In a further and/or alternative embodiment, the genetically engineered microbial cell is genetically engineered to have an enhanced PEP biosynthetic pathway. Preferably, the genetically engineered microbial cell is genetically engineered to have increased phosphoenolpyruvate synthase activity, for example, in that the ppsA gene encoding phosphoenolpyruvate synthase is overexpressed, and/or in that the non-naturally occurring microorganisms contain at least one additional copy a nucleotide sequence allowing the expression of phosphoenolpyruvate synthase or a functional variant thereof. Overexpression of ppsA enhances intracellular PEP synthesis such that more PEP is available for sialic acid production. For example, a suitable phosphoenolpyruvate synthase is E. coli PpsA.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, кодирующую PpsA Е. coli или ее функциональный вариант.Указанная нуклеотидная последовательность, кодирующая PpsA Е. coli или ее функциональный вариант, обладает идентичностью последовательностей по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или по меньшей мере 99% с геном ppsA Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence encoding E. coli PpsA or a functional variant thereof. Said nucleotide sequence encoding E. coli PpsA or a functional variant thereof has at least sequence identity 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99% with the E. coli ppsA gene.
В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus дополнительно модифицирована для того, чтобы иметь способность переносить указанный один единственный источник углерода в клетку посредством механизма, при котором не потребляется ФЕП.In a further and/or alternative embodiment, the genetically engineered Bacillus cell is further modified to have the ability to transport said single carbon source into the cell through a mechanism that does not consume PEP.
В дополнительном и/или альтернативном воплощении клетка Bacillus для получения сиалированного олигосахарида не обладает β-галактозидазной активностью или обладает пониженной β-галактозидазной активностью, по сравнению с клеткой Bacillus дикого типа того же вида.In a further and/or alternative embodiment, the Bacillus cell for producing the sialylated oligosaccharide has no β-galactosidase activity or has reduced β-galactosidase activity compared to a wild-type Bacillus cell of the same species.
Внутриклеточный биосинтез сиалированных олигосахаридов требует импортирования лактозы в качестве субстрата-акцептора для сиалилтрансферазы, акцептирующей лактозу. Любая внутриклеточная активность фермента, который гидролизует поглощенную лактозу, будет воздействовать на эффективность образования сиалиллактозы, поскольку пул внутриклеточной лактозы будет уменьшен. Таким образом, будет преимущественным, если клетка Bacillus для получения сиалированного олигосахарида не будет обладать или будет обладать по меньшей мере, по сравнению с клеткой Bacillus дикого типа, сниженной активностью бета-галактозидазы.Intracellular biosynthesis of sialylated oligosaccharides requires the import of lactose as an acceptor substrate for lactose-accepting sialyltransferase. Any intracellular enzyme activity that hydrolyzes ingested lactose will affect the efficiency of sialyllactose formation because the pool of intracellular lactose will be reduced. Thus, it will be advantageous if the Bacillus cell used to produce the sialylated oligosaccharide has no or at least reduced beta-galactosidase activity compared to a wild-type Bacillus cell.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для исключения или по меньшей мере уменьшения р-галактозидазной активности клетки.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to eliminate or at least reduce the β-galactosidase activity of the cell.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена ganA. В еще одном воплощении клетка Bacillus генетически сконструирована для уменьшения уровня экспрессии гена ganA, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered through deletion or functional inactivation of the ganA gene. In yet another embodiment, the Bacillus cell is genetically engineered to reduce the level of expression of the ganA gene compared to a wild-type Bacillus cell.
Ген ganA Bacillus также называется yvfN или lacA. Это ген регулона GanR, который содержит гены, кодирующие ферменты, участвующие в утилизации галактана. Ген ganA кодирует бета-галактозидазу, которая участвует в утилизации галактана Bacillus.The Bacillus ganA gene is also called yvfN or lacA. This is the GanR regulon gene, which contains genes encoding enzymes involved in galactan utilization. The ganA gene encodes beta-galactosidase, which is involved in the utilization of Bacillus galactan.
Делеция или функциональная инактивация гена ganA аннулирует GanA-опосредованную β-галактозидазную активность в клетке Bacillus, тогда как уменьшение уровня экспрессии ganA уменьшает количество GanA в клетке Bacillus и, следовательно, активность β-галактозидазы, которая могла бы мешать биосинтезу сиалированного олигосахарида.Deletion or functional inactivation of the ganA gene abolishes GanA-mediated β-galactosidase activity in the Bacillus cell, whereas reducing the level of ganA expression reduces the amount of GanA in the Bacillus cell and, therefore, β-galactosidase activity, which would interfere with sialylated oligosaccharide biosynthesis.
В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством удаления или функциональной инактивации гена yesZ. Ген yesZ Bacillus кодирует бета-галактозидазу YesZ, которая играет роль в деградации рамногалактуронана, происходящего из клеточных стенок растений. Экспрессия гена yesZ Bacillus индуцируется рамногалактуронаном I. В еще одном воплощении клетка Bacillus генетически сконструирована для уменьшения уровня экспрессии гена yesZ, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered by deleting or functionally inactivating the yesZ gene. The Bacillus yesZ gene encodes YesZ beta-galactosidase, which plays a role in the degradation of rhamnogalacturonan derived from plant cell walls. Expression of the Bacillus yesZ gene is induced by rhamnogalacturonan I. In yet another embodiment, a Bacillus cell is genetically engineered to reduce the level of expression of the yesZ gene compared to a wild-type Bacillus cell.
Удаление или функциональная инактивация гена yesZ аннулирует YesZ-опосредованную р-галактозидазную активность в клетке Bacillus, тогда как уменьшение уровня экспрессии yesZ уменьшает количество YesZ в клетке Bacillus и, следовательно, активность β-галактозидазы, которая могла бы мешать биосинтезу сиалированного олигосахарида.Deletion or functional inactivation of the yesZ gene abolishes YesZ-mediated β-galactosidase activity in the Bacillus cell, whereas decreasing the level of yesZ expression reduces the amount of YesZ in the Bacillus cell and, therefore, β-galactosidase activity, which would interfere with sialylated oligosaccharide biosynthesis.
Когда В. subtilis вступает в постэкспоненциальную фазу роста, они (начинают) продуцировать большие количества внеклеточных протеаз. Чужеродные белки часто являются чувствительными к протеазе. Таким образом, штамм, не содержащий экзопротеазу, является желательным для повышения стабильности гетерологичных белков и для обеспечения аккумуляции высоких уровней чужеродных белков. Геном Bacillus кодирует по меньшей мере восемь внеклеточных протеаз, а именно nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована в том, что по меньшей мере один ген, кодирующий внеклеточную протеазу, был удален или функционально инактивирован, предпочтительно по меньшей мере один из генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Предпочтительно, два, три, четыре, пять, шесть, семь, или восемь из генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA, удалены или функционально инактивированы.When B. subtilis enters the post-exponential growth phase, they (begin to) produce large amounts of extracellular proteases. Foreign proteins are often protease sensitive. Thus, an exoprotease-free strain is desirable to enhance the stability of heterologous proteins and to allow the accumulation of high levels of foreign proteins. The Bacillus genome encodes at least eight extracellular proteases, namely nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA. Thus, in a further and/or alternative embodiment, the Bacillus cell is genetically engineered such that at least one gene encoding an extracellular protease has been deleted or functionally inactivated, preferably at least one of the genes selected from the group consisting of nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA. Preferably, two, three, four, five, six, seven, or eight of the genes selected from the group consisting of nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA are deleted or functionally inactivated.
В, subtiiis синтезирует пульхерриминовую кислоту, когда растет в средах, содержащих углевод, такой как глюкоза или лактоза. Выделяемая пульхерриминовая кислота образует красный пигмент пульхерримин, соль пульхерриминовой кислоты (хелат железа (III)), когда железо находится в среде для выращивания. Образования данного нежелательного побочного продукта во время процессов ферментации можно избежать/аннулировать посредством удаления/нарушения генов yvmC и/или сурХ. Ген yvmC кодирует циклодипептидсинтазу, и ген сурХ кодирует цитохром Р450 цикло-I-лейцил-I-лейцилдипептидоксидазу.B, subtiiis synthesizes pulcherrimic acid when grown in media containing a carbohydrate such as glucose or lactose. The released pulcherrimic acid forms the red pigment pulcherrimin, a salt of pulcherrimic acid (iron(III) chelate) when iron is in the growth medium. The formation of this undesirable by-product during fermentation processes can be avoided/abrogated by deleting/disrupting the yvmC and/or surX genes. The yvmC gene encodes cyclodipeptide synthase, and the surX gene encodes cytochrome P450 cyclo-I-leucyl-I-leucyl dipeptide oxidase.
Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована таким образом, что по меньшей мере один из генов yvmC и сурХ удален или функционально инактивирован.Thus, in a further and/or alternative embodiment, the Bacillus cell is genetically engineered such that at least one of the yvmC and surX genes is deleted or functionally inactivated.
Ризобактерия В. subtilis имеет гены для синтеза более чем 20 антибиотиков. Среди них находятся антибиотики-пептиды, такие как лантибиотики и пептиды, подобные лактибиотикам Bacillus subtilis (субтилин, эрицин S, мерсацидин, субланцин 168, субтилозин А) и антибиотики, синтезируемые нерибосомально (пептид) (сурфактин, итуирн, бацилломицин, микосубтилин, коринебактин/бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикоумацин, 3,3'-неотрегалозадиамин, диффицидин, ризоктицин).The rhizobacterium B. subtilis has genes for the synthesis of more than 20 antibiotics. Among them are peptide antibiotics, such as lantibiotics and peptides similar to lactibiotics of Bacillus subtilis (subtilin, ericin S, mersacidin, sublancin 168, subtilosin A) and antibiotics synthesized non-ribosomally (peptide) (surfactin, ituirn, bacillomycin, mycosubtilin, corinebactin/ bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilizocin, amikoumacin, 3,3'-neotrehalosadiamine, difficidin, rhizocticin).
Для получения сиалированного олигосахарида предпочтительно использовать клетку Bacillus, которая не продуцирует антибиотик. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus не синтезирует один или более антибиотиков, выбранных из группы, состоящей из лантибиотиков и пептидов, подобных лантибиотикам, таких как субтилин, эрицин S, мерзацидин, субланцин 168, субтилозин А; антибиотиков, синтезированных нерибосомально (пептид), таких как сурфактин, итурин, бацилломицин, микосубтилин, коринебактин/ бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикоумацин, 3,3'-неотрегалозадиамин, диффицидин и ризоктицин. Клетка Bacillus могла быть генетически сконструирована для нарушения или аннулирования их своей способности синтезировать один или более из указанных антибиотиков.To obtain the sialylated oligosaccharide, it is preferable to use a Bacillus cell that does not produce the antibiotic. Thus, in an additional and/or alternative embodiment, the Bacillus cell does not synthesize one or more antibiotics selected from the group consisting of lantibiotics and lantibiotic-like peptides such as subtilin, ericin S, merzacidin, sublancin 168, subtilosin A; non-ribosomally synthesized antibiotics (peptide), such as surfactin, iturin, bacillomycin, mycosubtilin, corynebactin/bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilizocin, amikoumacin, 3,3'-neotrehalosadiamine, difficidin and rhizocticin. The Bacillus cell may have been genetically engineered to disrupt or abrogate its ability to synthesize one or more of these antibiotics.
Генетически сконструированная клетка Bacillus, которая может продуцировать сиалированный олигосахарид, может, возможно, включать дополнительные признаки и может быть генетически сконструирована для того, чтобы иметь данные дополнительные признаки. Считается, что данные дополнительные признаки улучают продуктивность микроорганизма, который не встречается в природе, приводя к более высоким выходам сиалированного олигосахарида.A genetically engineered Bacillus cell that can produce a sialylated oligosaccharide may optionally include additional traits and may be genetically engineered to have these additional traits. These additional traits are believed to improve the productivity of the microorganism, which does not occur naturally, resulting in higher yields of sialylated oligosaccharide.
Клетка Bacillus по изобретению может продуцировать сиалированный олигосахарид при культивации в присутствии лактозы в среде и в условиях, которые являются пермиссивными в отношении клетки Bacillus, для получения сиалированного олигосахарида. Таким образом, также предложено применение генетически сконструированной клетки Bacillus, как ранее описано в данном документе, для получения сиалированного олигосахарида.The Bacillus cell of the invention can produce sialylated oligosaccharide when cultured in the presence of lactose in a medium and under conditions that are permissive to the Bacillus cell to produce sialylated oligosaccharide. Thus, the use of a genetically engineered Bacillus cell, as previously described herein, to produce a sialylated oligosaccharide is also provided.
В одном аспекте предложен способ получения сиалированного олигосахарида. Способ включает (i) предоставление клетки Bacillus, как описано ранее в данном документе, (ii) культивацию указанной клетки Bacillus в культуральной среде или ферментационном бульоне и в условиях, которые являются пермиссивными в отношении получения сиалированного олигосахарида. Способ может дополнительно включать извлечение сиалированного олигосахарида из культуральной среды/ферментационного бульона и/или из клетки Bacillus.In one aspect, a method for producing a sialylated oligosaccharide is provided. The method comprises (i) providing a Bacillus cell as described previously herein, (ii) cultivating said Bacillus cell in a culture medium or fermentation broth and under conditions that are permissive for the production of sialylated oligosaccharide. The method may further comprise recovering the sialylated oligosaccharide from the culture medium/fermentation broth and/or from the Bacillus cell.
Ферментационный бульон содержит по меньшей мере один источник углерода для метаболизма клетки Bacillus. В некоторых воплощениях по меньшей мере один источник углерода выбран из группы, состоящей из глюкозы, фруктозы, сахарозы, глицерина и их комбинаций. Источник углерода может быть поглощен клеткой Bacillus и может быть привлечен метаболизмом клетки Bacillus с образованием биомассы и/или энергии в форме высокоэнергетических трифосфатов.The fermentation broth contains at least one carbon source for the metabolism of the Bacillus cell. In some embodiments, the at least one carbon source is selected from the group consisting of glucose, fructose, sucrose, glycerol, and combinations thereof. The carbon source may be taken up by the Bacillus cell and may be metabolized by the Bacillus cell to produce biomass and/or energy in the form of high-energy triphosphates.
В некоторых воплощениях ферментационный бульон содержит лактозу, в частности, если клетка Bacillus не может синтезировать лактозу сама по себе. Лактоза может подаваться в ферментационный бульон извне. Лактоза может служить субстратом-акцептором для группировки NeuNAc в получении некоторых сиалированных олигосахаридов, в частности, в получении сиалиллактоз.In some embodiments, the fermentation broth contains lactose, particularly if the Bacillus cell cannot synthesize lactose on its own. Lactose can be supplied to the fermentation broth from outside. Lactose can serve as an acceptor substrate for the NeuNAc group in the production of some sialylated oligosaccharides, in particular, in the production of sialyllactose.
В разных воплощениях ферментационный бульон содержит сиаловую кислоту, в частности, если клетка Bacillus используется для получения сиалированного олигосахарида, в которой отсутствует путь биосинтеза сиаловой кислоты, но есть путь утилизации сиаловой кислоты.In various embodiments, the fermentation broth contains sialic acid, particularly if a Bacillus cell is used to produce the sialylated oligosaccharide, which lacks a sialic acid biosynthesis pathway but does have a sialic acid utilization pathway.
В некоторых воплощениях получение сиалированного олигосахарида не требует добавления N-ацетилглюкозамина, N-ацетилманнозамина и/или N-ацетилнейраминовой кислоты в ферментационный бульон и/или культивации генетически сконструированной микробной клетки в присутствии N-ацетилглюкозамина, N-ацетилманнозамина и/или N-ацетилнейрамановой кислоты для внутриклеточного биосинтеза сиалированного олигосахарида, поскольку клетка Bacillus используется для получения сиалированного олигосахарида, в которой имеется путь биосинтеза сиаловой кислоты de novo для внутриклеточного биосинтеза NeuNAC.In some embodiments, preparation of the sialylated oligosaccharide does not require the addition of N-acetylglucosamine, N-acetylmannosamine and/or N-acetylneuraminic acid to the fermentation broth and/or culturing the genetically engineered microbial cell in the presence of N-acetylglucosamine, N-acetylmannosamine and/or N-acetylneuraminic acid for intracellular biosynthesis of sialylated oligosaccharide, since the Bacillus cell is used to produce sialylated oligosaccharide, which has a de novo sialic acid biosynthesis pathway for intracellular biosynthesis of NeuNAC.
В данном способе по меньшей мере одна генетически сконструированная клетка Bacillus культивируется в ферментационном бульоне и в условиях, которые являются пермиссивными в отношении получения сахарида, содержащего по меньшей мере одну группировку N-ацетилнейраминовой кислоты.In this method, at least one genetically engineered Bacillus cell is cultured in a fermentation broth and under conditions that are permissive for the production of a saccharide containing at least one N-acetylneuraminic acid moiety.
В то время как в процессе используется источник углерода в ферментационном бульоне для генетически сконструированной клетки Bacillus, нет необходимости в том, чтобы добавлять глюкозамин и/или N-ацетилнейраминовую кислоту и/или N-ацетилглюкозамин и/или N-ацетилманнозамин в ферментационный бульон, когда клетка Bacillus может внутриклеточно продуцировать N-ацетилнейраминовую кислоту. Таким образом, в разных воплощениях для получения сиалированного олигосахарида, генетически сконструированную клетку Bacillus культивируют в отсутствие и/или без добавления одного или более, выбранных из группы, состоящей из глюкозамина, N-ацетилглюкозамина, N-ацетилманнозамина и N-ацетилнейраминовой кислоты. Генетически сконструированную клетку Bacillus можно культивировать в отсутствии и/или без добавления галактозы, поскольку галактоза не доставляется в качестве субстрата-акцептора для реакции сиалилтрансферазы.While the process utilizes the carbon source in the fermentation broth for the genetically engineered Bacillus cell, it is not necessary to add glucosamine and/or N-acetylneuraminic acid and/or N-acetylglucosamine and/or N-acetylmannosamine to the fermentation broth when the Bacillus cell can produce N-acetylneuraminic acid intracellularly. Thus, in various embodiments, to produce a sialylated oligosaccharide, a genetically engineered Bacillus cell is cultured in the absence and/or without the addition of one or more selected from the group consisting of glucosamine, N-acetylglucosamine, N-acetylmannosamine and N-acetylneuraminic acid. The genetically engineered Bacillus cell can be cultured in the absence and/or without the addition of galactose, since galactose is not supplied as an acceptor substrate for the sialyltransferase reaction.
В дополнительных и/или альтернативных воплощениях генетически сконструированную клетку Bacillus культивируют в присутствии одного или более моносахаридов (например, галактозы), дисахаридов (например, лактозы), трисахаридов (например, лакто-N-триозы II), тетрасахаридов (например, лакто-N-тетраозы) и/или пентасахаридов (например, сиалиллакто-N-тетраозы а).In additional and/or alternative embodiments, the genetically engineered Bacillus cell is cultured in the presence of one or more monosaccharides (e.g., galactose), disaccharides (e.g., lactose), trisaccharides (e.g., lacto-N-triose II), tetrasaccharides (e.g., lacto-N -tetraose) and/or pentasaccharides (for example, sialyllacto-N-tetraose a).
Согласно дополнительному и/или альтернативному воплощению генетически сконструированную клетку Bacillus культивируют в присутствии по меньшей мере одного субстрата-акцептора, выбранного из группы, состоящей из галактозы, N-ацетилгалактозамина, N-ацетилглюкозамина, лактозы, лактулозы, N-ацетиллактозамина, лакто-N-биозы, лакто-N-триозы, 2'-фукозиллактозы, 3-фукозиллактозы, 3'-сиалиллактозы, 6'-сиалиллактозы, 3'-сиалил-N-ацетиллактозамина, 6'-сиалил-N-ацетиллактозамина, 3'-галактозиллактозы, 6'-галактозиллактозы, лакто-N-триозы II, лакто-N-тетраозы, лакто-N-неотетраозы, 2'3-дифукозиллактозы, 3-фукозил-3'-сиалиллактозы и 3-фукозил-6'-сиалиллактозы. Данные субстраты импортируются в клетку и используются в качестве молекул-акцепторов в клетке.In a further and/or alternative embodiment, the genetically engineered Bacillus cell is cultured in the presence of at least one acceptor substrate selected from the group consisting of galactose, N-acetylgalactosamine, N-acetylglucosamine, lactose, lactulose, N-acetyllactosamine, lacto-N- bioses, lacto-N-triose, 2'-fucosyllactose, 3-fucosyllactose, 3'-sialyllactose, 6'-sialyllactose, 3'-sialyl-N-acetyllactosamine, 6'-sialyl-N-acetyllactosamine, 3'-galactosyllactose, 6'-galactosyllactose, lacto-N-triose II, lacto-N-tetraose, lacto-N-neotetraose, 2'3-difucosyllactose, 3-fucosyl-3'-sialyllactose and 3-fucosyl-6'-sialyllactose. These substrates are imported into the cell and used as acceptor molecules in the cell.
Способ включает возможную стадию выделения сиалированного олигосахарида, который продуцирован генетически сконструированной клеткой Bacillus во время ее культивирования и пролиферации в ферментационном бульоне. Сиалированный олигосахарид может быть выделен из ферментационного бульона после удаления генетически сконструированных клеток Bacillus, например, посредством центрифугирования или фильтрации и/или может быть выделен из клеток, например, в том отношении, что клетки собирают из ферментационного бульона посредством центрифугирования и подвергают стадии лизиса клеток. Затем, сиалированные олигосахариды могут быть дополнительно очищены из ферментационного бульона и/или клеточных лизатов подходящими методиками, известными специалисту в данной области. Подходящие методики включают микрофильтрацию, ультрафильтрацию, диафильтрацию, хроматографию с псевдодвижущимся слоем, электродиализ, обратный осмос, гель-фильтрацию, анионообменную хроматографию, катионообменную хроматографию и т.п.The method includes the optional step of isolating a sialylated oligosaccharide that is produced by a genetically engineered Bacillus cell during its cultivation and proliferation in a fermentation broth. The sialylated oligosaccharide may be isolated from the fermentation broth after removal of the genetically engineered Bacillus cells, for example, by centrifugation or filtration, and/or may be isolated from the cells, for example, in that the cells are collected from the fermentation broth by centrifugation and subjected to a cell lysis step. The sialylated oligosaccharides can then be further purified from the fermentation broth and/or cell lysates by suitable techniques known to one of ordinary skill in the art. Suitable techniques include microfiltration, ultrafiltration, diafiltration, pseudo-moving bed chromatography, electrodialysis, reverse osmosis, gel filtration, anion exchange chromatography, cation exchange chromatography, and the like.
Способ и генетически сконструированную микробную клетку, которую используют в способе, используют для получения сиалированного олигосахарида. Термин «сиалированный олигосахарид» относится к молекуле олигосахарида, содержащей по меньшей мере одну группировку N-ацетилнейраминовой кислоты.The method and the genetically engineered microbial cell used in the method are used to produce sialylated oligosaccharide. The term "sialylated oligosaccharide" refers to an oligosaccharide molecule containing at least one N-acetylneuraminic acid moiety.
В дополнительном и/или альтернативном воплощении сиалированный сахарид представляет собой олигосахарид. Термин «олигосахарид», в том виде, в котором он используется в данном документе, относится к полимерам моносахаридных остатков, где указанные полимеры содержат по меньшей мере два моносахаридных остатка, но не больше чем 10 моносахаридных остатков, предпочтительно не больше чем 7 моносахаридных остатков. Олигосахариды представляют собой или линейную цепь моносахаридов или являются разветвленными. Кроме того, моносахаридные остатки олигосахаридов могут характеризоваться целым рядом химических модификаций. Соответственно, олигосахариды могу содержать одну или более несахаридных группировок. Термин «сиалированный олигосахарид», в том виде, в котором он используется в данном документе, относится к олигосахаридам, содержащим один или более группировок N-ацетилнейраминовой кислоты.In a further and/or alternative embodiment, the sialylated saccharide is an oligosaccharide. The term "oligosaccharide" as used herein refers to polymers of monosaccharide residues, wherein said polymers contain at least two monosaccharide residues, but no more than 10 monosaccharide residues, preferably no more than 7 monosaccharide residues. Oligosaccharides are either a linear chain of monosaccharides or are branched. In addition, the monosaccharide residues of oligosaccharides can be characterized by a number of chemical modifications. Accordingly, oligosaccharides may contain one or more non-saccharide moieties. The term "sialylated oligosaccharide", as used herein, refers to oligosaccharides containing one or more N-acetylneuraminic acid moieties.
Согласно дополнительному и/или альтернативному воплощению сиалированный олигосахарид выбран из группы, состоящей из 3'-сиалиллактозы, 6'-сиалиллактозы, сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, фукозил-сиалиллакто-N-тетраозы а, фукозил-сиалиллакто-N-тетраозы b, фукозил-сиалиллакто-N-тетраозы с, дисиалиллакто-N-тетраозы, фукозиллакто-N-тетраозы I, фукозиллакто-N-тетраозы II, 3'-сиалилгалактозы, 6'-сиалилгалактозы, 3'-сиалил-N-ацетиллактозамина и 6'-сиалил-N-ацетиллактозамина.In a further and/or alternative embodiment, the sialylated oligosaccharide is selected from the group consisting of 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, fucosyl-sialyllacto- N-tetraose a, fucosyl-sialyllacto-N-tetraose b, fucosyl-sialyllacto-N-tetraose c, disialyllacto-N-tetraose, fucosyllacto-N-tetraose I, fucosyllacto-N-tetraose II, 3'-sialylgalactose, 6' -sialylgalactose, 3'-sialyl-N-acetyllactosamine and 6'-sialyl-N-acetyllactosamine.
В еще одном аспекте изобретения предложено применение генетически сконструированной клетки Bacillus, как описано ранее в данном документе, для получения сиалированного олигосахарида в цельноклеточном ферментационном процессе, а именно, сиалированный олигосахарид синтезируется генетически сконструированной клеткой Bacillus и в генетически сконструированной клетке Bacillus.Another aspect of the invention provides the use of a genetically engineered Bacillus cell, as described previously herein, to produce a sialylated oligosaccharide in a whole cell fermentation process, namely, the sialylated oligosaccharide is synthesized by and in a genetically engineered Bacillus cell.
В еще одном аспекте изобретения предложен сиалированный олигосахарид, который получен способом и/или посредством применения генетически сконструированной клетки Bacillus, как описано ранее в данном документе.In yet another aspect of the invention, there is provided a sialylated oligosaccharide that is produced by the method and/or use of a genetically engineered Bacillus cell as described previously herein.
В еще одном аспекте изобретения предложено применение сиалированного олигосахарида, который получен способом, как описано ранее в данном документе, и/или посредством применения генетически сконструированной клетки Bacillus, как описано ранее в данном документе, для изготовления питательной композиции.Another aspect of the invention provides the use of a sialylated oligosaccharide that is prepared by a method as described previously herein and/or through the use of a genetically engineered Bacillus cell as described previously herein for the manufacture of a nutritional composition.
Таким образом, предложена питательная композиция, содержащая по меньшей мере один сиалированный олигосахарид, который получен способом и/или посредством генетически сконструированной клетки Bacillus, как ранее описано в данном документе.Thus, a nutritional composition is provided comprising at least one sialylated oligosaccharide which is produced by a method and/or through a genetically engineered Bacillus cell as previously described herein.
В дополнительном и/или альтернативном воплощении сиалированный олигосахарид выбран из группы, состоящей из 3'-сиалиллактозы, 6'-сиалиллактозы, сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, фукозил-сиалиллакто-N-тетраозы а, фукозил-сиалиллакто-N-тетраозы b, фукозил-сиалиллакто-N-тетраозы с, дисиалиллакто-N-тетраозы, фукозилдисиалиллакто-N-тетраозы I, фукозилдисиаллакто-N-тетраозы II, 3'-сиалилгалактозы, 6'-сиалилгалактозы, 3'-сиалил-N-ацетиллактозамина и 6'-сиалил-N-ацетиллактозамина.In an additional and/or alternative embodiment, the sialylated oligosaccharide is selected from the group consisting of 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, fucosyl-sialyllacto- N-tetraose a, fucosyl-sialyllacto-N-tetraose b, fucosyl-sialyllacto-N-tetraose c, disialyllacto-N-tetraose, fucosyldisiallyllacto-N-tetraose I, fucosyldisiallyllacto-N-tetraose II, 3'-sialylgalactose, 6' -sialylgalactose, 3'-sialyl-N-acetyllactosamine and 6'-sialyl-N-acetyllactosamine.
В некоторых воплощениях питательная композиция дополнительно содержит по меньшей мере один нейтральный ОГМ, предпочтительно по меньшей мере один нейтральный ОГМ, который продуцирован посредством использования генетически сконструированной клетки Bacillus. По меньшей мере один нейтральный ОГМ выделен из группы, состоящей из 2'-фукозиллактозы, 3-фукозиллактозы, 2',3-дифукозиллактозы, лакто-N-триозы II, лакто-N-тетраозы, лакто-N-неотетраозы, лакто-N-фукопентаозы I, лакто-N-неофукопентаозы I, лакто-N-фукопентаозы II, лакто-N-фукопентаозы III, лакто-N-фукопентаозы V, лакто-N-неофукопентаозы V, лакто-N-дифукогексаозы I, лакто-N-дифукогексаозы II, лакто-N-неодифукогексаозы I, лакто-N-гексаозы, лакто-N-неогексаозы, пара-лакто-N-гексаозы и пара-лакто-N-неогексаозы.In some embodiments, the nutritional composition further comprises at least one neutral HMO, preferably at least one neutral HMO that is produced through the use of a genetically engineered Bacillus cell. At least one neutral HGM is isolated from the group consisting of 2'-fucosyllactose, 3-fucosyllactose, 2',3-difucosyllactose, lacto-N-triose II, lacto-N-tetraose, lacto-N-neotetraose, lacto-N -fucopentaose I, lacto-N-neofucopentaose I, lacto-N-fucopentaose II, lacto-N-fucopentaose III, lacto-N-fucopentaose V, lacto-N-neofucopentaose V, lacto-N-difucohexaose I, lacto-N- difucohexaoses II, lacto-N-neodifucohexaoses I, lacto-N-hexaoses, lacto-N-neohexaoses, para-lacto-N-hexaoses and para-lacto-N-neohexaoses.
В дополнительном воплощении питательная композиция выбрана из группы, состоящей из медицинских композиций, фармацевтических композиций, нутрицевтических композиций, детских питательных смесей и биологически активных добавок.In a further embodiment, the nutritional composition is selected from the group consisting of medical compositions, pharmaceutical compositions, nutraceutical compositions, infant formulas and dietary supplements.
Питательная композиция может быть представлена в жидкой форме или в твердой форме, включая порошки, гранулы, хлопья и пеллеты, но, не ограничиваясь ими.The nutritional composition may be presented in liquid form or solid form, including, but not limited to, powders, granules, flakes and pellets.
Настоящее изобретение будет описано относительно конкретных воплощений, но данное изобретение не ограничивается ими, а только формулой изобретения. Кроме того, термины первый, второй и тому подобное в описании и в формуле изобретения используются для проведения различия между похожими элементами и не обязательно для описания последовательности, во времени, в пространстве, по рангу или любым другим образом. Следует понимать, что термины, используемые таким образом, являются взаимозаменяемыми в соответствующих обстоятельствах, и что воплощения изобретения, описанные в данном документе, способны работать в последовательностях, отличных от описанных или проиллюстрированных в данном документе.The present invention will be described with respect to specific embodiments, but the invention is not limited to them, but only to the claims. In addition, the terms first, second, and the like in the specification and claims are used to distinguish between like elements and not necessarily to describe sequence, in time, space, rank, or any other manner. It should be understood that the terms used in this manner are interchangeable in appropriate circumstances, and that the embodiments of the invention described herein are capable of operating in sequences other than those described or illustrated herein.
Следует отметить, что термин «содержащий», используемый в формуле изобретения, не следует считать ограничивающимся средствами, перечисленными в дальнейшем; он не исключает других элементов или стадий. Таким образом, его следует считать определяющим наличие заявленных признаков, целых чисел, стадий или компонентов, на которые ссылаются, но он не исключает наличие или добавление одного или более других признаков, целых чисел, стадий или компонентов или их групп. Таким образом, объем выражения «устройство, содержащее средства А и В» не следует ограничивать устройствами, состоящими только из компонентов А и В. Оно означает, что в отношении настоящего изобретения, единственными релевантными компонентами устройства являются А и В.It should be noted that the term “comprising” as used in the claims should not be considered limited to the means listed below; it does not exclude other elements or stages. Thus, it should be considered to determine the presence of the claimed features, integers, steps or components referred to, but it does not exclude the presence or addition of one or more other features, integers, steps or components or groups thereof. Thus, the scope of the expression "device comprising means A and B" should not be limited to devices consisting only of components A and B. It means that for the purposes of the present invention, the only relevant components of the device are A and B.
Ссылка на всем протяжении данного описания изобретения на «одно воплощение» или «воплощение» означает, что конкретный признак, структура или характеристика, описанные в связи с данным воплощением, включены в по меньшей мере одно воплощение настоящего изобретения. Таким образом, появления фраз «в одном воплощении» или «в воплощении» в разных местах по всему объему данного описания изобретения не обязательно все относятся к одному и тому же воплощению, но могут. Кроме того, конкретные признаки, структуры или характеристики могут быть объединены любым подходящим образом, как будет очевидно среднему специалисту в данной области из данного раскрытия, в одном или более воплощениях.Reference throughout this specification to “one embodiment” or “embodiment” means that the particular feature, structure, or characteristic described in connection with that embodiment is included in at least one embodiment of the present invention. Thus, appearances of the phrases “in one embodiment” or “in an embodiment” in different places throughout this specification do not necessarily all refer to the same embodiment, but may. Moreover, specific features, structures, or characteristics may be combined in any suitable manner, as will be apparent to one of ordinary skill in the art from this disclosure, in one or more embodiments.
Аналогично, следует понимать, что в описании иллюстративных воплощений изобретения разные признаки изобретения иногда сгруппированы вместе в одном единственном воплощении, фигуре или его описании в целях упрощения раскрытия и помощи в понимании одного или более из разных аспектов изобретения. Данный способ раскрытия, однако, не нужно считать отражающим мысль, что заявленное изобретение требует больше признаков, чем явным образом перечислены в каждом пункте. Скорее, как отражено в приведенной ниже формуле изобретения, аспекты изобретения заключаются меньше чем во всех признаках одного вышеизложенного раскрытого воплощения. Таким образом, формула изобретения после подробного описания явным образом включена тем самым в данное подробное описание, причем каждый пункт отдельно стоит в виде отдельного воплощения данного изобретения.Likewise, it should be understood that in the description of illustrative embodiments of the invention, various features of the invention are sometimes grouped together in one single embodiment, figure, or description thereof for the purpose of simplifying the disclosure and aiding in understanding one or more of the various aspects of the invention. This manner of disclosure, however, should not be taken to imply that the claimed invention requires more features than are expressly listed in each claim. Rather, as reflected in the claims below, aspects of the invention are comprised of less than all of the features of the one disclosed embodiment set forth above. Thus, the claims following the detailed description are hereby expressly incorporated into this detailed description, with each claim standing alone as a separate embodiment of the invention.
Кроме того, в то время как некоторые воплощения, описанные в данном документе, включают некоторые, но не все признаки, включенные в другие воплощения, подразумевается, что комбинации признаков разных воплощений находятся в объеме изобретения и образуют разные воплощения, как будет понятно специалистам в данной области. Например, в приведенной ниже формуле изобретения любое из заявленных воплощений можно использовать в любой комбинации.In addition, while some embodiments described herein include some, but not all, of the features included in other embodiments, it is understood that combinations of features of different embodiments are within the scope of the invention and form different embodiments, as will be appreciated by those skilled in the art. areas. For example, in the claims below, any of the claimed embodiments can be used in any combination.
Кроме того, некоторые из воплощений описаны в данном документе как способ или комбинация элементов способа, которые могут быть реализованы посредством процессора компьютерной системы или с помощью других средств выполнения функции. Таким образом, процессор с необходимыми инструкциями для осуществления такого способа или элемента способа образует средство осуществления способа или элемента способа. Кроме того, описанный в данном документе элемент воплощения аппарата представляет собой пример средства осуществления функции, выполняемой элементом, с целью осуществления изобретения.In addition, some of the embodiments are described herein as a method or combination of method elements that may be implemented by a computer system processor or other means of performing a function. Thus, a processor with the necessary instructions for implementing such method or method element constitutes means for implementing the method or method element. In addition, the apparatus embodiment described herein is an example of a means of implementing the function performed by the apparatus for the purpose of carrying out the invention.
В описании и графических материалах, предоставленных в данном документе, изложены многочисленные конкретные подробности. Однако, понятно, что воплощения изобретения можно осуществлять на практике без данных конкретных подробностей. В других примерах хорошо известные способы, структуры и методики не были показаны подробно для того, чтобы не затруднять понимание. Теперь изобретение будет описано с помощью подробного описания нескольких воплощений изобретения. Ясно, что другие воплощения изобретения могут быть скомпонованы в соответствии со знаниями специалистов в данной области, не отклоняясь от истинной сущности или технической идеи изобретения, причем изобретение ограничено только условиями прилагаемой формулы изобретения.Numerous specific details are set forth in the descriptions and graphics provided herein. However, it will be understood that embodiments of the invention may be practiced without these specific details. In other examples, well-known methods, structures and techniques have not been shown in detail in order to avoid obstruction of understanding. The invention will now be described by way of detailed description of several embodiments of the invention. It is clear that other embodiments of the invention can be put together in accordance with the knowledge of those skilled in the art without deviating from the true spirit or technical idea of the invention, the invention being limited only by the terms of the appended claims.
ПримерыExamples
Пример 1: Трансформация Bacillus subtilisExample 1: Transformation of Bacillus subtilis
Bacillus subtilis можно подвергать генетическим манипуляциям посредством разных методик. Для трансформации В. subtilis компетентные клетки готовили посредством модифицированного протокола двухстадийного способа (Anagnostopoulos, С.and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). Ночную культуру инокулировали в среде MG1 и встряхивали при 37°С. Среда MG1 представляет собой минимальную среду Спицайзена, которая дополнена 0,5% глюкозой, 5 мМ MgSO4 и 0,02% казаминовыми кислотами (возможно, дополнительно дополнена биотином и/или L-триптофаном). На следующее утро данную культуру разводили 1:20 в свежей среде MG1 и инкубировали при 37°С в течение приблизительно 6 ч. 1 мл культуры разводили в 8 мл среды MG2, которая отличается от среды MG1 по концентрации казаминовых кислот (0,01% вместо 0,02%). В укороченном протоколе ночную культуру непосредственно разводят в среде MG2. После инкубации в течение еще 90 мин порцию культуры, 1 мл, смешивали с 1-3 мкг мультимерной плазмидной ДНК или линейной ДНК и инкубировали при 37°С в течение 30-60 мин при встряхивании. Мультимерную плазмидную ДНК получали или посредством использования штамма Е. coli NM538 для размножения плазмидной ДНК или посредством линеаризации плазмиды в результате расщепления рестриктазой с одним разрезом, которая осуществляет расщепление в пределах каркаса с последующим повторным лигированием Т4 ДНК лигазой.Bacillus subtilis can be genetically manipulated through various techniques. For transformation of B. subtilis, competent cells were prepared by a modified two-step protocol (Anagnostopoulos, C. and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). The overnight culture was inoculated in MG1 medium and shaken at 37°C. MG1 medium is Spitzeisen's minimal medium supplemented with 0.5% glucose, 5 mM MgSO 4 and 0.02% casamino acids (possibly additionally supplemented with biotin and/or L-tryptophan). The next morning, this culture was diluted 1:20 in fresh MG1 medium and incubated at 37°C for approximately 6 hours. 1 ml of culture was diluted in 8 ml of MG2 medium, which differs from MG1 medium in the concentration of casamino acids (0.01% instead of 0.02%). In the shortened protocol, the overnight culture is directly propagated in MG2 medium. After incubation for another 90 min, a 1 ml portion of the culture was mixed with 1-3 μg of multimeric plasmid DNA or linear DNA and incubated at 37°C for 30-60 min with shaking. Multimeric plasmid DNA was prepared either by using E. coli strain NM538 to propagate the plasmid DNA or by linearizing the plasmid by digestion with a single cut restriction enzyme that cleaves within the framework followed by re-ligation with T4 DNA ligase.
Затем, клетки распределяли по чашкам с 2xYT и агаром, содержащим соответствующий антибиотик. Антибиотики добавляли в следующих концентрациях: 5 мкг⋅мл-1 эритромицина, 5 мкг⋅мл-1 хлорамфеникола, 10 мкг⋅мл-1 канамицина. 100 мкг⋅мл-1 спектиномицина.The cells were then plated with 2xYT and agar containing the appropriate antibiotic. Antibiotics were added in the following concentrations: 5 μg⋅ml -1 erythromycin, 5 μg⋅ml -1 chloramphenicol, 10 μg⋅ml -1 kanamycin. 100 µg⋅ml -1 spectinomycin.
В качестве альтернативы, для трансформации протопластов (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559) клетки выращивали в 20 мл бульона Penassay (РАВ) при 37°С до начала стационарной фазы роста (OD600 (от англ. optical density - оптическая фаза) равна 1,7-2). Затем клетки осаждали и ресуспендировали в 10 мл среды SMPP (0,3%-ный бычий сывороточный альбумин, 5%-ная 2 М сахароза, 25% 4× РАВ, 50% 2× SMM), состоящей из 2×SMM, представляющего собой 1 М сахарозу, 0,04 М гидрат двунатриевой соли малеиновой кислоты и 0,04 М MgCl2 (рН 6,5). После добавления лизоцима (10 мг мл-1) и мутанолизина (75 Ед мл-1) смесь инкубировали при 37°С при встряхивании с образованием протопластов. Образование протопластов проверяли посредством микроскопа. Затем протопласты аккуратно собирали посредством центрифугирования при 5200 ×g и 4°С в течение 5 мин, два раза промывали охлажденным льдом промывочным буфером для электротрансформации (1× SMM) и, в конечном итоге, суспендировали в данном растворе. Плазмидную ДНК (1-3 мкг) добавляли к 120 мкл суспензии протопластов, и смесь держали на льду в течение по меньшей мере 5 мин. Смесь для трансформации переносили в кювету, объемом 0,2 см, и один импульс для электропорации прикладывали на уровне 25 мкФ, 400 Ω⋅ и 0,7 кВ. Сразу после разряда электропорации 1 мл восстанавливающей среды (равные объемы 4х РАВ и 2х SMM, свежеприготовленные перед применением) добавляли в кювету. Затем реакционную смесь для трансформации переносили в 2 мл пробирку и инкубировали при 37°С при встряхивании в течение 12 ч. Для регенерации клеточную суспензию распределяли по чашкам с DM3 и агаром (Chang, S. and Cohen, S. (1979) MGG 168(1):111-115) и инкубировали при 37°C в течение 48 ч. Регенерирующая среда DM3 содержала следующие стерильные растворы на литр: 200 мл 4%-ого агара, 100 мл 5%-ных казаминовых кислот, 50 мл 10%-ого дрожжевого экстракта, 100 мл 3,5%-ого K2HPO4 и 1,5%-ого KH2PO4, 25 мл 20%-ной глюкозы, 20 мл 1 М MgCl2, 500 мл 0,5 М сорбита и 5 мл стерилизованного посредством фильтрации 2%-ого бычьего сывороточного альбумина (добавляемые к смеси, когда температура ниже 55°С), и ее дополняли соответствующим антибиотиком.Alternatively, for protoplast transformation (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559), cells were grown in 20 ml Penassay broth (PAB) at 37°C until stationary growth phase (OD 600 (from the English optical density - optical phase) is 1.7-2). Cells were then pelleted and resuspended in 10 ml SMPP medium (0.3% bovine serum albumin, 5% 2 M sucrose, 25% 4× PAB, 50% 2× SMM), consisting of 2× SMM, which is 1 M sucrose, 0.04 M disodium maleic acid hydrate and 0.04 M MgCl 2 (pH 6.5). After adding lysozyme (10 mg ml -1 ) and mutanolysin (75 U ml -1 ), the mixture was incubated at 37°C with shaking to form protoplasts. The formation of protoplasts was checked using a microscope. The protoplasts were then carefully collected by centrifugation at 5200 × g and 4°C for 5 min, washed twice with ice-cold electrotransformation wash buffer (1× SMM), and finally suspended in this solution. Plasmid DNA (1-3 μg) was added to 120 μl of protoplast suspension, and the mixture was kept on ice for at least 5 minutes. The transformation mixture was transferred into a 0.2 cm cuvette, and one electroporation pulse was applied at 25 μF, 400 Ω⋅ and 0.7 kV. Immediately after the electroporation discharge, 1 ml of reducing medium (equal volumes of 4x PAB and 2x SMM, freshly prepared before use) was added to the cuvette. The transformation reaction mixture was then transferred to a 2 ml tube and incubated at 37°C with shaking for 12 hours. For regeneration, the cell suspension was distributed onto DM3 and agar plates (Chang, S. and Cohen, S. (1979) MGG 168( 1):111-115) and incubated at 37°C for 48 hours. The regenerating medium DM3 contained the following sterile solutions per liter: 200 ml of 4% agar, 100 ml of 5% casamino acids, 50 ml of 10% of yeast extract, 100 ml of 3.5% K 2 HPO 4 and 1.5% KH 2 PO 4 , 25 ml of 20% glucose, 20 ml of 1 M MgCl 2 , 500 ml of 0.5 M sorbitol and 5 ml of filter-sterilized 2% bovine serum albumin (added to the mixture when the temperature is below 55°C), and it was supplemented with the appropriate antibiotic.
Электропорацию В. subtilis проводили в соответствии с модифицированным протоколом от Zhang et al. (2011), предоставленным MoBiTec GmbH (Zhang.G., Bao,P., Zhang,Y., Deng,A., Chen,N. и Wen,T. (2011) Anal. Biochem., 409:130-137). Ночную культуру 2x YT разводили в 100 раз свежей средой 2х YT, и культуру выращивали до OD600 0,2 при 37°С на ротационной качалке. Затем культуру дополняли 1%-ным DL-треонином, 2%-ным глицином, 0,1%-ным триптофаном и 0,03% Tween 80. После культивирования в течение еще 60 мин клеточную суспензию охлаждали на льду в течение 20 мин, центрифугировали при 5000 × g в течение 10 мин при 4°С и два раза промывали буфером для электропорации (0,5 М трегалоза, 0,5 М сорбит, 0,5 М маннит, 0,5 мМ MgCl2, 0,5 мМ K2HPO4, 0,5 мМ KH2PO4, рН 7,4, стерилизовали посредством фильтрации и хранили в замороженном виде). Наконец, клетки ресуспендировали в буфере для электропорации в соотношении 1/100 исходного объема культуры, и 100 мкл клеточной суспензии смешивали с ДНК. Смесь для трансформации переносили в 0,1-см кювету, и электропорацию проводили при 1,8 кВ с помощью одного импульса, доставляемого посредством прибора MicroPulser™ (Bio-Rad). Сразу после доставки импульса 1 мл бульона 2х YT, содержащего 0,5 М сорбит и 0,38 М маннит, добавляли в кювету. Суспензию для трансформации переносили в пробирку, объемом 2 мл, и инкубировали при 37°С в течение 3 ч на ротационной качалке. Клетки распределяли по чашке с 2х YT и агаром и инкубировали при 37°С в течение ночи.Electroporation of B. subtilis was performed according to a modified protocol from Zhang et al. (2011) provided by MoBiTec GmbH (Zhang.G., Bao,P., Zhang,Y., Deng,A., Chen,N. and Wen,T. (2011) Anal. Biochem., 409:130-137 ). The overnight 2x YT culture was diluted 100-fold with fresh 2x YT medium and the culture was grown to an OD 600 of 0.2 at 37°C on a rotary shaker. The culture was then supplemented with 1% DL-threonine, 2% glycine, 0.1% tryptophan, and 0.03% Tween 80. After culturing for another 60 min, the cell suspension was cooled on ice for 20 min, centrifuged at 5000 × g for 10 min at 4°C and washed twice with electroporation buffer (0.5 M trehalose, 0.5 M sorbitol, 0.5 M mannitol, 0.5 mM MgCl 2 , 0.5 mM K 2 HPO 4 , 0.5 mM KH 2 PO 4 , pH 7.4, filter sterilized and stored frozen). Finally, the cells were resuspended in electroporation buffer at a ratio of 1/100 of the original culture volume, and 100 μl of the cell suspension was mixed with DNA. The transformation mixture was transferred to a 0.1 cm cuvette and electroporation was performed at 1.8 kV with a single pulse delivered by a MicroPulser™ instrument (Bio-Rad). Immediately after delivery of the pulse, 1 ml of 2x YT broth containing 0.5 M sorbitol and 0.38 M mannitol was added to the cuvette. The transformation suspension was transferred into a 2 ml test tube and incubated at 37°C for 3 hours on a rotary shaker. Cells were spread on a 2x YT agar plate and incubated at 37°C overnight.
Используя альтернативный протокол электропорации (Xue, G.P., J.S. Johnson and В.P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 мл седы LB, содержащей 0,5 M глюцит, инокулировали В. subtilis и инкубировали в течение ночи при 37°С.Далее, ночную культуру разводили (1:16) 75 мл LB, содержащей 0,5 М глюцит, и инкубировали до получения OD600 0,85-0,95. Затем клетки осаждали посредством центрифугирования в течение 10 мин при 4°С при 5,000хg и четыре раза промывали буфером для электропорации, охлажденным посредством льда (10% глицерин, 0,5 М глюцит, 0,5 М маннит). Наконец, клетки ресуспендировали в 1-2 мл буфера для электропорации. Электропорацию проводили, используя 60 мкл компетентных клеток с ДНК в охлажденной кювете для электропорации (расстояние между электродами 1 мм). Смесь клетки-ДНК подвергали воздействию одного электрического импульса на уровне 25 мкФ, 200 Ω и 21 кВ/см. Наконец, 1 мл бульона для восстановления (LB, содержащая 0,5 М глюцит и 0,38 М маннит) добавляли к электропермеабилизированным клеткам, и бактериальную культуру инкубировали в течение 3 ч при 37°С с последующим посевом на LB с агаром с добавлением антибиотика.Using an alternative electroporation protocol (Xue, G.P., J.S. Johnson and B.P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 ml of LB sedum containing 0.5 M glucite was inoculated with B. subtilis and incubated in overnight at 37°C. Next, the overnight culture was diluted (1:16) with 75 ml of LB containing 0.5 M glucite and incubated until an OD 600 of 0.85-0.95 was obtained. Cells were then pelleted by centrifugation for 10 min at 4°C at 5,000 xg and washed four times with ice-cold electroporation buffer (10% glycerol, 0.5 M glucose, 0.5 M mannitol). Finally, the cells were resuspended in 1–2 ml of electroporation buffer. Electroporation was performed using 60 μl of competent cells with DNA in a chilled electroporation cuvette (distance between electrodes 1 mm). The cell-DNA mixture was exposed to a single electrical pulse at 25 μF, 200 Ω, and 21 kV/cm. Finally, 1 ml of recovery broth (LB containing 0.5 M glucite and 0.38 M mannitol) was added to the electropermeabilized cells, and the bacterial culture was incubated for 3 h at 37°C, followed by plating on LB agar supplemented with antibiotic. .
Использовали две разные обогащенные среды, а именно бульон Luria (LB) и 2х YT.Two different enriched media were used, namely Luria broth (LB) and 2x YT.
Среда бульон Luria (LB) состояла из 1%-ого триптона, 0,5%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,2).Luria broth (LB) medium consisted of 1% tryptone, 0.5% yeast extract, and 0.5% NaCl (pH 7.2).
Среда 2х YT состояла из 1,6%-ого триптона, 1%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,5).2x YT medium consisted of 1.6% tryptone, 1% yeast extract and 0.5% NaCl (pH 7.5).
Для получения чашек с обогащенной средой с агаром добавляли 15 г л-1 агара.To obtain plates with enriched agar medium, 15 g l -1 agar was added.
Для экспериментов со встряхиваемыми колбами использовали минимальную среду Спицайзена (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U. S. A. 44(10):1072-1078).For shake flask experiments, Spizizen's minimal medium was used (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U.S.A. 44(10):1072-1078).
Минимальная среда Спицайзена содержит следующие соли: 2 г/л (NH4)2SO4, 14 г/л K2HPO4, 6 г/л KH2PO4, 1 г/л цитрата Na3 × 2⋅H2O и 0,2 г/л MgSO4 × 7⋅H2O.Spitzeisen's minimal medium contains the following salts: 2 g/l (NH 4 ) 2 SO 4 , 14 g/l K 2 HPO 4 , 6 g/l KH 2 PO 4 , 1 g/l citrate Na 3 × 2⋅H 2 O and 0.2 g/l MgSO 4 × 7⋅H 2 O.
Предкультуральная среда, состоящая из минимальных солей Спицайзена, дополненная 2% D-глюкозой, 0,05% казаминовыми кислотами и MgSO4, до конечной концентрации 2 мМ (возможно дополнительно дополненная биотином и/или L-триптофаном).Preculture medium consisting of Spitzen salts supplemented with 2% D-glucose, 0.05% casamino acids and MgSO 4 to a final concentration of 2 mM (optionally supplemented with biotin and/or L-tryptophan).
Основная культуральная среда состояла из минимальных солей Спицайзена, дополненная 2%-ной D-глюкозой, 0,05%-ными казаминовыми кислотами, MgSO4 до конечной концентрации 2 мМ и 0,5 мл⋅л-1 1000х раствора микроэлементов (возможно дополнительно дополненная биотином и/или L-триптофаном).The main culture medium consisted of minimal Spitzeisen salts, supplemented with 2% D-glucose, 0.05% casamino acids, MgSO 4 to a final concentration of 2 mM and 0.5 ml⋅l -1 1000x solution of microelements (possibly additionally supplemented biotin and/or L-tryptophan).
Раствор микроэлементов (1000х) состоял из 100,6 г л-1 C6H9NO6, 56,4 г⋅л-1 цитрата железа (III)-аммония, 9,8 г⋅л-1 MnCl2 × 4⋅H2O, 1,6 г⋅л-1 CoCl2 × 6⋅H2O, 1 г⋅л-1 CuCl2 × 2⋅H2O, 1,9 г⋅л-1 Н3 BO3, 9 г⋅л-1 ZnSO4 × 7⋅H2O, 1,1 г⋅л-1 Na2MoO4 × 2⋅H2O, 1,5 г⋅л-1 Na2SeO3, 1,5 г⋅л-1 NiSO4 × 6⋅H2O.The trace element solution (1000x) consisted of 100.6 g l -1 C 6 H 9 NO 6 , 56.4 g⋅l -1 iron (III)-ammonium citrate, 9.8 g⋅l -1 MnCl 2 × 4⋅ H 2 O, 1.6 g⋅l -1 CoCl 2 × 6⋅H 2 O, 1 g⋅l -1 CuCl 2 × 2⋅H 2 O, 1.9 g⋅l -1 H 3 BO 3 , 9 g⋅l -1 ZnSO4 × 7⋅H 2 O, 1.1 g⋅l -1 Na 2 MoO 4 × 2⋅H 2 O, 1.5 g⋅l -1 Na 2 SeO 3 , 1.5 g ⋅l -1 NiSO 4 × 6⋅H 2 O.
При необходимости, соответствующий(ие) антибиотик(и) добавляли к среде для того, чтобы сделать ее селективной.If necessary, appropriate antibiotic(s) were added to the medium in order to make it selective.
Штаммы В. subtilis исходно выращивали на чашках с обогащенными средами с агаром с получением одиночных колоний. Данные чашки выращивали в течение 1 суток при 30-37°С. В экспериментах со встряхиваемыми колбами 20 мл предварительной культуры инокулировали одиночной колонией и выращивали в течение ночи при 30-37°С на ротационной качалке. Следующие 20 мл основных культур инокулировали данной предварительной культурой до начальной OD600 примерно 0,1 и инкубировали при 30-37°С на ротационной качалке. Если требовалась индукция, 40-60 мл основной культуры разбивали на порции по 20 мл в момент времени индукции. Объем культуры не превышал 20% емкости встряхиваемой колбы.B. subtilis strains were initially grown on enriched agar plates to produce single colonies. These dishes were grown for 1 day at 30-37°C. For shake flask experiments, 20 mL of preculture was inoculated with a single colony and grown overnight at 30–37°C on a rotary shaker. The next 20 ml of main cultures were inoculated with this preculture to an initial OD 600 of approximately 0.1 and incubated at 30-37°C on a rotary shaker. If induction was required, 40–60 ml of the main culture was divided into 20 ml portions at the induction time point. The volume of the culture did not exceed 20% of the capacity of the shake flask.
Пример 2: Конструирование штамма-продуцента Bacillus subtilis для 3'-сиалиллактозыExample 2: Construction of a Bacillus subtilis producer strain for 3'-sialyllactose
Для синтеза 3'-сиалиллактозы из метаболического промежуточного соединения - УДФ-N-ацетилглюкозамина с использованием пути neuCBA, конструировали экспрессионную плазмиду В. subtilis (SEQ ID NO: 1). Сначала гены neuA, neuB, neuC, а также α-2,3-сиалилтрансферазу, подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac. Ген neuB Campylobacter jejuni (номер доступа UniProtKB: Q93MP9) кодирует синтазу сиаловой кислоты. Ген neuC Campylobacter jejuni (номер доступа UniProtKB: Q93MP8) кодирует N-ацетилглюкозамин-6-фосфат 2-эпимеразу. Ген siaT Pasteurella multocida (номер доступа UniProtKB: Q9CLP3) кодирует α-2,3-сиалилтрансферазу. Открытую рамку считывания гена lacY Е. coli (номе доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР (полимеразная цепная реакция) из хромосомной ДНК. Затем, конструировали экспрессионную кассету <Pgrac100-neuBCA-siaT-lacY-terminator>, которая содержит все необходимые гены под контролем индуцибельного промотора Pgrac100. С этой целью, экспрессионный вектор рНТ253 В. subtilis (MoBiTec GmbH, Göttingen, Германия) использовали в качестве каркаса. Каждый ген в пределах экспрессионной кассеты связывали с последовательностью RBS В. subtilis. Дополнительно, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) помещали ниже экспрессионной кассеты. Полученную плазмиду <pHT253-Pgrac100-neuBCA-2,3siaT-lacY-terminator> (SEQ ID NO: 1) использовали для трансформации спорообразующего штамма В. subtilis (таблица 1) посредством использования его природной компетентности.To synthesize 3'-sialyllactose from the metabolic intermediate UDP-N-acetylglucosamine using the neuCBA pathway, a B. subtilis expression plasmid (SEQ ID NO: 1) was constructed. First, the neuA, neuB, neuC genes, as well as the α-2,3-sialyltransferase, were codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. The Campylobacter jejuni neuA gene (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase . The neuB gene of Campylobacter jejuni (UniProtKB accession number: Q93MP9) encodes sialic acid synthase. The neuC gene of Campylobacter jejuni (UniProtKB accession number: Q93MP8) encodes N-acetylglucosamine 6-phosphate 2-epimerase. The Pasteurella multocida siaT gene (UniProtKB accession number: Q9CLP3) encodes an α-2,3-sialyltransferase. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR (polymerase chain reaction) from chromosomal DNA. Then, an expression cassette <P grac100 -neuBCA-siaT-lacY-terminator> was constructed, which contains all the necessary genes under the control of the inducible P grac100 promoter. For this purpose, the B. subtilis expression vector pHT253 (MoBiTec GmbH, Göttingen, Germany) was used as a scaffold. Each gene within the expression cassette was linked to the B. subtilis RBS sequence. Additionally, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was placed downstream of the expression cassette. The resulting plasmid <pHT253-P grac100 -neuBCA-2,3siaT-lacY-terminator> (SEQ ID NO: 1) was used to transform the spore-forming B. subtilis strain (Table 1) by exploiting its natural competence.
Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 3'-сиалиллактозы в присутствии экзогенной лактозы.Transformants were cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose.
Пример 3: Конструирование штамма-продуцента Bacillus subtilis для 3'-сиалиллактозыExample 3: Construction of a Bacillus subtilis producer strain for 3'-sialyllactose
Для синтеза 3'-сиалиллактозы из метаболического промежуточного соединения - УДФ-N-ацетилглюкозамина с использованием пути neuCBA, конструировали конститутивную экспрессионную плазмиду В. subtilis (SEQ ID NO: 2). Сначала, гены neuA, neuB, neuC и siaT подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac. Ген neuB Campylobacter jejuni (номер доступа UniProtKB: Q93MP9) кодирует синтазу сиаловой кислоты.To synthesize 3'-sialyllactose from the metabolic intermediate UDP-N-acetylglucosamine using the neuCBA pathway, a B. subtilis constitutive expression plasmid (SEQ ID NO: 2) was constructed. First, the neuA, neuB, neuC, and siaT genes were codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. The Campylobacter jejuni neuA gene (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase. The neuB gene of Campylobacter jejuni (UniProtKB accession number: Q93MP9) encodes sialic acid synthase.
Ген neuC Campylobacter jejuni (номер доступа UniProtKB: Q93MP8) кодирует N-ацетилглюкозамин-6-фосфат 2-эпимеразу. Ген siaT Pasteurella multocida (номер доступа UniProtKB: Q9CLP3) кодирует α-2,3-сиалилтрансферазу. Открытую рамку считывания гена lacY Е. coli (номе доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК. Затем, конструировали экспрессионную кассету <P43-neuBCA-PlepA-siaT-lacY-terminator>, которая содержит все необходимые гены, функционально связанные с двумя сильными конститутивными промоторами В. subtilis и/или Р43. Экспрессионный вектор рНТ253 В. subtilis (MoBiTec GmbH, Göttingen, Германия) использовали в качестве каркаса плазмиды. Каждый ген в пределах экспрессионной кассеты был связан с последовательностью RBS В. subtilis. Дополнительно, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) помещали ниже экспрессионной кассеты.The neuC gene of Campylobacter jejuni (UniProtKB accession number: Q93MP8) encodes N-acetylglucosamine 6-phosphate 2-epimerase. The Pasteurella multocida siaT gene (UniProtKB accession number: Q9CLP3) encodes an α-2,3-sialyltransferase. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA. Then, an expression cassette <P43-neuBCA-P lepA -siaT-lacY-terminator> was constructed, which contains all the necessary genes functionally associated with two strong constitutive promoters of B. subtilis and/or P43. The B. subtilis expression vector pHT253 (MoBiTec GmbH, Göttingen, Germany) was used as the plasmid backbone. Each gene within the expression cassette was linked to the B. subtilis RBS sequence. Additionally, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was placed downstream of the expression cassette.
Полученную плазмиду <phT253-P43-neuBCA--siaT-lacY-terminator> (SEQ ID NO: 2) использовали для трансформации спорообразующего и неспорообразующего штаммов В. subtilis (таблица 1) посредством использования их природной компетентности.The resulting plasmid <phT253-P43-neuBCA- -siaT-lacY-terminator> (SEQ ID NO: 2) was used to transform spore-forming and non-spore-forming strains of B. subtilis (Table 1) by exploiting their natural competence.
Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 3'-сиалиллактозы в присутствии экзогенной лактозы.Transformants were cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose.
Пример 4: Конструирование штамма-продуцента Bacillus subtilis для 6'-сиалиллактозыExample 4: Construction of a Bacillus subtilis producer strain for 6'-sialyllactose
Для продукции 6'-сиалиллактозы в В. subtilis использовали α-2,6-сиалилтрансферазу из Photobacterium leiognathi. Открытую рамку считывания гена siaT (номер доступа UniProtKB: D0VYB7) подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.α-2,6-sialyltransferase from Photobacterium leiognathi was used to produce 6'-sialyllactose in B. subtilis. The open reading frame of the siaT gene (UniProtKB accession number: D0VYB7) was codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp.
Экспрессионную плазмиду <pHT253-Pgrac100-neuBCA-2,6siaT-lacY-terminator> (SEQ ID NO: 3) конструировали, как описано в примере 2. Полученную плазмиду (SEQ ID NO: 3) использовали для трансформации спорообразующего и неспорообразующего штаммов В. subtilis (Таблица 1) посредством использования их природной компетентности. Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 6'-сиалиллактозы в присутствии экзогенной лактозы.The expression plasmid <pHT253-P grac100 -neuBCA-2,6siaT-lacY-terminator> (SEQ ID NO: 3) was constructed as described in example 2. The resulting plasmid (SEQ ID NO: 3) was used to transform the spore-forming and non-spore-forming strains B subtilis (Table 1) by exploiting their natural competence. Gene expression was confirmed by targeted proteomics and/or real-time PCR. Transformants were cultured under conditions that are permissive for B. subtilis to produce 6'-sialyllactose in the presence of exogenous lactose.
Пример 5: Конструирование штамма Bacillus subtilis для получения 3'-сиалиллактозыExample 5: Construction of a Bacillus subtilis strain for the production of 3'-sialyllactose
Конструирование метаболизма В. subtilis (Таблица 1) достигалось посредством интеграции гетерологичных генов neuA Campylobacter jejuni, nanT Е. coli и siaT Haemophilus parahaemolyticus и одновременного удаления эндогенного гена ganA посредством гомологичной рекомбинации. Ген ganA В. subtilis (yvfN, lacA), который расположен в пределах галактозного оперона, кодирует бета-галактозидазу.Engineering the metabolism of B. subtilis (Table 1) was achieved by integrating the heterologous neuA genes of Campylobacter jejuni, nanT of E. coli, and siaT of Haemophilus parahaemolyticus and simultaneous deletion of the endogenous ganA gene through homologous recombination. The ganA gene of B. subtilis (yvfN, lacA), which is located within the galactose operon, encodes beta-galactosidase.
Для продукции 3'-сиалиллактозы из экзогенной сиаловой кислоты/N-ацетилнейраминовой кислоты и лактозы, открытые рамки считывания neuA, nanT и siaT были функционально связаны с конститутивным промотором Р43 В. subtilis (часть репозитория iGem: ID последовательности: ВВа_K143013) в виде оперона. С этой целью, во-первых, гены neuA, nanT и siaT подвергали оптимизации кодонов для экспрессиии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac, ген nanT Е. coli (номер доступа GenBank: NP_417691.4) кодирует транспортер сиаловой кислоты и ген siaT Н. parahaemolyticus (номер доступа UniProtKB: I3DHL4) кодирует альфа-N-ацетилнейраминил-2,3-бета-галактозил-1,3-N-ацетилгалактозаминид 6-альфа-сиалилтрансферазу (альфа-2,3-сиалилтрансферазу).For the production of 3'-sialyllactose from exogenous sialic acid/N-acetylneuraminic acid and lactose, the open reading frames neuA, nanT and siaT were functionally linked to the constitutive B. subtilis P43 promoter (part of the iGem repository: Sequence ID: BBa_K143013) as an operon. To this end, firstly, the neuA, nanT and siaT genes were codon optimized for expression in B. subtilis and obtained synthetically by GenScript Corp. The neuA gene of Campylobacter jejuni (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase, the nanT E gene . coli (GenBank accession number: NP_417691.4) encodes the sialic acid transporter and the siaT gene H. parahaemolyticus (UniProtKB accession number: I3DHL4) encodes alpha-N-acetylneuraminyl-2,3-beta-galactosyl-1,3-N-acetylgalactosaminide 6-alpha-sialyltransferase (alpha-2,3-sialyltransferase).
Каждый ген в пределах экспрессионной кассеты был связан с последовательностью RBS В. subtilis. Кроме того, подходящая терминирующая последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) была расположена ниже экспрессионной кассеты.Each gene within the expression cassette was linked to the B. subtilis RBS sequence. In addition, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was located downstream of the expression cassette.
Клонирующий вектор pBR322 (New England Biolabs GmbH, Франкфурт, Германия) использовали в качестве каркаса плазмиды. Кассету полной интеграции собирали для создания суицидной плазмиды<pBR322 flank ganA up-Р43-siaT-neuA-nanT-terminator-erm-flank ganA down>(SEQ ID NO: 4). Затем, В. subtilis трансформировали данной плазмидой за счет ее природной компетентности. Клетки распределяли по чашкам с 2х YT и агаром, содержащей соответствующий антибиотик (5 мкг мл-1 эритромицина). Интеграцию экспрессионной кассеты <Р43-siaT-neuA-nanT-terminator> в локус ganA генома В. subtilis, с получением штамма А, проверяли посредством ПЦР на колониях. Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Cloning vector pBR322 (New England Biolabs GmbH, Frankfurt, Germany) was used as the plasmid backbone. The full integration cassette was assembled to create the suicide plasmid<pBR322 flank ganA up-P43-siaT-neuA-nanT-terminator-erm-flank ganA down>(SEQ ID NO: 4). Then, B. subtilis was transformed with this plasmid due to its natural competence. The cells were spread on 2x YT and agar plates containing the appropriate antibiotic (5 μg ml -1 erythromycin). Integration of the <P43-siaT-neuA-nanT-terminator> expression cassette into the ganA locus of the B. subtilis genome, resulting in strain A, was verified by colony PCR. Gene expression was confirmed by targeted proteomics and/or real-time PCR.
Для импортирования экзогенной лактозы в клетку Bacillus ген lacY Е. coli интегрировали в эндогенный локус amyE (amyA) генома В. subtilis (кодирующий альфа-амилазу). С этой целью, открытую рамку считывания гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК. Кассету интеграции <flank amyE up-1ох71-aad9-lox66-P43-lacY-flank amyE down> (SEQ ID NO: 5) конструировали и клонировали в pBR322 (New England Biolabs GmbH, Фанкфурт, Германия). Штамм A трансформировали полученной суицидной плазмидой за счет природной компетентности. Интеграцию экспрессионной кассеты <Р43-lacY> в локус amyE штамма А, с получением конечного штамма В проверяли посредством ПЦР на колониях.To import exogenous lactose into the Bacillus cell, the E. coli lacY gene was integrated into the endogenous amyE (amyA) locus of the B. subtilis genome (encoding alpha-amylase). For this purpose, the open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA. The <flank amyE up-1ox71-aad9-lox66-P43-lacY-flank amyE down> integration cassette (SEQ ID NO: 5) was constructed and cloned into pBR322 (New England Biolabs GmbH, Fankfurt, Germany). Strain A was transformed with the resulting suicide plasmid due to natural competence. Integration of the <P43-lacY> expression cassette into the amyE locus of strain A, resulting in the final strain B, was verified by colony PCR.
Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Штамм В культивировали в условиях, которые являются пермиссивными в отношении В. subtilis с получением 3'-сиалиллактозы в присутствии экзогенной лактозы и сиаловой кислоты/N-ацетилнейраминовой кислоты.Gene expression was confirmed by targeted proteomics and/or real-time PCR. Strain B was cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose and sialic acid/N-acetylneuraminic acid.
Пример 6: Получение сиалиллактозы с использованием штаммов Bacillus subtilis с модифицированным метаболизмомExample 6: Production of sialyllactose using modified metabolism strains of Bacillus subtilis
Предварительную культуру инокулировали штаммом Bacillus subtilis с модифицированным метаболизмом, подходящим для биосинтеза сиалиллактозы (как описано в примерах 2-5).The preculture was inoculated with a Bacillus subtilis strain with a modified metabolism suitable for the biosynthesis of sialyllactose (as described in examples 2-5).
Предварительную культуру инкубировали при 30-37°С в течение ночи и затем разводили до исходной OD600 примерно 0,1 в свежей основной культуральной среде. Когда основная культура достигала OD600 приблизительно 0,5, 2 мМ лактозу добавляли к среде для выращивания. Когда для экспрессии гена использовали индуцибельный промотор Pgrac100, индукцию осуществляли посредством лактозы (2 мМ) или как лактозы (2 мМ), так и IPTG (от англ. isopropylthiogalactoside -изопропилтиогалактозид) (1 мМ). Для утилизирующего биосинтеза CMP-N-ацетилнейраминовой кислоты, дополнительно, добавляли 2 мМ сиаловой кислоты/N-ацетилнейраминовой кислоты. Культивирование прекращали после примерно 24 ч/48 ч после индукции, и внутриклеточную и внеклеточную сиалиллактозу анализировали посредством тонкослойной хроматографии и/или ВЭЖХ (высокоэффективной жидкостной хроматографии) и/или масс-спектрометрии (как описано в WO 2017/042382 А или WO 2019/008133 А). Выявляли биосинтез существенных количеств сиалиллактозы (3'-сиалиллактозы/6'-сиалиллактозы).The preculture was incubated at 30-37°C overnight and then diluted to an initial OD 600 of approximately 0.1 in fresh basal culture medium. When the main culture reached an OD 600 of approximately 0.5, 2 mM lactose was added to the growth medium. When the inducible P grac100 promoter was used for gene expression, induction was accomplished by lactose (2 mM) or both lactose (2 mM) and IPTG (1 mM). For the utilization biosynthesis of CMP-N-acetylneuraminic acid, 2 mM sialic acid/N-acetylneuraminic acid was additionally added. Culture was stopped after approximately 24 h/48 h post-induction, and intracellular and extracellular sialyllactose were analyzed by thin layer chromatography and/or HPLC and/or mass spectrometry (as described in WO 2017/042382 A or WO 2019/008133 A). The biosynthesis of significant amounts of sialyllactose (3'-sialyllactose/6'-sialyllactose) was detected.
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ LIST OF SEQUENCES
<110> Jennewein Biotechnologie GmbH<110> Jennewein Biotechnologie GmbH
<120> ПРОДУКЦИЯ СИАЛИРОВАННЫХ ОЛИГОСАХАРИДОВ В КЛЕТКАХ BACILLUS<120> PRODUCTION OF SIALYLATED OLIGOSACCHARIDES IN BACILLUS CELLS
<130> P 1906 WO<130>P 1906 WO
<160> 5<160> 5
<170> PatentIn version 3.5<170> Patent In version 3.5
<210> 1<210> 1
<211> 13121<211> 13121
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Экспрессионная плазмида<223> Expression plasmid
<400> 1<400> 1
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa
60 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa
120 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat
180 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt
240 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat
300 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag
360 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt
420 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt
480 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc
540 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga
600 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa
660 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct
720 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa
780 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc
840 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat
900 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa
960 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct
10201020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact
10801080
atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg
11401140
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta
12001200
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc
12601260
gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga
13201320
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt
13801380
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt
14401440
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg
15001500
aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc
15601560
gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat
16201620
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt
16801680
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc
17401740
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc
18001800
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag
18601860
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt
19201920
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat
19801980
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag
20402040
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac
21002100
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg
21602160
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg caggggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg
22202220
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt
22802280
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc
23402340
ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt
24002400
gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg gaatatttga ttgatcgtaa cgatgaag cactctttcc actatcccta cagtgttatg
24602460
gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca
25202520
aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt
25802580
ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag
26402640
gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa
27002700
gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa
27602760
acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg
28202820
tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg
28802880
cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa
29402940
tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca
30003000
tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac
30603060
tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagagata
31203120
tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac
31803180
atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca
32403240
ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa
33003300
caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga
33603360
aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg
34203420
gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca
34803480
gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat
35403540
cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac
36003600
aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg
36603660
aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag
37203720
cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt
37803780
taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt
38403840
ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa
39003900
attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg
39603960
gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact
40204020
acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat
40804080
atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg
41404140
cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa
42004200
ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc
42604260
tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa
43204320
tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg
43804380
aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg
44404440
tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc
45004500
agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc
45604560
ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct
46204620
ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca
46804680
tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg
47404740
gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag
48004800
ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata
48604860
gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga
49204920
aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg
49804980
cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc
50405040
ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct
51005100
caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa
51605160
gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga
52205220
aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa
52805280
acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta
53405340
gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt
54005400
tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat
54605460
atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat
55205520
ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt
55805580
gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg
56405640
aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc
57005700
aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt
57605760
agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt
58205820
ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac
58805880
aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg
59405940
gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac
60006000
ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa
60606060
cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt
61206120
taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa
61806180
aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat
62406240
catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac
63006300
ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa
63606360
gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt
64206420
ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa
64806480
catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac
65406540
acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttcttttact acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttctttttact
66006600
tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata
66606660
tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc
67206720
aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta
67806780
ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac
68406840
aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg
69006900
ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat
69606960
ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca
70207020
tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc
70807080
tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg
71407140
cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc
72007200
caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg
72607260
accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg
73207320
tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc
73807380
cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt
74407440
ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa
75007500
cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc
75607560
agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac
76207620
tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg
76807680
gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc
77407740
ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat
78007800
ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc
78607860
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt
79207920
gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct
79807980
gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg
80408040
gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata
81008100
cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt
81608160
tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac
82208220
aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac
82808280
tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt
83408340
ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca
84008400
agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt
84608460
aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca
85208520
atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat
85808580
tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc
86408640
caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc
87008700
caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta
87608760
agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag
88208820
aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg
88808880
aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc
89408940
ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg
90009000
aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa
90609060
acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa
91209120
tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag
91809180
agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata
92409240
taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct
93009300
attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca
93609360
gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg
94209420
ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg
94809480
tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg
95409540
ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg
96009600
aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga
96609660
aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc
97209720
cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa
97809780
aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa
98409840
ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc
99009900
cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat
99609960
tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta
1002010020
aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat
1008010080
aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca
1014010140
gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt
1020010200
aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca
1026010260
atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga
1032010320
aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag
1038010380
ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa
1044010440
taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca
1050010500
tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga
1056010560
atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt
1062010620
agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt
1068010680
tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa
1074010740
agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact
1080010800
ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat
1086010860
cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat
1092010920
atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct
1098010980
cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt
1104011040
gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt
1110011100
taacaactcg atttgttttt ccagatctcg agggtaacta gcctcgccga tcccgcaaga taacaactcg atttgttttt cgagatctcg agggtaacta gcctcgccga tcccgcaaga
1116011160
ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt
1122011220
tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca
1128011280
ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt
1134011340
ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga
1140011400
tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa
1146011460
gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct
1152011520
gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat
1158011580
acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga
1164011640
tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc
1170011700
caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat
1176011760
gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa
1182011820
cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac
1188011880
tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa
1194011940
agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc
1200012000
tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc
1206012060
ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag
1212012120
acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta
1218012180
ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa
1224012240
gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc
1230012300
gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat
1236012360
ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga
1242012420
gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt
1248012480
ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata
1254012540
cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac
1260012600
cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg
1266012660
ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg
1272012720
tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag
1278012780
cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct
1284012840
ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc
1290012900
aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt
1296012960
ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg
1302013020
tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga
1308013080
gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c
1312113121
<210> 2<210> 2
<211> 11125<211> 11125
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Плазмида<223> Plasmid
<400> 2<400> 2
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa
60 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa
120 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat
180 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt
240 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat
300 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag
360 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt
420 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt
480 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc
540 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga
600 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa
660 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct
720 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa
780 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc
840 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat
900 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa
960 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct
10201020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact
10801080
atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta
11401140
tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa
12001200
catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa
12601260
cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat
13201320
catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat
13801380
cccgggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa cccggggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa
14401440
agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc
15001500
gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg
15601560
ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat
16201620
gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct
16801680
tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa
17401740
tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact
18001800
ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt
18601860
cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat
19201920
ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg
19801980
caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc
20402040
ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg
21002100
ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa
21602160
gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc
22202220
tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta
22802280
ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat
23402340
ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa
24002400
aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa
24602460
agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct
25202520
gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa
25802580
caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt
26402640
aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag
27002700
acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct
27602760
ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa
28202820
ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa
28802880
aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat
29402940
ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa
30003000
caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa
30603060
aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa
31203120
aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact
31803180
gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca
32403240
ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct
33003300
tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa
33603360
aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa
34203420
aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc
34803480
gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa
35403540
ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga
36003600
tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt
36603660
tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa
37203720
cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat
37803780
ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata
38403840
tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat
39003900
ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt
39603960
tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga
40204020
acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta
40804080
cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt
41404140
gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag
42004200
aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat
42604260
tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact
43204320
gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt
43804380
tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta
44404440
cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc
45004500
atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga
45604560
tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag
46204620
atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc
46804680
aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga
47404740
agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg
48004800
caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt
48604860
tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa
49204920
acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa
49804980
agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt
50405040
tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac
51005100
cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg
51605160
ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg
52205220
atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct
52805280
atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg
53405340
ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt
54005400
atttttatct tcgggccact gttacaatac aacattttag taggatcgat tgttggtggt atttttatct tcggggccact gttacaatac aacattttag taggatcgat tgttggtggt
54605460
atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa
55205520
gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg
55805580
gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg
56405640
ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg
57005700
ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag
57605760
ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc
58205820
gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt
58805880
gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt
59405940
aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc
60006000
ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca
60606060
gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg
61206120
ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg
61806180
gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat
62406240
atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc
63006300
ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt
63606360
caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc
64206420
ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa
64806480
gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact
65406540
ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta
66006600
ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg
66606660
aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt
67206720
tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat
67806780
aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg
68406840
tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta
69006900
acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat
69606960
ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca
70207020
ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac
70807080
agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat
71407140
caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga
72007200
agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg
72607260
tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga
73207320
aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt
73807380
tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta
74407440
cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa
75007500
ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga
75607560
agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa
76207620
gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga
76807680
atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata
77407740
tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca
78007800
aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt
78607860
cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg
79207920
gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga
79807980
atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga
80408040
agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt
81008100
tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt
81608160
taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt
82208220
aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt
82808280
aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa
83408340
tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg
84008400
acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg
84608460
attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt
85208520
gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg
85808580
aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta
86408640
tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg
87008700
gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat
87608760
agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa
88208820
tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt
88808880
ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac
89408940
cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa
90009000
aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag
90609060
gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt
91209120
ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt
91809180
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca
92409240
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg
93009300
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc
93609360
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg
94209420
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt
94809480
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta
95409540
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat
96009600
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga
96609660
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca
97209720
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact
97809780
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc
98409840
acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact
99009900
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt
99609960
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt
1002010020
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt
1008010080
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata
1014010140
ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag
1020010200
attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat
1026010260
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa
1032010320
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca
1038010380
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt
1044010440
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg
1050010500
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc
1056010560
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga
1062010620
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc
1068010680
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc
1074010740
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca
1080010800
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg
1086010860
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta
1092010920
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct
1098010980
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag
1104011040
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa
1110011100
gcggaagagc gcccaatacg catgc gcggaagagc gcccaatacg catgc
1112511125
<210> 3<210> 3
<211> 13805<211> 13805
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Экспрессионная плазмида<223> Expression plasmid
<400> 3<400> 3
ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa
60 60
tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa
120 120
gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat
180 180
aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt
240 240
tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat
300 300
ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag
360 360
gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt
420 420
ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt
480 480
tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc
540 540
cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga
600 600
aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa
660 660
tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct
720 720
cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa
780 780
tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc
840 840
ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat
900 900
ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa
960 960
aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct
10201020
tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact
10801080
atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg
11401140
gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta
12001200
agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc
12601260
gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga
13201320
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt
13801380
attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt
14401440
caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg
15001500
aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc
15601560
gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat
16201620
tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt
16801680
cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc
17401740
tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc
18001800
cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag
18601860
atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt
19201920
ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat
19801980
ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag
20402040
attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac
21002100
gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg
21602160
cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg caggggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg
22202220
tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt
22802280
tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc
23402340
ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt
24002400
gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg gaatatttga ttgatcgtaa cgatgaag cactctttcc actatcccta cagtgttatg
24602460
gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca
25202520
aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt
25802580
ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag
26402640
gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa
27002700
gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa
27602760
acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg
28202820
tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg
28802880
cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa
29402940
tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca
30003000
tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac
30603060
tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagagata
31203120
tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac
31803180
atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca
32403240
ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa
33003300
caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga
33603360
aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg
34203420
gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca
34803480
gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat
35403540
cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac
36003600
aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg
36603660
aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag
37203720
cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt
37803780
taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt
38403840
ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa
39003900
attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg
39603960
gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact
40204020
acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat
40804080
atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg
41404140
cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa
42004200
ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc
42604260
tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa
43204320
tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg
43804380
aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg
44404440
tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc
45004500
agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc
45604560
ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct
46204620
ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca
46804680
tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg
47404740
gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag
48004800
ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata
48604860
gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga
49204920
aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg
49804980
cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc
50405040
ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct
51005100
caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa
51605160
gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga
52205220
aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa
52805280
acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta
53405340
gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt
54005400
tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat
54605460
atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat
55205520
ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt
55805580
gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg
56405640
aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat
57005700
gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac
57605760
aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt
58205820
caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt
58805880
gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat
59405940
ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat
60006000
gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac
60606060
gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac
61206120
gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta
61806180
gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca
62406240
aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc
63006300
aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg
63606360
tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg
64206420
aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac
64806480
tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa
65406540
ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat
66006600
ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat
66606660
caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga
67206720
acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc
67806780
gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc
68406840
tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac
69006900
atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg
69606960
gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct
70207020
tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg
70807080
cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca
71407140
gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc
72007200
attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt
72607260
tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga
73207320
tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta
73807380
tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc
74407440
tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta
75007500
tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttttatctt cggggccactg ttacaataca acattttagt aggatcgatt gttggtggta
75607560
tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag
76207620
tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg
76807680
cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc
77407740
tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc
78007800
cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc
78607860
tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg
79207920
tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg
79807980
ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta
80408040
acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc
81008100
tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag
81608160
cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg
82208220
gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg
82808280
tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata
83408340
tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct
84008400
tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc
84608460
aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc
85208520
taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag
85808580
actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg
86408640
gctcaccttc gggtgggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg gctcaccttc gggtggggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg
87008700
cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta
87608760
cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt
88208820
actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt
88808880
tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt
89408940
tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct
90009000
tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct
90609060
agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct
91209120
gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg
91809180
aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg
92409240
gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag
93009300
atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga
93609360
accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag
94209420
cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt
94809480
aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac
95409540
aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag
96009600
ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac
96609660
attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc
97209720
ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc
97809780
gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag
98409840
tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt
99009900
ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata
99609960
attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc
1002010020
acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg
1008010080
ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt
1014010140
acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc
1020010200
cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc
1026010260
ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa
1032010320
aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg
1038010380
atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata
1044010440
tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat
1050010500
cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg
1056010560
aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca
1062010620
aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta
1068010680
agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa
1074010740
aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta
1080010800
gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat
1086010860
ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa
1092010920
gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat
1098010980
ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca
1104011040
ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta
1110011100
agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actctttact agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actcttttact
1116011160
ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt
1122011220
ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca
1128011280
gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc
1134011340
ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc
1140011400
tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca
1146011460
acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt
1152011520
ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt
1158011580
gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa
1164011640
tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc
1170011700
tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt
1176011760
attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta
1182011820
actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt
1188011880
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag
1194011940
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca
1200012000
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc
1206012060
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat
1212012120
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc
1218012180
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg
1224012240
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc
1230012300
agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat
1236012360
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga
1242012420
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc
1248012480
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc
1254012540
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt
1260012600
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc
1266012660
tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc
1272012720
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca
1278012780
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca
1284012840
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt
1290012900
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta
1296012960
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg
1302013020
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc
1308013080
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag
1314013140
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa
1320013200
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc
1326013260
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc
1332013320
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta
1338013380
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag
1344013440
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct
1350013500
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga
1356013560
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc
1362013620
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt
1368013680
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg
1374013740
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg
1380013800
catgc catgc
1380513805
<210> 4<210> 4
<211> 10838<211> 10838
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Суицидная плазмида<223> Suicide plasmid
<400> 4<400> 4
ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa
60 60
ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg
120 120
caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt
180 180
gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata
240 240
tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg
300 300
ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac
360 360
cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac
420 420
aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca
480 480
cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg
540 540
actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct
600 600
caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat
660 660
gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt
720 720
cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct
780 780
ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct
840 840
tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa
900 900
acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt
960 960
cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc
10201020
cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca
10801080
tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc
11401140
gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat
12001200
tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg
12601260
ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga
13201320
attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac
13801380
atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg
14401440
tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg
15001500
ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc
15601560
tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg
16201620
taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca
16801680
ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga
17401740
ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa
18001800
cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt cgttccagta acggggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt
18601860
ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc
19201920
aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt
19801980
ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac
20402040
gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac
21002100
ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc
21602160
agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc
22202220
cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg
22802280
tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc
23402340
tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta
24002400
tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct
24602460
gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg
25202520
aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa
25802580
tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa
26402640
gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc
27002700
gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc
27602760
ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt
28202820
gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat gaatgatgtc atggggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat
28802880
accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg
29402940
cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca cggaacgaag ggctaagaga acaagggagga gaatgtgatg tcaaagcttg aaaaaacgca
30003000
cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga
30603060
tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt
31203120
ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa
31803180
aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg
32403240
aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa
33003300
acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat
33603360
caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc
34203420
agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc
34803480
gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata
35403540
ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct
36003600
ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga
36603660
aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag
37203720
atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt
37803780
ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca
38403840
tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc
39003900
tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat
39603960
ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca
40204020
gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg
40804080
atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg
41404140
aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc
42004200
tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg
42604260
ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa
43204320
acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta
43804380
tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag
44404440
gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca
45004500
aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga
45604560
atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg
46204620
ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa
46804680
catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt
47404740
ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt
48004800
acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta
48604860
aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt
49204920
ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta
49804980
aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta
50405040
tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa
51005100
tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc
51605160
cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct
52205220
atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg
52805280
aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat
53405340
ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg
54005400
tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata
54605460
ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa
55205520
gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc
55805580
ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc
56405640
cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt
57005700
ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac
57605760
ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta
58205820
tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg
58805880
caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt
59405940
ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc
60006000
tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca
60606060
atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct
61206120
gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc
61806180
ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc
62406240
ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga
63006300
aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata
63606360
atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc
64206420
tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt
64806480
taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa
65406540
cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa
66006600
acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa
66606660
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac
67206720
tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat
67806780
ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc
68406840
tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt
69006900
atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt
69606960
aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc
70207020
aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca
70807080
gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta
71407140
tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc
72007200
gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat
72607260
aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat
73207320
aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct
73807380
tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa
74407440
aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt
75007500
gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat
75607560
aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat
76207620
cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt
76807680
aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa
77407740
acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa
78007800
agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat
78607860
atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa
79207920
tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc
79807980
gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct
80408040
ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct
81008100
gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct
81608160
cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg
82208220
aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta
82808280
gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag
83408340
aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg
84008400
tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac
84608460
gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct
85208520
ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa
85808580
aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc
86408640
actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc
87008700
tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga
87608760
tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca
88208820
tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc
88808880
gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg
89408940
caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt
90009000
tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa
90609060
gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct
91209120
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc
91809180
cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg
92409240
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct
93009300
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag
93609360
cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga
94209420
agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga
94809480
agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg
95409540
gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag
96009600
aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag
96609660
ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat
97209720
gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct
97809780
taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac
98409840
tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa
99009900
tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg
99609960
gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt
1002010020
gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca
1008010080
ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt
1014010140
cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct
1020010200
tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg
1026010260
cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg cagcactgca taattctctt actngtcatgc catccgtaag atgcttttct gtgactggtg
1032010320
agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg
1038010380
cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa
1044010440
aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt
1050010500
aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt
1056010560
gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt
1062010620
gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca
1068010680
tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat
1074010740
ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata
1080010800
aaaataggcg tatcacgagg ccctttcgtc ttcaagaa aaaataggcg tatcacgagg ccctttcgtc ttcaagaa
1083810838
<210> 5<210> 5
<211> 4254<211> 4254
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Интерграционная кассета<223> Integration cassette
<400> 5<400> 5
gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc
60 60
atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa
120 120
aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat
180 180
gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg
240 240
tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg
300 300
ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca
360 360
attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca
420 420
ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg
480 480
cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag
540 540
aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt
600 600
ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat
660 660
tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg
720 720
gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg
780 780
agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt
840 840
tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa
900 900
caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc
960 960
agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa
10201020
aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac
10801080
tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga
11401140
acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac
12001200
ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt
12601260
agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag
13201320
acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat
13801380
tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga
14401440
atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt
15001500
aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt
15601560
agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc agaggaatta ctacctgata ttccatttc tgatgtgaga agagccatta tggattcgtc
16201620
agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg
16801680
tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt
17401740
ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct
18001800
tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa
18601860
cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt
19201920
tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc
19801980
tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg
20402040
gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta
21002100
agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt
21602160
ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca
22202220
tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt
22802280
ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata
23402340
cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt
24002400
cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg
24602460
cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg
25202520
cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc
25802580
ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg
26402640
ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc
27002700
cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga
27602760
actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac
28202820
ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga
28802880
acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat
29402940
tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc
30003000
tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt
30603060
ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa
31203120
atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg
31803180
cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag
32403240
catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat
33003300
ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga
33603360
agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt
34203420
atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact
34803480
taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc
35403540
tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa
36003600
gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa
36603660
gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa
37203720
ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg
37803780
atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca
38403840
tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct
39003900
ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt
39603960
gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc
40204020
ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc
40804080
acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct
41404140
caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc
42004200
cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg
42544254
<---<---
Claims (16)
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP19195148.2 | 2019-09-03 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| RU2816764C1 true RU2816764C1 (en) | 2024-04-04 |
Family
ID=
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007101862A1 (en) * | 2006-03-09 | 2007-09-13 | Centre National De La Recherche Scientifique (Cnrs) | Method of producing sialylated oligosaccharides |
| RU2593321C2 (en) * | 2010-11-23 | 2016-08-10 | Нестек С.А. | Oligosaccharide composition for treating acute respiratory infections |
| WO2018122225A1 (en) * | 2016-12-27 | 2018-07-05 | Inbiose N.V. | In vivo synthesis of sialylated compounds |
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007101862A1 (en) * | 2006-03-09 | 2007-09-13 | Centre National De La Recherche Scientifique (Cnrs) | Method of producing sialylated oligosaccharides |
| RU2593321C2 (en) * | 2010-11-23 | 2016-08-10 | Нестек С.А. | Oligosaccharide composition for treating acute respiratory infections |
| WO2018122225A1 (en) * | 2016-12-27 | 2018-07-05 | Inbiose N.V. | In vivo synthesis of sialylated compounds |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20230113685A (en) | Production of sialylated oligosaccharides in Bacillus cells | |
| AU2021204574B2 (en) | Probiotic and prebiotic compositions, and methods of use thereof for modulation of the microbiome | |
| AU2015315110B2 (en) | Alpha (1,3) fucosyltransferases for use in the production of fucosylated oligosaccharides | |
| KR102424721B1 (en) | Peptide-mediated delivery of rna-guided endonuclease into cells | |
| KR102267412B1 (en) | Rna trnascription vector and uses thereof | |
| CA3098403C (en) | Biosynthesis of human milk oligosaccharides in engineered bacteria | |
| EP2970872B1 (en) | Microorganisms and methods for producing sialylated and n-acetylglucosamine-containing oligosaccharides | |
| Kobata | Exo-and endoglycosidases revisited | |
| Bouma et al. | Sugar transport by the marine chitinolytic bacterium Vibrio furnissii: molecular cloning and analysis of the glucose and N-acetylglucosamine permeases | |
| CN110267663A (en) | Glycan polymers and related methods | |
| KR20220020826A (en) | Production of Fucosylated Oligosaccharides in Bacillus | |
| CN111065740B (en) | 2-O-sulfurylase mutants and 3-O-sulfurylase mutants and methods of using the same | |
| TW202221129A (en) | Cellular production of di- and/or oligosaccharides | |
| Nishimoto et al. | Identification of the putative proton donor residue of lacto-N-biose phosphorylase (EC 2.4. 1.211) | |
| RU2816764C1 (en) | Production of sialylated oligosaccharides in bacillus cells | |
| US20120276131A1 (en) | Anti-trypanosomiasis vaccines and diagnostics | |
| Skåne et al. | The fish pathogen Aliivibrio salmonicida LFI1238 can degrade and metabolize chitin despite gene disruption in the chitinolytic pathway | |
| KR20210005178A (en) | Therapeutic genome editing in X-linked high IGM syndrome | |
| CN108699580A (en) | The Heparan sulfate with high 3-O- sulphations ratio in aminoglucose saccharide residue | |
| KR20120128647A (en) | Process for production and purification of recombinant lysosomal alpha-mannosidase | |
| HK40075120A (en) | Production of sialylated oligosaccharides in bacillus cells | |
| Watanabe et al. | Molecular characterization of a novel β1, 3-galactosyltransferase for capsular polysaccharide synthesis by Streptococcus agalactiae type Ib | |
| Sokolovskaya et al. | Dysbiosis-associated gut bacterium Ruminococcus gnavus varies at the strain level in ability to utilize key mucin component sialic acid | |
| US20140349339A1 (en) | PmST3 ENZYME FOR CHEMOENZYMATIC SYNTHESIS OF ALPHA-2-3-SIALOSIDES | |
| US7309600B2 (en) | Haemophilus influenzae sialyltransferase and methods of use thereof |