[go: up one dir, main page]

RU2816764C1 - Production of sialylated oligosaccharides in bacillus cells - Google Patents

Production of sialylated oligosaccharides in bacillus cells Download PDF

Info

Publication number
RU2816764C1
RU2816764C1 RU2022107329A RU2022107329A RU2816764C1 RU 2816764 C1 RU2816764 C1 RU 2816764C1 RU 2022107329 A RU2022107329 A RU 2022107329A RU 2022107329 A RU2022107329 A RU 2022107329A RU 2816764 C1 RU2816764 C1 RU 2816764C1
Authority
RU
Russia
Prior art keywords
bacillus
bacillus cell
sialyltransferase
genetically engineered
cell
Prior art date
Application number
RU2022107329A
Other languages
Russian (ru)
Inventor
Штефан ЙЕННЕВАЙН
Дирк ВАРТЕНБЕРГ
Штефани ХАБЕРЗЕТЦЕР
Original Assignee
Хр. Ханзен ХМО ГмбХ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Хр. Ханзен ХМО ГмбХ filed Critical Хр. Ханзен ХМО ГмбХ
Application granted granted Critical
Publication of RU2816764C1 publication Critical patent/RU2816764C1/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention represents a non-spore-forming Bacillus cell for producing a sialylated oligosaccharide, wherein said Bacillus cell is genetically engineered to contain lactose permease, a CMP-NeuNAc biosynthesis pathway and sialyltransferase, wherein the Bacillus cell sporulation capacity is impaired as a result of deletion or functional inactivation of one or more genes coding Spo0A, sigma E and sigma F. Invention also relates to a method of producing a sialylated oligosaccharide using said Bacillus cell.
EFFECT: disclosed is a non-spore-forming Bacillus cell for producing a sialylated oligosaccharide.
13 cl, 1 dwg, 3 tbl, 6 ex

Description

Настоящее изобретение относится к области техники генной инженерии, в частности, к генной инженерии клеток Bacillus для получения сиалированных олигосахаридов в указанных клетках Bacillus, к ферментативной продукции сиалированных олигосахаридов с использованием указанных клеток Bacillus и к применению полученных таким образом сиалированных олигосахаридов.The present invention relates to the field of genetic engineering, in particular to the genetic engineering of Bacillus cells to produce sialylated oligosaccharides in said Bacillus cells, to the enzymatic production of sialylated oligosaccharides using said Bacillus cells and to the use of the sialylated oligosaccharides thus obtained.

Предшествующий уровень техникиPrior Art

Человеческое грудное молоко обеспечивает детей грудного возраста всеми питательными веществами, в которых они нуждаются для здорового роста и развития. Сахариды, которые присутствуют в человеческом грудном молоке, представляют собой его основной компонент, превосходя жиры и белки. Помимо лактозы, которая служит источником энергии, человеческое грудное молоко содержит молекулы более сложных сахаридов, а именно, олигосахаридов. На сегодняшний день в человеческом грудном молоке идентифицировано приблизительно 200 структурно отличающихся олигосахаридов. Данные олигосахариды обнаружены в значимых концентрациях только в человеческом молоке, и они суммарно известны как олигосахариды грудного молока (ОГМ). Указанные ОГМ основаны на дисахариде - лактозе (состоящей из группировки глюкозы (Glc) и группировки галактозы (Gal)) и несут дополнительные остатки моносахаридов, которые основаны на N-ацетил-глюкозамине (GlcNAc), фукозе (Fuc), сиаловой кислоте/N-ацетилнейраминовой кислоте (NeuNAc) и/или галактозе (Gal). Концентрация и состав ОГМ в человеческом грудном молоке варьирует среди индивидуумов и на протяжении периода лактации от вплоть до 20 г/л в молозиве до 5-10 г/л в зрелом молоке.Human breast milk provides infants with all the nutrients they need for healthy growth and development. Sugars, which are present in human breast milk, represent its main component, surpassing fats and proteins. In addition to lactose, which serves as a source of energy, human breast milk contains molecules of more complex saccharides, namely oligosaccharides. To date, approximately 200 structurally distinct oligosaccharides have been identified in human breast milk. These oligosaccharides are found in significant concentrations only in human milk, and they are collectively known as human milk oligosaccharides (HMOs). These HGMs are based on the disaccharide lactose (consisting of a glucose group (Glc) and a galactose group (Gal)) and carry additional monosaccharide residues that are based on N-acetyl-glucosamine (GlcNAc), fucose (Fuc), sialic acid/N- acetylneuraminic acid (NeuNAc) and/or galactose (Gal). The concentration and composition of HMOs in human breast milk varies among individuals and throughout the lactation period, from up to 20 g/L in colostrum to 5-10 g/L in mature milk.

Значимое число ОГМ несет одну группировку NeuNAc. Среди данных сиалированных олигосахаридов грудного молока (СОГМ), 3'-сиалиллактоза, 6'-сиалиллактоза, сиалиллакто-N-тетраоза а, сиалиллакто-N-тетраоза b, сиалиллакто-N-тетраоза с и дисиалиллакто-N-тетраоза представляют собой наиболее распространенные члены в человеческом грудном молоке.A significant number of OGMs carry one NeuNAc group. Among these sialylated human milk oligosaccharides (HOMS), 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c and disialyllacto-N-tetraose are the most common members in human breast milk.

Сиаловые кислоты (Sia) представляют собой семейство отрицательно заряженных моносахаридов с каркасом из девяти атомов углерода. Более чем 50 форм данных α-кетокислот обнаружено в природе. Наиболее распространенной сиаловой кислотой, по-видимому, является N-ацетилнейраминовая кислота (NANA -от англ. N-acetylneuraminic acid, NeuNAc, Neu5Ac).Sialic acids (Sia) are a family of negatively charged monosaccharides with a backbone of nine carbon atoms. More than 50 forms of these α-keto acids have been found in nature. The most common sialic acid appears to be N-acetylneuraminic acid (NANA - N-acetylneuraminic acid, NeuNAc, Neu5Ac).

Сиаловые кислоты находятся в качестве концевых моносахаридных группировок гликанов, которые находятся в гликоконъюгатах (гликопротеины и гликолипиды) на поверхности клеток позвоночных и высших беспозвоночных. Сиаловые кислоты являются компонентами липополисахаридов и капсульных полисахаридов патогенных бактерий, включая Escherichia coli K1, Haemophilus influenzae, Haemophilus ducreyi, Pateurella multocida, Neisseria gonorrhoeae, Neisseria meningitidis, Campylobacter jejuni и Streptococcus agalactiae.Sialic acids are found as terminal monosaccharide groups of glycans that are found in glycoconjugates (glycoproteins and glycolipids) on the surface of vertebrate and higher invertebrate cells. Sialic acids are components of lipopolysaccharides and capsular polysaccharides of pathogenic bacteria, including Escherichia coli K1, Haemophilus influenzae, Haemophilus ducreyi, Pateurella multocida, Neisseria gonorrhoeae, Neisseria meningitidis, Campylobacter jejuni and Streptococcus agalactiae.

Наблюдали, что сиалированные ОГМ поддерживают устойчивость грудного ребенка к энтеропатогенным бактериям и вирусам. Что интересно, недавние исследования, кроме того, продемонстрировали защитное действие длинноцепочечных СОГМ в отношении некротического энтероколита, который является одним из наиболее распространенных и смертельных заболеваний у недоношенных новорожденных. Кроме того, показано, что сиалированные олигосахариды нейтрализуют энтеротоксины разных патогенных микробов, включая Escherichia coli, Vibrio cholerae и Salmonella. Кроме того, обнаружено, что сиалированные олигосахариды препятствуют колонизации кишечника Helicobacter pylori и, вследствие этого, предотвращают или ингибируют язвы желудка и двенадцатиперстной кишки. Кроме того, полагают, что сиалированные олигосахаирды поддерживают развитие головного мозга младенца и его когнитивные способности.It has been observed that sialylated HGMs support the infant's resistance to enteropathogenic bacteria and viruses. Interestingly, recent studies have also demonstrated a protective effect of long-chain SOGM against necrotizing enterocolitis, which is one of the most common and fatal diseases in preterm infants. In addition, sialylated oligosaccharides have been shown to neutralize enterotoxins from a variety of pathogenic microbes, including Escherichia coli, Vibrio cholerae and Salmonella. In addition, sialylated oligosaccharides have been found to inhibit colonization of the intestine by Helicobacter pylori and consequently prevent or inhibit gastric and duodenal ulcers. In addition, sialylated oligosaccharides are believed to support infant brain development and cognitive abilities.

Благодаря известной пользе от ОГМ, главным образом сиалированных ОГМ, экономически целесообразный способ их получения является желательным, таким образом, чтобы данные сиалированные олигосахариды или по меньшей мере некоторые из данных сиалированных олигосахаридов стали доступными в качестве добавки к детским питательным смесям.Due to the known benefits of HMOs, primarily sialylated HMOs, an economically viable method for preparing them is desirable such that these sialylated oligosaccharides, or at least some of these sialylated oligosaccharides, become available as an additive to infant formulas.

Ограниченная доступность грудного молока для целей, отличных от грудного вскармливания грудного ребенка, и сложности получения чистых фракций отдельных олигосахаридов грудного молока из природных источников привели к разработке химических путей их синтеза. Однако, и химический синтез, и биокаталитические подходы in-vitro оказались коммерчески нерациональными. Кроме того, в частности химический синтез олигосахаридов грудного молока включает применение нескольких вредных химических веществ, которые накладывают риск загрязнения конечного продукта.The limited availability of human milk for purposes other than infant breastfeeding and the difficulty of obtaining pure fractions of individual human milk oligosaccharides from natural sources have led to the development of chemical routes for their synthesis. However, both chemical synthesis and in-vitro biocatalytic approaches have proven to be commercially unsustainable. In addition, the chemical synthesis of human milk oligosaccharides in particular involves the use of several harmful chemicals that pose a risk of contamination of the final product.

В качестве альтернативы химическому и биокаталитическому синтезу in-vitro разработано ферментативное получение ОГМ. На сегодняшний день, рекомбинантные клетки Escherichia coli используют для микробной продукции некоторых ОГМ в промышленном масштабе.As an alternative to chemical and biocatalytic synthesis in-vitro, the enzymatic production of OGM has been developed. Today, recombinant Escherichia coli cells are used for the microbial production of certain HMOs on an industrial scale.

Однако, род Escherichia coli включает патогенные члены, а также непатогенные члены. Несмотря на то, что для микробной продукции ОГМ используют непатогенные штаммы Е. coli, такие непатогенные Е. coli не считают безопасными для изготовления продуктов, которые предназначены для потребления человеком во множестве областей. Это мешает одобрению контролирующими органами ОГМ, изготавливаемых современными биотехнологическими способами, для потребления человеком в указанных областях. Таким образом, микробные клетки родов, которые расценивались бы как безопасные для потребления человеком или расценивались бы как безопасные при использовании в получении соединений для потребления человеком в таких областях, необходимы для изготовления сахаридов, которые предназначены для потребления человеком, например, олигосахаридов грудного молока, в частности, для потребления грудными детьми. Применение продуктивных штаммов, считающихся безопасными, уменьшает, по меньшей мере предположительно, проблемы в отношении вероятности рисков для здоровья человека, обусловленных сахаридом, и будет облегчать их одобрение контролирующими органами в большинстве областей.However, the genus Escherichia coli includes pathogenic members as well as non-pathogenic members. Although non-pathogenic E. coli strains are used for HGM microbial production, such non-pathogenic E. coli are not considered safe for the manufacture of products intended for human consumption in a variety of applications. This prevents regulatory approval of HGMs produced by modern biotechnological methods for human consumption in these areas. Thus, microbial cells of genera that would be considered safe for human consumption or would be considered safe when used in the preparation of compounds for human consumption in such areas are needed for the manufacture of saccharides that are intended for human consumption, for example, human milk oligosaccharides, in particularly for consumption by infants. The use of productive strains considered safe will, at least presumably, reduce concerns regarding the likelihood of human health risks posed by the saccharide and will facilitate their regulatory approval in most areas.

Проблема решается посредством использования бактериальных клеток рода Bacillus для получения сиалированных олигосахаридов, в частности сиалированных ОГМ. Бактериальные клетки некоторых видов рода Bacillus уже расцениваются как безопасные для потребления человеком или для получения соединений/пищи для потребления человеком. Следовательно, предложены клетки Bacillus вида и/или штаммов, которые обычно расцениваются как безопасные для получения сиалированных олигосахаридов, в частности, для получения сиалированных олигосахаридов грудного молока.The problem is solved by using bacterial cells of the genus Bacillus to produce sialylated oligosaccharides, in particular sialylated OGM. Bacterial cells of some species of the genus Bacillus are already considered safe for human consumption or for the production of compounds/food for human consumption. Accordingly, Bacillus cells of species and/or strains are provided which are generally regarded as safe for the production of sialylated oligosaccharides, in particular for the production of sialylated oligosaccharides in breast milk.

Бактерии рода Bacillus являются грамположительными, палочковидными, образующими эндоспоры микробными клетками или аэробных, или факультативно анаэробных видов. Род Bacillus принадлежит к типу Фирмикуты. Геном членов рода Bacillus имеет тенденцию к парам оснований А-Т в своей частоте использования кодона. Виды Bacillus почти повсеместно распространены в природе. Например, они могут быть найдены в почве (В. subtilis), а также встречаются в экстремальных условиях окружающей среды, таких как высокий рН (В. alcalophilus), высокая температура (В. thermophilus) или высокое содержание солей (В, halodurans).Bacteria of the genus Bacillus are gram-positive, rod-shaped, endospore-forming microbial cells of either aerobic or facultative anaerobic species. The genus Bacillus belongs to the phylum Firmicutes. The genome of members of the genus Bacillus tends toward A-T base pairs in its codon usage frequency. Bacillus species are almost ubiquitous in nature. For example, they can be found in soil (B. subtilis) and are also found in extreme environmental conditions such as high pH (B. alcalophilus), high temperature (B. thermophilus) or high salt content (B. halodurans).

Род Bacillus включает 266 видов, имеющих название, которые включают свободноживущие виды, а также паразитарные патогенные виды. Два вида Bacillus считаются значимыми с медицинской точки зрения: В. anthracis, который вызывает сибирскую язву, и В. cereus, который вызывает пищевое отравление. Третий вид, В. thuringiensis, является важным патогеном насекомых, продуцирующим токсин, который может уничтожать насекомых. Таким образом, он используется в качестве инсектицида для борьбы с насекомыми-вредителями.The genus Bacillus contains 266 named species, which include free-living species as well as parasitic pathogenic species. Two species of Bacillus are considered medically significant: B. anthracis, which causes anthrax, and B. cereus, which causes food poisoning. The third species, B. thuringiensis, is an important insect pathogen that produces a toxin that can kill insects. Thus, it is used as an insecticide to control insect pests.

Из-за их статуса GRAS (от англ. generally recognized as safe - общепризнан безопасным), несколько видов Bacillus, например, В. amyloliquefaciens, В. licheniformis и B. subtilis, используются в биотехнологическом получении разных белков и соединений, используемых в пищевой и фармацевтической промышленности.Due to their GRAS (generally recognized as safe) status, several Bacillus species, such as B. amyloliquefaciens, B. licheniformis and B. subtilis, are used in the biotechnological production of various proteins and compounds used in food and pharmaceutical industry.

Bacillus amyloliquefaciens является источником рестриктазы BamHI и также синтезирует природный белок - антибиотик барназу. Кроме того, В. amyloliquefaciens продуцирует плантазолицин, антибиотик с селективной активностью в отношении В.anthracis. Альфа-амилаза из В. amyloliquefaciens часто используется в гидролизе крахмала. В. amyloliquefaciens также является источником субтилизина, который катализирует распад белков.Bacillus amyloliquefaciens is a source of the BamHI restriction enzyme and also synthesizes a natural protein, the antibiotic barnase. In addition, B. amyloliquefaciens produces plantazolicin, an antibiotic with selective activity against B. anthracis. Alpha-amylase from B. amyloliquefaciens is often used in starch hydrolysis. B. amyloliquefaciens is also a source of subtilisin, which catalyzes the breakdown of proteins.

Bacillus amyloliquefaciens представляет собой бактерию-колонизатора корней, которая используется для того, чтобы бороться с некоторыми патогенами корней растений в сельском хозяйстве, водной культуре и гидропонике, поскольку она оказывает действие против бактериальных и грибковых патогенов и может предотвращать инфицирование в результате конкурентного исключения или вытеснения нежелательного патогена в конкурентной борьбе.Bacillus amyloliquefaciens is a root colonizing bacterium that is used to control some plant root pathogens in agriculture, aquaculture and hydroponics as it has antibacterial and fungal pathogens and can prevent infection through competitive exclusion or displacement of unwanted pathogen in competition.

Ее высокая способность секретировать щелочную сериновую протеазу сделала B. licheniformis одной из наиболее важных бактерий в промышленном производстве фермента. Субтилизин Carlsberg, секретируемый В. licheniformis, используют в качестве протеазы для моющих средств, и он продается под торговым названием Alcalase®.Its high ability to secrete alkaline serine protease has made B. licheniformis one of the most important bacteria in the industrial production of the enzyme. Carlsberg subtilisin, secreted by B. licheniformis, is used as a protease for detergents and is sold under the trade name Alcalase®.

Bacillus subtilis представляет собой бактерию, позитивную в отношении каталазы, которая обнаружена в почве и желудочно-кишечном тракте жвачных животных и человека. В. subtilis и вещества, происходящие из данной бактерии, не содержащей эндотоксин, оценивались разными авторитетными органами в отношении их безопасности и пользы в применении в пищевой продукции. В Соединенных Штатах ферменты карбогидраза и протеаза из В. subtilis общепризнаны безопасными (GRAS) Управлением по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA - от англ. Food and Drug Administration). Bacillus subtilis также присвоен статус «квалифицированной презумпции безопасности» Европейским агентством по безопасности продуктов питания.Bacillus subtilis is a catalase-positive bacterium that is found in the soil and gastrointestinal tract of ruminants and humans. B. subtilis and substances derived from this endotoxin-free bacterium have been evaluated by various authorities for their safety and benefit in food applications. In the United States, the carbohydrase and protease enzymes from B. subtilis are generally recognized as safe (GRAS) by the US Food and Drug Administration (FDA). Bacillus subtilis has also been given "qualified presumption of safety" status by the European Food Safety Authority.

Кроме того, нетоксигенные и непатогенные штаммы В. subtilis обычно используются в пищевой промышленности. Например, ферментированные соевые бобы в виде натто часто потребляют в Японии, и они содержат вплоть до 108 жизнеспособных клеток В. subtilis на грамм. Натто признают за их вклад в здоровую флору кишечника и поглощение витамина K2. Продукт натто и В. subtilis var. natto в качестве его основного компонента представляют собой FOSHU (от англ. Foods for Specified Health Use - пищевые продукты, специально используемые для поддержания здоровья), одобренные министерством здравоохранения, труда и социальной защиты Японии как эффективные для сохранения здоровья.In addition, non-toxigenic and non-pathogenic strains of B. subtilis are commonly used in the food industry. For example, fermented soybeans in the form of natto are often consumed in Japan and contain up to 10 8 viable B. subtilis cells per gram. Natto is recognized for its contribution to healthy gut flora and vitamin K2 absorption. The product of natto and B. subtilis var. natto as its main component are FOSHU (Foods for Specified Health Use), approved by the Ministry of Health, Labor and Welfare of Japan as effective in maintaining health.

С В. subtilis легко работать, она быстро растет, и условия культивирования являются простыми. Рекомбинантные штаммы В. subtilis используют в продукции полигидроксиалканолатов, гиалуроновой кислоты и разных ферментов, таких как амилаза и протеазы.B. subtilis is easy to work with, grows quickly, and culture conditions are simple. Recombinant strains of B. subtilis are used in the production of polyhydroxyalkanolates, hyaluronic acid and various enzymes such as amylase and proteases.

С природными изолятами В. subtilis дикого типа сложно работать, по сравнению с лабораторными штаммами, которые подвергались процессам одомашнивания на основе мутагенеза и селекции. Данные одомашненные штаммы часто обладают улучшенными способностями к развитию природной компетентности (поглощению и интеграции ДНК окружающей среды), улучшенными способностями к росту и потере способностей, необходимых «в дикой природе». В В. subtilis линейная ДНК, а также мультимерные формы плазмидной ДНК активно поглощаются природными компетентными клетками.Natural isolates of wild-type B. subtilis are difficult to work with compared to laboratory strains that have been subjected to domestication processes based on mutagenesis and selection. These domesticated strains often have improved abilities to develop natural competence (uptake and integration of environmental DNA), improved growth abilities, and loss of abilities required "in the wild." In B. subtilis, linear DNA, as well as multimeric forms of plasmid DNA, are actively taken up by natural competent cells.

В определенных физиологических условиях маленькая субпопуляция клеток В. subtilis становится компетентной. В В. subtilis природная компетентность регулируется сложной регуляторной сетью. Ключевые регуляторы в данной сети представляют собой, среди прочих, мастер регулятор компетентности СоmK и транскрипционный мастер регулятор споруляции SpoOA. Эффективность трансформации клеток В. subtilis и возможно эффективность интеграции ДНК в их геном можно улучшать посредством генной инженерии. Это может быть достигнуто посредством эктопической интеграции экспрессионной кассеты, содержащей регулируемый промотор (например, промотор, индуцируемый маннитом ) и гены comK и comS, в геном В. subtilis. Дополнительно, данная стратегия обеспечивает трансформацию В. subtilis за счет природной компетентности с использованием сложной среды (например, LB).Under certain physiological conditions, a small subpopulation of B. subtilis cells becomes competent. In B. subtilis, natural competence is regulated by a complex regulatory network. Key regulators in this network are, among others, the master competence regulator ComK and the transcriptional master sporulation regulator SpoOA. The efficiency of transformation of B. subtilis cells and possibly the efficiency of DNA integration into their genome can be improved through genetic engineering. This can be achieved through ectopic integration of an expression cassette containing a regulated promoter (e.g. mannitol inducible promoter ) and the comK and comS genes into the B. subtilis genome. Additionally, this strategy enables transformation of B. subtilis through natural competence using a complex environment (eg, LB).

Для продукции сиалированных олигосахаридов клетки Bacillus можно генетически конструировать разными способами.Bacillus cells can be genetically engineered in a variety of ways to produce sialylated oligosaccharides.

Термин «генетически сконструированный», в том виде, в котором он используется в данном документе, относится к модификации генетического состава клетки Bacillus с использованием методов молекулярной биологии. Модификация генетического состава клетки Bacillus может включать перенос генов в пределах и/или через видовые связи, вставку, удаление, замену и/или модификацию нуклеотидов, триплетов, генов, открытых рамок считывания, промоторов, энхансеров, терминаторов и других нуклеотидных последовательностей, опосредуя и/или контролируя экспрессию генов. Модификация генетического состава клетки Bacillus нацелена на создание генетически сконструированной клетки, обладающей конкретными, желательными свойствами. Генетически сконструированные клетки Bacillus могут содержать один или более генов, которые отсутствуют в нативной (не генетически сконструированной) форме клетки. Методики введения экзогенных молекул нуклеиновой кислоты и/или осуществления вставки экзогенных молекул нуклеиновой кислоты (рекомбинантных, гетерологичных) в наследуемую информацию клетки Bacillus для вставки, удаления или изменения нуклеотидной последовательности генетической информации клетки известны квалифицированному специалисту. Генетически сконструированные клетки Bacillus могут содержать один или более генов, которые находятся в нативной форме клетки, где указанные гены модифицированы и повторно введены в клетку Bacillus искусственными средствами. Термин «генетически сконструированный» также охватывает клетки Bacillus, которые содержат молекулу нуклеиновой кислоты, являющуюся эндогенной в отношении клетки, и которая модифицирована без удаления молекулы нуклеиновой кислоты из клетки. Такие модификации включают модификации, полученные в результате замены генов, сайт-специфичных мутаций, и родственные методики.The term "genetically engineered", as used herein, refers to the modification of the genetic composition of a Bacillus cell using molecular biology techniques. Modification of the genetic composition of a Bacillus cell may include gene transfer within and/or across species relationships, insertion, deletion, substitution and/or modification of nucleotides, triplets, genes, open reading frames, promoters, enhancers, terminators and other nucleotide sequences, mediating and/ or by controlling gene expression. Modification of the genetic makeup of a Bacillus cell aims to create a genetically engineered cell that has specific, desirable properties. Genetically engineered Bacillus cells may contain one or more genes that are not present in the native (non-genetically engineered) form of the cell. Methods for introducing exogenous nucleic acid molecules and/or inserting exogenous nucleic acid molecules (recombinant, heterologous) into the inherited information of a Bacillus cell to insert, delete or change the nucleotide sequence of the genetic information of the cell are known to a qualified specialist. Genetically engineered Bacillus cells may contain one or more genes that are found in the native form of the cell, wherein said genes are modified and reintroduced into the Bacillus cell by artificial means. The term “genetically engineered” also includes Bacillus cells that contain a nucleic acid molecule that is endogenous to the cell and that is modified without removing the nucleic acid molecule from the cell. Such modifications include modifications resulting from gene replacement, site-specific mutations, and related techniques.

Интеграция гена и/или (одновременная) инактивация гена посредством нарушения или удаления может быть достигнута посредством гомологичной рекомбинации. Для эффективной гомологичной рекомбинации по меньшей мере 400-500 п. н. гомологичных плечей необходимы в В. subtilis.Gene integration and/or (simultaneous) gene inactivation through disruption or deletion can be achieved through homologous recombination. For efficient homologous recombination, at least 400-500 bp. homologous arms are required in B. subtilis.

Еще одним способом направленного конструирования генома является система CRISPR-Cas9. Данный быстрый и безмаркерный инструмент редактирования генома может быть использован для крупномасштабных геномных делеций, маленьких и больших вставок ДНК, сайленсинга генов посредством введения стоп-кодона, а также введения точечных мутаций. Никаких предварительных модификаций генома не требуется для «бесшовного» редактирования генома посредством CRISPR-Cas9.Another method for targeted genome design is the CRISPR-Cas9 system. This fast, marker-free genome editing tool can be used for large-scale genomic deletions, small and large DNA insertions, gene silencing via stop codons, and point mutations. No prior genome modifications are required for seamless genome editing via CRISPR-Cas9.

Случайную хромосомную интеграцию генов и инсерционный мутагенез можно проводить, используя модифицированный транспозон mariner. Данная система не проявляет тенденцию к горячим точкам в В. subtilis, одновременно демонстрируя высокую эффективность в случайной эктопической интеграции.Random chromosomal gene integration and insertional mutagenesis can be carried out using a modified mariner transposon. This system does not tend to hotspot in B. subtilis while demonstrating high efficiency in random ectopic integration.

Несмотря на то, что виды Bacillus используют для промышленного производства ферментов, на сегодняшний день клетки Bacillus не внедрялись для промышленного производства олигосахаридов, в частности промышленного производства сиалированных олигосахаридов.Although Bacillus species are used for the industrial production of enzymes, to date Bacillus cells have not been introduced into the industrial production of oligosaccharides, in particular the industrial production of sialylated oligosaccharides.

В китайской патентной заявке CN 108410787 А раскрыты рекомбинантные клетки Bacillus subtilis, которые синтезируют лактил-N-неотетраозу. Указанные рекомбинантные клетки В. subtilis имеют ген лактозопермеазы, который интегрируют в геном клетки. Кроме того, указанная клетка Bacillus, которая несет плазмиду, содержащую ген β-1,3-N-глюкозаминтрансферазы и ген β-1,4-галактозилтрансферазы. Клетки В. subtilis можно культивировать в присутствии экзогенной лактозы и они синтезируют лактил-N-неотетраозу при титрах вплоть до примерно 1 г/л, что слишком мало для экономически целесообразного промышленного производства.Chinese patent application CN 108410787 A discloses recombinant Bacillus subtilis cells that synthesize lactyl-N-neotetraose. These recombinant B. subtilis cells have a lactose permease gene, which is integrated into the cell genome. In addition, said Bacillus cell which carries a plasmid containing a β-1,3-N-glucosamine transferase gene and a β-1,4-galactosyltransferase gene. B. subtilis cells can be cultured in the presence of exogenous lactose and synthesize lactyl-N-neotetraose at titers as low as about 1 g/L, which is too low for economical industrial production.

В китайской патентной заявке CN 109735479 А раскрыты рекомбинантные клетки Bacillus subtilis для осуществления синтеза 2'-фукозиллактозы, где уровень экспрессии фермента-транспортера лактозы повышен, и где клетка экспрессирует фукозокиназу, фосфатгуанинтрансферазу и фукозилтрансферазу. Сообщалось, что выход 2'-фукозиллактозы в ферментационной среде составлял от 0,424 г/л до 1,042 г/л.Chinese patent application CN 109735479 A discloses recombinant Bacillus subtilis cells to carry out the synthesis of 2'-fucosyllactose, where the expression level of lactose transporter enzyme is increased, and where the cell expresses fucosokinase, phosphate guanine transferase and fucosyltransferase. The yield of 2'-fucosyllactose in the fermentation medium was reported to range from 0.424 g/L to 1.042 g/L.

Несмотря на то, что во множестве патентных заявок упоминается Bacillus в качестве рода, который, как считается, подходит для продукции нейтральных олигосахаридов, таких как лакто-N-неотетраоза или 2'-фукозиллактоза, никакого применения Bacillus для продукций сиалированных олигосахаридов, в частности сиалированных олигосахаридов грудного молока, еще не было реализовано, предположительно из-за значительных усилий в модификации метаболизма, которые требуются для реализации необходимых путей биосинтеза для продукции ОГМ в Bacillus. Тогда как указанная выше В. subtilis для продукции LNnT зависит от субстратов-доноров, которые встречаются в природе в клетках В. subtilis, продукция сиалированного олигосахарида в Bacillus требует реализации гетерологичного метаболического пути в клетке для обеспечения субстрата-донора, а именно СМР (от англ. Cytidine Monophosphatase - цитидинмонофосфат)-NeuNAc, который является крайне важным для синтеза сиалированных олигосахаридов.Although numerous patent applications mention Bacillus as a genus believed to be suitable for the production of neutral oligosaccharides such as lacto-N-neotetraose or 2'-fucosyllactose, there is no application of Bacillus for the production of sialylated oligosaccharides, in particular sialylated human milk oligosaccharides has not yet been realized, presumably due to the significant metabolic modification efforts required to implement the necessary biosynthetic pathways for HGM production in Bacillus. While the above B. subtilis production of LNnT depends on donor substrates that occur naturally in B. subtilis cells, the production of sialylated oligosaccharide in Bacillus requires the implementation of a heterologous metabolic pathway in the cell to provide the donor substrate, namely SMP (from the English Cytidine Monophosphatase - cytidine monophosphate)-NeuNAc, which is extremely important for the synthesis of sialylated oligosaccharides.

Цель была достигнута посредством предоставления клетки Bacillus, в которой имеется лактозопермеаза для импортирования экзогенной лактозы в клетку, путь биосинтеза CMP-NeuNAc для внутриклеточного образования нуклеотид-активируемой сиаловой кислоты, а именно, цитидинмонофосфат-N-ацетилнейраминовой кислоты (CMP-NeuNAc), в качестве субстрата-донора для группировки сиаловой кислоты, и сиалилтрансфераза для переноса группировки сиаловой кислоты с CMP-NeuNAc на субстрат-акцептор. Культивация таких клеток Bacillus в присутствии экзогенной лактозы делает возможной продукцию желательного сиалированного олигосахарида.The goal was achieved by providing the Bacillus cell, which has a lactose permease to import exogenous lactose into the cell, the CMP-NeuNAc biosynthetic pathway for the intracellular production of nucleotide-activated sialic acid, namely cytidine monophosphate-N-acetylneuraminic acid (CMP-NeuNAc), as a donor substrate for the sialic acid moiety, and a sialyltransferase to transfer the sialic acid moiety from CMP-NeuNAc to the acceptor substrate. Cultivation of such Bacillus cells in the presence of exogenous lactose allows the production of the desired sialylated oligosaccharide.

Краткое изложение сущности изобретенияSummary of the invention

Согласно первому аспекту предложена неспорообразующая бактериальная клетка рода Bacillus для получения сиалированного олигосахарида, где в клетке Bacillus имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to the first aspect, a non-spore-forming bacterial cell of the genus Bacillus is proposed for the production of sialylated oligosaccharide, wherein the Bacillus cell has a lactose permease, a CMP-NeuNAc biosynthetic pathway and a sialyltransferase.

Согласно второму аспекту предложено применение неспорообразующей бактериальной клетки рода Bacillus согласно первому аспекту для получения сиалированного олигосахарида.According to the second aspect, the use of a non-spore-forming bacterial cell of the genus Bacillus according to the first aspect is proposed for the production of sialylated oligosaccharide.

Согласно третьему аспекту предложен способ получения сиалированного олигосахарида, включающий:According to a third aspect, there is provided a method for producing a sialylated oligosaccharide, comprising:

- предоставление неспорообразующей бактериальной клетки рода Bacillus, где в указанной клетке Bacillus имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза;- providing a non-spore-forming bacterial cell of the genus Bacillus, wherein said Bacillus cell contains lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase;

- культивирование клетки Bacillus в культуральной среде, содержащей лактозу, и в условиях, которые являются пермиссивными в отношении клетки Bacillus, с продукцией сиалированного олигосахарида, и- culturing the Bacillus cell in a culture medium containing lactose and under conditions that are permissive to the Bacillus cell, producing sialylated oligosaccharide, and

- возможно, извлечение сиалированного олигосахарида из культуральной среды и/или клетки Bacillus.- possibly extracting the sialylated oligosaccharide from the culture medium and/or Bacillus cells.

Согласно четвертому аспекту предложены сиалированные олигосахариды, которые были продуцированы клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to a fourth aspect, sialylated oligosaccharides are provided that have been produced by a Bacillus cell that contains lactose permease, the CMP-NeuNAc biosynthetic pathway, and sialyltransferase.

Согласно пятому аспекту предложено применение сиалированного олигосахарида, который был продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза, для изготовления питательной композиции.According to a fifth aspect, there is proposed the use of a sialylated oligosaccharide that has been produced by a Bacillus cell that has lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase, for the manufacture of a nutritional composition.

Согласно шестому аспекту предложены питательные композиции, содержащие по меньшей мере один сиалированный олигосахарид, который продуцирован клеткой Bacillus, в которой имеется лактозопермеаза, путь биосинтеза CMP-NeuNAc и сиалилтрансфераза.According to a sixth aspect, nutritional compositions are provided comprising at least one sialylated oligosaccharide that is produced by a Bacillus cell that contains lactose permease, the CMP-NeuNAc biosynthetic pathway and sialyltransferase.

Описание графических материаловDescription of graphic materials

На фиг. 1 проиллюстрированы разные воплощения пути биосинтеза CMP-NeuNAc, который осуществляется в клетке Bacillus для получения сиалированного олигосахарида.In fig. 1 illustrates various embodiments of the CMP-NeuNAc biosynthetic pathway that occurs in a Bacillus cell to produce a sialylated oligosaccharide.

Подробное описаниеDetailed description

Согласно первому аспекту предложена неспорообразующая бактериальная клетка рода Bacillus для получения сиалированного олигосахарида. Для того, чтобы иметь способность продуцировать сиалированный олигосахарид, клетка Bacillus должна предоставлять сиалилтрансферазе субстрат-донор, содержащий группировку сиаловой кислоты, и субстрат-акцептор, представляющий собой дисахарид или олигосахарид, таким образом, чтобы сиалилтрансфераза могла переносить группировку сиаловой кислоты от субстрата-донора на указанный субстрат-акцептор, с образованием, вследствие этого, сиалированного олигосахарида.According to a first aspect, a non-spore-forming bacterial cell of the genus Bacillus is provided for the production of sialylated oligosaccharide. In order to be able to produce a sialylated oligosaccharide, the Bacillus cell must provide the sialyltransferase with a donor substrate containing a sialic acid moiety and an acceptor substrate that is a disaccharide or oligosaccharide, such that the sialyltransferase can transfer the sialic acid moiety from the donor substrate to said substrate-acceptor, resulting in the formation of a sialylated oligosaccharide.

Следует понимать, что сиалированный олигосахарид, который предназначена продуцировать указанная клетка Bacillus, представляет собой целевой сиалированный олигосахарид, тогда как другие сиалированные олигосахариды, которые могут быть образованы за счет разнородности сиалилтрансферазы во время продукции желательного сиалированного олигосахарида в клетке Bacillus, считаются нежелательными сиалированными олигосахаридами или побочными продуктами.It should be understood that the sialylated oligosaccharide that the specified Bacillus cell is intended to produce is the desired sialylated oligosaccharide, while other sialylated oligosaccharides that may be formed due to sialyltransferase heterogeneity during the production of the desired sialylated oligosaccharide in the Bacillus cell are considered undesired sialylated oligosaccharides or by-products. products.

Клетка Bacillus для получения сиалированного олигосахарида представляет собой неспорообразующую клетку Bacillus. Клетки Bacillus дикого типа могут образовывать споры. Считают, что споруляция, а именно, процесс образования спор, у бактерий представляет собой реакцию бактериальной клетки, которая инициирует программу развития, приводящую к образованию дочерних клеток отличной морфологии и направления развития. Споруляцию Bacillus исследовали как основную модель дифференцировки клеток. Во время споруляции палочковидная клетка Bacillus делится ассиметрично, что приводит, вследствие этого, к получению двух генетически идентичных клеток с разной морфологией и направлениями развития.The Bacillus cell for producing the sialylated oligosaccharide is a non-sporulating Bacillus cell. Wild-type Bacillus cells can form spores. It is believed that sporulation, namely the process of spore formation, in bacteria is a reaction of a bacterial cell that initiates a developmental program leading to the formation of daughter cells of different morphology and developmental direction. Bacillus sporulation has been studied as a major model of cell differentiation. During sporulation, the rod-shaped Bacillus cell divides asymmetrically, resulting in the production of two genetically identical cells with different morphologies and developmental directions.

Однако, при промышленном получении не желательно, если бактериальный штамм - продуцент образует споры во время ферментативной продукции целевого продукта. Таким образом, предпочтительно использовать клетки Bacillus для получения сиалированных олигосахаридов, которые не способны образовывать споры. Такие клетки Bacillus называются «неспорообразующими».However, during industrial production, it is not desirable if the producing bacterial strain forms spores during the enzymatic production of the target product. Thus, it is preferable to use Bacillus cells to produce sialylated oligosaccharides that are unable to form spores. Such Bacillus cells are called "non-spore-forming".

В одном воплощении неспорообразующая клетка Bacillus для получения сиалированного олигосахарида происходила из одного из штаммов В. subtilis, перечисленных в Таблице 1.In one embodiment, the non-sporulating Bacillus cell to produce the sialylated oligosaccharide was from one of the B. subtilis strains listed in Table 1.

В некоторых воплощениях клетка Bacillus генетически сконструирована так, чтобы стать неспорообразующей, например, посредством делеции или функциональной инактивации SpoOA. SpoOA представляет собой ДНК-связывающий белок, который влияет, напрямую или опосредовано, на экспрессию более чем 500 генов на протяжении ранней стадии споруляции. Подходящая функциональная инактивация SpoOA включает делецию участка фосфорилирования, где фосфотрансферазы SpoOF и SpoOB фосфорилируют SpoOA. Делеция или функциональная инактивация участка фосфорилирования фосфотрансферазы SpoOF и SpoOB приводит к функциональной инактивации SpoOA и, вследствие этого, нарушает способность клетки Bacillus образовывать споры. В качестве альтернативы, ген или нуклеотидная последовательность, кодирующая SpoOA, или часть гена или нуклеотидной последовательности, кодирующей SpoOA, могут быть удалены из генома клетки Bacillus.In some embodiments, the Bacillus cell is genetically engineered to become nonspore-forming, for example, through deletion or functional inactivation of SpoOA. SpoOA is a DNA-binding protein that influences, directly or indirectly, the expression of more than 500 genes during early sporulation. Suitable functional inactivation of SpoOA involves deletion of the phosphorylation site where the phosphotransferases SpoOF and SpoOB phosphorylate SpoOA. Deletion or functional inactivation of the phosphorylation site of the phosphotransferases SpoOF and SpoOB results in functional inactivation of SpoOA and consequently impairs the ability of the Bacillus cell to form spores. Alternatively, the gene or nucleotide sequence encoding SpoOA, or part of the gene or nucleotide sequence encoding SpoOA, can be deleted from the genome of the Bacillus cell.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена(ов), кодирующего(их) фактор сигма SigE (sigE) и/или фактор сигма SigF (sigF). Факторы сигма SigE и SigF представляют собой транскрипционные факторы, которые участвуют в экспрессии генов, которые кодируют белки, которые участвуют в ранней фазе споруляции.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered by deletion or functional inactivation of the gene(s) encoding the sigma factor SigE (sigE) and/or the sigma factor SigF (sigF). The sigma factors SigE and SigF are transcription factors that are involved in the expression of genes that encode proteins that are involved in the early phase of sporulation.

Делеция или функциональная инактивация SpoOA, SigE и/или SigF нарушает способность клетки Bacillus образовывать споры. Такая неспорообразующая клетка Bacillus может быть использована в качестве предшественника для образования клетки Bacillus, которая способна продуцировать сиалированный олигосахарид.Deletion or functional inactivation of SpoOA, SigE and/or SigF impairs the ability of the Bacillus cell to form spores. Such a non-sporulating Bacillus cell can be used as a precursor to form a Bacillus cell that is capable of producing sialylated oligosaccharide.

Клетки Bacillus дикого типа как не синтезируют лактозу внутриклеточно, так и не поглощают экзогенную лактозу. Однако, лактоза представляет собой субстрат-акцептор для группировки сиаловой кислоты посредством сиалилтрансферазы, акцептирующей лактозу, в образовании некоторых сиалированных олигосахаридов, таких как 3'-сиалилактоза (3-SL) или 6'-сиалилактоза (3-SL). Следовательно, для того, чтобы иметь способность продуцировать такие сиалированные олигосахариды, клетка Bacillus должна обладать способностью предоставления лактозы сиалилтрансферазе, акцептирующей лактозу, или посредством образования лактозы внутриклеточно и/или посредством поглощения лактозы извне. Корме того, лактоза обычно представляет собой дисахаридную группировку, которую несет большая часть, если не все, сиалированных ОГМ. Следовательно, поглощение лактозы также требуется для биосинтеза сиалированных ОГМ, отличных от трисахаридов, а именно, когда субстрат-акцептор для группировки NeuNAc представляет собой олигосахарид, а не дисахарид лактозу.Wild-type Bacillus cells neither synthesize lactose intracellularly nor absorb exogenous lactose. However, lactose is a substrate acceptor for sialic acid moiety via lactose-accepting sialyltransferase to form some sialylated oligosaccharides such as 3'-sialylactose (3-SL) or 6'-sialylactose (3-SL). Therefore, in order to have the ability to produce such sialylated oligosaccharides, the Bacillus cell must have the ability to provide lactose to lactose-accepting sialyltransferase, either by producing lactose intracellularly and/or by uptake of lactose externally. In addition, lactose is typically a disaccharide moiety that carries most, if not all, sialylated HMOs. Therefore, lactose uptake is also required for the biosynthesis of sialylated OGMs other than trisaccharides, namely when the acceptor substrate for the NeuNAc moiety is an oligosaccharide rather than the disaccharide lactose.

В одном воплощении в клетке Bacillus для продуцирования сиалированного олигосахарида имеется лактозопермеаза для поглощения экзогенной лактозы. Следовательно, клетка Bacillus может поглощать экзогенную лактозу. В качестве альтернативы, клетка Bacillus может быть генетически сконструирована для внутриклеточного синтеза лактозы из глюкозы и галактозы, таким образом, что не будет необходимым экзогенное поступление лактозы для получения сиалированного олигосахарида.In one embodiment, a lactose permease is present in the Bacillus cell to produce the sialylated oligosaccharide for the uptake of exogenous lactose. Therefore, the Bacillus cell can take up exogenous lactose. Alternatively, the Bacillus cell could be genetically engineered to synthesize lactose intracellularly from glucose and galactose such that exogenous supply of lactose would not be necessary to produce the sialylated oligosaccharide.

Термин «экзогенный» в отношении лактозы, в том виде, в котором он используется в данном документе, относится к лактозе, которая не происходит из клетки Bacillus для получения сиалированного олигосахарида, а именно, являясь внутриклеточно синтезированной указанной клеткой Bacillus, а которая происходит вне указанной клетки Bacillus, и которую добавляют к культуральной среде, в которой выращивают клетку Bacillus для получения сиалированного олигосахарида.The term "exogenous" with respect to lactose, as used herein, refers to lactose that does not originate from a Bacillus cell to produce the sialylated oligosaccharide, namely, being intracellularly synthesized by said Bacillus cell, but that originates outside of that Bacillus cells, and which is added to the culture medium in which the Bacillus cell is grown to obtain the sialylated oligosaccharide.

В некоторых воплощениях клетка Bacillus генетически сконструирована для того, чтобы иметь способность поглощать экзогенную лактозу, а именно генетически сконструирована так, чтобы содержать лактозопермеазу. Таким образом, в клетке Bacillus для получения сиалированного олигосахарида имеется гетерологичная лактозопермеаза. Подходящая гетерологичная лактозопермеаза представляет собой LacY Е. coli или ее функциональный вариант.In some embodiments, the Bacillus cell is genetically engineered to have the ability to take up exogenous lactose, namely, genetically engineered to contain lactose permease. Thus, the Bacillus cell has a heterologous lactose permease to produce sialylated oligosaccharide. A suitable heterologous lactose permease is E. coli LacY or a functional variant thereof.

Термин «гетерологичный», в том виде, в котором он используется в данном документе, в отношении белков, полипептидов, ферментов и транспортеров, а также в отношении молекул нуклеиновой кислоты, нуклеотидных последовательностей и/или генов, относится к молекуле, которая не является нативной в отношении вида клетки Bacillus, которая содержит указанную молекулу. Термин «ненативный» указывает на то, что указанная молекула отсутствует в клетке-предшественнике Bacillus, встречающейся в природе или дикого типа, а именно, в клетке Bacillus того же вида, который наиболее часто встречается в природе. Таким образом, «гетерологичная последовательность» или «гетерологичная нуклеиновая кислота» или «гетерологичный полипептид», в том виде, в котором он используется в данном документе, представляет собой последовательность или нуклеиновую кислоту или пептид, которые происходят из источника, являющегося чужеродным в отношении клетки Bacillus (например, из другого вида), или, если из того же источника, модифицированы по сравнению со своей исходной формой. Гетерологичная последовательность может быть стабильно введена, например, посредством трансфекции, трансформации, конъюгации или трансдукции, в геном микробной клетки-хозяина, таким образом, представляя генетически сконструированную клетку-хозяина. Можно применять методики, которые будут зависеть от клетки-хозяина, в которую должна быть введена последовательность. Разные методики известны специалисту в данной области, и например, раскрыты в Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). Соответственно, «гетерологичный полипептид» представляет собой полипептид, который в природе не встречается в клетке, и «гетерологичная сиалилтрансфераза» представляет собой сиалилтрансферазу, которая не встречается в природе в микробной клетке.The term "heterologous", as used herein, in relation to proteins, polypeptides, enzymes and transporters, as well as in relation to nucleic acid molecules, nucleotide sequences and/or genes, refers to a molecule that is not native in relation to the type of Bacillus cell that contains the specified molecule. The term "non-native" indicates that the molecule is not present in a naturally occurring or wild-type Bacillus progenitor cell, namely a Bacillus cell of the same species that is most commonly found in nature. Thus, a “heterologous sequence” or “heterologous nucleic acid” or “heterologous polypeptide”, as used herein, is a sequence or nucleic acid or peptide that is derived from a source that is foreign to the cell Bacillus (eg from another species), or, if from the same source, modified from its original form. The heterologous sequence can be stably introduced, for example, by transfection, transformation, conjugation or transduction, into the genome of a microbial host cell, thereby representing a genetically engineered host cell. Techniques may be used that will depend on the host cell into which the sequence is to be introduced. Various techniques are known to one skilled in the art and, for example, are disclosed in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2nd Ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y. (1989). Accordingly, a “heterologous polypeptide” is a polypeptide that does not naturally occur in a cell, and a “heterologous sialyltransferase” is a sialyltransferase that does not naturally occur in a microbial cell.

Термин «функциональный вариант», в том виде, в котором он используется в данном документе, в отношении ферментов и/или транспортных молекул, относится к белкам или полипептидам, обладающим такой же активностью (ферментативной, каталитической или транслоцирующей), что и референный фермент или молекула-транспортер, но который имеет аминокислотную последовательность, отличную от аминокислотной последовательности референсной молекулы фермента или транспортера. Таким образом, типичный вариант белка/полипептида отличается по аминокислотной последовательности от референсного белка/полипептида. Вариант и референсный белок/полипептид может отличаться по аминокислотной последовательности одной или более заменами, присоединениями и/или делециями в любой комбинации. Следовательно, термин «функциональный вариант» включает усеченные версии референсного белка/полипептида, которые обладают такой же активностью, как и референсный белок/полипептид. Замещенный или вставленный аминокислотный остаток может представлять собой или может не представлять собой аминокислотный остаток, кодируемый генетическим кодом. Вариант белка/полипептида может представлять собой встречающийся в природе, как например, аллельный вариант, или он может представлять собой вариант, который не известно, чтобы встречался в природе. Варианты белков/полипептидов, не встречающиеся в природе, могут быть созданы посредством методик мутагенеза, посредством прямого синтеза и посредством других методов генной инженерии, известных специалистам в данной области. В пределах объема настоящего раскрытия в термин «вариант» также включены белки и межвидовые гомологи, которые имеют аминокислотную последовательность, которая обладает более чем примерно 60%-ной идентичностью аминокислотных последовательностей, предпочтительно 65%-ной, 70%-ной, 75%-ной, 80%-ной, 85%-ной, 90%-ной, более предпочтительно 91%-ной, 92%-ной, 93%-ной, 94%-ной, 95%-ной, 96%-ной, 97%-ной, 98%-ной или 99%-ной или большей идентичностью аминокислотных последовательностей, предпочтительно, на протяжении области из по меньшей мере примерно 25, 50, 100, 200, 500, 1000 или более аминокислот, с референсным полипептидом.The term "functional variant", as used herein, in relation to enzymes and/or transport molecules, refers to proteins or polypeptides having the same activity (enzymatic, catalytic or translocation) as the reference enzyme or transporter molecule, but which has an amino acid sequence different from the amino acid sequence of the reference enzyme or transporter molecule. Thus, a typical protein/polypeptide variant differs in amino acid sequence from the reference protein/polypeptide. The variant and reference protein/polypeptide may differ in amino acid sequence by one or more substitutions, additions and/or deletions in any combination. Therefore, the term "functional variant" includes truncated versions of the reference protein/polypeptide that have the same activity as the reference protein/polypeptide. The substituted or inserted amino acid residue may or may not be an amino acid residue encoded by the genetic code. The protein/polypeptide variant may be a naturally occurring variant, such as an allelic variant, or it may be a variant that is not known to occur in nature. Variants of proteins/polypeptides not found in nature can be created through mutagenesis techniques, through direct synthesis, and through other genetic engineering techniques known to those skilled in the art. Within the scope of the present disclosure, the term "variant" also includes proteins and interspecies homologs that have an amino acid sequence that has greater than about 60% amino acid sequence identity, preferably 65%, 70%, 75% , 80%, 85%, 90%, more preferably 91%, 92%, 93%, 94%, 95%, 96%, 97% -th, 98% or 99% or greater amino acid sequence identity, preferably over a region of at least about 25, 50, 100, 200, 500, 1000 or more amino acids, with the reference polypeptide.

Термин «такая же активность», в том виде, в котором он используется в данном документе, относится к ферментативной, каталитической активности или активности транспортировки белка/полипептида лишь с точки зрения качества. Следовательно, «функциональный вариант» также включает варианты, которые обладают повышенной или пониженной активностью, по сравнению с активностью референсного белка/полипептида.The term “same activity”, as used herein, refers to the enzymatic, catalytic or transport activity of a protein/polypeptide only from a quality standpoint. Therefore, a “functional variant” also includes variants that have increased or decreased activity compared to the activity of the reference protein/polypeptide.

В разных воплощениях клетка Bacillus генетически сконструирована так, что содержит и экспрессирует нуклеотидную последовательность, которая кодирует лактозопермеазу, предпочтительно нуклеотидную последовательность, которая кодирует лактозопермеазу LacY E.coli (UniProtKB- Р02920) или ее функциональный вариант.In various embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a lactose permease, preferably a nucleotide sequence that encodes E. coli LacY lactose permease (UniProtKB-P02920) or a functional variant thereof.

Лактозопермеаза LacY Е. coli кодируется областью, кодирующей белок (а именно, открытая рамка считывания) гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1).E. coli LacY lactose permease is encoded by the protein coding region (namely, open reading frame) of the E. coli lacY gene (Gen Bank accession number: NP_414877.1).

Следовательно, в некоторых воплощениях клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, кодирующую область, кодирующую белок LacY Е. coli.Therefore, in some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence encoding a region encoding the E. coli LacY protein.

В некоторых воплощениях частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную лактозопермеазу, приспособлена к частоте использования кодона Bacillus. Частота использования кодона В. subtilis, например, необычна тем, что суммарное содержание GC ниже примерно 45%, содержание GC первой буквы данных кодонов выше примерно 51%, содержание CG второй буквы данных кодонов ниже примерно 36,1% и содержание CG третьей буквы данных кодонов ниже примерно 46%.In some embodiments, the codon usage frequency of the nucleotide sequence encoding the heterologous lactose permease is adjusted to the codon usage frequency of Bacillus. The codon usage frequency of B. subtilis, for example, is unusual in that the total GC content is below about 45%, the GC content of the first letter of these codons is above about 51%, the CG content of the second letter of these codons is below about 36.1%, and the CG content of the third letter of data codons below approximately 46%.

Для экспрессии лактозопермеазы клетка Bacillus содержит рекомбинантный ген лактозопермеазы, где нуклеотидная последовательность, которая кодирует лактозопермеазу, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию нуклеотидной последовательности, кодирующей лактозопермеазу.For expression of lactose permease, the Bacillus cell contains a recombinant lactose permease gene, wherein a nucleotide sequence that encodes lactose permease is operably linked to expression control sequences that mediate expression of the nucleotide sequence encoding lactose permease.

Термин «функционально связанный», в том виде, в котором он используется в данном документе, будет означать функциональную связь между нуклеотидной последовательностью, которая кодирует полипептид или белок (обычно называемой «областью, кодирующей белок», «открытой рамкой считывания» и иногда даже «геном») и второй нуклеотидной последовательностью (последовательностью контроля экспрессии, такой как промотор, сигнальная последовательность или ряд сайтов связывания транскрипционных факторов), которая влияет на транскрипцию и/или трансляцию нуклеотидной последовательности, которая кодирует полипептид или белок. Соответственно, термин «промотор» обозначает последовательности дезоксирибонуклеиновой кислоты (ДНК), которые обычно «предшествуют» открытой рамке считывания в ДНК-полимере и обеспечивают сайт инициации транскрипции в мРНК. «Регуляторные» последовательности ДНК, также обычно расположенные «выше» (то есть, предшествуя) открытой рамки считывания в данном ДНК-полимере, связывают белки, которые определяют частоту (или скорость) инициации транскрипции. В совокупности называемые «промоторной/регуляторной» или «контрольной» ДНК-последовательностью, данные последовательности, которые предшествуют выбранной открытой рамке считывания (или серии открытых рамок считывания) в функциональном ДНК-полимере способствуют определению того, будет ли происходить транскрипция (и в конечном итоге экспрессия) открытой рамки считывания. Последовательности ДНК, которые «следуют за» геном в ДНК-полимере и обеспечивают сигнал для терминации транскрипции в мРНК, называются последовательностями, «терминирующими» транскрипцию.The term "operably linked", as used herein, will mean a functional relationship between a nucleotide sequence that encodes a polypeptide or protein (commonly referred to as a "protein coding region", "open reading frame" and sometimes even " genome") and a second nucleotide sequence (an expression control sequence such as a promoter, a signal sequence, or a series of transcription factor binding sites) that influences the transcription and/or translation of the nucleotide sequence that encodes the polypeptide or protein. Accordingly, the term “promoter” refers to the deoxyribonucleic acid (DNA) sequences that typically “precede” the open reading frame in the DNA polymer and provide the transcription initiation site in the mRNA. "Regulatory" DNA sequences, also usually located "upstream" (that is, preceding) the open reading frame in a given DNA polymer, bind proteins that determine the frequency (or rate) of transcription initiation. Collectively referred to as a "promoter/regulator" or "control" DNA sequence, the sequence data that precedes a selected open reading frame (or series of open reading frames) in a functional DNA polymer helps determine whether transcription will occur (and ultimately expression) open reading frame. DNA sequences that “follow” a gene in a DNA polymer and provide a signal to terminate transcription in mRNA are called transcription termination sequences.

Рекомбинантный ген лактозопермеазы может находиться, будучи интегрированным в хромосому Bacillus, или присутствовать в виде эписомальной версии на дополнительной плазмиде в клетке Bacillus.The recombinant lactose permease gene may be integrated into the Bacillus chromosome or present as an episomal version on an additional plasmid in the Bacillus cell.

Экспрессия гетерологичного гена лактозопермеазы в клетке Bacillus позволяет полученной клетке Bacillus поглощать извне поставляемую лактозу из культуральной среды. Поглощенная лактоза может затем служить субстратом-акцептором для группировки сиаловой кислоты, подлежащей переносу сиалилтрансферазой, акцептирующей лактозу (см. ниже в данном документе), например, в образовании 3'-SL или 6'-SL.Expression of a heterologous lactose permease gene in a Bacillus cell allows the resulting Bacillus cell to take up externally supplied lactose from the culture medium. The absorbed lactose can then serve as an acceptor substrate for a sialic acid moiety to be transferred by lactose-accepting sialyltransferase (see later herein), for example, to form a 3'-SL or 6'-SL.

Для получения сиалированного олигосахарида Bacillus должна иметь способность предоставлять субстрат-донор для переноса группировки NeuNAc на субстрат-акцептор. Типичным субстратом-донором для группировки NeuNAc является CMP-NeuNAc. Следовательно, клетка Bacillus должна уметь внутриклеточно продуцировать CMP-NeuNAc для продукции сиалированных олигосахаридов. В случае внутриклеточного биосинтеза CMP-NeuNAc в клетке Bacillus имеется путь биосинтеза CMP-NeuNAc (Фиг. 1). Таким образом, клетка Bacillus генетически сконструирована так, чтобы иметь путь биосинтеза CMP-NeuNAc.To produce a sialylated oligosaccharide, Bacillus must be able to provide a donor substrate for the transfer of the NeuNAc moiety to the acceptor substrate. A typical donor substrate for the NeuNAc moiety is CMP-NeuNAc. Therefore, the Bacillus cell must be able to produce CMP-NeuNAc intracellularly to produce sialylated oligosaccharides. In the case of intracellular biosynthesis of CMP-NeuNAc, the Bacillus cell has a CMP-NeuNAc biosynthesis pathway (Figure 1). Thus, the Bacillus cell is genetically engineered to have the CMP-NeuNAc biosynthetic pathway.

Путь биосинтеза CMP-NeuNAc включает путь утилизации NeuNAc или путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза de novo NeuNAc. Следовательно, в клетке Bacillus имеется путь биосинтеза CMP-NeuNAc, включающий путь утилизации NeuNAc и/или путь биосинтеза сиаловой кислоты.The CMP-NeuNAc biosynthesis pathway includes the NeuNAc recycling pathway or the sialic acid biosynthesis pathway for de novo intracellular biosynthesis of NeuNAc. Therefore, the Bacillus cell has a CMP-NeuNAc biosynthesis pathway, including a NeuNAc utilization pathway and/or a sialic acid biosynthesis pathway.

Путь утилизации NeuNAc включает поглощение экзогенной сиаловой кислоты клеткой Bacillus и превращение поглощенной сиаловой кислоты в CMP-NeuNAc. Для поглощения экзогенной NeuNAc в клетке Bacillus имеется транспортер сиаловой кислоты. В некоторых воплощениях генетически сконструированная клетка Bacillus генетически сконструирована таким образом, чтобы имелся транспорт сиаловой кислоты для поглощения экзогенной NeuNAc. Подходящий транспортер сиаловой кислоты представляет собой NanT Е. coli (UniProtKB Р41036). NanT Е. coli катализирует протон-зависимый симпорт сиаловой кислоты. NanT может транспортировать NeuNAc, а также родственные сиаловые кислоты N-гликолилнейраминовую кислоту (NeuNGc) и 3-кето-3-дезокси-D-глицеро-D-галактононовую кислоту (KDN). В одном воплощении в генетически сконструированной клетке Bacillus имеется NanT Е. coli или его функциональный вариант.The NeuNAc utilization pathway involves the uptake of exogenous sialic acid by the Bacillus cell and the conversion of the ingested sialic acid to CMP-NeuNAc. For the uptake of exogenous NeuNAc, the Bacillus cell has a sialic acid transporter. In some embodiments, the genetically engineered Bacillus cell is genetically engineered to have sialic acid transport to take up exogenous NeuNAc. A suitable sialic acid transporter is E. coli NanT (UniProtKB P41036). E. coli NanT catalyzes the proton-dependent symport of sialic acid. NanT can transport NeuNAc as well as the related sialic acids N-glycolylneuraminic acid (NeuNGc) and 3-keto-3-deoxy-D-glycero-D-galactonic acid (KDN). In one embodiment, the genetically engineered Bacillus cell contains E. coli NanT or a functional variant thereof.

В некоторых воплощениях клетка Bacillus генетически сконструирована таким образом, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует транспортер сиаловой кислоты для поглощения экзогенной NeuNAc, предпочтительно, нуклеотидную последовательность, которая кодирует NanT Е. coli или его функциональный вариант.In some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a sialic acid transporter for uptake of exogenous NeuNAc, preferably a nucleotide sequence that encodes E. coli NanT or a functional variant thereof.

NanT Е. coli кодируется белок-кодирующей областью гена папТ Е. coli. Следовательно, в некоторых воплощениях клетка Bacillus генетически сконструирована таким образом, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует транспортер сиаловой кислоты NanT Е. coli или его функциональный вариант.E. coli NanT is encoded by the protein-coding region of the E. coli naT gene. Therefore, in some embodiments, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes the E. coli NanT sialic acid transporter or a functional variant thereof.

Для экспрессии транспортера сиаловой кислоты клетка Bacillus содержит рекомбинантный ген транспортера сиаловой кислоты, где нуклеотидная последовательность, которая кодирует транспортер сиаловой кислоты, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию нуклеотидной последовательности, кодирующей транспортер сиаловой кислоты.For expression of the sialic acid transporter, the Bacillus cell contains a recombinant sialic acid transporter gene, wherein a nucleotide sequence that encodes the sialic acid transporter is operably linked to expression control sequences that mediate expression of the nucleotide sequence encoding the sialic acid transporter.

Рекомбинантный ген транспортера сиаловой кислоты может присутствовать, будучи интегрированным в хромосому Bacillus, или присутствовать в виде эписомальной версии на дополнительной плазмиде в клетке Bacillus.The recombinant sialic acid transporter gene may be present integrated into the Bacillus chromosome, or present as an episomal version on an additional plasmid in the Bacillus cell.

В одном из воплощений частота использования кодона нуклеотидной последовательности, кодирующей транспортер сиаловой кислоты, адаптирована к частоте использования кодона Bacillus.In one embodiment, the codon frequency of the nucleotide sequence encoding the sialic acid transporter is adapted to the codon frequency of Bacillus.

В разных воплощениях путь биосинтеза CMP-NeuNAc включает путь биосинтеза сиаловой кислоты. Таким образом, в клетке Bacillus может иметься путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты. Путь биосинтеза сиаловой кислоты включает ферментативные активности глутамин:фруктозо-6-фосфатаминотрансферазы (Фиг. 1: ) и синтазы N-ацетилнейраминовой кислоты (тоже самое, что синтаза сиаловой кислоты) (Фиг. 1: ). Следовательно, в клетке Bacillus для получения сиалированного олигосахарида есть глутамин:фруктозо-6-фосфатаминотрансфераза и синтаза N-ацетилнейраминовой кислоты.In various embodiments, the CMP-NeuNAc biosynthetic pathway includes the sialic acid biosynthetic pathway. Thus, the Bacillus cell may have a sialic acid biosynthetic pathway for the intracellular biosynthesis of N-acetylneuraminic acid. The sialic acid biosynthetic pathway involves the enzymatic activities of glutamine:fructose-6-phosphate aminotransferase (Figure 1: ) and N-acetylneuraminic acid synthase (same as sialic acid synthase) (Figure 1: ). Therefore, the Bacillus cell requires glutamine:fructose-6-phosphate aminotransferase and N-acetylneuraminic acid synthase to produce sialylated oligosaccharide.

Фермент глутамин:фруктозо-6-фосфатаминотрансфераза (ЕС 2.6.1.16) катализирует превращение фруктозо-6-фосфата (Frc-6P) в глюкозамин-6-фосфат (GlcN-6P) с использованием глутамина (Фиг. 1: ). Обычно считается, что данная ферментативная реакция является первой стадией пути биосинтеза гексозамина. Альтернативными названиями глутамин:фруктозо-6-фосфатаминотрансферазы являются D-фруктозо-6-фосфатаминотрансфераза, GFAT, глюкозамин-6-фосфатсинтаза, гексозофосфатаминотрансфераза и L-глутамин-D-фруктозо-6-фосфатаминотрансфераза.The enzyme glutamine:fructose-6-phosphate aminotransferase (EC 2.6.1.16) catalyzes the conversion of fructose-6-phosphate (Frc-6P) to glucosamine-6-phosphate (GlcN-6P) using glutamine (Figure 1: ). This enzymatic reaction is generally believed to be the first step in the hexosamine biosynthetic pathway. Alternative names for glutamine:fructose-6-phosphate aminotransferase are D-fructose-6-phosphate aminotransferase, GFAT, glucosamine-6-phosphate synthase, hexosephosphate aminotransferase, and L-glutamine-D-fructose-6-phosphate aminotransferase.

В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется глутамин:фруктозо-6-фосфатаминотрансфераза, предпочтительно, гетерологичная глутамин:фруктозо-6-фосфатаминотрансфераза. Пример подходящей гетерологичной глутамин:фруктозо-6-фосфатаминотрансферазы происходит из Е. coli. Глутамин:фруктозо-6-фосфатаминотрансфераза Е. coli (UniProtKB - Р17169) обозначается GlmS. Следовательно, в клетке Bacillus имеется GlmS Е. coli или функциональный вариант GlmS Е. coli. Предпочтительно, функциональный вариант GlmS Е. coli представляет собой версию, которая демонстрирует значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата, по сравнению с ферментом дикого типа. Пример функционального варианта GlmS Е. coli, который демонстрирует значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата. Примеры функциональных вариантов GlmS Е. coli, которые демонстрируют значимо уменьшенную чувствительность к ингибированию глюкозамин-6-фосфата, представляют собой GlmS*54 и GlmS*, как описано в международной заявке №РСТ/ЕР2019/063669 (включена в данный документ посредством ссылки).In an additional and/or alternative embodiment, the genetically engineered Bacillus cell contains a glutamine:fructose-6-phosphate aminotransferase, preferably a heterologous glutamine:fructose-6-phosphate aminotransferase. An example of a suitable heterologous glutamine:fructose-6-phosphate aminotransferase comes from E. coli. Glutamine: fructose-6-phosphate aminotransferase from E. coli (UniProtKB - P17169) is designated GlmS. Therefore, the Bacillus cell contains E. coli GlmS or a functional variant of E. coli GlmS. Preferably, the functional E. coli GlmS variant is a version that exhibits significantly reduced sensitivity to glucosamine 6-phosphate inhibition compared to the wild type enzyme. An example of a functional E. coli GlmS variant that exhibits significantly reduced sensitivity to glucosamine 6-phosphate inhibition. Examples of E. coli GlmS functional variants that exhibit significantly reduced sensitivity to glucosamine-6-phosphate inhibition are GlmS*54 and GlmS*, as described in International Application No. PCT/EP2019/063669 (incorporated herein by reference).

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует глутамин:фуктозо-6-фосфатаминотрансферазу, предпочтительно глутамин:фруктозо-6-фосфатаминотрансферазу GlmS Е. coli, или нуклеотидную последовательность, кодирующую функциональный вариант GlmS Е. coli, который демонстрировал значимо пониженную чувствительность в отношении ингибирования глюкозамин-6-фосфата, по сравнению с ферментом дикого типа.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence that encodes a glutamine:fuctose-6-phosphate aminotransferase, preferably a glutamine:fructose-6-phosphate aminotransferase E. coli GlmS, or a nucleotide sequence encoding a functional variant E. coli GlmS, which showed significantly reduced sensitivity for glucosamine-6-phosphate inhibition compared to the wild-type enzyme.

Для экспрессии глутамин:фруктозо-6-фосфатаминотрансферазы клетка Bacillus содержит рекомбинантный ген глутамин:фруктозо-6-фосфатаминотрансферазы, где нуклеотидная последовательность, которая кодирует глутамин:фруктозо-6-фосфатаминотрансферазу, функционально связана с последовательностями контроля экспрессии, которые опосредуют экспрессию открытой рамки считывания глутамин:фруктозо-6-фосфатаминотрансферазы.For expression of glutamine:fructose-6-phosphate aminotransferase, the Bacillus cell contains a recombinant glutamine:fructose-6-phosphate aminotransferase gene, where the nucleotide sequence that encodes the glutamine:fructose-6-phosphate aminotransferase is operably linked to expression control sequences that mediate expression of the glutamine open reading frame : fructose-6-phosphate aminotransferase.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глутамин:фруктозо-6-фосфатаминотрансферазу, адаптирована до частоты использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glutamine:fructose-6-phosphate aminotransferase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген глутамин:фуктозо-6-фосфатаминотрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glutamine:fuctose-6-phosphate aminotransferase gene can be integrated into the Bacillus chromosome or carried as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтазу сиаловой кислоты. Синтаза сиаловой кислоты катализирует конденсацию N-ацетилманнозамина (ManNAc) и фосфоенолпирувата (ФЕП) с N-ацетилнейраминовой кислотой (NeuNAc) (Фиг. 1: ). Ферментативное образование NeuNAc представляет собой последнюю стадию пути биосинтеза сиаловой кислоты.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains sialic acid synthase. Sialic acid synthase catalyzes the condensation of N-acetylmannosamine (ManNAc) and phosphoenolpyruvate (PEP) with N-acetylneuraminic acid (NeuNAc) (Figure 1: ). The enzymatic formation of NeuNAc represents the last step in the sialic acid biosynthetic pathway.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтазу сиаловой кислоты или ее функциональный вариант, предпочтительно гетерологичную синтазу сиаловой кислоты. Примеры синтаз сиаловой кислоты известны из множества видов бактерий, таких как Campylobacter jejuni, Streptococcus agalactiae, Butyrivibrio proteoclasticus, Methanobrevibacter ruminatium, Acetobacterium woodii, Desulfobacula toluolica, Escherichia coli, Prevotella nigescens, Halorhabdus tiamatea, Desulfotignum phosphitoxidans или Candidatus Scalindua sp., Idomarina loihiensis, Fusobacterium nucleatum или Neisseria meningitidis. Примером подходящей синтазы сиаловой кислоты является синтаза N-ацетилнейраминовой кислоты NeuB С.jejuni, как кодируется геном пеиВ С.jejuni.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a sialic acid synthase or a functional variant thereof, preferably a heterologous sialic acid synthase. Examples of sialic acid synthases are known from many bacterial species, such as Campylobacter jejuni, Streptococcus agalactiae, Butyrivibrio proteoclasticus, Methanobrevibacter ruminatium, Acetobacterium woodii, Desulfobacula toluolica, Escherichia coli, Prevotella nigescens, Halorhabdus tiamatea, Desulfotignum phosphitoxidans or Candidatus Scalindua sp., Idomarina loihiensis, Fusobacterium nucleatum or Neisseria meningitidis. An example of a suitable sialic acid synthase is the C. jejuni N-acetylneuraminic acid synthase NeuB, as encoded by the C. jejuni neuB gene.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует синтазу N-ацетилнейраминовой кислоты. Следовательно, нуклеотидная последовательность, которая кодирует синтазу N-ацетилнейраминовой кислоты, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует синтазу N-ацетилнейраминовой кислоты в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности синтазы N-ацетилнейраминовой кислоты.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes N-acetylneuraminic acid synthase. Therefore, a nucleotide sequence that encodes N-acetylneuraminic acid synthase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylneuraminic acid synthase in a genetically engineered Bacillus cell with ensuring intracellular activity of N-acetylneuraminic acid synthase.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную синтазу N-ацетилнейраминовой кислоты, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylneuraminic acid synthase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген синтазы N-ацетилнейраминовой кислоты может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylneuraminic acid synthase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В одном воплощении путь биосинтеза сиаловой кислоты включает уридиндифосфат-N-ацетилглюкозамин (УДФ-GlcNAc) в качестве промежуточного соединения. В клетке Bacillus, имеющей путь биосинтеза сиаловой кислоты, который включает УДФ-GlcNAc в качестве промежуточного соединения, дополнительно имеется фосфоглюкозаминмутаза (Фиг. 1: ), глюкозамин-1-фосфат N-ацетилтрансфераза (Фиг. 1: ), N-ацетилглюкозамин-1-фосфатуридилтрансфераза (Фиг. 1 ) и УДФ-N-ацетилглюкозамин 2-эпимераза (Фиг. 1: ).In one embodiment, the sialic acid biosynthetic pathway includes uridine diphosphate-N-acetylglucosamine (UDP-GlcNAc) as an intermediate. The Bacillus cell, which has a sialic acid biosynthetic pathway that includes UDP-GlcNAc as an intermediate, additionally contains phosphoglucosamine mutase (Figure 1: ), glucosamine-1-phosphate N-acetyltransferase (Fig. 1: ), N-acetylglucosamine-1-phosphate uridyl transferase (Fig. 1 ) and UDP-N-acetylglucosamine 2-epimerase (Fig. 1: ).

Фосфоглюкозаминмутаза превращает глюкозамин-6-фосфат (GlcN-6P) в глюкозамин-1-фосфат (GlcN-1 Р).Phosphoglucosamine mutase converts glucosamine 6-phosphate (GlcN-6P) to glucosamine 1-phosphate (GlcN-1 P).

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована таким образом, чтобы содержать фосфоглюкозаминмутазу. Подходящая фосфоглюкозаминмутаза представляет собой фосфоглюкозаминмутазу GlmM Е. coli или ее функциональный вариант.Указанная GlmM Е. coli кодируется геном glmM Е. coli.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to contain phosphoglucosamine mutase. A suitable phosphoglucosamine mutase is E. coli phosphoglucosamine mutase GlmM or a functional variant thereof. Said E. coli GlmM is encoded by the E. coli glmM gene.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы в ней содержалась и экспрессировалась нуклеотидная последовательность, которая кодирует фосфоглюкозаминмутазу, предпочтительно, нуклеотидная последовательность, которая кодирует GlmM Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes a phosphoglucosamine mutase, preferably a nucleotide sequence that encodes E. coli GlmM or a functional variant thereof.

Фосфоглюкозаминмутаза GlmM Е. coli кодируется белок-кодирующей областью гена glmM Е. coli. Следовательно, клетка Bacillus генетически сконструирована для содержания и экспрессии нуклеотидной последовательности, которая кодирует GlmM Е. coli.E. coli phosphoglucosamine mutase GlmM is encoded by the protein-coding region of the E. coli glmM gene. Therefore, the Bacillus cell is genetically engineered to contain and express the nucleotide sequence that encodes E. coli GlmM.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует фосфоглюкозаминмутазу. Следовательно, нуклеотидная последовательность, которая кодирует фосфоглюкозаминмутазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует фосфоглюкозаминмутазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности фосфоглюкозаминмутазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes a phosphoglucosamine mutase. Therefore, a nucleotide sequence that encodes a phosphoglucosamine mutase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of the nucleotide sequence that encodes a phosphoglucosamine mutase in a genetically engineered Bacillus cell to provide intracellular phosphoglucosamine mutase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную фосфоглюкозаминмутазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous phosphoglucosamine mutase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген фосфоглюкозаминмутазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant phosphoglucosamine mutase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

Глюкозамин-1-фосфат-N-ацетилтрансфераза катализирует перенос ацетильной группы с ацетил-коэнзима А на глюкозамин-1-фосфат (GlcN-1-P) с получением N-ацетилглюкозамин-1-фосфата (GlcNAc-1-P).Glucosamine-1-phosphate-N-acetyltransferase catalyzes the transfer of an acetyl group from acetyl-coenzyme A to glucosamine-1-phosphate (GlcN-1-P) to produce N-acetylglucosamine-1-phosphate (GlcNAc-1-P).

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать глюкозамин-1-фосфат-N-ацетилтрансферазу.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to contain glucosamine 1-phosphate N-acetyltransferase.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes glucosamine 1-phosphate N-acetyltransferase.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу. Следовательно, нуклеотидная последовательность, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует глюкозамин-1-фосфат-N-ацетилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности глюкозамин-1-фосфат-N-ацетилтрансферазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes glucosamine-1-phosphate-N-acetyltransferase. Therefore, a nucleotide sequence that encodes glucosamine-1-phosphate-N-acetyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes glucosamine-1-phosphate-N -acetyltransferase in a genetically engineered Bacillus cell to provide intracellular glucosamine-1-phosphate-N-acetyltransferase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глюкозамин-1-фосфат-N-ацетилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glucosamine-1-phosphate-N-acetyltransferase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген глюкозамин-1-фосфат-N-ацетилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glucosamine-1-phosphate-N-acetyltransferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

N-ацетилглюкозамин-1-фосфатуридилтрансфераза превращает N-ацетилглюкозамин-1-фосфат (GlcNAc-1-P) в УДФ-GlcNAc посредством переноса уридин-5-монофосфата (с уридин 5-трифосфата).N-acetylglucosamine-1-phosphate uridyltransferase converts N-acetylglucosamine-1-phosphate (GlcNAc-1-P) to UDP-GlcNAc by transferring uridine 5-monophosphate (from uridine 5-triphosphate).

В дополнительном и/или альтернативном воплощении клетка генетически сконструирована для того, чтобы иметь N-ацетилглюкозамин-1-фосфатуридилтрансферазу.In a further and/or alternative embodiment, the cell is genetically engineered to have N-acetylglucosamine-1-phosphate uridyl transferase.

В дополнительном и/или альтернативном воплощении клетка генетически сконструирована для того, чтобы содержать или экспрессировать нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу.In a further and/or alternative embodiment, the cell is genetically engineered to contain or express a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyl transferase.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyl transferase.

Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-1-фосфатуридилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-1-фосфатуридилтрансферазы.Therefore, a nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-1-phosphate uridyltransferase in genetically engineered Bacillus cell to ensure intracellular activity of N-acetylglucosamine-1-phosphate uridyl transferase.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-1-фосфатуридилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-1-phosphate uridyl transferase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген N-ацетилглюкозамин-1-фосфатуридилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-1-phosphate uridyl transferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении глюкозамин-1-фосфат-N-ацетилтрансферазная активность и N-ацетилглюкозамин-1-фосфатуридилтрансферазная активность обеспечиваются бифункциональным ферментом. Примером таких бифункциональных ферментов является GlmU Е. coli. GlmU Е. coli катализирует по меньшей мере две последовательные реакции, которые превращают глюкозамин-1-фосфат в УДФ-GlcNAc (Фиг. 1: ). С-концевой домен катализирует перенос ацетильной группы с ацетил-коэнзима А на глюкозамин-1-фосфат (GlcN-1-P) с получением N-ацетилглюкозамин-1-фосфата (GlcNAc-1-P), который превращается в УДФ-GlcNAc посредством переноса уридин-5-монофосфата (с уридин 5-трифосфата), реакция, катализируемая N-концевым доменом.In an additional and/or alternative embodiment, the glucosamine-1-phosphate N-acetyltransferase activity and N-acetylglucosamine-1-phosphate uridyltransferase activity are provided by a bifunctional enzyme. An example of such bifunctional enzymes is E. coli GlmU. E. coli GlmU catalyzes at least two sequential reactions that convert glucosamine 1-phosphate to UDP-GlcNAc (Figure 1: ). The C-terminal domain catalyzes the transfer of an acetyl group from acetyl-coenzyme A to glucosamine-1-phosphate (GlcN-1-P) to produce N-acetylglucosamine-1-phosphate (GlcNAc-1-P), which is converted to UDP-GlcNAc by transfer of uridine 5-monophosphate (from uridine 5-triphosphate), a reaction catalyzed by the N-terminal domain.

Такой бифункциональный фермент также известен из Bacillus subtilis и Haemophilus influenzae.Such a bifunctional enzyme is also known from Bacillus subtilis and Haemophilus influenzae.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь гетерологичную бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу. Подходящим примером является GlmU Е. coli или ее функциональный вариант (включая GlmU Н. influenzae). Указанная GlmU Е. coli кодируется геном glmU Е. coli.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to have a heterologous bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate uridyltransferase. A suitable example is E. coli GlmU or a functional variant thereof (including H. influenzae GlmU). Said E. coli GlmU is encoded by the E. coli glmU gene.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать или сверхэкспрессировать нуклеотидную последовательность, которая кодирует указанный бифункциональный фермент, предпочтительно нуклеотидную последовательность, которая кодирует GlmU Е. coli или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express or overexpress a nucleotide sequence that encodes said bifunctional enzyme, preferably a nucleotide sequence that encodes E. coli GlmU or a functional variant thereof.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-осфатуридилтрансферазу. Следовательно, нуклеотидная последовательность, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной глюкозамин-1-фосфат-N-ацетилтрансферазной активности и N-ацетилглюкозамин-1-фосфатуридилтрансферазной активности.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-osphaturidyltransferase. Therefore, a nucleotide sequence that encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate uridyltransferase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence, which encodes a bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase in a genetically engineered Bacillus cell to provide intracellular glucosamine-1-phosphate-N-acetyltransferase activity and N-acetylglucosamine-1-phosphate-uridyltransferase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную бифункциональную глюкозамин-1-фосфат-N-ацетилтрансферазу/N-ацетилглюкозамин-1-фосфатуридилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген бифункциональной глюкозамин-1-фосфат-N-ацетилтрансферазы/N-ацетилглюкозамин-1-фосфатуридилтрансферазы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant bifunctional glucosamine-1-phosphate-N-acetyltransferase/N-acetylglucosamine-1-phosphate-uridyltransferase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении путь биосинтеза сиаловой кислоты включает превращение УДФ-GlcNAc в N-ацетилманнозамин (ManNAc). Данное превращение может быть катализировано УДФ-N-ацетилглюкозамин-2-эимеазой, которая не только превращает УДФ-N-ацетилглюкозамин в УДФ-N-ацетилманнозамин, но одновременно высвобождает УДФ (Фиг. 1: ).In an additional and/or alternative embodiment, the sialic acid biosynthetic pathway involves the conversion of UDP-GlcNAc to N-acetylmannosamine (ManNAc). This conversion can be catalyzed by UDP-N-acetylglucosamine-2-eimease, which not only converts UDP-N-acetylglucosamine to UDP-N-acetylmannosamine, but simultaneously releases UDP (Figure 1: ).

Следовательно, клетка Bacillus содержит УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ.Therefore, the Bacillus cell contains UDP-N-acetylglucosamine-2-epimerase, which simultaneously releases UDP.

Подходящая УДФ-N-ацетилглюкозамин-2-эпимераза с сопутствующим высвобождением УДФ представляет собой УДФ-N-ацетилглюкозамин-2-эпимеразу NeuC Campylobacter jejuni, кодируемую геном пеиС С.jejuni.A suitable UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP is Campylobacter jejuni UDP-N-acetylglucosamine-2-epimerase NeuC, encoded by the C. jejuni neuC gene.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы иметь УДФ-N-ацетилглюкозамин-2-эпимеразу с сопутствующим высвобождением УДФ.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to have UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ, предпочтительно чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует NeuC С, jejuni или ее функциональный вариант.In a further and/or alternative embodiment, a Bacillus cell is genetically engineered to contain and express a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase that simultaneously releases UDP, preferably to contain and express a nucleotide sequence that encodes NeuC C , jejuni or a functional variant thereof.

УДФ-N-ацетилглюкозамин-2-эпимераза NeuC С.jejuni кодируется белок-кодирующей областью гена пеиС С.jejuni. Следовательно, клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, которая кодирует NeuC С.jejuni.C. jejuni UDP-N-acetylglucosamine-2-epimerase NeuC is encoded by the protein-coding region of the C. jejuni NeuC gene. Therefore, the Bacillus cell is genetically engineered to contain and express the nucleotide sequence that encodes C. jejuni NeuC.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу с сопутствующим высвобождением УДФ во время ее ферментативной реакции с высвобождением ManNAc. Следовательно, нуклеотидная последовательность, которая кодирует УДФ-N-ацетилглюкозамин-2-эпимеразу, которая одновременно высвобождает УДФ, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует указанную УДФ-N-ацетилглюкозамин-2-эпимеразу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности УДФ-N-ацетилглюкозамин-2-эпимеразы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase with concomitant release of UDP during its enzymatic reaction to release ManNAc. Therefore, a nucleotide sequence that encodes UDP-N-acetylglucosamine-2-epimerase, which simultaneously releases UDP, is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes said UDP -N-acetylglucosamine-2-epimerase in a genetically engineered Bacillus cell to provide intracellular UDP-N-acetylglucosamine-2-epimerase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную УДФ-N-ацетилглюкозамин-2-эпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous UDP-N-acetylglucosamine-2-epimerase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген УДФ-N-ацетилглюкозамин-2-эпимеразы может быть интегрирован в хромосому Bacillus или присутствовать в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant UDP-N-acetylglucosamine-2-epimerase gene may be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В альтернативном воплощении в пути биосинтеза сиаловой кислоты используется N-ацетилглюкозамин-6-фосфат (GlcNAc-6-P) в качестве промежуточного соединения, но не используется УДФ-GlcNAc. В генетически сконструированной клетке Bacillus имеется путь биосинтеза сиаловой кислоты для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты, в котором используется GlcNAc-6-P в качестве промежуточного соединения, имеется глюкозамин-6-фосфат-N-ацетилтрансфераза (Фиг. 1: ). В пути биосинтеза сиаловой кислоты, использующем глюкозамин-6-фосфат-N-ацетилтрансферазу для внутриклеточного биосинтеза N-ацетилнейраминовой кислоты, не используется УДФ-GlcNAc для биосинтеза сиаловой кислоты.In an alternative embodiment, the sialic acid biosynthetic pathway uses N-acetylglucosamine-6-phosphate (GlcNAc-6-P) as an intermediate, but does not use UDP-GlcNAc. The genetically engineered Bacillus cell has a sialic acid biosynthetic pathway for the intracellular biosynthesis of N-acetylneuraminic acid, which uses GlcNAc-6-P as an intermediate, has glucosamine-6-phosphate-N-acetyltransferase (Figure 1: ). The sialic acid biosynthetic pathway, which uses glucosamine-6-phosphate-N-acetyltransferase for the intracellular biosynthesis of N-acetylneuraminic acid, does not use UDP-GlcNAc for the biosynthesis of sialic acid.

Путь биосинтеза сиаловой кислоты, использующий GlcNAc-6P, включает активности ферментов глутамин:фруктозо-6-фосфатаминотрансферазы (Фиг. 1: ) и синтазы N-ацетилнейраминовой кислоты (Фиг. 1: ). Указанный путь биосинтеза сиаловой кислоты дополнительно включает а) активности ферментов глюкозамин-6-фосфат-N-ацетилтрансферазы (Фиг. 1: ), N-ацетилглюкозамин-6-фосфатфосфатазы (Фиг. 1: ) и N-ацетилглюкозамин-2-эпимеразы (Фиг. 1: ) или b) активности ферментов глюкозамин-6-фосфат-N-ацетилтрансферазы (Фиг. 1: ), N-ацетилглюкозамин-6-фосфатэпимеразы (Фиг. 1: ) и N-ацетилманнозамин-6-фосфатфосфатазы (Фиг. 1: ). Таким образом, необязательно, чтобы генетически сконструированная клетка Bacillus обладала ферментативными активностями фосфоглюкозаминмутазы, N-ацетилглюкозамин-1-фосфатуридилтрансферазы и УДФ-N-ацетилглюкозамин 2-эпимеразы с сопутствующим высвобождением УДФ для внутриклеточного биосинтеза сиаловой кислоты. Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus, способная синтезировать сиаловую кислоту, не содержит одной или более активностей ферментов, выбранных из группы, состоящей из активностей ферментов фосфоглюкозаминмутазы, N-ацетилглюкозамин-1-фосфатуридилтрансферазы и УДФ N-ацетилглюкозамин-2-эпимеразы с сопутствующим высвобождением УДФ.The sialic acid biosynthetic pathway using GlcNAc-6P involves the activities of glutamine:fructose-6-phosphate aminotransferase enzymes (Figure 1: ) and N-acetylneuraminic acid synthase (Fig. 1: ). This pathway for the biosynthesis of sialic acid additionally includes a) the activity of the enzymes glucosamine-6-phosphate-N-acetyltransferase (Fig. 1: ), N-acetylglucosamine-6-phosphate phosphatase (Fig. 1: ) and N-acetylglucosamine-2-epimerase (Fig. 1: ) or b) the activity of glucosamine-6-phosphate-N-acetyltransferase enzymes (Figure 1: ), N-acetylglucosamine-6-phosphate epimerase (Fig. 1: ) and N-acetylmannosamine-6-phosphate phosphatase (Fig. 1: ). Thus, it is not necessary for a genetically engineered Bacillus cell to possess the enzymatic activities of phosphoglucosamine mutase, N-acetylglucosamine-1-phosphate-uridyltransferase and UDP-N-acetylglucosamine 2-epimerase with concomitant release of UDP for intracellular sialic acid biosynthesis. Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell capable of synthesizing sialic acid does not contain one or more enzyme activities selected from the group consisting of phosphoglucosamine mutase, N-acetylglucosamine-1-phosphate uridyl transferase, and UDP N-acetylglucosamine enzyme activities -2-epimerase with concomitant release of UDP.

В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется глюкозамин-6-фосфат-N-ацетилтрансферазная активность. Указанная глюкозамин-6-фосфат-N-ацетилтрансферазная активность превращает GlcN-6P в N-ацетилглюкозамин-6-фосфат (GlcNAc-6P). Примером глюкозамин-6-фосфат-N-ацетилтрансферазы является Gna1 Saccharomyces cerevisiae (UniProtKB - P43577).In a further and/or alternative embodiment, the genetically engineered Bacillus cell has glucosamine 6-phosphate N-acetyltransferase activity. This glucosamine 6-phosphate N-acetyltransferase activity converts GlcN-6P to N-acetylglucosamine 6-phosphate (GlcNAc-6P). An example of glucosamine 6-phosphate N-acetyltransferase is Saccharomyces cerevisiae Gna1 (UniProtKB - P43577).

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит глюкозамин-6-фосфат N-ацетилтрансферазу, предпочтительно, гетерологичную глюкозамин-6-фосфат-N-ацетилтрансферазу, более предпочтительно Gna1 из S. cerevisiae или ее функциональный вариант.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains a glucosamine 6-phosphate N-acetyltransferase, preferably a heterologous glucosamine 6-phosphate N-acetyltransferase, more preferably Gna1 from S. cerevisiae or a functional variant thereof.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую глюкозамин-6-фосфат-N-ацетилтрансферазу, предпочтительно, Gna1 S. cerevisiae, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности глюкозамин-1-фосфат-N-ацетилтрансферазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding glucosamine 6-phosphate N-acetyltransferase, preferably S. cerevisiae Gna1, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence influencing the transcription and/or translation of the specified nucleotide sequence in a genetically engineered Bacillus cell to ensure intracellular glucosamine-1-phosphate-N-acetyltransferase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную глюкозамин-6-фосфат-N-ацетилтрансферазу, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous glucosamine-6-phosphate-N-acetyltransferase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген глюкозамин-6-фосфат-N-ацетилтрансферазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant glucosamine-6-phosphate-N-acetyltransferase gene can be integrated into the Bacillus chromosome or carried as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется N-ацетилглюкозамин-6-фосфатфосфатазная активность. Указанная N-ацетилглюкозамин-6-фосфатфосфатазная активность превращает GlcNAc-6P в N-ацетилглюкозамин (GlcNAc). Примерами N-ацетилглюкозамин-6-фосфатфосфатазы являются сахарофосфатазы HAD-подобного суперсемейства, которые катализируют превращение GlcNAc6P в GlcNAc. HAD-подобное суперсемейство ферментов названо в честь бактериального фермента -дегидрогеназы галогенокислоты и включает фосфатазы. Подходящая фосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc6P в GlcNAc, может быть выбрана из группы, состоящей из фруктозо-1-фосфатфосфатазы (YqaB, UniProtKB - Р77475) и альфа-D-глюкозо-1-фосфатфосфатазы (YihX, UniProtKB - P0A8Y3). Считают, что ферменты YqaB Е. coli и YihX E.coli также действуют на GlcNAc6P (Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-6-phosphate phosphatase activity. This N-acetylglucosamine 6-phosphate phosphatase activity converts GlcNAc-6P to N-acetylglucosamine (GlcNAc). Examples of N-acetylglucosamine-6-phosphate phosphatases are sugar phosphatases of the HAD-like superfamily, which catalyze the conversion of GlcNAc6P to GlcNAc. The HAD-like superfamily of enzymes is named after the bacterial enzyme halide dehydrogenase and includes phosphatases. A suitable HAD-like superfamily phosphatase catalyzing the conversion of GlcNAc6P to GlcNAc may be selected from the group consisting of fructose-1-phosphate phosphatase (YqaB, UniProtKB - P77475) and alpha-D-glucose-1-phosphate phosphatase (YihX, UniProtKB - P0A8Y3) . The E. coli YqaB and E. coli YihX enzymes are also thought to act on GlcNAc6P (Lee, S.-W. and Oh, M.-K. (2015) Metabolic Engineering 28: 143-150).

В дополнительном и/или альтернативном воплощении сахарофосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, представляет собой гетерологичный фермент в генетически сконструированной клетке Bacillus. В дополнительном и/или альтернативном воплощении сахарофосфатаза HAD-подобного суперсемейства, катализирующего превращение GlcNAc6P в GlcNAc, выбрана из группы, состоящей из YqaB Е. coli, YihX Е. coli и их функциональных вариантов.In an additional and/or alternative embodiment, the HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc is a heterologous enzyme in a genetically engineered Bacillus cell. In an additional and/or alternative embodiment, the HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc6P to GlcNAc is selected from the group consisting of E. coli YqaB, E. coli YihX, and functional variants thereof.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, которая содержит и экспрессирует нуклеотидную последовательность, кодирующую сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc. В дополнительном и/или альтернативном воплощении нуклеотидная последовательность, кодирующая сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, представляет собой гетерологичную нуклеотидную последовательность. В дополнительном и/или альтернативном воплощении нуклеотидная последовательность, кодирующая сахарофосфатазу HAD-подобного суперсемейства, катализирующего превращение GlcNAc-6P в GlcNAc, кодирует YqaB Е. coli или YihX Е. coli или функциональный вариант одного или двух данных ферментов.In an additional and/or alternative embodiment, the genetically engineered Bacillus cell contains a nucleic acid molecule that contains and expresses a nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc. In an additional and/or alternative embodiment, the nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc is a heterologous nucleotide sequence. In an additional and/or alternative embodiment, the nucleotide sequence encoding a HAD-like superfamily sugar phosphatase that catalyzes the conversion of GlcNAc-6P to GlcNAc encodes E. coli YqaB or E. coli YihX or a functional variant of one or two of these enzymes.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатфосфатазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate phosphatase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген N-ацетилглюкозамин-6-фосфатфосфатазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-6-phosphate phosphatase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus обладает N-ацетилглюкозамин-2-эпимеразной активностью. N-ацетилглюкозамин-2-эпимераза (ЕС 5.1.3.8) представляет собой фермент, который катализирует превращение N-ацетилглюкозамина (GlcNAc) в N-ацетилманнозамин (ManNAc). Фермент представляет собой рацемазу, оказывающую действие на углеводы и их производные. Систематическое название данного класса ферментов представляет собой N-ацил-D-глюкозамин 2-эпимеразу. Данный фермент участвует в метаболизме аминосахаров и метаболизме нуклеотидных Сахаров, предпочтительно гетерологичная N-ацетилглюкозамин 2-эпимераза.In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-2-epimerase activity. N-acetylglucosamine-2-epimerase (EC 5.1.3.8) is an enzyme that catalyzes the conversion of N-acetylglucosamine (GlcNAc) to N-acetylmannosamine (ManNAc). The enzyme is a racemase that acts on carbohydrates and their derivatives. The systematic name for this class of enzymes is N-acyl-D-glucosamine 2-epimerase. This enzyme is involved in the metabolism of amino sugars and the metabolism of nucleotide sugars, preferably heterologous N-acetylglucosamine 2-epimerase.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-2-эпимеразу, предпочтительно гетерологичную N-ацетилглюкозамин-2-эпимеразу. Примеры N-ацетилглюкозамин-2-эпимераз описаны у Anabena variabilis, Acaryochloris sp., Nostoc sp., Nostoc punctiforme, Bacteroides ovatus или Synechocystis sp.Пример подходящей N-ацетилглюкозамин 2-эпимеразы представляет собой N-цетилглюкозамин 2-эпимеразу В. ovatus АТСС 8483 (UniProtKB - A7LVG6), как кодируется геном BACOVA_01816. Еще одним примером является N-ацетилглюкозамин 2-эпимераза Synechocystis sp.(штамм РСС 6803) (UniProtKB - Р74124), которая также известна, как ренин-связывающий белок и кодируется геном slr1975.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-2-epimerase, preferably a heterologous N-acetylglucosamine-2-epimerase. Examples of N-acetylglucosamine 2-epimerases are described in Anabena variabilis, Acaryochloris sp., Nostoc sp., Nostoc punctiforme, Bacteroides ovatus or Synechocystis sp. An example of a suitable N-acetylglucosamine 2-epimerase is B. ovatus ATCC N-cetylglucosamine 2-epimerase 8483 (UniProtKB - A7LVG6), as encoded by the BACOVA_01816 gene. Another example is N-acetylglucosamine 2-epimerase from Synechocystis sp. (strain PCC 6803) (UniProtKB - P74124), which is also known as renin-binding protein and is encoded by the slr1975 gene.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, которая кодирует N-ацетилглюкозамин 2-эимеразу, предпочтительно, N-ацетилглюкозамин-2-эпимеразу В. ovatus АТСС 8483 или Synechocystis sp.(штамм РСС 6803) или ее функциональный вариант.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence that encodes N-acetylglucosamine 2-eimerase, preferably N-acetylglucosamine 2-epimerase of B. ovatus ATCC 8483 or Synechocystis sp. (strain PCC 6803) or a functional variant thereof.

Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилглюкозамин-2-эпимеразу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-2-эпимеразу в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-2-эпимеразы.Therefore, a nucleotide sequence that encodes N-acetylglucosamine-2-epimerase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-2-epimerase in genetically engineered Bacillus cell to ensure intracellular activity of N-acetylglucosamine-2-epimerase.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-2-эпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-2-epimerase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген N-ацетилглюкозамин-2-эпимеразы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylglucosamine-2-epimerase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus имеется N-ацетилглюкозамин-6-фосфатэпимеразная активность и N-ацетилманнозамин-6-фосфатфосфатазная активность. N-ацетилглюкозамин-6-фосфатэпимераза превращает N-ацетилглюкозамин-6-фосфат (GlcNAc-6P) в N-ацетилмоннозамин-6-фосфат (ManNAc-6P), тогда как N-ацетилманнозамин-6-фосфатфосфатаза дефосфорилирует ManNAc-6P с получением N-ацетилмоннозамина (ManNAc). Обладание N-ацетилглюкозамин-6-фосфатэпимеразная активность и N-ацетилглюкозамин-6-фосфатфосфатазная активность обеспечивает дополнительный или альтернативный путь для обеспечения ManNAc для продукции Neu5Ac.In a further and/or alternative embodiment, the genetically engineered Bacillus cell has N-acetylglucosamine-6-phosphate epimerase activity and N-acetylmannosamine-6-phosphate phosphatase activity. N-acetylglucosamine-6-phosphate epimerase converts N-acetylglucosamine-6-phosphate (GlcNAc-6P) to N-acetylmonnosamine-6-phosphate (ManNAc-6P), whereas N-acetylmannosamine-6-phosphate phosphatase dephosphorylates ManNAc-6P to produce N -acetylmonnosamine (ManNAc). Possession of N-acetylglucosamine-6-phosphate epimerase activity and N-acetylglucosamine-6-phosphate phosphatase activity provides an additional or alternative pathway to provide ManNAc for Neu5Ac production.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-6-фосфатэпимеразу. Примером подходящей N-ацетилглюкозамин-6-фосфатэпимеразы является NanE Е. coli (UniprotKB Р0А761), как кодируется геном папЕ Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-6-phosphate epimerase. An example of a suitable N-acetylglucosamine-6-phosphate epimerase is E. coli NanE (UniprotKB P0A761), as encoded by the E. coli paPE gene.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилглюкозамин-6-фосфатэпимеразу, предпочтительно нуклеотидную последовательность, кодирующую NanE E.coli или ее функциональный вариант.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylglucosamine-6-phosphate epimerase, preferably a nucleotide sequence encoding E. coli NanE or a functional variant thereof.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилглюкозамин-6-фосфатэпимеразу, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной микробной клетке с обеспечением внутриклеточной активности N-ацетилглюкозамин-2-фосфатэпимеразы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylglucosamine-6-phosphate epimerase, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence , affecting the transcription and/or translation of the specified nucleotide sequence in a genetically engineered microbial cell to ensure the intracellular activity of N-acetylglucosamine-2-phosphate epimerase.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатэпимеразу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate epimerase is adapted to the codon frequency of Bacillus.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит N-ацетилглюкозамин-6-фосфатфосфатазу, которая превращает ManNAc-6P в ManNAc.In a further and/or alternative embodiment, the genetically engineered Bacillus cell contains N-acetylglucosamine-6-phosphate phosphatase, which converts ManNAc-6P to ManNAc.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую N-ацетилманнозамин-6-фосфатфосфатазу. Следовательно, нуклеотидная последовательность, которая кодирует N-ацетилгманнозамин-6-фосфатфосфатазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, которая кодирует N-ацетилглюкозамин-6-фосфатфосфатазу, в генетически сконструированной клетке Bacillus с обеспечением внутриклеточной активности N-ацетилглюкозамин-6-фосфатфосфатазы.Thus, in a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding N-acetylmannosamine 6-phosphate phosphatase. Therefore, a nucleotide sequence that encodes N-acetylglucosamine-6-phosphate phosphatase is operably linked to at least one nucleic acid expression control sequence affecting the transcription and/or translation of said nucleotide sequence that encodes N-acetylglucosamine-6-phosphate phosphatase, in genetically engineered Bacillus cell to provide intracellular N-acetylglucosamine-6-phosphate phosphatase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную N-ацетилглюкозамин-6-фосфатфосфатазу, адаптирована к частоте использования кодона Bacillus.In a further and/or alternative embodiment, the codon frequency of the nucleotide sequence encoding the heterologous N-acetylglucosamine-6-phosphate phosphatase is adapted to the codon frequency of Bacillus.

Рекомбинантный ген N-ацетилманнозамин-6-фосфатфосфатазы может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant N-acetylmannosamine 6-phosphate phosphatase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В генетически сконструированной клетке Bacillus имеется активность синтетазы цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты (Фиг. 1: ) для переноса цитидин-5'-монофосфата на N-ацетилнейраминовую кислоту с образованием СМР-активированной N-ацетилнейраминовой кислоты (CMP-NeuNAc). Несколько синтетаз 5'-монофосфо-(СМР)-сиаловой кислоты известны в данной области и описаны, например, синтетазы 5'-монофосфо-(СМР)-сиаловой кислоты из Е. coli, Neisseria meningitidis, Campylobacter jejuni, Streptococcus sp.и т.д.The genetically engineered Bacillus cell has cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase activity (Figure 1: ) to transfer cytidine 5'-monophosphate to N-acetylneuraminic acid to form CMP-activated N-acetylneuraminic acid (CMP-NeuNAc). Several 5'-monophospho-(CMP)-sialic acid synthetases are known in the art and have been described, for example, 5'-monophospho-(CMP)-sialic acid synthetases from E. coli, Neisseria meningitidis, Campylobacter jejuni, Streptococcus sp., etc. .d.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, предпочтительно, гетерологичную синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, более предпочтительно N-ацетилнейраминатцитидилтрансферазу NeuA из С.jejuni. NeuA С.jejuni кодируется геном neuA С. jejuni.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises cytidine 5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, preferably a heterologous cytidine 5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, more preferably N-acetylneuraminate cytidyltransferase NeuA from C. jejuni. C. jejuni NeuA is encoded by the C. jejuni neuA gene.

Таким образом, в дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую и экспрессирующую нуклеотидную последовательность, кодирующую синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, где указанная нуклеотидная последовательность функционально связана с по меньшей мере одной последовательностью контроля экспрессии нуклеиновой кислоты, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности в генетически сконструированной микробной клетке с обеспечением активности N-ацетилнейраминатцитидилтрансферазы.Thus, in a further and/or alternative embodiment, a genetically engineered Bacillus cell comprises a nucleic acid molecule comprising and expressing a nucleotide sequence encoding cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase, wherein said nucleotide sequence is operably linked to at least one nucleic acid expression control sequence influencing the transcription and/or translation of the specified nucleotide sequence in a genetically engineered microbial cell to ensure N-acetylneuraminate cytidyl transferase activity.

В дополнительном и/или альтернативном воплощении частота использования кодона нуклеотидной последовательности, кодирующей гетерологичную синтетазу цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты, адаптирована к частоте использования кодона Bacillus.In an additional and/or alternative embodiment, the codon usage frequency of the nucleotide sequence encoding heterologous cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase is adapted to the Bacillus codon usage frequency.

Рекомбинантный ген синтетазы цитидин-5'-монофосфо-(СМР)-N-ацетилнейраминовой кислоты может быть интегрирован в хромосому Bacillus или находиться в виде эписомальной версии на плазмиде в клетке Bacillus.The recombinant cytidine-5'-monophospho-(CMP)-N-acetylneuraminic acid synthetase gene can be integrated into the Bacillus chromosome or present as an episomal version on a plasmid in the Bacillus cell.

В генетически сконструированной клетке Bacillus имеется сиалилтрансфераза, предпочтительно гетерологичная сиалилтрансфераза и более предпочтительно сиалилтрансферазная активность, выбранная из группы, состоящей из α-2,3-сиалилтрансферазной активности, α-2,6-сиалилтрансферазной активности и/или α-2,8-сиалилтрансферазной активности. Сиалилтрансферазная активность может переносить группировку N-ацетилнейраминовой кислоты с CMP-NeuNAc на акцепторную молекулу, где указанная акцепторная молекула представляет собой молекулу сахарида, с получением сиалированного сахарида.The genetically engineered Bacillus cell contains a sialyltransferase, preferably a heterologous sialyltransferase and more preferably a sialyltransferase activity selected from the group consisting of α-2,3-sialyltransferase activity, α-2,6-sialyltransferase activity and/or α-2,8-sialyltransferase activity. Sialyltransferase activity can transfer the N-acetylneuraminic acid moiety from CMP-NeuNAc to an acceptor molecule, where the acceptor molecule is a saccharide molecule, to produce a sialylated saccharide.

В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка содержит по меньшей мере одну сиалилтрансферазу, предпочтительно по меньшей мере одну гетерологичную сиалилтрансферазу, где указанная сиалилтрансфераза может обладать α-2,3-сиалилтрансферазной активностью и/или α-2,6-сиалилтрансферазной активностью и/или α-2,8-сиалилтрансферазной активностью для переноса группировки NeuNAc с CMP-NeuNAc в качестве субстрата-донора на акцепторный сахарид. Иллюстративные сиалилтрансферазы и их гены идентифицированы в Таблице 2.In a further and/or alternative embodiment, the genetically engineered microbial cell contains at least one sialyltransferase, preferably at least one heterologous sialyltransferase, wherein said sialyltransferase may have α-2,3-sialyltransferase activity and/or α-2,6-sialyltransferase activity and/or α-2,8-sialyltransferase activity to transfer the NeuNAc moiety from CMP-NeuNAc as a donor substrate to an acceptor saccharide. Exemplary sialyltransferases and their genes are identified in Table 2.

Термин «сиалилтрансфераза», в том виде, в котором он используется в данном документе, относится к полипептидам, способным обладать сиалилтрансферазной активностью. «Сиалилтрансферазная активность» относится к переносу остатка сиаловой кислоты, предпочтительно остатка N-ацетилнейраминовой кислоты (Neu5Ac), с субстрата-донора на акцепторную молекулу. Термин «сиалилтрансфераза» включает функциональные фрагменты сиалилтрансфераз, описанных в данном документе, функциональные варианты сиалилтрансфераз, описанных в данном документе, и функциональные фрагменты функциональных вариантов. «Функциональный» в данном отношении означает, что фрагменты и/или варианты могут обладать сиалилтрансферазной активностью. Функциональные фрагменты сиалилтрансферазы охватывают усеченные версии сиалилтрансферазы, как кодируется их геном, встречающимся в природе, усеченная версия которого может обладать сиалилтрансферазной активностью. Примерами усеченных версий являются сиалилтрансферазы, которые не содержат так называемой лидерной последовательности, которая обычно направляет полипептид к конкретной внутриклеточной локализации. Обычно такие лидерные последовательности удаляют из полипептида во время его внутриклеточного транспорта, и они также отсутствуют в зрелой сиалилтрансферазе, встречающейся в природе.The term “sialyltransferase”, as used herein, refers to polypeptides capable of having sialyltransferase activity. "Sialyltransferase activity" refers to the transfer of a sialic acid residue, preferably an N-acetylneuraminic acid residue (Neu5Ac), from a donor substrate to an acceptor molecule. The term “sialyltransferase” includes functional fragments of the sialyltransferases described herein, functional variants of the sialyltransferases described herein, and functional fragments of functional variants. "Functional" in this regard means that the fragments and/or variants may have sialyltransferase activity. Functional sialyltransferase fragments comprise truncated versions of the sialyltransferase as encoded by their naturally occurring gene, the truncated version of which may have sialyltransferase activity. Examples of truncated versions are sialyltransferases, which do not contain the so-called leader sequence that usually directs the polypeptide to a specific subcellular location. Typically, such leader sequences are removed from the polypeptide during intracellular transport, and they are also absent from the mature sialyltransferase found in nature.

Гетерологичная сиалилтрансфераза может переносить остаток сиаловой кислоты с субстрата-донора на молекулу-акцептор. Термин «может» в отношении гетерологичной сиалилтрансферазы относится к сиалилтрансферазной активности гетерологичной сиалилтрансферазы и условию, что подходящие условия реакции требуются для гетерологичной сиалилтрансферазы для обладания ее ферментативной активностью. В отсутствии подходящих условий реакции гетерологичная сиалилтрансфераза не обладает своей ферментативной активностью, но сохраняет свою ферментативную активность и обладает своей ферментативной активностью, когда восстанавливают подходящие условия реакции. Подходящие условия реакции включают наличие подходящего субстрата-донора, наличие подходящих молекул-акцепторов, наличие существенных кофакторов, таких как, например, одновалентные или двухвалентные ионы, значение рН в соответствующем диапазоне, подходящую температуру и тому подобное. Не обязательно, чтобы оптимальные значения для каждого фактора, влияющего на ферментативную реакцию гетерологичной сиалилтрансферазы, были удовлетворены, но условия реакции должны быть такими, чтобы гетерологичная сиалилтрансфераза осуществляла свою ферментативную активность. Соответственно, термин «может» исключает любые условия, при которых ферментативная активность гетерологичной сиалилтрансферазы необратимо нарушена, и также исключено воздействие на гетерологичную сиалилтрансферазу любого такого условия. Напротив, термин «может» означает, что сиалилтрансфераза является ферментативно активной, а именно, обладает своей сиалилтрансферазной активностью, если пермиссивные условия реакции (где все требования, являющиеся необходимыми для того, чтобы сиалилтрансфераза реализовывала свою ферментативную активность) предоставлены сиалилтрансферазе.A heterologous sialyltransferase can transfer a sialic acid residue from a donor substrate to an acceptor molecule. The term “may” in relation to a heterologous sialyltransferase refers to the sialyltransferase activity of the heterologous sialyltransferase and the proviso that suitable reaction conditions are required for the heterologous sialyltransferase to have its enzymatic activity. In the absence of suitable reaction conditions, the heterologous sialyltransferase does not have its enzymatic activity, but retains its enzymatic activity and has its enzymatic activity when suitable reaction conditions are restored. Suitable reaction conditions include the presence of a suitable donor substrate, the presence of suitable acceptor molecules, the presence of significant cofactors such as, for example, monovalent or divalent ions, a pH value in the appropriate range, a suitable temperature, and the like. It is not necessary that the optimum values for each factor influencing the enzymatic reaction of the heterologous sialyltransferase be satisfied, but the reaction conditions must be such that the heterologous sialyltransferase performs its enzymatic activity. Accordingly, the term “may” excludes any conditions under which the enzymatic activity of the heterologous sialyltransferase is irreversibly impaired, and also excludes the heterologous sialyltransferase being affected by any such condition. In contrast, the term “may” means that the sialyltransferase is enzymatically active, namely, possesses its sialyltransferase activity if permissive reaction conditions (where all the requirements necessary for the sialyltransferase to exercise its enzymatic activity) are provided to the sialyltransferase.

Сиалилтрансферазы можно различить по типу связи с сахаром, которую они образуют. В том виде, в котором они используются в данном документе, термины «α-2,3-сиалилтрансфераза» и «α-2,3-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,3-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы. Аналогично, термины «α-2,6-сиалилтрансфераза» и «α-2,6-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,6-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы. Аналогично, термины «α-2,8-сиалилтрансфераза» и «α-2,8-сиалилтрансферазная активность» относятся к полипептидам и их ферментативной активности, которые добавляют остаток сиаловой кислоты с α-2,8-связью к галактозе, N-ацетилгалактозамину или галактозе или остатку N-ацетилгалактозамина акцепторной молекулы.Sialyltransferases can be distinguished by the type of sugar bond they form. As used herein, the terms "α-2,3-sialyltransferase" and "α-2,3-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add a sialic acid residue to an α-2 ,3-bond to galactose, N-acetylgalactosamine or galactose or the N-acetylgalactosamine residue of the acceptor molecule. Similarly, the terms "α-2,6-sialyltransferase" and "α-2,6-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add an α-2,6-linked sialic acid residue to galactose, N-acetylgalactosamine or galactose or an N-acetylgalactosamine residue of an acceptor molecule. Likewise, the terms "α-2,8-sialyltransferase" and "α-2,8-sialyltransferase activity" refer to polypeptides and their enzymatic activities that add an α-2,8-linked sialic acid residue to galactose, N-acetylgalactosamine or galactose or an N-acetylgalactosamine residue of an acceptor molecule.

Кроме того, генетически сконструированная клетка Bacillus генетически сконструирована для того, чтобы содержать и экспрессировать нуклеотидную последовательность, кодирующую гетерологичную сиалилтрансферазу. С этой целью нуклеотидная последовательность, кодирующая гетерологичную сиалилтрансферазу, функционально связана с по меньшей мере одной последовательностью контроля экспрессии, влияющей на транскрипцию и/или трансляцию указанной нуклеотидной последовательности, кодирующей гетерологичную сиалилтрансферазу, в генетически сконструированной клетке Bacillus с получением внутриклеточной сиалилтрансферазной активности.In addition, the genetically engineered Bacillus cell is genetically engineered to contain and express a nucleotide sequence encoding a heterologous sialyltransferase. To this end, a nucleotide sequence encoding a heterologous sialyltransferase is operably linked to at least one expression control sequence affecting the transcription and/or translation of said nucleotide sequence encoding a heterologous sialyltransferase in a genetically engineered Bacillus cell to produce intracellular sialyltransferase activity.

В еще одном воплощении гетерологичная сиалилтрансфераза может обладать α-2,6-сиалилтрансферазной активностью.In yet another embodiment, the heterologous sialyltransferase may have α-2,6-sialyltransferase activity.

В дополнительном и/или альтернативном воплощении в генетически сконструированной клетке Bacillus содержится и экспрессируется молекула нуклеиновой кислоты, которая содержит по меньшей мере одну нуклеотидную последовательность, кодирующую указанную гетерологичную сиалилтрансферазу, способную обладать α-2,6-сиалилтрансферазной активностью.In an additional and/or alternative embodiment, a genetically engineered Bacillus cell contains and expresses a nucleic acid molecule that contains at least one nucleotide sequence encoding said heterologous sialyltransferase capable of having α-2,6-sialyltransferase activity.

В дополнительном и/или альтернативном воплощении гетерологичная сиалилтрансфераза может обладать α-2,8-сиалилтрансферазной активностью. Примером гетерологичной сиалилтрансферазы, которая способна обладать α-2,8-сиалилтрансферазной активностью, является сиалилтрансфераза Cstll OH4384Campylobacter jejuni.In a further and/or alternative embodiment, the heterologous sialyltransferase may have α-2,8-sialyltransferase activity. An example of a heterologous sialyltransferase that is capable of α-2,8-sialyltransferase activity is the Campylobacter jejuni sialyltransferase Cstll OH4384.

Сиалилтрансфераза может переносить остаток сиаловой кислоты, например, остаток N-ацетилнейраминовой кислоты (Neu5Ac), от субстрата-донора, например, CMP-Neu5Ac, на акцепторную молекулу. Акцепторная молекула представляет собой молекулу сахарида, предпочтительно молекулу сахарида, изложенную в Таблице 3.A sialyltransferase can transfer a sialic acid residue, such as an N-acetylneuraminic acid residue (Neu5Ac), from a donor substrate, such as CMP-Neu5Ac, to an acceptor molecule. The acceptor molecule is a saccharide molecule, preferably a saccharide molecule set forth in Table 3.

В дополнительном и/или альтернативном воплощении в генетически сконструированной микробной клетке Bacillus содержится молекула нуклеиновой кислоты, которая содержит и экспрессирует по меньшей мере одну нуклеотидную последовательность, кодирующую указанную гетерологичную сиалилтрансферазу, способную обладать α-2,3-сиалилтрансферазной активностью.In an additional and/or alternative embodiment, the genetically engineered Bacillus microbial cell contains a nucleic acid molecule that contains and expresses at least one nucleotide sequence encoding said heterologous sialyltransferase capable of having α-2,3-sialyltransferase activity.

В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой моносахарид, предпочтительно моносахарид, выбранный из группы, состоящей из N-ацетилглюкозамина, галактозы и N-ацетилгалактозамина.In a further and/or alternative embodiment, the acceptor molecule is a monosaccharide, preferably a monosaccharide selected from the group consisting of N-acetylglucosamine, galactose and N-acetylgalactosamine.

В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой дисахарид, предпочтительно дисахарид, выбранный из группы, состоящей из лактозы, лактулозы, N-ацетиллактозамина, лакто-N-биозы, лактулозы и мелибиозы.In a further and/or alternative embodiment, the acceptor molecule is a disaccharide, preferably a disaccharide selected from the group consisting of lactose, lactulose, N-acetyllactosamine, lacto-N-biose, lactulose and melibiose.

В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой трисахарид, предпочтительно трисахарид, выбранный из группы, состоящей из рафинозы, лакто-N-триозы II, 2'-фукозиллактозы, 3-фукозиллактозы, 3'-сиалиллактозы, 6'-сиалиллактозы, 3'-сиалил-N-In an additional and/or alternative embodiment, the acceptor molecule is a trisaccharide, preferably a trisaccharide selected from the group consisting of raffinose, lacto-N-triose II, 2'-fucosyllactose, 3-fucosyllactose, 3'-sialyllactose, 6'-sialyllactose, 3'-sialyl-N-

ацетиллактозамина, 6'-сиалил-N-ацетиллактозамина, 3'-галактозиллактозы и 6'-галактозиллактозы.acetyllactosamine, 6'-sialyl-N-acetyllactosamine, 3'-galactosyllactose and 6'-galactosyllactose.

В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой тетрасахарид, предпочтительно тетрасахарид, выбранный из группы, состоящей из лакто-N-тетраозы, лакто-N-неотетраозы, 2'3-дифукозиллактозы, 3-фукозил-3'-сиалиллактозы и 3-фукозил-6'-сиалиллактозы.In an additional and/or alternative embodiment, the acceptor molecule is a tetrasaccharide, preferably a tetrasaccharide selected from the group consisting of lacto-N-tetraose, lacto-N-neotetraose, 2'3-difucosyllactose, 3-fucosyl-3'-sialyllactose and 3 -fucosyl-6'-sialyllactose.

В дополнительном и/или альтернативном воплощении акцепторная молекула представляет собой пентасахарид, предпочтительно пентасахарид, выбранный из группы, состоящей из сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, лакто-N-фукопентаозы I, лакто-N-фукопентаозы II, лакто-N-фукопентаозы III, лакто-N-фукопентаозы V, лакто-N-неофукопентаозы I и лакто-N-неофукопентаозы V.In an additional and/or alternative embodiment, the acceptor molecule is a pentasaccharide, preferably a pentasaccharide selected from the group consisting of sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, lacto-N-fucopentaose I, lacto-N-fucopentaose II, lacto-N-fucopentaose III, lacto-N-fucopentaose V, lacto-N-neofucopentaose I and lacto-N-neofucopentaose V.

Следует понимать, что клетка Bacillus, уже несущая один или более генов, кодирующих указанные ферменты образом, достаточным для продукции NeuNAc, CMP-NeuNAc и/или сиалированного сахарида, не нуждается в генетической модификации для совершения биосинтеза сиаловой кислоты и для переноса группировки сиаловой кислоты на акцептор-сахарид, но, тем не менее, может быть генетически сконструирована для изменения уровня экспрессии одного или более из указанных генов для повышения внутриклеточного уровня продуктов указанного одного или более генов, таких как, например, количество глутамин:фруктозо-6-фосфатаминотрансфеаза, глюкозамин-6-фосфат N-ацетилтрансфераза, N-ацетилглюкозамин-6-фосфатфосфатаза, N-ацетилглюкозамин 2-эпимераза и/или синтетаза N-ацетилнейраминовой кислоты, с повышением, таким образом, скорости биосинтеза Neu5Ac, и, как следствие, сиалированного сахарида, в генетически сконструированной клетке.It should be understood that a Bacillus cell already carrying one or more genes encoding these enzymes in a manner sufficient to produce NeuNAc, CMP-NeuNAc and/or sialylated saccharide does not require genetic modification to perform sialic acid biosynthesis and to transfer the sialic acid moiety to saccharide acceptor, but may nevertheless be genetically engineered to alter the expression level of one or more of said genes to increase the intracellular level of products of said one or more genes, such as, for example, the amount of glutamine: fructose-6-phosphate aminotransferase, glucosamine -6-phosphate N-acetyltransferase, N-acetylglucosamine-6-phosphate phosphatase, N-acetylglucosamine 2-epimerase and/or N-acetylneuraminic acid synthetase, thus increasing the rate of Neu5Ac biosynthesis, and, as a consequence, sialylated saccharide, in genetically engineered cell.

В некоторых воплощениях клетка Bacillus предназначена для применения в получении 3'-SL и генетически сконструирована для того, чтобы иметь лактозопермеазу, путь биосинтеза CMP-NeuNAc, в котором используется GlcN-1P в качестве промежуточного соединения, и α-2,3-сиалилтрансферазу.In some embodiments, a Bacillus cell is intended for use in the production of 3'-SL and is genetically engineered to have a lactose permease, a CMP-NeuNAc biosynthetic pathway that uses GlcN-1P as an intermediate, and an α-2,3-sialyltransferase.

В разных воплощениях клетка Bacillus предназначена для применения в получении 6'-SL и генетически сконструирована для того, чтобы иметь лактозопермеазу, путь биосинтеза CMP-NeuNAc, в котором используется GlcN-1P в качестве промежуточного соединения, и α-2,6-сиалилтрансферазу.In various embodiments, a Bacillus cell is intended for use in the production of 6'-SL and is genetically engineered to have a lactose permease, a CMP-NeuNAc biosynthetic pathway that uses GlcN-1P as an intermediate, and an α-2,6-sialyltransferase.

В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка Bacillus синтезирует больше ФЕП, чем клетка дикого типа. В дополнительном и/или альтернативном воплощении генетически сконструированная микробная клетка генетически сконструирована для того, чтобы имелся усиленный путь биосинтеза ФЕП. Предпочтительно, генетически сконструированная микробная клетка генетически сконструирована для обладания повышенной активностью синтазы фосфоенолпирувата, например, в том, что ген ppsA, кодирующий фосфоенолпируватсинтазу, сверхэкспрессируется, и/или в том, что микроорганизмы, не встречающиеся в природе, содержат по меньшей мере одну дополнительную копию нуклеотидной последовательности, делающую возможной экспрессию фосфоенолпируватсинтазы или ее функционального варианта. Сверхэкспрессия ppsA усиливает внутриклеточный синтез ФЕП таким образом, что больше ФЕП доступно для продукции сиаловой кислоты. Например, подходящая фосфоенолпируватсинтаза представляет собой PpsA Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus microbial cell synthesizes more PEP than the wild type cell. In a further and/or alternative embodiment, the genetically engineered microbial cell is genetically engineered to have an enhanced PEP biosynthetic pathway. Preferably, the genetically engineered microbial cell is genetically engineered to have increased phosphoenolpyruvate synthase activity, for example, in that the ppsA gene encoding phosphoenolpyruvate synthase is overexpressed, and/or in that the non-naturally occurring microorganisms contain at least one additional copy a nucleotide sequence allowing the expression of phosphoenolpyruvate synthase or a functional variant thereof. Overexpression of ppsA enhances intracellular PEP synthesis such that more PEP is available for sialic acid production. For example, a suitable phosphoenolpyruvate synthase is E. coli PpsA.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus содержит молекулу нуклеиновой кислоты, содержащую нуклеотидную последовательность, кодирующую PpsA Е. coli или ее функциональный вариант.Указанная нуклеотидная последовательность, кодирующая PpsA Е. coli или ее функциональный вариант, обладает идентичностью последовательностей по меньшей мере 80%, по меньшей мере 85%, по меньшей мере 90%, по меньшей мере 95%, по меньшей мере 98% или по меньшей мере 99% с геном ppsA Е. coli.In a further and/or alternative embodiment, the genetically engineered Bacillus cell comprises a nucleic acid molecule comprising a nucleotide sequence encoding E. coli PpsA or a functional variant thereof. Said nucleotide sequence encoding E. coli PpsA or a functional variant thereof has at least sequence identity 80%, at least 85%, at least 90%, at least 95%, at least 98%, or at least 99% with the E. coli ppsA gene.

В дополнительном и/или альтернативном воплощении генетически сконструированная клетка Bacillus дополнительно модифицирована для того, чтобы иметь способность переносить указанный один единственный источник углерода в клетку посредством механизма, при котором не потребляется ФЕП.In a further and/or alternative embodiment, the genetically engineered Bacillus cell is further modified to have the ability to transport said single carbon source into the cell through a mechanism that does not consume PEP.

В дополнительном и/или альтернативном воплощении клетка Bacillus для получения сиалированного олигосахарида не обладает β-галактозидазной активностью или обладает пониженной β-галактозидазной активностью, по сравнению с клеткой Bacillus дикого типа того же вида.In a further and/or alternative embodiment, the Bacillus cell for producing the sialylated oligosaccharide has no β-galactosidase activity or has reduced β-galactosidase activity compared to a wild-type Bacillus cell of the same species.

Внутриклеточный биосинтез сиалированных олигосахаридов требует импортирования лактозы в качестве субстрата-акцептора для сиалилтрансферазы, акцептирующей лактозу. Любая внутриклеточная активность фермента, который гидролизует поглощенную лактозу, будет воздействовать на эффективность образования сиалиллактозы, поскольку пул внутриклеточной лактозы будет уменьшен. Таким образом, будет преимущественным, если клетка Bacillus для получения сиалированного олигосахарида не будет обладать или будет обладать по меньшей мере, по сравнению с клеткой Bacillus дикого типа, сниженной активностью бета-галактозидазы.Intracellular biosynthesis of sialylated oligosaccharides requires the import of lactose as an acceptor substrate for lactose-accepting sialyltransferase. Any intracellular enzyme activity that hydrolyzes ingested lactose will affect the efficiency of sialyllactose formation because the pool of intracellular lactose will be reduced. Thus, it will be advantageous if the Bacillus cell used to produce the sialylated oligosaccharide has no or at least reduced beta-galactosidase activity compared to a wild-type Bacillus cell.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована для исключения или по меньшей мере уменьшения р-галактозидазной активности клетки.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered to eliminate or at least reduce the β-galactosidase activity of the cell.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации гена ganA. В еще одном воплощении клетка Bacillus генетически сконструирована для уменьшения уровня экспрессии гена ganA, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered through deletion or functional inactivation of the ganA gene. In yet another embodiment, the Bacillus cell is genetically engineered to reduce the level of expression of the ganA gene compared to a wild-type Bacillus cell.

Ген ganA Bacillus также называется yvfN или lacA. Это ген регулона GanR, который содержит гены, кодирующие ферменты, участвующие в утилизации галактана. Ген ganA кодирует бета-галактозидазу, которая участвует в утилизации галактана Bacillus.The Bacillus ganA gene is also called yvfN or lacA. This is the GanR regulon gene, which contains genes encoding enzymes involved in galactan utilization. The ganA gene encodes beta-galactosidase, which is involved in the utilization of Bacillus galactan.

Делеция или функциональная инактивация гена ganA аннулирует GanA-опосредованную β-галактозидазную активность в клетке Bacillus, тогда как уменьшение уровня экспрессии ganA уменьшает количество GanA в клетке Bacillus и, следовательно, активность β-галактозидазы, которая могла бы мешать биосинтезу сиалированного олигосахарида.Deletion or functional inactivation of the ganA gene abolishes GanA-mediated β-galactosidase activity in the Bacillus cell, whereas reducing the level of ganA expression reduces the amount of GanA in the Bacillus cell and, therefore, β-galactosidase activity, which would interfere with sialylated oligosaccharide biosynthesis.

В дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована посредством удаления или функциональной инактивации гена yesZ. Ген yesZ Bacillus кодирует бета-галактозидазу YesZ, которая играет роль в деградации рамногалактуронана, происходящего из клеточных стенок растений. Экспрессия гена yesZ Bacillus индуцируется рамногалактуронаном I. В еще одном воплощении клетка Bacillus генетически сконструирована для уменьшения уровня экспрессии гена yesZ, по сравнению с клеткой Bacillus дикого типа.In a further and/or alternative embodiment, the Bacillus cell is genetically engineered by deleting or functionally inactivating the yesZ gene. The Bacillus yesZ gene encodes YesZ beta-galactosidase, which plays a role in the degradation of rhamnogalacturonan derived from plant cell walls. Expression of the Bacillus yesZ gene is induced by rhamnogalacturonan I. In yet another embodiment, a Bacillus cell is genetically engineered to reduce the level of expression of the yesZ gene compared to a wild-type Bacillus cell.

Удаление или функциональная инактивация гена yesZ аннулирует YesZ-опосредованную р-галактозидазную активность в клетке Bacillus, тогда как уменьшение уровня экспрессии yesZ уменьшает количество YesZ в клетке Bacillus и, следовательно, активность β-галактозидазы, которая могла бы мешать биосинтезу сиалированного олигосахарида.Deletion or functional inactivation of the yesZ gene abolishes YesZ-mediated β-galactosidase activity in the Bacillus cell, whereas decreasing the level of yesZ expression reduces the amount of YesZ in the Bacillus cell and, therefore, β-galactosidase activity, which would interfere with sialylated oligosaccharide biosynthesis.

Когда В. subtilis вступает в постэкспоненциальную фазу роста, они (начинают) продуцировать большие количества внеклеточных протеаз. Чужеродные белки часто являются чувствительными к протеазе. Таким образом, штамм, не содержащий экзопротеазу, является желательным для повышения стабильности гетерологичных белков и для обеспечения аккумуляции высоких уровней чужеродных белков. Геном Bacillus кодирует по меньшей мере восемь внеклеточных протеаз, а именно nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована в том, что по меньшей мере один ген, кодирующий внеклеточную протеазу, был удален или функционально инактивирован, предпочтительно по меньшей мере один из генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA. Предпочтительно, два, три, четыре, пять, шесть, семь, или восемь из генов, выбранных из группы, состоящей из nprE, aprE, epr, bpr, mpr, nprB, vpr и wprA, удалены или функционально инактивированы.When B. subtilis enters the post-exponential growth phase, they (begin to) produce large amounts of extracellular proteases. Foreign proteins are often protease sensitive. Thus, an exoprotease-free strain is desirable to enhance the stability of heterologous proteins and to allow the accumulation of high levels of foreign proteins. The Bacillus genome encodes at least eight extracellular proteases, namely nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA. Thus, in a further and/or alternative embodiment, the Bacillus cell is genetically engineered such that at least one gene encoding an extracellular protease has been deleted or functionally inactivated, preferably at least one of the genes selected from the group consisting of nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA. Preferably, two, three, four, five, six, seven, or eight of the genes selected from the group consisting of nprE, aprE, epr, bpr, mpr, nprB, vpr and wprA are deleted or functionally inactivated.

В, subtiiis синтезирует пульхерриминовую кислоту, когда растет в средах, содержащих углевод, такой как глюкоза или лактоза. Выделяемая пульхерриминовая кислота образует красный пигмент пульхерримин, соль пульхерриминовой кислоты (хелат железа (III)), когда железо находится в среде для выращивания. Образования данного нежелательного побочного продукта во время процессов ферментации можно избежать/аннулировать посредством удаления/нарушения генов yvmC и/или сурХ. Ген yvmC кодирует циклодипептидсинтазу, и ген сурХ кодирует цитохром Р450 цикло-I-лейцил-I-лейцилдипептидоксидазу.B, subtiiis synthesizes pulcherrimic acid when grown in media containing a carbohydrate such as glucose or lactose. The released pulcherrimic acid forms the red pigment pulcherrimin, a salt of pulcherrimic acid (iron(III) chelate) when iron is in the growth medium. The formation of this undesirable by-product during fermentation processes can be avoided/abrogated by deleting/disrupting the yvmC and/or surX genes. The yvmC gene encodes cyclodipeptide synthase, and the surX gene encodes cytochrome P450 cyclo-I-leucyl-I-leucyl dipeptide oxidase.

Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus генетически сконструирована таким образом, что по меньшей мере один из генов yvmC и сурХ удален или функционально инактивирован.Thus, in a further and/or alternative embodiment, the Bacillus cell is genetically engineered such that at least one of the yvmC and surX genes is deleted or functionally inactivated.

Ризобактерия В. subtilis имеет гены для синтеза более чем 20 антибиотиков. Среди них находятся антибиотики-пептиды, такие как лантибиотики и пептиды, подобные лактибиотикам Bacillus subtilis (субтилин, эрицин S, мерсацидин, субланцин 168, субтилозин А) и антибиотики, синтезируемые нерибосомально (пептид) (сурфактин, итуирн, бацилломицин, микосубтилин, коринебактин/бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикоумацин, 3,3'-неотрегалозадиамин, диффицидин, ризоктицин).The rhizobacterium B. subtilis has genes for the synthesis of more than 20 antibiotics. Among them are peptide antibiotics, such as lantibiotics and peptides similar to lactibiotics of Bacillus subtilis (subtilin, ericin S, mersacidin, sublancin 168, subtilosin A) and antibiotics synthesized non-ribosomally (peptide) (surfactin, ituirn, bacillomycin, mycosubtilin, corinebactin/ bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilizocin, amikoumacin, 3,3'-neotrehalosadiamine, difficidin, rhizocticin).

Для получения сиалированного олигосахарида предпочтительно использовать клетку Bacillus, которая не продуцирует антибиотик. Таким образом, в дополнительном и/или альтернативном воплощении клетка Bacillus не синтезирует один или более антибиотиков, выбранных из группы, состоящей из лантибиотиков и пептидов, подобных лантибиотикам, таких как субтилин, эрицин S, мерзацидин, субланцин 168, субтилозин А; антибиотиков, синтезированных нерибосомально (пептид), таких как сурфактин, итурин, бацилломицин, микосубтилин, коринебактин/ бациллибактин, фенгицин, плипастатин, микобациллин, TL-119, бацилизин, бацилизоцин, амикоумацин, 3,3'-неотрегалозадиамин, диффицидин и ризоктицин. Клетка Bacillus могла быть генетически сконструирована для нарушения или аннулирования их своей способности синтезировать один или более из указанных антибиотиков.To obtain the sialylated oligosaccharide, it is preferable to use a Bacillus cell that does not produce the antibiotic. Thus, in an additional and/or alternative embodiment, the Bacillus cell does not synthesize one or more antibiotics selected from the group consisting of lantibiotics and lantibiotic-like peptides such as subtilin, ericin S, merzacidin, sublancin 168, subtilosin A; non-ribosomally synthesized antibiotics (peptide), such as surfactin, iturin, bacillomycin, mycosubtilin, corynebactin/bacillibactin, fengycin, plipastatin, mycobacillin, TL-119, bacilysin, bacilizocin, amikoumacin, 3,3'-neotrehalosadiamine, difficidin and rhizocticin. The Bacillus cell may have been genetically engineered to disrupt or abrogate its ability to synthesize one or more of these antibiotics.

Генетически сконструированная клетка Bacillus, которая может продуцировать сиалированный олигосахарид, может, возможно, включать дополнительные признаки и может быть генетически сконструирована для того, чтобы иметь данные дополнительные признаки. Считается, что данные дополнительные признаки улучают продуктивность микроорганизма, который не встречается в природе, приводя к более высоким выходам сиалированного олигосахарида.A genetically engineered Bacillus cell that can produce a sialylated oligosaccharide may optionally include additional traits and may be genetically engineered to have these additional traits. These additional traits are believed to improve the productivity of the microorganism, which does not occur naturally, resulting in higher yields of sialylated oligosaccharide.

Клетка Bacillus по изобретению может продуцировать сиалированный олигосахарид при культивации в присутствии лактозы в среде и в условиях, которые являются пермиссивными в отношении клетки Bacillus, для получения сиалированного олигосахарида. Таким образом, также предложено применение генетически сконструированной клетки Bacillus, как ранее описано в данном документе, для получения сиалированного олигосахарида.The Bacillus cell of the invention can produce sialylated oligosaccharide when cultured in the presence of lactose in a medium and under conditions that are permissive to the Bacillus cell to produce sialylated oligosaccharide. Thus, the use of a genetically engineered Bacillus cell, as previously described herein, to produce a sialylated oligosaccharide is also provided.

В одном аспекте предложен способ получения сиалированного олигосахарида. Способ включает (i) предоставление клетки Bacillus, как описано ранее в данном документе, (ii) культивацию указанной клетки Bacillus в культуральной среде или ферментационном бульоне и в условиях, которые являются пермиссивными в отношении получения сиалированного олигосахарида. Способ может дополнительно включать извлечение сиалированного олигосахарида из культуральной среды/ферментационного бульона и/или из клетки Bacillus.In one aspect, a method for producing a sialylated oligosaccharide is provided. The method comprises (i) providing a Bacillus cell as described previously herein, (ii) cultivating said Bacillus cell in a culture medium or fermentation broth and under conditions that are permissive for the production of sialylated oligosaccharide. The method may further comprise recovering the sialylated oligosaccharide from the culture medium/fermentation broth and/or from the Bacillus cell.

Ферментационный бульон содержит по меньшей мере один источник углерода для метаболизма клетки Bacillus. В некоторых воплощениях по меньшей мере один источник углерода выбран из группы, состоящей из глюкозы, фруктозы, сахарозы, глицерина и их комбинаций. Источник углерода может быть поглощен клеткой Bacillus и может быть привлечен метаболизмом клетки Bacillus с образованием биомассы и/или энергии в форме высокоэнергетических трифосфатов.The fermentation broth contains at least one carbon source for the metabolism of the Bacillus cell. In some embodiments, the at least one carbon source is selected from the group consisting of glucose, fructose, sucrose, glycerol, and combinations thereof. The carbon source may be taken up by the Bacillus cell and may be metabolized by the Bacillus cell to produce biomass and/or energy in the form of high-energy triphosphates.

В некоторых воплощениях ферментационный бульон содержит лактозу, в частности, если клетка Bacillus не может синтезировать лактозу сама по себе. Лактоза может подаваться в ферментационный бульон извне. Лактоза может служить субстратом-акцептором для группировки NeuNAc в получении некоторых сиалированных олигосахаридов, в частности, в получении сиалиллактоз.In some embodiments, the fermentation broth contains lactose, particularly if the Bacillus cell cannot synthesize lactose on its own. Lactose can be supplied to the fermentation broth from outside. Lactose can serve as an acceptor substrate for the NeuNAc group in the production of some sialylated oligosaccharides, in particular, in the production of sialyllactose.

В разных воплощениях ферментационный бульон содержит сиаловую кислоту, в частности, если клетка Bacillus используется для получения сиалированного олигосахарида, в которой отсутствует путь биосинтеза сиаловой кислоты, но есть путь утилизации сиаловой кислоты.In various embodiments, the fermentation broth contains sialic acid, particularly if a Bacillus cell is used to produce the sialylated oligosaccharide, which lacks a sialic acid biosynthesis pathway but does have a sialic acid utilization pathway.

В некоторых воплощениях получение сиалированного олигосахарида не требует добавления N-ацетилглюкозамина, N-ацетилманнозамина и/или N-ацетилнейраминовой кислоты в ферментационный бульон и/или культивации генетически сконструированной микробной клетки в присутствии N-ацетилглюкозамина, N-ацетилманнозамина и/или N-ацетилнейрамановой кислоты для внутриклеточного биосинтеза сиалированного олигосахарида, поскольку клетка Bacillus используется для получения сиалированного олигосахарида, в которой имеется путь биосинтеза сиаловой кислоты de novo для внутриклеточного биосинтеза NeuNAC.In some embodiments, preparation of the sialylated oligosaccharide does not require the addition of N-acetylglucosamine, N-acetylmannosamine and/or N-acetylneuraminic acid to the fermentation broth and/or culturing the genetically engineered microbial cell in the presence of N-acetylglucosamine, N-acetylmannosamine and/or N-acetylneuraminic acid for intracellular biosynthesis of sialylated oligosaccharide, since the Bacillus cell is used to produce sialylated oligosaccharide, which has a de novo sialic acid biosynthesis pathway for intracellular biosynthesis of NeuNAC.

В данном способе по меньшей мере одна генетически сконструированная клетка Bacillus культивируется в ферментационном бульоне и в условиях, которые являются пермиссивными в отношении получения сахарида, содержащего по меньшей мере одну группировку N-ацетилнейраминовой кислоты.In this method, at least one genetically engineered Bacillus cell is cultured in a fermentation broth and under conditions that are permissive for the production of a saccharide containing at least one N-acetylneuraminic acid moiety.

В то время как в процессе используется источник углерода в ферментационном бульоне для генетически сконструированной клетки Bacillus, нет необходимости в том, чтобы добавлять глюкозамин и/или N-ацетилнейраминовую кислоту и/или N-ацетилглюкозамин и/или N-ацетилманнозамин в ферментационный бульон, когда клетка Bacillus может внутриклеточно продуцировать N-ацетилнейраминовую кислоту. Таким образом, в разных воплощениях для получения сиалированного олигосахарида, генетически сконструированную клетку Bacillus культивируют в отсутствие и/или без добавления одного или более, выбранных из группы, состоящей из глюкозамина, N-ацетилглюкозамина, N-ацетилманнозамина и N-ацетилнейраминовой кислоты. Генетически сконструированную клетку Bacillus можно культивировать в отсутствии и/или без добавления галактозы, поскольку галактоза не доставляется в качестве субстрата-акцептора для реакции сиалилтрансферазы.While the process utilizes the carbon source in the fermentation broth for the genetically engineered Bacillus cell, it is not necessary to add glucosamine and/or N-acetylneuraminic acid and/or N-acetylglucosamine and/or N-acetylmannosamine to the fermentation broth when the Bacillus cell can produce N-acetylneuraminic acid intracellularly. Thus, in various embodiments, to produce a sialylated oligosaccharide, a genetically engineered Bacillus cell is cultured in the absence and/or without the addition of one or more selected from the group consisting of glucosamine, N-acetylglucosamine, N-acetylmannosamine and N-acetylneuraminic acid. The genetically engineered Bacillus cell can be cultured in the absence and/or without the addition of galactose, since galactose is not supplied as an acceptor substrate for the sialyltransferase reaction.

В дополнительных и/или альтернативных воплощениях генетически сконструированную клетку Bacillus культивируют в присутствии одного или более моносахаридов (например, галактозы), дисахаридов (например, лактозы), трисахаридов (например, лакто-N-триозы II), тетрасахаридов (например, лакто-N-тетраозы) и/или пентасахаридов (например, сиалиллакто-N-тетраозы а).In additional and/or alternative embodiments, the genetically engineered Bacillus cell is cultured in the presence of one or more monosaccharides (e.g., galactose), disaccharides (e.g., lactose), trisaccharides (e.g., lacto-N-triose II), tetrasaccharides (e.g., lacto-N -tetraose) and/or pentasaccharides (for example, sialyllacto-N-tetraose a).

Согласно дополнительному и/или альтернативному воплощению генетически сконструированную клетку Bacillus культивируют в присутствии по меньшей мере одного субстрата-акцептора, выбранного из группы, состоящей из галактозы, N-ацетилгалактозамина, N-ацетилглюкозамина, лактозы, лактулозы, N-ацетиллактозамина, лакто-N-биозы, лакто-N-триозы, 2'-фукозиллактозы, 3-фукозиллактозы, 3'-сиалиллактозы, 6'-сиалиллактозы, 3'-сиалил-N-ацетиллактозамина, 6'-сиалил-N-ацетиллактозамина, 3'-галактозиллактозы, 6'-галактозиллактозы, лакто-N-триозы II, лакто-N-тетраозы, лакто-N-неотетраозы, 2'3-дифукозиллактозы, 3-фукозил-3'-сиалиллактозы и 3-фукозил-6'-сиалиллактозы. Данные субстраты импортируются в клетку и используются в качестве молекул-акцепторов в клетке.In a further and/or alternative embodiment, the genetically engineered Bacillus cell is cultured in the presence of at least one acceptor substrate selected from the group consisting of galactose, N-acetylgalactosamine, N-acetylglucosamine, lactose, lactulose, N-acetyllactosamine, lacto-N- bioses, lacto-N-triose, 2'-fucosyllactose, 3-fucosyllactose, 3'-sialyllactose, 6'-sialyllactose, 3'-sialyl-N-acetyllactosamine, 6'-sialyl-N-acetyllactosamine, 3'-galactosyllactose, 6'-galactosyllactose, lacto-N-triose II, lacto-N-tetraose, lacto-N-neotetraose, 2'3-difucosyllactose, 3-fucosyl-3'-sialyllactose and 3-fucosyl-6'-sialyllactose. These substrates are imported into the cell and used as acceptor molecules in the cell.

Способ включает возможную стадию выделения сиалированного олигосахарида, который продуцирован генетически сконструированной клеткой Bacillus во время ее культивирования и пролиферации в ферментационном бульоне. Сиалированный олигосахарид может быть выделен из ферментационного бульона после удаления генетически сконструированных клеток Bacillus, например, посредством центрифугирования или фильтрации и/или может быть выделен из клеток, например, в том отношении, что клетки собирают из ферментационного бульона посредством центрифугирования и подвергают стадии лизиса клеток. Затем, сиалированные олигосахариды могут быть дополнительно очищены из ферментационного бульона и/или клеточных лизатов подходящими методиками, известными специалисту в данной области. Подходящие методики включают микрофильтрацию, ультрафильтрацию, диафильтрацию, хроматографию с псевдодвижущимся слоем, электродиализ, обратный осмос, гель-фильтрацию, анионообменную хроматографию, катионообменную хроматографию и т.п.The method includes the optional step of isolating a sialylated oligosaccharide that is produced by a genetically engineered Bacillus cell during its cultivation and proliferation in a fermentation broth. The sialylated oligosaccharide may be isolated from the fermentation broth after removal of the genetically engineered Bacillus cells, for example, by centrifugation or filtration, and/or may be isolated from the cells, for example, in that the cells are collected from the fermentation broth by centrifugation and subjected to a cell lysis step. The sialylated oligosaccharides can then be further purified from the fermentation broth and/or cell lysates by suitable techniques known to one of ordinary skill in the art. Suitable techniques include microfiltration, ultrafiltration, diafiltration, pseudo-moving bed chromatography, electrodialysis, reverse osmosis, gel filtration, anion exchange chromatography, cation exchange chromatography, and the like.

Способ и генетически сконструированную микробную клетку, которую используют в способе, используют для получения сиалированного олигосахарида. Термин «сиалированный олигосахарид» относится к молекуле олигосахарида, содержащей по меньшей мере одну группировку N-ацетилнейраминовой кислоты.The method and the genetically engineered microbial cell used in the method are used to produce sialylated oligosaccharide. The term "sialylated oligosaccharide" refers to an oligosaccharide molecule containing at least one N-acetylneuraminic acid moiety.

В дополнительном и/или альтернативном воплощении сиалированный сахарид представляет собой олигосахарид. Термин «олигосахарид», в том виде, в котором он используется в данном документе, относится к полимерам моносахаридных остатков, где указанные полимеры содержат по меньшей мере два моносахаридных остатка, но не больше чем 10 моносахаридных остатков, предпочтительно не больше чем 7 моносахаридных остатков. Олигосахариды представляют собой или линейную цепь моносахаридов или являются разветвленными. Кроме того, моносахаридные остатки олигосахаридов могут характеризоваться целым рядом химических модификаций. Соответственно, олигосахариды могу содержать одну или более несахаридных группировок. Термин «сиалированный олигосахарид», в том виде, в котором он используется в данном документе, относится к олигосахаридам, содержащим один или более группировок N-ацетилнейраминовой кислоты.In a further and/or alternative embodiment, the sialylated saccharide is an oligosaccharide. The term "oligosaccharide" as used herein refers to polymers of monosaccharide residues, wherein said polymers contain at least two monosaccharide residues, but no more than 10 monosaccharide residues, preferably no more than 7 monosaccharide residues. Oligosaccharides are either a linear chain of monosaccharides or are branched. In addition, the monosaccharide residues of oligosaccharides can be characterized by a number of chemical modifications. Accordingly, oligosaccharides may contain one or more non-saccharide moieties. The term "sialylated oligosaccharide", as used herein, refers to oligosaccharides containing one or more N-acetylneuraminic acid moieties.

Согласно дополнительному и/или альтернативному воплощению сиалированный олигосахарид выбран из группы, состоящей из 3'-сиалиллактозы, 6'-сиалиллактозы, сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, фукозил-сиалиллакто-N-тетраозы а, фукозил-сиалиллакто-N-тетраозы b, фукозил-сиалиллакто-N-тетраозы с, дисиалиллакто-N-тетраозы, фукозиллакто-N-тетраозы I, фукозиллакто-N-тетраозы II, 3'-сиалилгалактозы, 6'-сиалилгалактозы, 3'-сиалил-N-ацетиллактозамина и 6'-сиалил-N-ацетиллактозамина.In a further and/or alternative embodiment, the sialylated oligosaccharide is selected from the group consisting of 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, fucosyl-sialyllacto- N-tetraose a, fucosyl-sialyllacto-N-tetraose b, fucosyl-sialyllacto-N-tetraose c, disialyllacto-N-tetraose, fucosyllacto-N-tetraose I, fucosyllacto-N-tetraose II, 3'-sialylgalactose, 6' -sialylgalactose, 3'-sialyl-N-acetyllactosamine and 6'-sialyl-N-acetyllactosamine.

В еще одном аспекте изобретения предложено применение генетически сконструированной клетки Bacillus, как описано ранее в данном документе, для получения сиалированного олигосахарида в цельноклеточном ферментационном процессе, а именно, сиалированный олигосахарид синтезируется генетически сконструированной клеткой Bacillus и в генетически сконструированной клетке Bacillus.Another aspect of the invention provides the use of a genetically engineered Bacillus cell, as described previously herein, to produce a sialylated oligosaccharide in a whole cell fermentation process, namely, the sialylated oligosaccharide is synthesized by and in a genetically engineered Bacillus cell.

В еще одном аспекте изобретения предложен сиалированный олигосахарид, который получен способом и/или посредством применения генетически сконструированной клетки Bacillus, как описано ранее в данном документе.In yet another aspect of the invention, there is provided a sialylated oligosaccharide that is produced by the method and/or use of a genetically engineered Bacillus cell as described previously herein.

В еще одном аспекте изобретения предложено применение сиалированного олигосахарида, который получен способом, как описано ранее в данном документе, и/или посредством применения генетически сконструированной клетки Bacillus, как описано ранее в данном документе, для изготовления питательной композиции.Another aspect of the invention provides the use of a sialylated oligosaccharide that is prepared by a method as described previously herein and/or through the use of a genetically engineered Bacillus cell as described previously herein for the manufacture of a nutritional composition.

Таким образом, предложена питательная композиция, содержащая по меньшей мере один сиалированный олигосахарид, который получен способом и/или посредством генетически сконструированной клетки Bacillus, как ранее описано в данном документе.Thus, a nutritional composition is provided comprising at least one sialylated oligosaccharide which is produced by a method and/or through a genetically engineered Bacillus cell as previously described herein.

В дополнительном и/или альтернативном воплощении сиалированный олигосахарид выбран из группы, состоящей из 3'-сиалиллактозы, 6'-сиалиллактозы, сиалиллакто-N-тетраозы а, сиалиллакто-N-тетраозы b, сиалиллакто-N-тетраозы с, фукозил-сиалиллакто-N-тетраозы а, фукозил-сиалиллакто-N-тетраозы b, фукозил-сиалиллакто-N-тетраозы с, дисиалиллакто-N-тетраозы, фукозилдисиалиллакто-N-тетраозы I, фукозилдисиаллакто-N-тетраозы II, 3'-сиалилгалактозы, 6'-сиалилгалактозы, 3'-сиалил-N-ацетиллактозамина и 6'-сиалил-N-ацетиллактозамина.In an additional and/or alternative embodiment, the sialylated oligosaccharide is selected from the group consisting of 3'-sialyllactose, 6'-sialyllactose, sialyllacto-N-tetraose a, sialyllacto-N-tetraose b, sialyllacto-N-tetraose c, fucosyl-sialyllacto- N-tetraose a, fucosyl-sialyllacto-N-tetraose b, fucosyl-sialyllacto-N-tetraose c, disialyllacto-N-tetraose, fucosyldisiallyllacto-N-tetraose I, fucosyldisiallyllacto-N-tetraose II, 3'-sialylgalactose, 6' -sialylgalactose, 3'-sialyl-N-acetyllactosamine and 6'-sialyl-N-acetyllactosamine.

В некоторых воплощениях питательная композиция дополнительно содержит по меньшей мере один нейтральный ОГМ, предпочтительно по меньшей мере один нейтральный ОГМ, который продуцирован посредством использования генетически сконструированной клетки Bacillus. По меньшей мере один нейтральный ОГМ выделен из группы, состоящей из 2'-фукозиллактозы, 3-фукозиллактозы, 2',3-дифукозиллактозы, лакто-N-триозы II, лакто-N-тетраозы, лакто-N-неотетраозы, лакто-N-фукопентаозы I, лакто-N-неофукопентаозы I, лакто-N-фукопентаозы II, лакто-N-фукопентаозы III, лакто-N-фукопентаозы V, лакто-N-неофукопентаозы V, лакто-N-дифукогексаозы I, лакто-N-дифукогексаозы II, лакто-N-неодифукогексаозы I, лакто-N-гексаозы, лакто-N-неогексаозы, пара-лакто-N-гексаозы и пара-лакто-N-неогексаозы.In some embodiments, the nutritional composition further comprises at least one neutral HMO, preferably at least one neutral HMO that is produced through the use of a genetically engineered Bacillus cell. At least one neutral HGM is isolated from the group consisting of 2'-fucosyllactose, 3-fucosyllactose, 2',3-difucosyllactose, lacto-N-triose II, lacto-N-tetraose, lacto-N-neotetraose, lacto-N -fucopentaose I, lacto-N-neofucopentaose I, lacto-N-fucopentaose II, lacto-N-fucopentaose III, lacto-N-fucopentaose V, lacto-N-neofucopentaose V, lacto-N-difucohexaose I, lacto-N- difucohexaoses II, lacto-N-neodifucohexaoses I, lacto-N-hexaoses, lacto-N-neohexaoses, para-lacto-N-hexaoses and para-lacto-N-neohexaoses.

В дополнительном воплощении питательная композиция выбрана из группы, состоящей из медицинских композиций, фармацевтических композиций, нутрицевтических композиций, детских питательных смесей и биологически активных добавок.In a further embodiment, the nutritional composition is selected from the group consisting of medical compositions, pharmaceutical compositions, nutraceutical compositions, infant formulas and dietary supplements.

Питательная композиция может быть представлена в жидкой форме или в твердой форме, включая порошки, гранулы, хлопья и пеллеты, но, не ограничиваясь ими.The nutritional composition may be presented in liquid form or solid form, including, but not limited to, powders, granules, flakes and pellets.

Настоящее изобретение будет описано относительно конкретных воплощений, но данное изобретение не ограничивается ими, а только формулой изобретения. Кроме того, термины первый, второй и тому подобное в описании и в формуле изобретения используются для проведения различия между похожими элементами и не обязательно для описания последовательности, во времени, в пространстве, по рангу или любым другим образом. Следует понимать, что термины, используемые таким образом, являются взаимозаменяемыми в соответствующих обстоятельствах, и что воплощения изобретения, описанные в данном документе, способны работать в последовательностях, отличных от описанных или проиллюстрированных в данном документе.The present invention will be described with respect to specific embodiments, but the invention is not limited to them, but only to the claims. In addition, the terms first, second, and the like in the specification and claims are used to distinguish between like elements and not necessarily to describe sequence, in time, space, rank, or any other manner. It should be understood that the terms used in this manner are interchangeable in appropriate circumstances, and that the embodiments of the invention described herein are capable of operating in sequences other than those described or illustrated herein.

Следует отметить, что термин «содержащий», используемый в формуле изобретения, не следует считать ограничивающимся средствами, перечисленными в дальнейшем; он не исключает других элементов или стадий. Таким образом, его следует считать определяющим наличие заявленных признаков, целых чисел, стадий или компонентов, на которые ссылаются, но он не исключает наличие или добавление одного или более других признаков, целых чисел, стадий или компонентов или их групп. Таким образом, объем выражения «устройство, содержащее средства А и В» не следует ограничивать устройствами, состоящими только из компонентов А и В. Оно означает, что в отношении настоящего изобретения, единственными релевантными компонентами устройства являются А и В.It should be noted that the term “comprising” as used in the claims should not be considered limited to the means listed below; it does not exclude other elements or stages. Thus, it should be considered to determine the presence of the claimed features, integers, steps or components referred to, but it does not exclude the presence or addition of one or more other features, integers, steps or components or groups thereof. Thus, the scope of the expression "device comprising means A and B" should not be limited to devices consisting only of components A and B. It means that for the purposes of the present invention, the only relevant components of the device are A and B.

Ссылка на всем протяжении данного описания изобретения на «одно воплощение» или «воплощение» означает, что конкретный признак, структура или характеристика, описанные в связи с данным воплощением, включены в по меньшей мере одно воплощение настоящего изобретения. Таким образом, появления фраз «в одном воплощении» или «в воплощении» в разных местах по всему объему данного описания изобретения не обязательно все относятся к одному и тому же воплощению, но могут. Кроме того, конкретные признаки, структуры или характеристики могут быть объединены любым подходящим образом, как будет очевидно среднему специалисту в данной области из данного раскрытия, в одном или более воплощениях.Reference throughout this specification to “one embodiment” or “embodiment” means that the particular feature, structure, or characteristic described in connection with that embodiment is included in at least one embodiment of the present invention. Thus, appearances of the phrases “in one embodiment” or “in an embodiment” in different places throughout this specification do not necessarily all refer to the same embodiment, but may. Moreover, specific features, structures, or characteristics may be combined in any suitable manner, as will be apparent to one of ordinary skill in the art from this disclosure, in one or more embodiments.

Аналогично, следует понимать, что в описании иллюстративных воплощений изобретения разные признаки изобретения иногда сгруппированы вместе в одном единственном воплощении, фигуре или его описании в целях упрощения раскрытия и помощи в понимании одного или более из разных аспектов изобретения. Данный способ раскрытия, однако, не нужно считать отражающим мысль, что заявленное изобретение требует больше признаков, чем явным образом перечислены в каждом пункте. Скорее, как отражено в приведенной ниже формуле изобретения, аспекты изобретения заключаются меньше чем во всех признаках одного вышеизложенного раскрытого воплощения. Таким образом, формула изобретения после подробного описания явным образом включена тем самым в данное подробное описание, причем каждый пункт отдельно стоит в виде отдельного воплощения данного изобретения.Likewise, it should be understood that in the description of illustrative embodiments of the invention, various features of the invention are sometimes grouped together in one single embodiment, figure, or description thereof for the purpose of simplifying the disclosure and aiding in understanding one or more of the various aspects of the invention. This manner of disclosure, however, should not be taken to imply that the claimed invention requires more features than are expressly listed in each claim. Rather, as reflected in the claims below, aspects of the invention are comprised of less than all of the features of the one disclosed embodiment set forth above. Thus, the claims following the detailed description are hereby expressly incorporated into this detailed description, with each claim standing alone as a separate embodiment of the invention.

Кроме того, в то время как некоторые воплощения, описанные в данном документе, включают некоторые, но не все признаки, включенные в другие воплощения, подразумевается, что комбинации признаков разных воплощений находятся в объеме изобретения и образуют разные воплощения, как будет понятно специалистам в данной области. Например, в приведенной ниже формуле изобретения любое из заявленных воплощений можно использовать в любой комбинации.In addition, while some embodiments described herein include some, but not all, of the features included in other embodiments, it is understood that combinations of features of different embodiments are within the scope of the invention and form different embodiments, as will be appreciated by those skilled in the art. areas. For example, in the claims below, any of the claimed embodiments can be used in any combination.

Кроме того, некоторые из воплощений описаны в данном документе как способ или комбинация элементов способа, которые могут быть реализованы посредством процессора компьютерной системы или с помощью других средств выполнения функции. Таким образом, процессор с необходимыми инструкциями для осуществления такого способа или элемента способа образует средство осуществления способа или элемента способа. Кроме того, описанный в данном документе элемент воплощения аппарата представляет собой пример средства осуществления функции, выполняемой элементом, с целью осуществления изобретения.In addition, some of the embodiments are described herein as a method or combination of method elements that may be implemented by a computer system processor or other means of performing a function. Thus, a processor with the necessary instructions for implementing such method or method element constitutes means for implementing the method or method element. In addition, the apparatus embodiment described herein is an example of a means of implementing the function performed by the apparatus for the purpose of carrying out the invention.

В описании и графических материалах, предоставленных в данном документе, изложены многочисленные конкретные подробности. Однако, понятно, что воплощения изобретения можно осуществлять на практике без данных конкретных подробностей. В других примерах хорошо известные способы, структуры и методики не были показаны подробно для того, чтобы не затруднять понимание. Теперь изобретение будет описано с помощью подробного описания нескольких воплощений изобретения. Ясно, что другие воплощения изобретения могут быть скомпонованы в соответствии со знаниями специалистов в данной области, не отклоняясь от истинной сущности или технической идеи изобретения, причем изобретение ограничено только условиями прилагаемой формулы изобретения.Numerous specific details are set forth in the descriptions and graphics provided herein. However, it will be understood that embodiments of the invention may be practiced without these specific details. In other examples, well-known methods, structures and techniques have not been shown in detail in order to avoid obstruction of understanding. The invention will now be described by way of detailed description of several embodiments of the invention. It is clear that other embodiments of the invention can be put together in accordance with the knowledge of those skilled in the art without deviating from the true spirit or technical idea of the invention, the invention being limited only by the terms of the appended claims.

ПримерыExamples

Пример 1: Трансформация Bacillus subtilisExample 1: Transformation of Bacillus subtilis

Bacillus subtilis можно подвергать генетическим манипуляциям посредством разных методик. Для трансформации В. subtilis компетентные клетки готовили посредством модифицированного протокола двухстадийного способа (Anagnostopoulos, С.and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). Ночную культуру инокулировали в среде MG1 и встряхивали при 37°С. Среда MG1 представляет собой минимальную среду Спицайзена, которая дополнена 0,5% глюкозой, 5 мМ MgSO4 и 0,02% казаминовыми кислотами (возможно, дополнительно дополнена биотином и/или L-триптофаном). На следующее утро данную культуру разводили 1:20 в свежей среде MG1 и инкубировали при 37°С в течение приблизительно 6 ч. 1 мл культуры разводили в 8 мл среды MG2, которая отличается от среды MG1 по концентрации казаминовых кислот (0,01% вместо 0,02%). В укороченном протоколе ночную культуру непосредственно разводят в среде MG2. После инкубации в течение еще 90 мин порцию культуры, 1 мл, смешивали с 1-3 мкг мультимерной плазмидной ДНК или линейной ДНК и инкубировали при 37°С в течение 30-60 мин при встряхивании. Мультимерную плазмидную ДНК получали или посредством использования штамма Е. coli NM538 для размножения плазмидной ДНК или посредством линеаризации плазмиды в результате расщепления рестриктазой с одним разрезом, которая осуществляет расщепление в пределах каркаса с последующим повторным лигированием Т4 ДНК лигазой.Bacillus subtilis can be genetically manipulated through various techniques. For transformation of B. subtilis, competent cells were prepared by a modified two-step protocol (Anagnostopoulos, C. and Spizizen, J. (1961) J Bacteriol 81 (5): 741-746). The overnight culture was inoculated in MG1 medium and shaken at 37°C. MG1 medium is Spitzeisen's minimal medium supplemented with 0.5% glucose, 5 mM MgSO 4 and 0.02% casamino acids (possibly additionally supplemented with biotin and/or L-tryptophan). The next morning, this culture was diluted 1:20 in fresh MG1 medium and incubated at 37°C for approximately 6 hours. 1 ml of culture was diluted in 8 ml of MG2 medium, which differs from MG1 medium in the concentration of casamino acids (0.01% instead of 0.02%). In the shortened protocol, the overnight culture is directly propagated in MG2 medium. After incubation for another 90 min, a 1 ml portion of the culture was mixed with 1-3 μg of multimeric plasmid DNA or linear DNA and incubated at 37°C for 30-60 min with shaking. Multimeric plasmid DNA was prepared either by using E. coli strain NM538 to propagate the plasmid DNA or by linearizing the plasmid by digestion with a single cut restriction enzyme that cleaves within the framework followed by re-ligation with T4 DNA ligase.

Затем, клетки распределяли по чашкам с 2xYT и агаром, содержащим соответствующий антибиотик. Антибиотики добавляли в следующих концентрациях: 5 мкг⋅мл-1 эритромицина, 5 мкг⋅мл-1 хлорамфеникола, 10 мкг⋅мл-1 канамицина. 100 мкг⋅мл-1 спектиномицина.The cells were then plated with 2xYT and agar containing the appropriate antibiotic. Antibiotics were added in the following concentrations: 5 μg⋅ml -1 erythromycin, 5 μg⋅ml -1 chloramphenicol, 10 μg⋅ml -1 kanamycin. 100 µg⋅ml -1 spectinomycin.

В качестве альтернативы, для трансформации протопластов (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559) клетки выращивали в 20 мл бульона Penassay (РАВ) при 37°С до начала стационарной фазы роста (OD600 (от англ. optical density - оптическая фаза) равна 1,7-2). Затем клетки осаждали и ресуспендировали в 10 мл среды SMPP (0,3%-ный бычий сывороточный альбумин, 5%-ная 2 М сахароза, 25% 4× РАВ, 50% 2× SMM), состоящей из 2×SMM, представляющего собой 1 М сахарозу, 0,04 М гидрат двунатриевой соли малеиновой кислоты и 0,04 М MgCl2 (рН 6,5). После добавления лизоцима (10 мг мл-1) и мутанолизина (75 Ед мл-1) смесь инкубировали при 37°С при встряхивании с образованием протопластов. Образование протопластов проверяли посредством микроскопа. Затем протопласты аккуратно собирали посредством центрифугирования при 5200 ×g и 4°С в течение 5 мин, два раза промывали охлажденным льдом промывочным буфером для электротрансформации (1× SMM) и, в конечном итоге, суспендировали в данном растворе. Плазмидную ДНК (1-3 мкг) добавляли к 120 мкл суспензии протопластов, и смесь держали на льду в течение по меньшей мере 5 мин. Смесь для трансформации переносили в кювету, объемом 0,2 см, и один импульс для электропорации прикладывали на уровне 25 мкФ, 400 Ω⋅ и 0,7 кВ. Сразу после разряда электропорации 1 мл восстанавливающей среды (равные объемы 4х РАВ и 2х SMM, свежеприготовленные перед применением) добавляли в кювету. Затем реакционную смесь для трансформации переносили в 2 мл пробирку и инкубировали при 37°С при встряхивании в течение 12 ч. Для регенерации клеточную суспензию распределяли по чашкам с DM3 и агаром (Chang, S. and Cohen, S. (1979) MGG 168(1):111-115) и инкубировали при 37°C в течение 48 ч. Регенерирующая среда DM3 содержала следующие стерильные растворы на литр: 200 мл 4%-ого агара, 100 мл 5%-ных казаминовых кислот, 50 мл 10%-ого дрожжевого экстракта, 100 мл 3,5%-ого K2HPO4 и 1,5%-ого KH2PO4, 25 мл 20%-ной глюкозы, 20 мл 1 М MgCl2, 500 мл 0,5 М сорбита и 5 мл стерилизованного посредством фильтрации 2%-ого бычьего сывороточного альбумина (добавляемые к смеси, когда температура ниже 55°С), и ее дополняли соответствующим антибиотиком.Alternatively, for protoplast transformation (Romero, D. et al. (2006) Journal of Microbiological Methods 66:556-559), cells were grown in 20 ml Penassay broth (PAB) at 37°C until stationary growth phase (OD 600 (from the English optical density - optical phase) is 1.7-2). Cells were then pelleted and resuspended in 10 ml SMPP medium (0.3% bovine serum albumin, 5% 2 M sucrose, 25% 4× PAB, 50% 2× SMM), consisting of 2× SMM, which is 1 M sucrose, 0.04 M disodium maleic acid hydrate and 0.04 M MgCl 2 (pH 6.5). After adding lysozyme (10 mg ml -1 ) and mutanolysin (75 U ml -1 ), the mixture was incubated at 37°C with shaking to form protoplasts. The formation of protoplasts was checked using a microscope. The protoplasts were then carefully collected by centrifugation at 5200 × g and 4°C for 5 min, washed twice with ice-cold electrotransformation wash buffer (1× SMM), and finally suspended in this solution. Plasmid DNA (1-3 μg) was added to 120 μl of protoplast suspension, and the mixture was kept on ice for at least 5 minutes. The transformation mixture was transferred into a 0.2 cm cuvette, and one electroporation pulse was applied at 25 μF, 400 Ω⋅ and 0.7 kV. Immediately after the electroporation discharge, 1 ml of reducing medium (equal volumes of 4x PAB and 2x SMM, freshly prepared before use) was added to the cuvette. The transformation reaction mixture was then transferred to a 2 ml tube and incubated at 37°C with shaking for 12 hours. For regeneration, the cell suspension was distributed onto DM3 and agar plates (Chang, S. and Cohen, S. (1979) MGG 168( 1):111-115) and incubated at 37°C for 48 hours. The regenerating medium DM3 contained the following sterile solutions per liter: 200 ml of 4% agar, 100 ml of 5% casamino acids, 50 ml of 10% of yeast extract, 100 ml of 3.5% K 2 HPO 4 and 1.5% KH 2 PO 4 , 25 ml of 20% glucose, 20 ml of 1 M MgCl 2 , 500 ml of 0.5 M sorbitol and 5 ml of filter-sterilized 2% bovine serum albumin (added to the mixture when the temperature is below 55°C), and it was supplemented with the appropriate antibiotic.

Электропорацию В. subtilis проводили в соответствии с модифицированным протоколом от Zhang et al. (2011), предоставленным MoBiTec GmbH (Zhang.G., Bao,P., Zhang,Y., Deng,A., Chen,N. и Wen,T. (2011) Anal. Biochem., 409:130-137). Ночную культуру 2x YT разводили в 100 раз свежей средой 2х YT, и культуру выращивали до OD600 0,2 при 37°С на ротационной качалке. Затем культуру дополняли 1%-ным DL-треонином, 2%-ным глицином, 0,1%-ным триптофаном и 0,03% Tween 80. После культивирования в течение еще 60 мин клеточную суспензию охлаждали на льду в течение 20 мин, центрифугировали при 5000 × g в течение 10 мин при 4°С и два раза промывали буфером для электропорации (0,5 М трегалоза, 0,5 М сорбит, 0,5 М маннит, 0,5 мМ MgCl2, 0,5 мМ K2HPO4, 0,5 мМ KH2PO4, рН 7,4, стерилизовали посредством фильтрации и хранили в замороженном виде). Наконец, клетки ресуспендировали в буфере для электропорации в соотношении 1/100 исходного объема культуры, и 100 мкл клеточной суспензии смешивали с ДНК. Смесь для трансформации переносили в 0,1-см кювету, и электропорацию проводили при 1,8 кВ с помощью одного импульса, доставляемого посредством прибора MicroPulser™ (Bio-Rad). Сразу после доставки импульса 1 мл бульона 2х YT, содержащего 0,5 М сорбит и 0,38 М маннит, добавляли в кювету. Суспензию для трансформации переносили в пробирку, объемом 2 мл, и инкубировали при 37°С в течение 3 ч на ротационной качалке. Клетки распределяли по чашке с 2х YT и агаром и инкубировали при 37°С в течение ночи.Electroporation of B. subtilis was performed according to a modified protocol from Zhang et al. (2011) provided by MoBiTec GmbH (Zhang.G., Bao,P., Zhang,Y., Deng,A., Chen,N. and Wen,T. (2011) Anal. Biochem., 409:130-137 ). The overnight 2x YT culture was diluted 100-fold with fresh 2x YT medium and the culture was grown to an OD 600 of 0.2 at 37°C on a rotary shaker. The culture was then supplemented with 1% DL-threonine, 2% glycine, 0.1% tryptophan, and 0.03% Tween 80. After culturing for another 60 min, the cell suspension was cooled on ice for 20 min, centrifuged at 5000 × g for 10 min at 4°C and washed twice with electroporation buffer (0.5 M trehalose, 0.5 M sorbitol, 0.5 M mannitol, 0.5 mM MgCl 2 , 0.5 mM K 2 HPO 4 , 0.5 mM KH 2 PO 4 , pH 7.4, filter sterilized and stored frozen). Finally, the cells were resuspended in electroporation buffer at a ratio of 1/100 of the original culture volume, and 100 μl of the cell suspension was mixed with DNA. The transformation mixture was transferred to a 0.1 cm cuvette and electroporation was performed at 1.8 kV with a single pulse delivered by a MicroPulser™ instrument (Bio-Rad). Immediately after delivery of the pulse, 1 ml of 2x YT broth containing 0.5 M sorbitol and 0.38 M mannitol was added to the cuvette. The transformation suspension was transferred into a 2 ml test tube and incubated at 37°C for 3 hours on a rotary shaker. Cells were spread on a 2x YT agar plate and incubated at 37°C overnight.

Используя альтернативный протокол электропорации (Xue, G.P., J.S. Johnson and В.P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 мл седы LB, содержащей 0,5 M глюцит, инокулировали В. subtilis и инкубировали в течение ночи при 37°С.Далее, ночную культуру разводили (1:16) 75 мл LB, содержащей 0,5 М глюцит, и инкубировали до получения OD600 0,85-0,95. Затем клетки осаждали посредством центрифугирования в течение 10 мин при 4°С при 5,000хg и четыре раза промывали буфером для электропорации, охлажденным посредством льда (10% глицерин, 0,5 М глюцит, 0,5 М маннит). Наконец, клетки ресуспендировали в 1-2 мл буфера для электропорации. Электропорацию проводили, используя 60 мкл компетентных клеток с ДНК в охлажденной кювете для электропорации (расстояние между электродами 1 мм). Смесь клетки-ДНК подвергали воздействию одного электрического импульса на уровне 25 мкФ, 200 Ω и 21 кВ/см. Наконец, 1 мл бульона для восстановления (LB, содержащая 0,5 М глюцит и 0,38 М маннит) добавляли к электропермеабилизированным клеткам, и бактериальную культуру инкубировали в течение 3 ч при 37°С с последующим посевом на LB с агаром с добавлением антибиотика.Using an alternative electroporation protocol (Xue, G.P., J.S. Johnson and B.P. Dalrymple: 1999; Journal of Microbiological Methods 34:183-191), 5 ml of LB sedum containing 0.5 M glucite was inoculated with B. subtilis and incubated in overnight at 37°C. Next, the overnight culture was diluted (1:16) with 75 ml of LB containing 0.5 M glucite and incubated until an OD 600 of 0.85-0.95 was obtained. Cells were then pelleted by centrifugation for 10 min at 4°C at 5,000 xg and washed four times with ice-cold electroporation buffer (10% glycerol, 0.5 M glucose, 0.5 M mannitol). Finally, the cells were resuspended in 1–2 ml of electroporation buffer. Electroporation was performed using 60 μl of competent cells with DNA in a chilled electroporation cuvette (distance between electrodes 1 mm). The cell-DNA mixture was exposed to a single electrical pulse at 25 μF, 200 Ω, and 21 kV/cm. Finally, 1 ml of recovery broth (LB containing 0.5 M glucite and 0.38 M mannitol) was added to the electropermeabilized cells, and the bacterial culture was incubated for 3 h at 37°C, followed by plating on LB agar supplemented with antibiotic. .

Использовали две разные обогащенные среды, а именно бульон Luria (LB) и 2х YT.Two different enriched media were used, namely Luria broth (LB) and 2x YT.

Среда бульон Luria (LB) состояла из 1%-ого триптона, 0,5%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,2).Luria broth (LB) medium consisted of 1% tryptone, 0.5% yeast extract, and 0.5% NaCl (pH 7.2).

Среда 2х YT состояла из 1,6%-ого триптона, 1%-ого дрожжевого экстракта и 0,5% NaCl (рН 7,5).2x YT medium consisted of 1.6% tryptone, 1% yeast extract and 0.5% NaCl (pH 7.5).

Для получения чашек с обогащенной средой с агаром добавляли 15 г л-1 агара.To obtain plates with enriched agar medium, 15 g l -1 agar was added.

Для экспериментов со встряхиваемыми колбами использовали минимальную среду Спицайзена (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U. S. A. 44(10):1072-1078).For shake flask experiments, Spizizen's minimal medium was used (Spizizen, J. 1958 Proc. Natl. Acad. Sci. U.S.A. 44(10):1072-1078).

Минимальная среда Спицайзена содержит следующие соли: 2 г/л (NH4)2SO4, 14 г/л K2HPO4, 6 г/л KH2PO4, 1 г/л цитрата Na3 × 2⋅H2O и 0,2 г/л MgSO4 × 7⋅H2O.Spitzeisen's minimal medium contains the following salts: 2 g/l (NH 4 ) 2 SO 4 , 14 g/l K 2 HPO 4 , 6 g/l KH 2 PO 4 , 1 g/l citrate Na 3 × 2⋅H 2 O and 0.2 g/l MgSO 4 × 7⋅H 2 O.

Предкультуральная среда, состоящая из минимальных солей Спицайзена, дополненная 2% D-глюкозой, 0,05% казаминовыми кислотами и MgSO4, до конечной концентрации 2 мМ (возможно дополнительно дополненная биотином и/или L-триптофаном).Preculture medium consisting of Spitzen salts supplemented with 2% D-glucose, 0.05% casamino acids and MgSO 4 to a final concentration of 2 mM (optionally supplemented with biotin and/or L-tryptophan).

Основная культуральная среда состояла из минимальных солей Спицайзена, дополненная 2%-ной D-глюкозой, 0,05%-ными казаминовыми кислотами, MgSO4 до конечной концентрации 2 мМ и 0,5 мл⋅л-1 1000х раствора микроэлементов (возможно дополнительно дополненная биотином и/или L-триптофаном).The main culture medium consisted of minimal Spitzeisen salts, supplemented with 2% D-glucose, 0.05% casamino acids, MgSO 4 to a final concentration of 2 mM and 0.5 ml⋅l -1 1000x solution of microelements (possibly additionally supplemented biotin and/or L-tryptophan).

Раствор микроэлементов (1000х) состоял из 100,6 г л-1 C6H9NO6, 56,4 г⋅л-1 цитрата железа (III)-аммония, 9,8 г⋅л-1 MnCl2 × 4⋅H2O, 1,6 г⋅л-1 CoCl2 × 6⋅H2O, 1 г⋅л-1 CuCl2 × 2⋅H2O, 1,9 г⋅л-1 Н3 BO3, 9 г⋅л-1 ZnSO4 × 7⋅H2O, 1,1 г⋅л-1 Na2MoO4 × 2⋅H2O, 1,5 г⋅л-1 Na2SeO3, 1,5 г⋅л-1 NiSO4 × 6⋅H2O.The trace element solution (1000x) consisted of 100.6 g l -1 C 6 H 9 NO 6 , 56.4 g⋅l -1 iron (III)-ammonium citrate, 9.8 g⋅l -1 MnCl 2 × 4⋅ H 2 O, 1.6 g⋅l -1 CoCl 2 × 6⋅H 2 O, 1 g⋅l -1 CuCl 2 × 2⋅H 2 O, 1.9 g⋅l -1 H 3 BO 3 , 9 g⋅l -1 ZnSO4 × 7⋅H 2 O, 1.1 g⋅l -1 Na 2 MoO 4 × 2⋅H 2 O, 1.5 g⋅l -1 Na 2 SeO 3 , 1.5 g ⋅l -1 NiSO 4 × 6⋅H 2 O.

При необходимости, соответствующий(ие) антибиотик(и) добавляли к среде для того, чтобы сделать ее селективной.If necessary, appropriate antibiotic(s) were added to the medium in order to make it selective.

Штаммы В. subtilis исходно выращивали на чашках с обогащенными средами с агаром с получением одиночных колоний. Данные чашки выращивали в течение 1 суток при 30-37°С. В экспериментах со встряхиваемыми колбами 20 мл предварительной культуры инокулировали одиночной колонией и выращивали в течение ночи при 30-37°С на ротационной качалке. Следующие 20 мл основных культур инокулировали данной предварительной культурой до начальной OD600 примерно 0,1 и инкубировали при 30-37°С на ротационной качалке. Если требовалась индукция, 40-60 мл основной культуры разбивали на порции по 20 мл в момент времени индукции. Объем культуры не превышал 20% емкости встряхиваемой колбы.B. subtilis strains were initially grown on enriched agar plates to produce single colonies. These dishes were grown for 1 day at 30-37°C. For shake flask experiments, 20 mL of preculture was inoculated with a single colony and grown overnight at 30–37°C on a rotary shaker. The next 20 ml of main cultures were inoculated with this preculture to an initial OD 600 of approximately 0.1 and incubated at 30-37°C on a rotary shaker. If induction was required, 40–60 ml of the main culture was divided into 20 ml portions at the induction time point. The volume of the culture did not exceed 20% of the capacity of the shake flask.

Пример 2: Конструирование штамма-продуцента Bacillus subtilis для 3'-сиалиллактозыExample 2: Construction of a Bacillus subtilis producer strain for 3'-sialyllactose

Для синтеза 3'-сиалиллактозы из метаболического промежуточного соединения - УДФ-N-ацетилглюкозамина с использованием пути neuCBA, конструировали экспрессионную плазмиду В. subtilis (SEQ ID NO: 1). Сначала гены neuA, neuB, neuC, а также α-2,3-сиалилтрансферазу, подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac. Ген neuB Campylobacter jejuni (номер доступа UniProtKB: Q93MP9) кодирует синтазу сиаловой кислоты. Ген neuC Campylobacter jejuni (номер доступа UniProtKB: Q93MP8) кодирует N-ацетилглюкозамин-6-фосфат 2-эпимеразу. Ген siaT Pasteurella multocida (номер доступа UniProtKB: Q9CLP3) кодирует α-2,3-сиалилтрансферазу. Открытую рамку считывания гена lacY Е. coli (номе доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР (полимеразная цепная реакция) из хромосомной ДНК. Затем, конструировали экспрессионную кассету <Pgrac100-neuBCA-siaT-lacY-terminator>, которая содержит все необходимые гены под контролем индуцибельного промотора Pgrac100. С этой целью, экспрессионный вектор рНТ253 В. subtilis (MoBiTec GmbH, Göttingen, Германия) использовали в качестве каркаса. Каждый ген в пределах экспрессионной кассеты связывали с последовательностью RBS В. subtilis. Дополнительно, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) помещали ниже экспрессионной кассеты. Полученную плазмиду <pHT253-Pgrac100-neuBCA-2,3siaT-lacY-terminator> (SEQ ID NO: 1) использовали для трансформации спорообразующего штамма В. subtilis (таблица 1) посредством использования его природной компетентности.To synthesize 3'-sialyllactose from the metabolic intermediate UDP-N-acetylglucosamine using the neuCBA pathway, a B. subtilis expression plasmid (SEQ ID NO: 1) was constructed. First, the neuA, neuB, neuC genes, as well as the α-2,3-sialyltransferase, were codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. The Campylobacter jejuni neuA gene (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase . The neuB gene of Campylobacter jejuni (UniProtKB accession number: Q93MP9) encodes sialic acid synthase. The neuC gene of Campylobacter jejuni (UniProtKB accession number: Q93MP8) encodes N-acetylglucosamine 6-phosphate 2-epimerase. The Pasteurella multocida siaT gene (UniProtKB accession number: Q9CLP3) encodes an α-2,3-sialyltransferase. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR (polymerase chain reaction) from chromosomal DNA. Then, an expression cassette <P grac100 -neuBCA-siaT-lacY-terminator> was constructed, which contains all the necessary genes under the control of the inducible P grac100 promoter. For this purpose, the B. subtilis expression vector pHT253 (MoBiTec GmbH, Göttingen, Germany) was used as a scaffold. Each gene within the expression cassette was linked to the B. subtilis RBS sequence. Additionally, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was placed downstream of the expression cassette. The resulting plasmid <pHT253-P grac100 -neuBCA-2,3siaT-lacY-terminator> (SEQ ID NO: 1) was used to transform the spore-forming B. subtilis strain (Table 1) by exploiting its natural competence.

Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Gene expression was confirmed by targeted proteomics and/or real-time PCR.

Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 3'-сиалиллактозы в присутствии экзогенной лактозы.Transformants were cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose.

Пример 3: Конструирование штамма-продуцента Bacillus subtilis для 3'-сиалиллактозыExample 3: Construction of a Bacillus subtilis producer strain for 3'-sialyllactose

Для синтеза 3'-сиалиллактозы из метаболического промежуточного соединения - УДФ-N-ацетилглюкозамина с использованием пути neuCBA, конструировали конститутивную экспрессионную плазмиду В. subtilis (SEQ ID NO: 2). Сначала, гены neuA, neuB, neuC и siaT подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac. Ген neuB Campylobacter jejuni (номер доступа UniProtKB: Q93MP9) кодирует синтазу сиаловой кислоты.To synthesize 3'-sialyllactose from the metabolic intermediate UDP-N-acetylglucosamine using the neuCBA pathway, a B. subtilis constitutive expression plasmid (SEQ ID NO: 2) was constructed. First, the neuA, neuB, neuC, and siaT genes were codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp. The Campylobacter jejuni neuA gene (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase. The neuB gene of Campylobacter jejuni (UniProtKB accession number: Q93MP9) encodes sialic acid synthase.

Ген neuC Campylobacter jejuni (номер доступа UniProtKB: Q93MP8) кодирует N-ацетилглюкозамин-6-фосфат 2-эпимеразу. Ген siaT Pasteurella multocida (номер доступа UniProtKB: Q9CLP3) кодирует α-2,3-сиалилтрансферазу. Открытую рамку считывания гена lacY Е. coli (номе доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК. Затем, конструировали экспрессионную кассету <P43-neuBCA-PlepA-siaT-lacY-terminator>, которая содержит все необходимые гены, функционально связанные с двумя сильными конститутивными промоторами В. subtilis и/или Р43. Экспрессионный вектор рНТ253 В. subtilis (MoBiTec GmbH, Göttingen, Германия) использовали в качестве каркаса плазмиды. Каждый ген в пределах экспрессионной кассеты был связан с последовательностью RBS В. subtilis. Дополнительно, подходящую терминирующую последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) помещали ниже экспрессионной кассеты.The neuC gene of Campylobacter jejuni (UniProtKB accession number: Q93MP8) encodes N-acetylglucosamine 6-phosphate 2-epimerase. The Pasteurella multocida siaT gene (UniProtKB accession number: Q9CLP3) encodes an α-2,3-sialyltransferase. The open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA. Then, an expression cassette <P43-neuBCA-P lepA -siaT-lacY-terminator> was constructed, which contains all the necessary genes functionally associated with two strong constitutive promoters of B. subtilis and/or P43. The B. subtilis expression vector pHT253 (MoBiTec GmbH, Göttingen, Germany) was used as the plasmid backbone. Each gene within the expression cassette was linked to the B. subtilis RBS sequence. Additionally, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was placed downstream of the expression cassette.

Полученную плазмиду <phT253-P43-neuBCA--siaT-lacY-terminator> (SEQ ID NO: 2) использовали для трансформации спорообразующего и неспорообразующего штаммов В. subtilis (таблица 1) посредством использования их природной компетентности.The resulting plasmid <phT253-P43-neuBCA- -siaT-lacY-terminator> (SEQ ID NO: 2) was used to transform spore-forming and non-spore-forming strains of B. subtilis (Table 1) by exploiting their natural competence.

Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Gene expression was confirmed by targeted proteomics and/or real-time PCR.

Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 3'-сиалиллактозы в присутствии экзогенной лактозы.Transformants were cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose.

Пример 4: Конструирование штамма-продуцента Bacillus subtilis для 6'-сиалиллактозыExample 4: Construction of a Bacillus subtilis producer strain for 6'-sialyllactose

Для продукции 6'-сиалиллактозы в В. subtilis использовали α-2,6-сиалилтрансферазу из Photobacterium leiognathi. Открытую рамку считывания гена siaT (номер доступа UniProtKB: D0VYB7) подвергали оптимизации кодонов для экспрессии в В. subtilis и получали синтетически посредством GenScript Corp.α-2,6-sialyltransferase from Photobacterium leiognathi was used to produce 6'-sialyllactose in B. subtilis. The open reading frame of the siaT gene (UniProtKB accession number: D0VYB7) was codon optimized for expression in B. subtilis and produced synthetically by GenScript Corp.

Экспрессионную плазмиду <pHT253-Pgrac100-neuBCA-2,6siaT-lacY-terminator> (SEQ ID NO: 3) конструировали, как описано в примере 2. Полученную плазмиду (SEQ ID NO: 3) использовали для трансформации спорообразующего и неспорообразующего штаммов В. subtilis (Таблица 1) посредством использования их природной компетентности. Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Трансформанты культивировали в условиях, которые являются пермиссивными в отношении В. subtilis, с получением 6'-сиалиллактозы в присутствии экзогенной лактозы.The expression plasmid <pHT253-P grac100 -neuBCA-2,6siaT-lacY-terminator> (SEQ ID NO: 3) was constructed as described in example 2. The resulting plasmid (SEQ ID NO: 3) was used to transform the spore-forming and non-spore-forming strains B subtilis (Table 1) by exploiting their natural competence. Gene expression was confirmed by targeted proteomics and/or real-time PCR. Transformants were cultured under conditions that are permissive for B. subtilis to produce 6'-sialyllactose in the presence of exogenous lactose.

Пример 5: Конструирование штамма Bacillus subtilis для получения 3'-сиалиллактозыExample 5: Construction of a Bacillus subtilis strain for the production of 3'-sialyllactose

Конструирование метаболизма В. subtilis (Таблица 1) достигалось посредством интеграции гетерологичных генов neuA Campylobacter jejuni, nanT Е. coli и siaT Haemophilus parahaemolyticus и одновременного удаления эндогенного гена ganA посредством гомологичной рекомбинации. Ген ganA В. subtilis (yvfN, lacA), который расположен в пределах галактозного оперона, кодирует бета-галактозидазу.Engineering the metabolism of B. subtilis (Table 1) was achieved by integrating the heterologous neuA genes of Campylobacter jejuni, nanT of E. coli, and siaT of Haemophilus parahaemolyticus and simultaneous deletion of the endogenous ganA gene through homologous recombination. The ganA gene of B. subtilis (yvfN, lacA), which is located within the galactose operon, encodes beta-galactosidase.

Для продукции 3'-сиалиллактозы из экзогенной сиаловой кислоты/N-ацетилнейраминовой кислоты и лактозы, открытые рамки считывания neuA, nanT и siaT были функционально связаны с конститутивным промотором Р43 В. subtilis (часть репозитория iGem: ID последовательности: ВВа_K143013) в виде оперона. С этой целью, во-первых, гены neuA, nanT и siaT подвергали оптимизации кодонов для экспрессиии в В. subtilis и получали синтетически посредством GenScript Corp.Ген neuA Campylobacter jejuni (номер доступа UniProtKB: Q93MP7) кодирует синтетазу CMP-Neu5Ac, ген nanT Е. coli (номер доступа GenBank: NP_417691.4) кодирует транспортер сиаловой кислоты и ген siaT Н. parahaemolyticus (номер доступа UniProtKB: I3DHL4) кодирует альфа-N-ацетилнейраминил-2,3-бета-галактозил-1,3-N-ацетилгалактозаминид 6-альфа-сиалилтрансферазу (альфа-2,3-сиалилтрансферазу).For the production of 3'-sialyllactose from exogenous sialic acid/N-acetylneuraminic acid and lactose, the open reading frames neuA, nanT and siaT were functionally linked to the constitutive B. subtilis P43 promoter (part of the iGem repository: Sequence ID: BBa_K143013) as an operon. To this end, firstly, the neuA, nanT and siaT genes were codon optimized for expression in B. subtilis and obtained synthetically by GenScript Corp. The neuA gene of Campylobacter jejuni (UniProtKB accession number: Q93MP7) encodes the CMP-Neu5Ac synthetase, the nanT E gene . coli (GenBank accession number: NP_417691.4) encodes the sialic acid transporter and the siaT gene H. parahaemolyticus (UniProtKB accession number: I3DHL4) encodes alpha-N-acetylneuraminyl-2,3-beta-galactosyl-1,3-N-acetylgalactosaminide 6-alpha-sialyltransferase (alpha-2,3-sialyltransferase).

Каждый ген в пределах экспрессионной кассеты был связан с последовательностью RBS В. subtilis. Кроме того, подходящая терминирующая последовательность В. subtilis из части репозитория iGem (ID последовательности: ВВа_В0015) была расположена ниже экспрессионной кассеты.Each gene within the expression cassette was linked to the B. subtilis RBS sequence. In addition, a suitable B. subtilis termination sequence from part of the iGem repository (sequence ID: BBa_B0015) was located downstream of the expression cassette.

Клонирующий вектор pBR322 (New England Biolabs GmbH, Франкфурт, Германия) использовали в качестве каркаса плазмиды. Кассету полной интеграции собирали для создания суицидной плазмиды<pBR322 flank ganA up-Р43-siaT-neuA-nanT-terminator-erm-flank ganA down>(SEQ ID NO: 4). Затем, В. subtilis трансформировали данной плазмидой за счет ее природной компетентности. Клетки распределяли по чашкам с 2х YT и агаром, содержащей соответствующий антибиотик (5 мкг мл-1 эритромицина). Интеграцию экспрессионной кассеты <Р43-siaT-neuA-nanT-terminator> в локус ganA генома В. subtilis, с получением штамма А, проверяли посредством ПЦР на колониях. Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени.Cloning vector pBR322 (New England Biolabs GmbH, Frankfurt, Germany) was used as the plasmid backbone. The full integration cassette was assembled to create the suicide plasmid<pBR322 flank ganA up-P43-siaT-neuA-nanT-terminator-erm-flank ganA down>(SEQ ID NO: 4). Then, B. subtilis was transformed with this plasmid due to its natural competence. The cells were spread on 2x YT and agar plates containing the appropriate antibiotic (5 μg ml -1 erythromycin). Integration of the <P43-siaT-neuA-nanT-terminator> expression cassette into the ganA locus of the B. subtilis genome, resulting in strain A, was verified by colony PCR. Gene expression was confirmed by targeted proteomics and/or real-time PCR.

Для импортирования экзогенной лактозы в клетку Bacillus ген lacY Е. coli интегрировали в эндогенный локус amyE (amyA) генома В. subtilis (кодирующий альфа-амилазу). С этой целью, открытую рамку считывания гена lacY Е. coli (номер доступа Gen Bank: NP_414877.1), кодирующую лактозопермеазу, амплифицировали посредством ПЦР из хромосомной ДНК. Кассету интеграции <flank amyE up-1ох71-aad9-lox66-P43-lacY-flank amyE down> (SEQ ID NO: 5) конструировали и клонировали в pBR322 (New England Biolabs GmbH, Фанкфурт, Германия). Штамм A трансформировали полученной суицидной плазмидой за счет природной компетентности. Интеграцию экспрессионной кассеты <Р43-lacY> в локус amyE штамма А, с получением конечного штамма В проверяли посредством ПЦР на колониях.To import exogenous lactose into the Bacillus cell, the E. coli lacY gene was integrated into the endogenous amyE (amyA) locus of the B. subtilis genome (encoding alpha-amylase). For this purpose, the open reading frame of the E. coli lacY gene (Gen Bank accession number: NP_414877.1), encoding lactose permease, was amplified by PCR from chromosomal DNA. The <flank amyE up-1ox71-aad9-lox66-P43-lacY-flank amyE down> integration cassette (SEQ ID NO: 5) was constructed and cloned into pBR322 (New England Biolabs GmbH, Fankfurt, Germany). Strain A was transformed with the resulting suicide plasmid due to natural competence. Integration of the <P43-lacY> expression cassette into the amyE locus of strain A, resulting in the final strain B, was verified by colony PCR.

Экспрессию гена подтверждали посредством направленной протеомики и/или посредством ПЦР в реальном времени. Штамм В культивировали в условиях, которые являются пермиссивными в отношении В. subtilis с получением 3'-сиалиллактозы в присутствии экзогенной лактозы и сиаловой кислоты/N-ацетилнейраминовой кислоты.Gene expression was confirmed by targeted proteomics and/or real-time PCR. Strain B was cultured under conditions that are permissive for B. subtilis to produce 3'-sialyllactose in the presence of exogenous lactose and sialic acid/N-acetylneuraminic acid.

Пример 6: Получение сиалиллактозы с использованием штаммов Bacillus subtilis с модифицированным метаболизмомExample 6: Production of sialyllactose using modified metabolism strains of Bacillus subtilis

Предварительную культуру инокулировали штаммом Bacillus subtilis с модифицированным метаболизмом, подходящим для биосинтеза сиалиллактозы (как описано в примерах 2-5).The preculture was inoculated with a Bacillus subtilis strain with a modified metabolism suitable for the biosynthesis of sialyllactose (as described in examples 2-5).

Предварительную культуру инкубировали при 30-37°С в течение ночи и затем разводили до исходной OD600 примерно 0,1 в свежей основной культуральной среде. Когда основная культура достигала OD600 приблизительно 0,5, 2 мМ лактозу добавляли к среде для выращивания. Когда для экспрессии гена использовали индуцибельный промотор Pgrac100, индукцию осуществляли посредством лактозы (2 мМ) или как лактозы (2 мМ), так и IPTG (от англ. isopropylthiogalactoside -изопропилтиогалактозид) (1 мМ). Для утилизирующего биосинтеза CMP-N-ацетилнейраминовой кислоты, дополнительно, добавляли 2 мМ сиаловой кислоты/N-ацетилнейраминовой кислоты. Культивирование прекращали после примерно 24 ч/48 ч после индукции, и внутриклеточную и внеклеточную сиалиллактозу анализировали посредством тонкослойной хроматографии и/или ВЭЖХ (высокоэффективной жидкостной хроматографии) и/или масс-спектрометрии (как описано в WO 2017/042382 А или WO 2019/008133 А). Выявляли биосинтез существенных количеств сиалиллактозы (3'-сиалиллактозы/6'-сиалиллактозы).The preculture was incubated at 30-37°C overnight and then diluted to an initial OD 600 of approximately 0.1 in fresh basal culture medium. When the main culture reached an OD 600 of approximately 0.5, 2 mM lactose was added to the growth medium. When the inducible P grac100 promoter was used for gene expression, induction was accomplished by lactose (2 mM) or both lactose (2 mM) and IPTG (1 mM). For the utilization biosynthesis of CMP-N-acetylneuraminic acid, 2 mM sialic acid/N-acetylneuraminic acid was additionally added. Culture was stopped after approximately 24 h/48 h post-induction, and intracellular and extracellular sialyllactose were analyzed by thin layer chromatography and/or HPLC and/or mass spectrometry (as described in WO 2017/042382 A or WO 2019/008133 A). The biosynthesis of significant amounts of sialyllactose (3'-sialyllactose/6'-sialyllactose) was detected.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ LIST OF SEQUENCES

<110> Jennewein Biotechnologie GmbH<110> Jennewein Biotechnologie GmbH

<120> ПРОДУКЦИЯ СИАЛИРОВАННЫХ ОЛИГОСАХАРИДОВ В КЛЕТКАХ BACILLUS<120> PRODUCTION OF SIALYLATED OLIGOSACCHARIDES IN BACILLUS CELLS

<130> P 1906 WO<130>P 1906 WO

<160> 5<160> 5

<170> PatentIn version 3.5<170> Patent In version 3.5

<210> 1<210> 1

<211> 13121<211> 13121

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Экспрессионная плазмида<223> Expression plasmid

<400> 1<400> 1

ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa

60 60

tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa

120 120

gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat

180 180

aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt

240 240

tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat

300 300

ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag

360 360

gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt

420 420

ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt

480 480

tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc

540 540

cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga

600 600

aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa

660 660

tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct

720 720

cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa

780 780

tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc

840 840

ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat

900 900

ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa

960 960

aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct

10201020

tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact

10801080

atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg

11401140

gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta

12001200

agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc

12601260

gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga

13201320

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt

13801380

attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt

14401440

caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg

15001500

aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc

15601560

gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat

16201620

tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt

16801680

cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc

17401740

tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc

18001800

cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag

18601860

atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt

19201920

ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat

19801980

ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag

20402040

attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac

21002100

gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg

21602160

cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg caggggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg

22202220

tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt

22802280

tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc

23402340

ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt

24002400

gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg gaatatttga ttgatcgtaa cgatgaag cactctttcc actatcccta cagtgttatg

24602460

gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca

25202520

aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt

25802580

ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag

26402640

gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa

27002700

gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa

27602760

acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg

28202820

tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg

28802880

cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa

29402940

tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca

30003000

tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac

30603060

tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagagata

31203120

tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac

31803180

atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca

32403240

ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa

33003300

caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga

33603360

aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg

34203420

gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca

34803480

gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat

35403540

cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac

36003600

aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg

36603660

aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag

37203720

cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt

37803780

taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt

38403840

ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa

39003900

attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg

39603960

gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact

40204020

acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat

40804080

atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg

41404140

cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa

42004200

ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc

42604260

tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa

43204320

tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg

43804380

aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg

44404440

tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc

45004500

agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc

45604560

ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct

46204620

ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca

46804680

tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg

47404740

gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag

48004800

ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata

48604860

gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga

49204920

aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg

49804980

cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc

50405040

ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct

51005100

caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa

51605160

gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga

52205220

aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa

52805280

acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta

53405340

gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt

54005400

tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat

54605460

atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat

55205520

ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt

55805580

gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg

56405640

aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc aggacaaaca tggataaatt tgctgaacat gaaattccga aagctgttat cgtggccggc

57005700

aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt aacggagaat ctctttcaca aatcgattac agactgcttc cgaaaaacta tgatgtcttt

57605760

agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt agatgcaacc agttttactt tgaagaacgc tattttcttg gcaacaaaat caaagcagtt

58205820

ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac ttctttacac cgggagtgtt tttagaacaa tactacacac tgtaccatct taaacgcaac

58805880

aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg aacgaatact ttgtcgataa cgttatcctg tcatcattta accatccgac agttgatctg

59405940

gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac gaaaaatcac aaaaaatcca ggctctgttt attgatgtga tcaacggcta cgaaaaatac

60006000

ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa ctgtctaaac tgacagcctt tgatgtttat ctgagataca aagaacttta cgaaaaccaa

60606060

cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt cgcattacat caggagtgta tatgtgcgcc gtcgcaatcg cgatgggcta tacagatatt

61206120

taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa taccttacag gaatcgattt ttatcaggca agcgaagaaa actacgcgtt tgataacaaa

61806180

aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat aaaccgaaca tcatcagatt actgccggat tttcgcaaag aaaaaacatt attttcatat

62406240

catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac catagcaaag atattgatct tgaagcatta tcttttctgc aacagcatta ccatgttaac

63006300

ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa ttttacagca tttctccgat gtctccgctg tcaaaacatt ttccgatccc gacagtggaa

63606360

gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt gatgattgtg aaacaacatt tgtcgcgccg ctgaaagaaa actacatcaa cgatattctt

64206420

ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa ttaccgccgc attttgtcta tgaaaaactt ggcgttgata aacttgcagc ggctttagaa

64806480

catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac catcatcatc atcatcatta aagtgatagc ggtaccatta taggtaagag aggaatgtac

65406540

acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttcttttact acatgtacta tttaaaaaac acaaactttt ggatgttcgg tttattcttt ttctttttact

66006600

tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata tttttatcat gggagcctac ttcccgtttt tcccgatttg gctacatgac atcaaccata

66606660

tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc tcagcaaaag tgatacgggt attatttttg ccgctatttc tctgttctcg ctattattcc

67206720

aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta aaccgctgtt tggtctgctt tctgacaaac tcgggctgcg caaatacctg ctgtggatta

67806780

ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac ttaccggcat gttagtgatg tttgcgccgt tctttatttt tatcttcggg ccactgttac

68406840

aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg aatacaacat tttagtagga tcgattgttg gtggtattta tctaggcttt tgttttaacg

69006900

ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat ccggtgcgcc agcagtagag gcatttattg agaaagtcag ccgtcgcagt aatttcgaat

69606960

ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca ttggtcgcgc gcggatgttt ggctgtgttg gctgggcgct gtgtgcctcg attgtcggca

70207020

tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc tcatgttcac catcaataat cagtttgttt tctggctggg ctctggctgt gcactcatcc

70807080

tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg tcgccgtttt actctttttc gccaaaacgg atgcgccctc ttctgccacg gttgccaatg

71407140

cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc cggtaggtgc caaccattcg gcatttagcc ttaagctggc actggaactg ttcagacagc

72007200

caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg caaaactgtg gtttttgtca ctgtatgtta ttggcgtttc ctgcacctac gatgtttttg

72607260

accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg accaacagtt tgctaatttc tttacttcgt tctttgctac cggtgaacag ggtacgcggg

73207320

tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc tatttggcta cgtaacgaca atgggcgaat tacttaacgc ctcgattatg ttctttgcgc

73807380

cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt cactgatcat taatcgcatc ggtgggaaaa acgccctgct gctggctggc actattatgt

74407440

ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa ctgtacgtat tattggctca tcgttcgcca cctcagcgct ggaagtggtt attctgaaaa

75007500

cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc cgctgcatat gtttgaagta ccgttcctgc tggtgggctg ctttaaatat attaccagcc

75607560

agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac agtttgaagt gcgtttttca gcgacgattt atctggtctg tttctgcttc tttaagcaac

76207620

tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg tggcgatgat ttttatgtct gtactggcgg gcaatatgta tgaaagcatc ggtttccagg

76807680

gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc gcgcttatct ggtgctgggt ctggtggcgc tgggcttcac cttaatttcc gtgttcacgc

77407740

ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat ttagcggccc cggcccgctt tccctgctgc gtcgtcaggt gaatgaagtc gcttaaggat

78007800

ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc ccatgtctag agtcgacgtc cccggggcag cccgcctaat gagcgggctt ttttcacgtc

78607860

ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt

79207920

gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct gtttgtcggt gaacgctctc tactagagtc acactggctc accttcgggt gggcctttct

79807980

gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg gcgtttatac ccggggcagc ccgcctaatg agcgggcttt tttcacgtca cgcgtccatg

80408040

gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata gagatctttg tctgcaactg aaaagtttat accttacctg gaacaaatgg ttgaaacata

81008100

cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt cgaggctaat atcggcttat taggaatagt ccctgtacta ataaaatcag gtggatcagt

81608160

tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac tgatcagtat attttggacg aagctcggaa agaatttgga gatgacttgc ttaattccac

82208220

aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac aattaaatta agggaaagaa taaagcgatt tgatgttcaa ggaatcacgg aagaagatac

82808280

tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt tcatgataaa gaagctctaa aactattcaa taaccttaca atggaattga tcgaaagggt

83408340

ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca ggaaggttaa tggtacgaaa attaggggat ctacctagaa agccacaagg cgataggtca

84008400

agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt agcttaaaga acccttacat ggatcttaca gattctgaaa gtaaagaaac aacagaggtt

84608460

aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca aaacaaacag aaccaaaaag aaaaaaagca ttgttgaaaa caatgaaagt tgatgtttca

85208520

atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat atccataata agattaaatc gctgcacgaa attctggcag catccgaagg gaattcatat

85808580

tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc tacttagagg atactattga gagagctatt gataagatgg ttgagacatt acctgagagc

86408640

caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc caaaaaactt tttatgaata tgaattaaaa aaaagaacca acaaaggctg agacagactc

87008700

caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta caaacgagtc tgttttttta aaaaaaatat taggagcatt gaatatatat tagagaatta

87608760

agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag agaaagacat gggaataaaa atattttaaa tccagtaaaa atatgataag attatttcag

88208820

aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg aatatgaaga actctgtttg tttttgatga aaaaacaaac aaaaaaaatc cacctaacgg

88808880

aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc aatctcaatt taactaacag cggccaaact gagaagttaa atttgagaag gggaaaaggc

89408940

ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg ggatttatac ttgtatttaa ctatctccat tttaacattt tattaaaccc catacaagtg

90009000

aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa aaaatcctct tttacactgt tcctttaggt gatcgcggag ggacattatg agtgaagtaa

90609060

acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa acctaaaagg aaatacagat gaattagtgt attatcgaca gcaaaccact ggaaataaaa

91209120

tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag tcgccaggaa gagaatcaaa aaagggaaag aagaagttta ttatgttgct gaaacggaag

91809180

agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata agaagatatg gacagaagag caaataaaaa acttttcttt agacaaattt ggtacgcata

92409240

taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct taccttacat agaaggtcat tatacaatct taaataatta cttctttgat ttttggggct

93009300

attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca attttttagg tgctgaagga attgcgctct atgctcacct aactcgttat gcatacggca

93609360

gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg gcaaagactt ttgctttcct agtctacaaa caatcgctaa aaaaatggac aagactcctg

94209420

ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg ttacagttag aggctacttg aaactgcttg aaaggtacgg ttttatttgg aaggtaaacg

94809480

tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg tccgtaataa aaccaaggat aacacagagg aatccccgat ttttaagatt agacgtaagg

95409540

ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg ttcctttgct ttcagaagaa cttttaaatg gaaaccctaa tattgaaatt ccagatgacg

96009600

aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga aggaagcaca tgtaaagaag gctttaaaaa aggaaaaaga gggtcttcca aaggttttga

96609660

aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc aaaaagagca cgatgaattt gttaaaaaaa tgatggatga gtcagaaaca attaatattc

97209720

cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa cagaggcctt acaatatgac acaatgtatg aagatatact cagtaaagga gaaattcgaa

97809780

aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa aagaaatcaa aaaacaaata cctaatccta caacatcttt tgagagtata tcaatgacaa

98409840

ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc ctgaagagga aaaagtcgac agtactttaa aaagcgaaat gcaaaatcgt gtctctaagc

99009900

cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat cttcttttga tacctggttt aaaaacacta agatcaaaat tgaaaataaa aattgtttat

99609960

tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta tacttgtacc gagtgaattt gcatttgaat ggattaagaa aagatattta gaaacaatta

1002010020

aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat aaacagtcct tgaagaagct ggatatgttt tcgaaaaaat cgaactaaga aaagtgcaat

1008010080

aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca aaactgctga agtatttcag cagttttttt tatttagaaa tagtgaaaaa aatataatca

1014010140

gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt gggaggtatc aatatttaat gagtactgat ttaaatttat ttagactgga attaataatt

1020010200

aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca aacacgtaga ctaattaaaa tttaatgagg gataaagagg atacaaaaat attaatttca

1026010260

atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga atccctatta aattttaaca agggggggat taaaatttaa ttagaggttt atccacaaga

1032010320

aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag aaagacccta ataaaatttt tactagggtt ataacactga ttaatttctt aatgggggag

1038010380

ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa ggattaaaat ttaatgacaa agaaaacaat cttttaagaa aagcttttaa aagataataa

1044010440

taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca taaaaagagc tttgcgatta agcaaaactc tttacttttt cattgacatt atcaaattca

1050010500

tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga tcgatttcaa attgttgttg tatcataaag ttaattctgt tttgcacaac cttttcagga

1056010560

atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt atataaaaca catctgaggc ttgttttata aactcagggt cgctaaagtc aatgtaacgt

1062010620

agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt agcatatgat atggtatagc ttccacccaa gttagccttt ctgcttcttc tgaatgtttt

1068010680

tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa tcatatactt ccatgggtat ctctaaatga ttttcctcat gtagcaaggt atgagcaaaa

1074010740

agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact agtttatgga attgatagtt cctctctttt tcttcaactt ttttatctaa aacaaacact

1080010800

ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat ttaacatctg agtcaatgta agcataagat gtttttccag tcataatttc aatcccaaat

1086010860

cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat cttttagaca gaaattctgg acgtaaatct tttggtgaaa gaattttttt atgtagcaat

1092010920

atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct atatccgata cagcaccttc taaaagcgtt ggtgaatagg gcattttacc tatctcctct

1098010980

cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt cattttgtgg aataaaaata gtcatattcg tccatctacc tatcctatta tcgaacagtt

1104011040

gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt gaacttttta atcaaggatc agtccttttt ttcattattc ttaaactgtg ctcttaactt

1110011100

taacaactcg atttgttttt ccagatctcg agggtaacta gcctcgccga tcccgcaaga taacaactcg atttgttttt cgagatctcg agggtaacta gcctcgccga tcccgcaaga

1116011160

ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt ggcccggcag tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt

1122011220

tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca

1128011280

ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt

1134011340

ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga

1140011400

tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa

1146011460

gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct

1152011520

gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat

1158011580

acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga

1164011640

tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc

1170011700

caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat

1176011760

gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa

1182011820

cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac

1188011880

tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa

1194011940

agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc

1200012000

tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc

1206012060

ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag

1212012120

acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta

1218012180

ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa

1224012240

gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc

1230012300

gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat

1236012360

ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga

1242012420

gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt

1248012480

ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata

1254012540

cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac

1260012600

cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg

1266012660

ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg

1272012720

tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag

1278012780

cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct

1284012840

ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc

1290012900

aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt

1296012960

ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg

1302013020

tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga

1308013080

gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c gtcagtgagc gaggaagcgg aagagcgccc aatacgcatg c

1312113121

<210> 2<210> 2

<211> 11125<211> 11125

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Плазмида<223> Plasmid

<400> 2<400> 2

ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa

60 60

tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa

120 120

gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat

180 180

aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt

240 240

tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat

300 300

ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag

360 360

gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt

420 420

ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt

480 480

tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc

540 540

cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga

600 600

aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa

660 660

tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct

720 720

cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa

780 780

tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc

840 840

ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat

900 900

ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa

960 960

aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct

10201020

tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact

10801080

atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta atggcgtgct gctagcattt tacattttta gaaatgggcg tgaaaaaaag cgcgcgatta

11401140

tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa tgtaaaatat aaagattaac taataaggag gacaaacatg aaagaaatca aaatccaaaa

12001200

catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa catcatcatc agcgaagaaa aagcgccgct ggttgtgccg gaaatcggca ttaatcataa

12601260

cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat cggatcttta gaactggcta aaatcatggt tgatgcagcg ttttcagctg gagccaaaat

13201320

catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat catcaaacat caaacacata tcgtcgaaga tgaaatgagc aaagctgcaa agaaagttat

13801380

cccgggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa cccggggcaac gctaaaatct ctatctacga aatcatgcag aaatgcgctt tagattacaa

14401440

agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc agatgaactt gccctgaaag aatacacaga aaaactggga cttgtgtatc ttagcacacc

15001500

gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg gttttcaaga gcaggcgcga atcgcttaga agatatggga gtctctgcat ttaaaatcgg

15601560

ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat ctcaggagaa tgtaataact atccgctgat caaacatatt gcagcgttta aaaaaccgat

16201620

gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct gattgtgtct acaggcatga actcaatcga aagcattaaa ccgacagtga aaatcctgct

16801680

tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa tgataacgaa atcccgtttg tcctgatgca tacaacaaac ctgtatccga caccgcataa

17401740

tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact tcttgttaga ttaaacgcca tgctggaact gaagaaagaa tttagctgca tggtgggact

18001800

ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt ttctgatcat acaacagata atctggcatg ccttggcgcg gtcgttcttg gagcgtgtgt

18601860

cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat cttagaaaga cattttacag attcaatgca tcgcagcgga ccggatattg tttgttctat

19201920

ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg ggatacaaaa gccttaaaag aactgatcat tcaatcagaa cagatggcaa tcattcgcgg

19801980

caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc caataacgaa tcaaagaaag cagccaaaca agaacaggtt acaatcgatt ttgcttttgc

20402040

ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg ctctgtggtc tcaatcaaag atattaagaa aggcgaagtt ctgtcaatgg ataatatttg

21002100

ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa ggtgaaaaga ccgggacttg gcggaatcag cgcagcggaa tttgaaaata ttctgggcaa

21602160

gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc gaaagcactg cgcgatattg aaaacgatgc gcagttaagc tatgaagatt ttgcttaagc

22202220

tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta tcttaaggag gattttagaa tgaagaaaat tctgtttatc acaggctcaa gagcggatta

22802280

ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat ctctaaaatc aaatcactta tgtaccgcgt ccaaaattca agcgaatttg aactttacat

23402340

ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa ctttgctaca ggcatgcatc tgagcaaaaa ctttggatac acagttaaag aattatataa

24002400

aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa aaatggcttt aaaaacatct acgaatttat caactacgat aaatattatc agacagataa

24602460

agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct agccctggca acaacaattg atggattttc aagatatgcg aacgaattaa aaccggatct

25202520

gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa gattgttgtg catggcgatc gcatcgaacc gcttgcagcg gctattgtcg gagcccttaa

25802580

caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt caacatcctg gttgcacata tcgaaggcgg agaaattagc ggaacaatcg atgattcttt

26402640

aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag aagacatgcg atttcaaaac ttgctcatat ccatctggtg aacgatgaat ttgcaaaaag

27002700

acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct acgccttatg caattaggcg aagatgaaaa atcaatcttt atcatcggat ctccggatct

27602760

ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa ggaactgctt aacgataaca aaatctcact tagcgaagcc aaaaaatact acgatattaa

28202820

ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa ctacgaaaac tatgcattac tgatgtttca tccggtcaca acagaaatca catctatcaa

28802880

aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat aaaccaagcc gataacctgg tgaaagcact tatccagtca aacaaaaact acatcgtcat

29402940

ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa ctatccgaat aacgatctgg gctttgaact gatccttcag agctatgaag aatttaaaaa

30003000

caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa caacccgaga tttaaactgt ttccgtctct gcgctttgaa tactttatca cacttctgaa

30603060

aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa aaacgccgat tttattatcg gaaactcttc atgcatcctg aaagaagcgt tatacctgaa

31203120

aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact aacagctggc attctggttg gatcaagaca aaatggccgc ttaggaaatg aaaacacact

31803180

gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca gaaagtgaat gcgaacagcg atgaaatcct taaagctatc aacacaatcc ataaaaaaca

32403240

ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct ggatttattt tctgctaaac tggaaattct tgatagctct aaactgtttt tcgaatatct

33003300

tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa tcaatcaggc gatttcttta aacttagcac acagaaagtt tttaaagata ttaaataaaa

33603360

aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa aggaggaact actatgtcac ttgcaattat cccggcgaga ggcggaagca aaggcatcaa

34203420

aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc aaacaaaaac ctggttctgc ttaacaacaa accgcttatc tactacacaa tcaaagcagc

34803480

gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa gctgaatgct aaatctattt caaaagttgt ggtctcaagc gatagcgatg aaatccttaa

35403540

ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga ctacgccaaa tctcaaaacg tggatattct gaaaagaccg atctctcttg cacaggatga

36003600

tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt tacaacatca gataaagtct tactgcatgc gctgaaattt tacaaagatt acgaagatgt

36603660

tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa tgtgttttta caaccgacat ctccgctgcg cacaaacatt catatcaacg aagcatttaa

37203720

cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat cctgtacaaa aattcaaacg ctaatgccct gattagcgtc tctgaatgcg ataacaaaat

37803780

ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata ccttaaagca tttgtttgca acgattgtgg cgatttagcc ggaatttgta atgatgaata

38403840

tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat tccgtttatg ccgcgccaga aactgccgaa aacatatatg agcaacggag cgatctacat

39003900

ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt ccttaaaatc aaagaatttc tgaacaaccc gtcatttctg caaagcaaaa caaaacattt

39603960

tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga tcttatggat gaatcatcat cactggatat tgattgcctg gaagatttaa agaaagttga

40204020

acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta acaaatttgg aaaaaataaa gtcaatgtat gaatggatac gggatatgaa tcaataagta

40804080

cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt cgtgaaagag aaaagcaacc cagatatgat agggaacttt tctctttctt gttttacatt

41404140

gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag gaatctttac aatcctattg atataatcta agctagtgta ttttgcgttt aatagtggag

42004200

aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat aaaagctagc gattaactaa taaggaggac aaacatggat aaatttgctg aacatgaaat

42604260

tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact tccgaaagct gttatcgtgg ccggcaacgg agaatctctt tcacaaatcg attacagact

43204320

gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt gcttccgaaa aactatgatg tctttagatg caaccagttt tactttgaag aacgctattt

43804380

tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta tcttggcaac aaaatcaaag cagttttctt tacaccggga gtgtttttag aacaatacta

44404440

cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc cacactgtac catcttaaac gcaacaacga atactttgtc gataacgtta tcctgtcatc

45004500

atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga atttaaccat ccgacagttg atctggaaaa atcacaaaaa atccaggctc tgtttattga

45604560

tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag tgtgatcaac ggctacgaaa aatacctgtc taaactgaca gcctttgatg tttatctgag

46204620

atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc atacaaagaa ctttacgaaa accaacgcat tacatcagga gtgtatatgt gcgccgtcgc

46804680

aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga aatcgcgatg ggctatacag atatttacct tacaggaatc gatttttatc aggcaagcga

47404740

agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg agaaaactac gcgtttgata acaaaaaacc gaacatcatc agattactgc cggattttcg

48004800

caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt caaagaaaaa acattatttt catatcatag caaagatatt gatcttgaag cattatcttt

48604860

tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa tctgcaacag cattaccatg ttaactttta cagcatttct ccgatgtctc cgctgtcaaa

49204920

acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa acattttccg atcccgacag tggaagatga ttgtgaaaca acatttgtcg cgccgctgaa

49804980

agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt agaaaactac atcaacgata ttcttttacc gccgcatttt gtctatgaaa aacttggcgt

50405040

tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac tgataaactt gcagcggctt tagaacatca tcatcatcat cattaaagtg atagcggtac

51005100

cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg cattataggt aagagaggaa tgtacacatg tactatttaa aaaacacaaa cttttggatg

51605160

ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg ttcggtttat tctttttctt ttactttttt atcatgggag cctacttccc gtttttcccg

52205220

atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct atttggctac atgacatcaa ccatatcagc aaaagtgata cgggtattat ttttgccgct

52805280

atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg atttctctgt tctcgctatt attccaaccg ctgtttggtc tgctttctga caaactcggg

53405340

ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt ctgcgcaaat acctgctgtg gattattacc ggcatgttag tgatgtttgc gccgttcttt

54005400

atttttatct tcgggccact gttacaatac aacattttag taggatcgat tgttggtggt atttttatct tcggggccact gttacaatac aacattttag taggatcgat tgttggtggt

54605460

atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa atttatctag gcttttgttt taacgccggt gcgccagcag tagaggcatt tattgagaaa

55205520

gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg gtcagccgtc gcagtaattt cgaatttggt cgcgcgcgga tgtttggctg tgttggctgg

55805580

gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg gcgctgtgtg cctcgattgt cggcatcatg ttcaccatca ataatcagtt tgttttctgg

56405640

ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg ctgggctctg gctgtgcact catcctcgcc gttttactct ttttcgccaa aacggatgcg

57005700

ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag ccctcttctg ccacggttgc caatgcggta ggtgccaacc attcggcatt tagccttaag

57605760

ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc ctggcactgg aactgttcag acagccaaaa ctgtggtttt tgtcactgta tgttattggc

58205820

gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt gtttcctgca cctacgatgt ttttgaccaa cagtttgcta atttctttac ttcgttcttt

58805880

gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt gctaccggtg aacagggtac gcgggtattt ggctacgtaa cgacaatggg cgaattactt

59405940

aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc aacgcctcga ttatgttctt tgcgccactg atcattaatc gcatcggtgg gaaaaacgcc

60006000

ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca ctgctgctgg ctggcactat tatgtctgta cgtattattg gctcatcgtt cgccacctca

60606060

gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg gcgctggaag tggttattct gaaaacgctg catatgtttg aagtaccgtt cctgctggtg

61206120

ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg ggctgcttta aatatattac cagccagttt gaagtgcgtt tttcagcgac gatttatctg

61806180

gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat gtctgtttct gcttctttaa gcaactggcg atgattttta tgtctgtact ggcgggcaat

62406240

atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc atgtatgaaa gcatcggttt ccagggcgct tatctggtgc tgggtctggt ggcgctgggc

63006300

ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt ttcaccttaa tttccgtgtt cacgcttagc ggccccggcc cgctttccct gctgcgtcgt

63606360

caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc caggtgaatg aagtcgctta aggatccatg tctagagtcg acgtccccgg ggcagcccgc

64206420

ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa ctaatgagcg ggcttttttc acgtcccagg catcaaataa aacgaaaggc tcagtcgaaa

64806480

gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact gactgggcct ttcgttttat ctgttgtttg tcggtgaacg ctctctacta gagtcacact

65406540

ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta ggctcacctt cgggtgggcc tttctgcgtt tatagaattc atattactta gaggatacta

66006600

ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg ttgagagagc tattgataag atggttgaga cattacctga gagccaaaaa actttttatg

66606660

aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt aatatgaatt aaaaaaaaga accaacaaag gctgagacag actccaaacg agtctgtttt

67206720

tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat tttaaaaaaa atattaggag cattgaatat atattagaga attaagaaag acatgggaat

67806780

aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg aaaaatattt taaatccagt aaaaatatga taagattatt tcagaatatg aagaactctg

68406840

tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta tttgtttttg atgaaaaaac aaacaaaaaa aatccaccta acggaatctc aatttaacta

69006900

acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat acagcggcca aactgagaag ttaaatttga gaaggggaaa aggcggattt atacttgtat

69606960

ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca ttaactatct ccattttaac attttattaa accccataca agtgaaaatc ctcttttaca

70207020

ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac ctgttccttt aggtgatcgc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac

70807080

agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat agatgaatta gtgtattatc gacagcaaac cactggaaat aaaatcgcca ggaagagaat

71407140

caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga caaaaaaggg aaagaagaag tttattatgt tgctgaaacg gaagagaaga tatggacaga

72007200

agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg agagcaaata aaaaactttt ctttagacaa atttggtacg catatacctt acatagaagg

72607260

tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga tcattataca atcttaaata attacttctt tgatttttgg ggctattttt taggtgctga

73207320

aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt aggaattgcg ctctatgctc acctaactcg ttatgcatac ggcagcaaag acttttgctt

73807380

tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta tcctagtcta caaacaatcg ctaaaaaaat ggacaagact cctgttacag ttagaggcta

74407440

cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa cttgaaactg cttgaaaggt acggttttat ttggaaggta aacgtccgta ataaaaccaa

75007500

ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga ggataacaca gaggaatccc cgatttttaa gattagacgt aaggttcctt tgctttcaga

75607560

agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa agaactttta aatggaaacc ctaatattga aattccagat gacgaggaag cacatgtaaa

76207620

gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga gaaggcttta aaaaaggaaa aagagggtct tccaaaggtt ttgaaaaaag agcacgatga

76807680

atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata atttgttaaa aaaatgatgg atgagtcaga aacaattaat attccagagg ccttacaata

77407740

tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca tgacacaatg tatgaagata tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca

78007800

aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt aatacctaat cctacaacat cttttgagag tatatcaatg acaactgaag aggaaaaagt

78607860

cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg cgacagtact ttaaaaagcg aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg

79207920

gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga gtttaaaaac actaagatca aaattgaaaa taaaaattgt ttattacttg taccgagtga

79807980

atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga atttgcattt gaatggatta agaaaagata tttagaaaca attaaaacag tccttgaaga

80408040

agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt agctggatat gttttcgaaa aaatcgaact aagaaaagtg caataaactg ctgaagtatt

81008100

tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt tcagcagttt tttttattta gaaatagtga aaaaaatata atcagggagg tatcaatatt

81608160

taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt taatgagtac tgatttaaat ttatttagac tggaattaat aattaacacg tagactaatt

82208220

aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt aaaatttaat gagggataaa gaggatacaa aaatattaat ttcaatccct attaaatttt

82808280

aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa aacaaggggg ggattaaaat ttaattagag gtttatccac aagaaaagac cctaataaaa

83408340

tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg tttttactag ggttataaca ctgattaatt tcttaatggg ggagggatta aaatttaatg

84008400

acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg acaaagaaaa caatctttta agaaaagctt ttaaaagata ataataaaaa gagctttgcg

84608460

attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt attaagcaaa actctttact ttttcattga cattatcaaa ttcatcgatt tcaaattgtt

85208520

gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg gttgtatcat aaagttaatt ctgttttgca caaccttttc aggaatataa aacacatctg

85808580

aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta aggcttgttt tataaactca gggtcgctaa agtcaatgta acgtagcata tgatatggta

86408640

tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg tagcttccac ccaagttagc ctttctgctt cttctgaatg tttttcatat acttccatgg

87008700

gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat gtatctctaa atgattttcc tcatgtagca aggtatgagc aaaaagttta tggaattgat

87608760

agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa agttcctctc tttttcttca acttttttat ctaaaacaaa cactttaaca tctgagtcaa

88208820

tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt tgtaagcata agatgttttt ccagtcataa tttcaatccc aaatctttta gacagaaatt

88808880

ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac ctggacgtaa atcttttggt gaaagaattt ttttatgtag caatatatcc gatacagcac

89408940

cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa cttctaaaag cgttggtgaa tagggcattt tacctatctc ctctcatttt gtggaataaa

90009000

aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag aatagtcata ttcgtccatc tacctatcct attatcgaac agttgaactt tttaatcaag

90609060

gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt gatcagtcct ttttttcatt attcttaaac tgtgctctta actttaacaa ctcgatttgt

91209120

ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ttttccagat ctcgagggta actagcctcg ccgatcccgc aagaggcccg gcagtcaggt

91809180

ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca

92409240

aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg

93009300

aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc

93609360

cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg

94209420

ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt

94809480

cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta

95409540

ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat

96009600

gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga

96609660

gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca

97209720

acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact

97809780

cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc

98409840

acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact acgatgcctg tagcaatggc aacaacgttg cgcaaactat taactggcga actacttact

99009900

ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt

99609960

ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt

1002010020

gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt

1008010080

atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata

1014010140

ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag

1020010200

attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat

1026010260

ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa

1032010320

aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca

1038010380

aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt

1044010440

ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg

1050010500

tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc

1056010560

ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga

1062010620

cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc

1068010680

agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc

1074010740

gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca

1080010800

ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg

1086010860

tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta

1092010920

tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct

1098010980

cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag

1104011040

tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa

1110011100

gcggaagagc gcccaatacg catgc gcggaagagc gcccaatacg catgc

1112511125

<210> 3<210> 3

<211> 13805<211> 13805

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Экспрессионная плазмида<223> Expression plasmid

<400> 3<400> 3

ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa ttaagttatt ggtatgactg gttttaagcg caaaaaaagt tgctttttcg tacctattaa

60 60

tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa tgtatcgttt tagaaaaccg actgtaaaaa gtacagtcgg cattatctca tattataaaa

120 120

gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat gccagtcatt aggcctatct gacaattcct gaatagagtt cataaacaat cctgcatgat

180 180

aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt aaccatcaca aacagaatga tgtacctgta aagatagcgg taaatatatt gaattacctt

240 240

tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat tattaatgaa ttttcctgct gtaataatgg gtagaaggta attactatta ttattgatat

300 300

ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag ttaagttaaa cccagtaaat gaagtccatg gaataataga aagagaaaaa gcattttcag

360 360

gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt gtataggtgt tttgggaaac aatttccccg aaccattata tttctctaca tcagaaaggt

420 420

ataaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt aaaatcata aaactctttg aagtcattct ttacaggagt ccaaatacca gagaatgttt

480 480

tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc tagatacacc atcaaaaatt gtataaagtg gctctaactt atcccaataa cctaactctc

540 540

cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga cgtcgctatt gtaaccagtt ctaaaagctg tatttgagtt tatcaccctt gtcactaaga

600 600

aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa aaataaatgc agggtaaaat ttatatcctt cttgttttat gtttcggtat aaaacactaa

660 660

tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct tatcaatttc tgtggttata ctaaaagtcg tttgttggtt caaataatga ttaaatatct

720 720

cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa cttttctctt ccaattgtct aaatcaattt tattaaagtt catttgatat gcctcctaaa

780 780

tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc tttttatcta aagtgaattt aggaggctta cttgtctgct ttcttcatta gaatcaatcc

840 840

ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat ttttttaaaa gtcaatatta ctgtaacata aatatatatt ttaaaaatat cccactttat

900 900

ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa ccaattttcg tttgttgaac taatgggtgc tttagttgaa gaataaagac cacattaaaa

960 960

aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct aatgtggtct tttgtgtttt tttaaaggat ttgagcgtag cgaaaaatcc ttttctttct

10201020

tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact tatcttgata ataagggtaa ctattgccga tcgtccattc cgacagcatc gccagtcact

10801080

atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg atggcgtgct gctagcgcca ttcgccattc aggctgcgca actgttggga agggcgatcg

11401140

gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc aaggcgatta

12001200

agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc agttgggtaa cgccagggtt ttcccagtca cgacgttgta aaacgacggc cagtgaattc

12601260

gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga gagctcaggc cttaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga

13201320

aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt

13801380

attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt attgggcgcc agggtggttt ttcttttcac cagtgagacg ggcaacagct gattgccctt

14401440

caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg caccgcctgg ccctgagaga gttgcagcaa gcggtccacg ctggtttgcc ccagcaggcg

15001500

aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc aaaatcctgt ttgatggtgg ttgacggcgg gatataacat gagctgtctt cggtatcgtc

15601560

gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat gtatcccact accgagatat ccgcaccaac gcgcagcccg gactcggtaa tggcgcgcat

16201620

tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt tgcgcccagc gccatctgat cgttggcaac cagcatcgca gtgggaacga tgccctcatt

16801680

cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc cagcatttgc atggtttgtt gaaaaccgga catggcactc cagtcgcctt cccgttccgc

17401740

tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc tatcggctga atttgattgc gagtgagata tttatgccag ccagccagac gcagacgcgc

18001800

cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag cgagacagaa cttaatgggc ccgctaacag cgcgatttgc tggtgaccca atgcgaccag

18601860

atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt atgctccacg cccagtcgcg taccgtcttc atgggagaaa ataatactgt tgatgggtgt

19201920

ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat ctggtcagag acatcaagaa ataacgccgg aacattagtg caggcagctt ccacagcaat

19801980

ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag ggcatcctgg tcatccagcg gatagttaat gatcagccca ctgacgcgtt gcgcgagaag

20402040

attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac attgtgcacc gccgctttac aggcttcgac gccgcttcgt tctaccatcg acaccaccac

21002100

gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg gctggcaccc agttgatcgg cgcgagattt aatcgccgcg acaatttgcg acggcgcgtg

21602160

cagggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg caggggccaga ctggaggtgg caacgccaat cagcaacgac tgtttgcccg ccagttgttg

22202220

tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt tgccacgcgg ttgggaatgt aattcagctc cgccatcgcc gcttccactt tttcccgcgt

22802280

tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc tttcgcagaa acgtggctgg cctggttcac cacgcgggaa acggtctgat aagagacacc

23402340

ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt ggcatactct gcgacatcgt ataacgttac tggtttcatc aaaatcgtct ccctccgttt

24002400

gaatatttga ttgatcgtaa ccagatgaag cactctttcc actatcccta cagtgttatg gaatatttga ttgatcgtaa cgatgaag cactctttcc actatcccta cagtgttatg

24602460

gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca gcttgaacaa tcacgaaaca ataattggta cgtacgatct ttcagccgac tcaaacatca

25202520

aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt aatcttacaa atgtagtctt tgaaagtatt acatatgtaa gatttaaatg caaccgtttt

25802580

ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag ttcggaagga aatgatgacc tcgtttccac cggaattagc ttggtaccaa aggaggtaag

26402640

gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa gatcactaga aaatttttta aaaaatctct tgacattgga agggagatat gttattataa

27002700

gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa gaattgcgga attgtgagcg gataacaatt cccatataga ttaactaata aggaggacaa

27602760

acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg acatgaaaga aatcaaaatc caaaacatca tcatcagcga agaaaaagcg ccgctggttg

28202820

tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg tgccggaaat cggcattaat cataacggat ctttagaact ggctaaaatc atggttgatg

28802880

cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa cagcgttttc agctggagcc aaaatcatca aacatcaaac acatatcgtc gaagatgaaa

29402940

tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca tgagcaaagc tgcaaagaaa gttatcccgg gcaacgctaa aatctctatc tacgaaatca

30003000

tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac tgcagaaatg cgctttagat tacaaagatg aacttgccct gaaagaatac acagaaaaac

30603060

tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagaagata tgggacttgt gtatcttagc acaccgtttt caagagcagg cgcgaatcgc ttagagata

31203120

tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac tgggagtctc tgcatttaaa atcggctcag gagaatgtaa taactatccg ctgatcaaac

31803180

atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca atattgcagc gtttaaaaaa ccgatgattg tgtctacagg catgaactca atcgaaagca

32403240

ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa ttaaaccgac agtgaaaatc ctgcttgata acgaaatccc gtttgtcctg atgcatacaa

33003300

caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga caaacctgta tccgacaccg cataatcttg ttagattaaa cgccatgctg gaactgaaga

33603360

aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg aagaatttag ctgcatggtg ggactttctg atcatacaac agataatctg gcatgccttg

34203420

gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca gcgcggtcgt tcttggagcg tgtgtcttag aaagacattt tacagattca atgcatcgca

34803480

gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat gcggaccgga tattgtttgt tctatggata caaaagcctt aaaagaactg atcattcaat

35403540

cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac cagaacagat ggcaatcatt cgcggcaata acgaatcaaa gaaagcagcc aaacaagaac

36003600

aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg aggttacaat cgattttgct tttgcctctg tggtctcaat caaagatatt aagaaaggcg

36603660

aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag aagttctgtc aatggataat atttgggtga aaagaccggg acttggcgga atcagcgcag

37203720

cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt cggaatttga aaatattctg ggcaagaaag cactgcgcga tattgaaaac gatgcgcagt

37803780

taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt taagctatga agattttgct taagctctta aggaggattt tagaatgaag aaaattctgt

38403840

ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa ttatcacagg ctcaagagcg gattactcta aaatcaaatc acttatgtac cgcgtccaaa

39003900

attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg attcaagcga atttgaactt tacatctttg ctacaggcat gcatctgagc aaaaactttg

39603960

gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact gatacacagt taaagaatta tataaaaatg gctttaaaaa catctacgaa tttatcaact

40204020

acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat acgataaata ttatcagaca gataaagccc tggcaacaac aattgatgga ttttcaagat

40804080

atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg atgcgaacga attaaaaccg gatctgattg ttgtgcatgg cgatcgcatc gaaccgcttg

41404140

cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa cagcggctat tgtcggagcc cttaacaaca tcctggttgc acatatcgaa ggcggagaaa

42004200

ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc ttagcggaac aatcgatgat tctttaagac atgcgatttc aaaacttgct catatccatc

42604260

tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa tggtgaacga tgaatttgca aaaagacgcc ttatgcaatt aggcgaagat gaaaaatcaa

43204320

tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg tctttatcat cggatctccg gatctggaac tgcttaacga taacaaaatc tcacttagcg

43804380

aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg aagccaaaaa atactacgat attaactacg aaaactatgc attactgatg tttcatccgg

44404440

tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc tcacaacaga aatcacatct atcaaaaacc aagccgataa cctggtgaaa gcacttatcc

45004500

agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc agtcaaacaa aaactacatc gtcatctatc cgaataacga tctgggcttt gaactgatcc

45604560

ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct ttcagagcta tgaagaattt aaaaacaacc cgagatttaa actgtttccg tctctgcgct

46204620

ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca ttgaatactt tatcacactt ctgaaaaacg ccgattttat tatcggaaac tcttcatgca

46804680

tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg tcctgaaaga agcgttatac ctgaaaacag ctggcattct ggttggatca agacaaaatg

47404740

gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag gccgcttagg aaatgaaaac acactgaaag tgaatgcgaa cagcgatgaa atccttaaag

48004800

ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata ctatcaacac aatccataaa aaacaggatt tattttctgc taaactggaa attcttgata

48604860

gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga gctctaaact gtttttcgaa tatcttcaat caggcgattt ctttaaactt agcacacaga

49204920

aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg aagtttttaa agatattaaa taaaaaggag gaactactat gtcacttgca attatcccgg

49804980

cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc cgagaggcgg aagcaaaggc atcaaaaaca aaaacctggt tctgcttaac aacaaaccgc

50405040

ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct ttatctacta cacaatcaaa gcagcgctga atgctaaatc tatttcaaaa gttgtggtct

51005100

caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa caagcgatag cgatgaaatc cttaactacg ccaaatctca aaacgtggat attctgaaaa

51605160

gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga gaccgatctc tcttgcacag gatgatacaa catcagataa agtcttactg catgcgctga

52205220

aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa aattttacaa agattacgaa gatgttgtgt ttttacaacc gacatctccg ctgcgcacaa

52805280

acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta acattcatat caacgaagca tttaacctgt acaaaaattc aaacgctaat gccctgatta

53405340

gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt gcgtctctga atgcgataac aaaatcctta aagcatttgt ttgcaacgat tgtggcgatt

54005400

tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat tagccggaat ttgtaatgat gaatatccgt ttatgccgcg ccagaaactg ccgaaaacat

54605460

atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat atatgagcaa cggagcgatc tacatcctta aaatcaaaga atttctgaac aacccgtcat

55205520

ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt ttctgcaaag caaaacaaaa cattttctta tggatgaatc atcatcactg gatattgatt

55805580

gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg gcctggaaga tttaaagaaa gttgaacaaa tttggaaaaa ataaagatta actaataagg

56405640

aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat aggacaaaca tgaaaagaat cttttgcctt gtgtctgcaa tcctgctttc agcgtgtaat

57005700

gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac gataaccaga atacagtcga tgttgtggtc tcaacagtga acgataacgt catcgaaaac

57605760

aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt aacacatacc aggtcaaacc gatcgataca ccgacaacat ttgatagcta ttcttggatt

58205820

caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt caaacatgcg gcacaccgat ccttaaagat gatgaaaaat actcactgtc atttgatttt

58805880

gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat gttgctccgg aattagatca ggatgaaaaa ttttgttttg aatttacagg cgatgttgat

59405940

ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat ggaaaacgct atgtgacaca aacaaatctg acagttgtgg caccgacact tgaagtgtat

60006000

gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac gtcgatcatg cgagcctgcc gtctcttcaa cagctgatga aaatcatcca acagaaaaac

60606060

gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac gaatactctc agaacgaaag atttatctca tggggccgca tcggacttac agaagataac

61206120

gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta gctgaaaaac tgaatgccca tatttatccg ctggctggaa ataacacatc tcaagaatta

61806180

gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca gtcgatgcag ttatcgatta cgcggattca aaaaacagac tgaatctgga acttaacaca

62406240

aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc aacacagctc atagctttcc gaacttagcc ccgattctgc gcattatctc aagcaaaagc

63006300

aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg aacatcctga tctctaacat caacctttac gatgatggct cagccgaata cgtgaacctg

63606360

tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg tacaactgga aagatacaga agataaaagc gtcaaactgt ctgattcatt tttagttctg

64206420

aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac aaagattact ttaatggaat ttcttcagaa aaaccgagcg gcatctatgg aagatataac

64806480

tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa tggcatcagc tgtacaacac atcttactat tttctgagaa aagattatct gacagtcgaa

65406540

ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat ccgcaactgc atgatcttcg cgaatatctt ggcggatcat taaaacagat gagctgggat

66006600

ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat ggcttttcac aactgagcaa aggagataaa gaactgtttc tgaacattgt tggctttgat

66606660

caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga caagaaaaac tgcaacagga atatcaacag agcgaacttc cgaattttgt gtttacagga

67206720

acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc acaacaacat gggcaggcgg agaaacaaaa gaatattatg cgcaacagca agttaacgtc

67806780

gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc gttaacaacg caatcaacga aacatctccg tactacctgg gcagagaaca tgatcttttc

68406840

tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac tttaaaggac atccgcgcgg cggaattatc aatgatatta tcctgggctc atttaataac

69006900

atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg atgattgata ttccggcgaa agttagcttt gaagtgctta tgatgacagg aatgttaccg

69606960

gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct gatacagtgg gcggaattgc atcatcactg tattttagca tcccggccga aaaagtctct

70207020

tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg tttatcgttt ttacatcaag cgatacaatc acagatcgcg aagatgctct gaaatctccg

70807080

cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca cttgttcagg tgatgatgac actgggcatt gtgaaagaaa aagatgtcct gttttggtca

71407140

gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc gatttaccgg attgctcttc aggagtttgt attgcccaat attaaagtga tagcggtacc

72007200

attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt attataggta agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt

72607260

tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tcggtttatt ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga

73207320

tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttggctaca tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta

73807380

tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tttctctgtt ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc

74407440

tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tgcgcaaata cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta

75007500

tttttatctt cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttttatctt cggggccactg ttacaataca acattttagt aggatcgatt gttggtggta

75607560

tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tttatctagg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag

76207620

tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg tcagccgtcg cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg

76807680

cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc cgctgtgtgc ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc

77407740

tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc tgggctctgg ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc

78007800

cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc cctcttctgc cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc

78607860

tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tggcactgga actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg

79207920

tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg tttcctgcac ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg

79807980

ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta ctaccggtga acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta

80408040

acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc acgcctcgat tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc

81008100

tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag tgctgctggc tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag

81608160

cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg cgctggaagt ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg

82208220

gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg gctgctttaa atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg

82808280

tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tctgtttctg cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata

83408340

tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tgtatgaaag catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct

84008400

tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc tcaccttaat ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc

84608460

aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc aggtgaatga agtcgcttaa ggatccatgt ctagagtcga cgtccccggg gcagcccgcc

85208520

taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag taatgagcgg gcttttttca cgtcccaggc atcaaataaa acgaaaggct cagtcgaaag

85808580

actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctctactag agtcacactg

86408640

gctcaccttc gggtgggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg gctcaccttc gggtggggcct ttctgcgttt atacccgggg cagcccgcct aatgagcggg

87008700

cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta cttttttcac gtcacgcgtc catggagatc tttgtctgca actgaaaagt ttatacctta

87608760

cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt cctggaacaa atggttgaaa catacgaggc taatatcggc ttattaggaa tagtccctgt

88208820

actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt actaataaaa tcaggtggat cagttgatca gtatattttg gacgaagctc ggaaagaatt

88808880

tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt tggagatgac ttgcttaatt ccacaattaa attaagggaa agaataaagc gatttgatgt

89408940

tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct tcaaggaatc acggaagaag atactcatga taaagaagct ctaaaactat tcaataacct

90009000

tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct tacaatggaa ttgatcgaaa gggtggaagg ttaatggtac gaaaattagg ggatctacct

90609060

agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct agaaagccac aaggcgatag gtcaagctta aagaaccctt acatggatct tacagattct

91209120

gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg gaaagtaaag aaacaacaga ggttaaacaa acagaaccaa aaagaaaaaa agcattgttg

91809180

aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg aaaacaatga aagttgatgt ttcaatccat aataagatta aatcgctgca cgaaattctg

92409240

gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag gcagcatccg aagggaattc atattactta gaggatacta ttgagagagc tattgataag

93009300

atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga atggttgaga cattacctga gagccaaaaa actttttatg aatatgaatt aaaaaaaaga

93609360

accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag accaacaaag gctgagacag actccaaacg agtctgtttt tttaaaaaaa atattaggag

94209420

cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt cattgaatat atattagaga attaagaaag acatgggaat aaaaatattt taaatccagt

94809480

aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac aaaaatatga taagattatt tcagaatatg aagaactctg tttgtttttg atgaaaaaac

95409540

aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag aaacaaaaaa aatccaccta acggaatctc aatttaacta acagcggcca aactgagaag

96009600

ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac ttaaatttga gaaggggaaa aggcggattt atacttgtat ttaactatct ccattttaac

96609660

attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc attttattaa accccataca agtgaaaatc ctcttttaca ctgttccttt aggtgatcgc

97209720

ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc ggagggacat tatgagtgaa gtaaacctaa aaggaaatac agatgaatta gtgtattatc

97809780

gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag gacagcaaac cactggaaat aaaatcgcca ggaagagaat caaaaaaggg aaagaagaag

98409840

tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt tttattatgt tgctgaaacg gaagagaaga tatggacaga agagcaaata aaaaactttt

99009900

ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata ctttagacaa atttggtacg catatacctt acatagaagg tcattataca atcttaaata

99609960

attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc attacttctt tgatttttgg ggctattttt taggtgctga aggaattgcg ctctatgctc

1002010020

acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg acctaactcg ttatgcatac ggcagcaaag acttttgctt tcctagtcta caaacaatcg

1008010080

ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt ctaaaaaaat ggacaagact cctgttacag ttagaggcta cttgaaactg cttgaaaggt

1014010140

acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc acggttttat ttggaaggta aacgtccgta ataaaaccaa ggataacaca gaggaatccc

1020010200

cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc cgatttttaa gattagacgt aaggttcctt tgctttcaga agaactttta aatggaaacc

1026010260

ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa ctaatattga aattccagat gacgaggaag cacatgtaaa gaaggcttta aaaaaggaaa

1032010320

aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg aagagggtct tccaaaggtt ttgaaaaaag agcacgatga atttgttaaa aaaatgatgg

1038010380

atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata atgagtcaga aacaattaat attccagagg ccttacaata tgacacaatg tatgaagata

1044010440

tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat tactcagtaa aggagaaatt cgaaaagaaa tcaaaaaaca aatacctaat cctacaacat

1050010500

cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg cttttgagag tatatcaatg acaactgaag aggaaaaagt cgacagtact ttaaaaagcg

1056010560

aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca aaatgcaaaa tcgtgtctct aagccttctt ttgatacctg gtttaaaaac actaagatca

1062010620

aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta aaattgaaaa taaaaattgt ttattacttg taccgagtga atttgcattt gaatggatta

1068010680

agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa agaaaagata tttagaaaca attaaaacag tccttgaaga agctggatat gttttcgaaa

1074010740

aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta aaatcgaact aagaaaagtg caataaactg ctgaagtatt tcagcagttt tttttattta

1080010800

gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat gaaatagtga aaaaaatata atcagggagg tatcaatatt taatgagtac tgatttaaat

1086010860

ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa ttatttagac tggaattaat aattaacacg tagactaatt aaaatttaat gagggataaa

1092010920

gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat gaggatacaa aaatattaat ttcaatccct attaaatttt aacaaggggg ggattaaaat

1098010980

ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca ttaattagag gtttatccac aagaaaagac cctaataaaa tttttactag ggttataaca

1104011040

ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta ctgattaatt tcttaatggg ggagggatta aaatttaatg acaaagaaaa caatctttta

1110011100

agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actctttact agaaaagctt ttaaaagata ataataaaaa gagctttgcg attaagcaaa actcttttact

1116011160

ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt ttttcattga cattatcaaa ttcatcgatt tcaaattgtt gttgtatcat aaagttaatt

1122011220

ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca ctgttttgca caaccttttc aggaatataa aacacatctg aggcttgttt tataaactca

1128011280

gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc gggtcgctaa agtcaatgta acgtagcata tgatatggta tagcttccac ccaagttagc

1134011340

ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc ctttctgctt cttctgaatg tttttcatat acttccatgg gtatctctaa atgattttcc

1140011400

tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca tcatgtagca aggtatgagc aaaaagttta tggaattgat agttcctctc tttttcttca

1146011460

acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt acttttttat ctaaaacaaa cactttaaca tctgagtcaa tgtaagcata agatgttttt

1152011520

ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt ccagtcataa tttcaatccc aaatctttta gacagaaatt ctggacgtaa atcttttggt

1158011580

gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa gaaagaattt ttttatgtag caatatatcc gatacagcac cttctaaaag cgttggtgaa

1164011640

tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc tagggcattt tacctatctc ctctcatttt gtggaataaa aatagtcata ttcgtccatc

1170011700

tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt tacctatcct attatcgaac agttgaactt tttaatcaag gatcagtcct ttttttcatt

1176011760

attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta attcttaaac tgtgctctta actttaacaa ctcgatttgt ttttccagat ctcgagggta

1182011820

actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt actagcctcg ccgatcccgc aagaggcccg gcagtcaggt ggcacttttc ggggaaatgt

1188011880

gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag

1194011940

acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca

1200012000

tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc

1206012060

agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat

1212012120

cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc

1218012180

aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg

1224012240

gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc

1230012300

agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat

1236012360

aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga

1242012420

gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc

1248012480

ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc

1254012540

aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt

1260012600

aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc

1266012660

tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc tggctggttt attgctgata aatctggagc cggtgagcgt gggtctcgcg gtatcattgc

1272012720

agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca

1278012780

ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca

1284012840

ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt

1290012900

ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta

1296012960

acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg

1302013020

agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc

1308013080

ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag

1314013140

cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa

1320013200

gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc

1326013260

cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc

1332013320

gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta

1338013380

caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag

1344013440

aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct

1350013500

tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga

1356013560

gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc

1362013620

ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt

1368013680

atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg

1374013740

cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcccaatacg

1380013800

catgc catgc

1380513805

<210> 4<210> 4

<211> 10838<211> 10838

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Суицидная плазмида<223> Suicide plasmid

<400> 4<400> 4

ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa ttctcatgtt tgacagctta tcatcgataa gctttaatgc ggtagtttat cacagttaaa

60 60

ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg ttgctaacgc agtcaggcac cgtgtatgaa atctaacaat gcgctcatcg tcatcctcgg

120 120

caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt caccgtcacc ctggatgctg taggcatagg cttggttatg ccggtactgc cgggcctctt

180 180

gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata gcgggatatc gtccattccg acagcatcgc cagtcactat ggcgtgctgc tagcgctata

240 240

tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg tgcgttgatg caatttctat gcgcacccgt tctcggagca ctgtccgacc gctttggccg

300 300

ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac ccgcccagtc ctgctcgctt cgctacttgg agccactatc gactacgcga tcatggcgac

360 360

cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac cacacccgtc ctgtggatcc tctacgccgg acgcatcgtg gccggcatca ccggcgccac

420 420

aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca aggtgcggtt gctggcgcct atatcgccga catcaccgat ggggaagatc gggctcgcca

480 480

cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg cttcgggctc atgagcgctt gtttcggcgt gggtatggtg gcaggccccg tggccggggg

540 540

actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct actgttgggc gccatctcct tgcatgcacc attccttgcg gcggcggtgc tcaacggcct

600 600

caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat caacctacta ctgggctgct tcctaatgca ggagtcgcat aagggagagc gtcgaccgat

660 660

gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt gcccttgaga gccttcaacc cagtcagctc cttccggtgg gcgcggggca tgactatcgt

720 720

cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct cgccgcactt atgactgtct tctttatcat gcaactcgta ggacaggtgc cggcagcgct

780 780

ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct ctgggtcatt ttcggcgagg accgctttcg ctggagcgcg acgatgatcg gcctgtcgct

840 840

tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa tgcggtattc ggaatcttgc acgccctcgc tcaagccttc gtcactggtc ccgccaccaa

900 900

acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt acgtttcggc gagaagcagg ccattatcgc cggcatggcg gccgacgcgc tgggctacgt

960 960

cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc cttgctggcg ttcgcgacgc gaggctggat ggccttcccc attatgattc ttctcgcttc

10201020

cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca cggcggcatc gggatgcccg cgttgcaggc catgctgtcc aggcaggtag atgacgacca

10801080

tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc tcagggacag cttcaaggat cgctcgcggc tcttaccagc ctaacttcga tcactggacc

11401140

gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat gctgatcgtc acggcgattt atgccgcctc ggcgagcaca tggaacgggt tggcatggat

12001200

tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg tgtaggcgcc gccctatacc ttgtctgcct ccccgcgttg cgtcgcggtg catggagccg

12601260

ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga ggccacctcg acctgaatgg aagccggcgg cacctcgcta acggattcac cactccaaga

13201320

attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac attggagcca atcaattctt gcggagaact gtgaatgcgc aaaccaaccc ttggcagaac

13801380

atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg atatccatcg cgtccgccat ctccagcagc cgcacgcggc gcatctcggg cagcgttggg

14401440

tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg tcctggccac gggtgcgcat gatcgtgctc ctgtcgttga ggacccggct aggctggcgg

15001500

ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc ggttgcctta ctggttagca gaatgaatca ccgatacgcg agcgaacgtg aagcgactgc

15601560

tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg tcttcggttt ccgtgtttcg

16201620

taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta tgttccggat ctgcatcgca

16801680

ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga ggatgctgct ggctaccctg tggaacacct acatctgtat taacgaagcg ctggcattga

17401740

ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa ccctgagtga tttttctctg gtcccgccgc atccataccg ccagttgttt accctcacaa

18001800

cgttccagta accgggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt cgttccagta acggggcatg ttcatcatca gtaacccgta tcgtgagcat cctctctcgt

18601860

ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc ttcatcggta tcattacccc catgaacaga aatccccctt acacggaggc atcagtgacc

19201920

aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac attaacgctt

19801980

ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga atcgcttcac

20402040

gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac

21002100

ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc

21602160

agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc

22202220

cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca gagcagattg

22802280

tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc tactgagagt gcaccagcgg gcaaggaaag ccttcaatat gtgcagtggt atgtcaactc

23402340

tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta tatgaagatc agcctgttta caatggcagg gtctttgctc tgtgtgacgt ttacggccta

24002400

tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct tgcgttttcg cgctttcggt ttaaagggag gaaatacgct ttaacgctct ttttattgct

24602460

gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg gcagatgatt cctcagtttt cagctttaat tgccttgttt gtgctggcgc aaatcttggg

25202520

aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa aatgatcaat agccactggc tgctaatctt gctttatatc ggcggcctga tcccgatgaa

25802580

tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa tacgtatttg atgaaagggt acatggattc cattccgatg gatttagacg aaagcgccaa

26402640

gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc gattgacgga gccagcagca ccagaatctt cttccagatc attctgccat tatcaaaacc

27002700

gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc gatggcggca gtcgtggcca tgaacggctt taccggtccg ctcggagatt ttgtgctgtc

27602760

ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt ctcaaccata ttgagaacgc ctgaatcata tacattgccc gtcggtctat tcaatttagt

28202820

gaatgatgtc atgggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat gaatgatgtc atggggggcca gctatacgac atttgcggcc ggagccctgc ttatcagcat

28802880

accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg accggttgcc gtcatcttta ttatgctgca aaagaatttt gtgtccggat taaccgcagg

29402940

cggaacgaag ggctaagaga acaaggagga gaatgtgatg tcaaagcttg aaaaaacgca cggaacgaag ggctaagaga acaagggagga gaatgtgatg tcaaagcttg aaaaaacgca

30003000

cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga cgtaacaaaa gcaaaattta tgctccatgg gggagactac aaccccgatc agtggctgga

30603060

tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt tcggcccgat attttagctg acgatatcaa actgatgaag ctttctcata cgaatacgtt

31203120

ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa ttctgtcggc aattttacat ttttagaaat gggcgtgaaa aaaagcgcgc gattatgtaa

31803180

aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg aatataaaga ttaactaata aggaggacaa acatgacaga acagtacatc aaaaacgttg

32403240

aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa aagtgtatct tgattatgca acaatcccga cactgaacta cttttaccat tttacagaaa

33003300

acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat acaaagatga tattgcgaca attagactgt ttggccttgg acgctttaac atctctaaat

33603360

caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc caatcatcga atcatatccg gaaggcatta tcagatattg cccgattatc tttgaagatc

34203420

agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc agacagcttt tcaacagctg tttatcacac tgcttacaga agattctttt tgtcaatacc

34803480

gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata gctttaactt tcatattaac ctgtttcatt catggaaaat gcttatcccg ctgctgcata

35403540

ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct ttatctggca atttaaacat aaagtcctgg atattaaact taacttttat gatgatggct

36003600

ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga ctgaaggact ggttacactg tcaaaaatcg aacaaaacta ttcaagcgaa attcttcaga

36603660

aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag aaatcatcga tattgatagc caatcttttt acgctgataa acttagcttt ttagatgaag

37203720

atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt atattgccag atatttatgg aatagcctgt ttgaatcaca ttactatctt ttaaacgatt

37803780

ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca ttctgcttaa aaacgaaaaa ctgagcttac tgaaaaactc tatcaaatac tgccatatca

38403840

tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc tggatcttga acgctattta caatttacac aggaagaaaa agatttcttt aacgaacttc

39003900

tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat tgggcattaa catccagagc cttgaagata aaatcaaaat ctttcaacaa aagaaaacat

39603960

ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca ttatttttac aggaacaaca atcttttctc tgccgaaaga agaagaagaa acactttaca

40204020

gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg gactgcatct gaacgctatc cttaactaca tccatccgaa cggcaaatac tttatcggcg

40804080

atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg atggatttac actggtgatc aaaggacatc cgcatcaaaa agaaatgaat agcagactgg

41404140

aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc aaaaatcatt tgaaaaagcc gtcatgctgc cggataacat cccgtttgaa attctttacc

42004200

tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg tgatcggctg caaaccggat aaaattggcg gatttgtttc aacaagctac ttttcatgtg

42604260

ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa ataagaaaaa tattgcggat ctgctgttta tcagcgcgag acaggaagaa gtgcgcaaaa

43204320

acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta acgattatct ttttaacatc caataccagc tgagagatat gatgatcaaa acaggattta

43804380

tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag tccaagaaga aaaaacacat ttttacagcg atattccgat ctttatttct taaaaaggag

44404440

gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca gaactactat gtcacttgca attatcccgg cgagaggcgg aagcaaaggc atcaaaaaca

45004500

aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga aaaacctggt tctgcttaac aacaaaccgc ttatctacta cacaatcaaa gcagcgctga

45604560

atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg atgctaaatc tatttcaaaa gttgtggtct caagcgatag cgatgaaatc cttaactacg

46204620

ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa ccaaatctca aaacgtggat attctgaaaa gaccgatctc tcttgcacag gatgatacaa

46804680

catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt catcagataa agtcttactg catgcgctga aattttacaa agattacgaa gatgttgtgt

47404740

ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt ttttacaacc gacatctccg ctgcgcacaa acattcatat caacgaagca tttaacctgt

48004800

acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta acaaaaattc aaacgctaat gccctgatta gcgtctctga atgcgataac aaaatcctta

48604860

aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt aagcatttgt ttgcaacgat tgtggcgatt tagccggaat ttgtaatgat gaatatccgt

49204920

ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta ttatgccgcg ccagaaactg ccgaaaacat atatgagcaa cggagcgatc tacatcctta

49804980

aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta aaatcaaaga atttctgaac aacccgtcat ttctgcaaag caaaacaaaa cattttctta

50405040

tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa tggatgaatc atcatcactg gatattgatt gcctggaaga tttaaagaaa gttgaacaaa

51005100

tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc tttggaaaaa ataagctctt aaggaggatt ttagaatgag cacaacaaca caaaatatcc

51605160

cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct cgtggtatcg ccatcttaac agagcccagt ggcgcgcatt ttctgcagcg tggttaggct

52205220

atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg atctgcttga tggatttgat tttgttctga ttgcactggt tcttacagaa gtgcaaggcg

52805280

aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat aatttggact tacaacagtg caggctgcct ctttaatttc agcagcgttt atcagcagat

53405340

ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg ggtttggcgg attaatgctg ggcgcaatgg gagatcgcta tggaagacgc ctggcgatgg

54005400

tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata tcacatctat tgttctgttt tcagcgggca cattagcttg cggctttgcc ccgggatata

54605460

ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa ttacaatgtt tatcgcgaga cttgtgattg gcatgggaat ggcaggcgaa tatggatcaa

55205520

gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc gcgcgacgta tgttatcgaa tcttggccga aacatctgcg caataaagca tcaggatttc

55805580

ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc ttattagcgg cttttctgtg ggagcggttg tggctgccca agtctattct cttgtcgttc

56405640

cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt cggtttgggg atggagagca ctgtttttca ttggcatcct tccgattatc tttgctcttt

57005700

ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac ggttacgcaa aaatatcccg gaagccgaag attggaaaga aaaacatgcc ggaaaagcac

57605760

ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta ctgtgagaac aatggtcgat attctgtata gaggcgaaca tcgcattgct aacatcgtta

58205820

tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg tgacattagc agcggctaca gctctgtggt tttgctttgc cggaaattta caaaacgccg

58805880

caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt caatcgttgc tgtgctgggc ttactgtgtg cggctatttt tatcagcttt atggttcagt

59405940

ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc ctgccggaaa acgctggccg acaggcgtga tgttaatggt ggtcgttctg tttgcttttc

60006000

tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca tttattcatg gccgattcaa gcccttttac cgacatacct gaaaacagat ttagcttaca

60606060

atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct atccgcatac agtggccaac gtcctgtttt tctcaggctt tggagccgca gttggctgct

61206120

gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc gtgtgggcgg atttcttggc gattggttag gaacaagaaa agcgtatgtt tgttcactgc

61806180

ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc ttgcgagcca gttactgatt atcccggttt ttgcaatcgg cggagcgaat gtctgggttc

62406240

ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga ttggactttt actgtttttc caacagatgt taggccaagg aattgctggc atcttaccga

63006300

aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata aactgattgg cggatatttt gatacagatc agagagcggc tggccttgga tttacatata

63606360

atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc atgttggagc actgggcgga gcccttgcac cgattatcgg agcgttaatt gctcaacgcc

64206420

tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt tggatcttgg cacagcgctt gcttctttat catttagcct gacatttgtg gtcattcttt

64806480

taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa taatcggcct tgatatgccg tcaagagttc agcgctggtt aagaccggaa gcactgagaa

65406540

cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa cacatgatgc gattgatggc aaaccgtttt caggagctgt gccgtttggc agcgccaaaa

66006600

acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa acgatctggt caaaacaaaa tcataaccag gcatcaaata aaacgaaagg ctcagtcgaa

66606660

agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctctact agagtcacac

67206720

tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat tggctcacct tcgggtgggc ctttctgcgt ttatatacgc gttaacccgg gcccgcggat

67806780

ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc ggatatgatc agatccttta actctggcaa ccctcaaaat tgaatgagac atgctacacc

68406840

tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt tccggataat aaatatatat aaacgtatat agatttcata aagtctaaca cactagactt

69006900

atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt atttacttcg taattaagtc gttaaaccgt gtgctctacg accaaaacta taaaaccttt

69606960

aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc aagaactttc tttttttaca agaaaaaaga aattagataa atctctcata tcttttattc

70207020

aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca aataatcgca tccgattgca gtataaattt aacgatcact catcatgttc atatttatca

70807080

gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta gagctcgtgc tataattata ctaattttat aaggaggaaa aaatatgggc atttttagta

71407140

tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc tttttgtaat cagcacagtt cattatcaac caaacaaaaa ataagtggtt ataatgaatc

72007200

gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat gttaataagc aaaattcata taaccaaatt aaagagggtt ataatgaacg agaaaaatat

72607260

aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat aaaacacagt caaaacttta ttacttcaaa acataatata gataaaataa tgacaaatat

73207320

aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct aagattaaat gaacatgata atatctttga aatcggctca ggaaaaggcc attttaccct

73807380

tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa tgaattagta aagaggtgta atttcgtaac tgccattgaa atagaccata aattatgcaa

74407440

aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt aactacagaa aataaacttg ttgatcacga taatttccaa gttttaaaca aggatatatt

75007500

gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat gcagtttaaa tttcctaaaa accaatccta taaaatatat ggtaatatac cttataacat

75607560

aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat aagtacggat ataatacgca aaattgtttt tgatagtata gctaatgaga tttatttaat

76207620

cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt cgtggaatac gggtttgcta aaagattatt aaatacaaaa cgctcattgg cattactttt

76807680

aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa aatggcagaa gttgatattt ctatattaag tatggttcca agagaatatt ttcatcctaa

77407740

acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa acctaaagtg aatagctcac ttatcagatt aagtagaaaa aaatcaagaa tatcacacaa

78007800

agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat agataaacaa aagtataatt atttcgttat gaaatgggtt aacaaagaat acaagaaaat

78607860

atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa atttacaaaa aatcaattta acaattcctt aaaacatgca ggaattgacg atttaaacaa

79207920

tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc tattagcttt gaacaattct tatctctttt caatagctat aaattattta ataagtaagc

79807980

gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct gaggcaggat caggacaatg attatatttt tgtcatgaat ttcacggaag aaaaacagct

80408040

ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct ggtcacgttt gatcagagtg tgaaggacat aatgacagga gacatattgt caggcgacct

81008100

gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct gacgatggaa aagtatgaag tgagaattgt cgtaaacaca cattaggctg atgctccgct

81608160

cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg cgatatgggc ggattctttt ttctatagaa tgaaaacgct tgctaagtct tggggggatg

82208220

aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta aaatcatgaa aagcaaagtg aaaatgttct ttgcggctgc catcgtgtgg agtgcatgta

82808280

gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag gttcaacagg atatgccgct gccattgaga aggagaagca cgtgtcagag cttcgggcag

83408340

aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg aggatctttt tgttaaaaaa gtagagggga tgaacaagga ttttatcaaa ggggcagatg

84008400

tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac tatccagcgt tattgctttg gaaaacagcg gtgtcacctt ttacaataca aacggaaaac

84608460

gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct gccaggatat ctttacaact ttaaaacagg ctggggtcaa ctatgttcgc gtccgcatct

85208520

ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa ggaatcaccc gtatgattca aatggcaacg ggtatggcgg gggaaacaat gatgttcaaa

85808580

aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc aagccatcga aatcggaaaa agagcgacag cgaacggaat gaaggtgctg gccgactttc

86408640

actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc actactctga tttctgggcc gatccagcga aacaaaaggt gcccaaagcc tgggcgaatc

87008700

tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga tcagctttga agcaaaaaaa gcaaagctct atgagtatac gaaacaaagc ctgcaaaaga

87608760

tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tgatcaagga aggcgtgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca

88208820

tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc

88808880

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg

89408940

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt

90009000

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa

90609060

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct

91209120

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc

91809180

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg

92409240

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct

93009300

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag

93609360

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga

94209420

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga

94809480

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg

95409540

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag

96009600

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag

96609660

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat

97209720

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct

97809780

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac

98409840

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa

99009900

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg

99609960

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt

1002010020

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca

1008010080

ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt ttgctgcagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt

1014010140

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct

1020010200

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg

1026010260

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg cagcactgca taattctctt actngtcatgc catccgtaag atgcttttct gtgactggtg

1032010320

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg

1038010380

cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa cgtcaacacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa

1044010440

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt

1050010500

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt

1056010560

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt

1062010620

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca

1068010680

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat

1074010740

ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata

1080010800

aaaataggcg tatcacgagg ccctttcgtc ttcaagaa aaaataggcg tatcacgagg ccctttcgtc ttcaagaa

1083810838

<210> 5<210> 5

<211> 4254<211> 4254

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Интерграционная кассета<223> Integration cassette

<400> 5<400> 5

gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc gcaggctgtt attgtaacat gtaagccata agccattcgt aaaagtgcgg gaggaaggtc

60 60

atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa atgaataatc tgcgtaatag actttcaggc gtgaatggga aaaataagag agtaaaagaa

120 120

aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat aaagaacaaa aaatctggtc ggagattggg atgatagcgg gagcatttgc gctgcttgat

180 180

gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg gtgatcatcc gcggcattat gtttgaattt ccgtttaaag aatgggctgc aagccttgtg

240 240

tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg tttttgttca tcattatctt atattactgc atcagggctg cggcatccgg aatgctcatg

300 300

ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca ccgagaatag acaccaaaga agaactgcaa aaacgggtga agcagcagcg aatagaatca

360 360

attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca attgcggtcg cctttgcggt agtggtgctt acgatgtacg acagggggat tccccataca

420 420

ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg ttcttcgctt ggctgaaaat gattcttctt tttatcgtct gcggcggcgt tctgtttctg

480 480

cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag cttcggtatg tgattgtgaa gctggcttac agaagagcgg taaaagaaga aataaaaaag

540 540

aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt aaatcatctt ttttgtttgg aaagcgaggg aagcgttcac agtttcgggc agcttttttt

600 600

ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat ataggaacat tgatttgtat tcactctgcc aagttgtttt gatagagtga ttgtgataat

660 660

tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg tttaaatgta agcgttaaca aaattctcca gtcttcacat cggtttgaaa ggaggaagcg

720 720

gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg gaagaatgaa gtaagaggga tttttgactc cgaagtaagt cttcaaaaaa tcaaataagg

780 780

agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt agtgtcaaga atgtttgcaa aacgattcaa aacctcttta ctgccgttat tcgctggatt

840 840

tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa tttattgctg tttcatttgg ttctggcagg accggcggct gcgagtgctg aaacggcgaa

900 900

caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc caaatcgaat gagcttacag caccgtcgat caaaagcgga accattcttc atgcatggcc

960 960

agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa agtgaattcg agctcggtac ctaccgttcg tataatgtat gctatacgaa gttatgataa

10201020

aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac aaaatttaga agccaatgaa atctataaat aaactaaatt aagtttattt aattaacaac

10801080

tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga tatggatata aaataggtac taatcaaaat agtgaggagg atatatttga atacatacga

11401140

acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac acaaattaat aaagtgaaaa aaatacttcg gaaacattta aaaaataacc ttattggtac

12001200

ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt ttacatgttt ggatcaggag ttgagagtgg actaaaacca aatagtgatc ttgacttttt

12601260

agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag agtcgtcgta tctgaaccat tgacagatca aagtaaagaa atacttatac aaaaaattag

13201320

acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat acctatttca aaaaaaatag gagataaaag caacttacga tatattgaat taacaattat

13801380

tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga tattcagcaa gaaatggtac cgtggaatca tcctcccaaa caagaattta tttatggaga

14401440

atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt atggttacaa gagctttatg aacaaggata cattcctcag aaggaattaa attcagattt

15001500

aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt aaccataatg ctttaccaag caaaacgaaa aaataaaaga atatacggaa attatgactt

15601560

agaggaatta ctacctgata ttccattttc tgatgtgaga agagccatta tggattcgtc agaggaatta ctacctgata ttccatttc tgatgtgaga agagccatta tggattcgtc

16201620

agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg agaggaatta atagataatt atcaggatga tgaaaccaac tctatattaa ctttatgccg

16801680

tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt tatgatttta actatggaca cgggtaaaat cataccaaaa gatattgcgg gaaatgcagt

17401740

ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct ggctgaatct tctccattag aacataggga gagaattttg ttagcagttc gtagttatct

18001800

tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa tggagagaat attgaatgga ctaatgaaaa tgtaaattta actataaact atttaaataa

18601860

cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt cagattaaaa aaattataaa aaaattgaaa aaatggtgga aacacttttt tcaatttttt

19201920

tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc tgttttatta tttaatattt gggaaatatt cattctaata taacttcgta taatgtatgc

19801980

tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg tatacgaacg gtaggatcct ctagagtcga cctgcaggca ttttacattt ttagaaatgg

20402040

gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta gcgtgaaaaa aagcgcgcga ttatgtaaaa tataaagtga tagcggtacc attataggta

21002100

agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt agagaggaat gtacacatgt actatttaaa aaacacaaac ttttggatgt tcggtttatt

21602160

ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca ctttttcttt tactttttta tcatgggagc ctacttcccg tttttcccga tttggctaca

22202220

tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt tgacatcaac catatcagca aaagtgatac gggtattatt tttgccgcta tttctctgtt

22802280

ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata ctcgctatta ttccaaccgc tgtttggtct gctttctgac aaactcgggc tgcgcaaata

23402340

cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt cctgctgtgg attattaccg gcatgttagt gatgtttgcg ccgttcttta tttttatctt

24002400

cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg cgggccactg ttacaataca acattttagt aggatcgatt gttggtggta tttatctagg

24602460

cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg cttttgtttt aacgccggtg cgccagcagt agaggcattt attgagaaag tcagccgtcg

25202520

cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc cagtaatttc gaatttggtc gcgcgcggat gtttggctgt gttggctggg cgctgtgtgc

25802580

ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg ctcgattgtc ggcatcatgt tcaccatcaa taatcagttt gttttctggc tgggctctgg

26402640

ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc ctgtgcactc atcctcgccg ttttactctt tttcgccaaa acggatgcgc cctcttctgc

27002700

cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga cacggttgcc aatgcggtag gtgccaacca ttcggcattt agccttaagc tggcactgga

27602760

actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac actgttcaga cagccaaaac tgtggttttt gtcactgtat gttattggcg tttcctgcac

28202820

ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga ctacgatgtt tttgaccaac agtttgctaa tttctttact tcgttctttg ctaccggtga

28802880

acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat acagggtacg cgggtatttg gctacgtaac gacaatgggc gaattactta acgcctcgat

29402940

tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc tatgttcttt gcgccactga tcattaatcg catcggtggg aaaaacgccc tgctgctggc

30003000

tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt tggcactatt atgtctgtac gtattattgg ctcatcgttc gccacctcag cgctggaagt

30603060

ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa ggttattctg aaaacgctgc atatgtttga agtaccgttc ctgctggtgg gctgctttaa

31203120

atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg atatattacc agccagtttg aagtgcgttt ttcagcgacg atttatctgg tctgtttctg

31803180

cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag cttctttaag caactggcga tgatttttat gtctgtactg gcgggcaata tgtatgaaag

32403240

catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat catcggtttc cagggcgctt atctggtgct gggtctggtg gcgctgggct tcaccttaat

33003300

ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga ttccgtgttc acgcttagcg gccccggccc gctttccctg ctgcgtcgtc aggtgaatga

33603360

agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt agtcgcttaa gcaatcaatg tcggatgcca gcctggcttt gattacgtgc taaatggttt

34203420

atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact atataatgac tcgggcttaa gcggttctct tccccattga gggcaaggct agacgggact

34803480

taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc taccgaaaga aaccatcaat gatggtttct tttttgttca taaatcagac aaaacttttc

35403540

tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa tcttgcaaaa gtttgtgaag tgttgcacaa tataaatgtg aaatacttca caaacaaaaa

36003600

gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa gacatcaaag agaaacatac cctggaagga tgattaatga tgaacaaaca tgtaaataaa

36603660

gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa gtagctttaa tcggagcggg ttttgttgga agcagttatg catttgcgtt aattaaccaa

37203720

ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg ggaatcacag atgagcttgt ggtcattgat gtaaataaag aaaaagcaat gggcgatgtg

37803780

atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca atggatttaa accacggaaa ggcgtttgcg ccacaaccgg tcaaaacatc ttacggaaca

38403840

tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct tatgaagact gcaaggatgc tgatattgtc tgcatttgcg ccggagcaaa ccaaaaacct

39003900

ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt ggtgagacac gccttgaatt agtagaaaag aacttgaaga ttttcaaagg catcgttagt

39603960

gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc gaagtcatgg cgagcggatt tgacggcatt ttcttagtcg cgacaaatcc ggttgatatc

40204020

ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc ctgacttacg caacatggaa attcagcggc ctgccaaaag agcgggtgat tggaagcggc

40804080

acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct acaacacttg attctgcgag attccgtttc atgctgagcg aatactttgg cgcagcgcct

41404140

caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc caaaacgtac acgcgcatat tatcggagag cacggcgaca cagagcttcc tgtttggagc

42004200

cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg cacgcgaatg tcggcggtgt gccggtcagt gaactcgttg agaaaaacga tgcg

42544254

<---<---

Claims (16)

1. Неспорообразующая клетка Bacillus для получения сиалированного олигосахарида, где указанная клетка Bacillus генетически сконструирована так, чтобы содержать лактозопермеазу, путь биосинтеза CMP-NeuNAc и сиалилтрансферазу, причем способность к споруляции клетки Bacillus нарушена в результате делеции или функциональной инактивации одного или более генов, кодирующих Spo0A, сигма E и сигма F.1. A non-sporulating Bacillus cell for producing a sialylated oligosaccharide, wherein said Bacillus cell is genetically engineered to contain a lactose permease, a CMP-NeuNAc biosynthetic pathway, and a sialyltransferase, wherein the sporulating ability of the Bacillus cell is impaired by deletion or functional inactivation of one or more genes encoding Spo0A , sigma E and sigma F. 2. Клетка Bacillus по п. 1, в которой лактозопермеаза представляет собой LacY E. coli или ее функциональный вариант.2. The Bacillus cell according to claim 1, wherein the lactose permease is E. coli LacY or a functional variant thereof. 3. Клетка Bacillus по любому из пп. 1, 2, где в пути биосинтеза CMP-NeuNAc используется GlcN-1P или GlcNAc-6P в качестве промежуточного соединения.3. Bacillus cell according to any one of paragraphs. 1, 2, where the CMP-NeuNAc biosynthetic pathway uses GlcN-1P or GlcNAc-6P as an intermediate. 4. Клетка Bacillus по любому из пп. 1-3, где в пути биосинтеза CMP-NeuNAc используется путь утилизации сиаловой кислоты.4. Bacillus cell according to any one of paragraphs. 1-3, where the CMP-NeuNAc biosynthetic pathway utilizes the sialic acid utilization pathway. 5. Клетка Bacillus по любому из пп. 1-4, в которой сиалилтрансфераза представляет собой сиалилтрансферазу, акцептирующую лактозу, предпочтительно сиалилтрансферазу, выбранную из группы, состоящей из α-2,3-сиалилтрансфераз, α-2,6-сиалилтрансфераз и α-2,8-сиалилтрансфераз.5. Bacillus cell according to any one of paragraphs. 1-4, wherein the sialyltransferase is a lactose-accepting sialyltransferase, preferably a sialyltransferase selected from the group consisting of α-2,3-sialyltransferases, α-2,6-sialyltransferases and α-2,8-sialyltransferases. 6. Клетка Bacillus по любому из пп. 1-5, где указанная клетка Bacillus не обладает какой-либо β-галактозидазной активностью или обладает пониженной β-галактозидазной активностью по сравнению с клеткой-предшественником Bacillus дикого типа того же вида.6. Bacillus cell according to any one of paragraphs. 1-5, wherein said Bacillus cell does not have any β-galactosidase activity or has reduced β-galactosidase activity compared to a wild-type Bacillus progenitor cell of the same species. 7. Клетка Bacillus по п. 6, где указанная клетка Bacillus генетически сконструирована посредством делеции или функциональной инактивации по меньшей мере одного из генов, выбранных из группы, состоящей из yesZ и ganA.7. The Bacillus cell of claim 6, wherein the Bacillus cell is genetically engineered by deletion or functional inactivation of at least one of the genes selected from the group consisting of yesZ and ganA. 8. Клетка Bacillus по любому из пп. 1-7, где указанная клетка Bacillus представляет собой клетку Bacillus subtilis.8. Bacillus cell according to any one of paragraphs. 1-7, wherein said Bacillus cell is a Bacillus subtilis cell. 9. Клетка Bacillus по любому из пп. 1-8, для применения в получении 3’-сиалиллактозы, где в пути биосинтеза CMP-NeuNAc используется GlcN-1P в качестве промежуточного соединения и где сиалилтрансфераза представляет собой α-2,3-сиалилтрансферазу.9. Bacillus cell according to any one of paragraphs. 1-8, for use in the production of 3'-sialyllactose, wherein the CMP-NeuNAc biosynthetic pathway uses GlcN-1P as an intermediate and where the sialyltransferase is an α-2,3-sialyltransferase. 10. Клетка Bacillus по любому из пп. 1-8, для применения в получении 6’-сиалиллактозы, где в пути биосинтеза CMP-NeuNAc используется GlcN-1P в качестве промежуточного соединения и где сиалилтрансфераза представляет собой α-2,6-сиалилтрансферазу.10. Bacillus cell according to any one of paragraphs. 1-8, for use in the production of 6'-sialyllactose, wherein the CMP-NeuNAc biosynthetic pathway uses GlcN-1P as an intermediate and where the sialyltransferase is an α-2,6-sialyltransferase. 11. Применение клетки Bacillus по любому из пп. 1-10 для получения сиалированного олигосахарида.11. Use of a Bacillus cell according to any one of paragraphs. 1-10 to obtain sialylated oligosaccharide. 12. Способ получения сиалированного олигосахарида, включающий:12. A method for producing sialylated oligosaccharide, including: - предоставление неспорообразующей клетки Bacillus, как определено в любом из пп. 1-10;- providing a non-sporulating Bacillus cell as defined in any one of paragraphs. 1-10; - культивирование указанной клетки Bacillus в ферментационном бульоне и в условиях, которые являются пермиссивными в отношении получения сиалированного олигосахарида; и, возможно,- culturing said Bacillus cell in a fermentation broth and under conditions that are permissive for the production of sialylated oligosaccharide; and, perhaps, - извлечение сиалированного олигосахарида из среды и/или клетки Bacillus.- extraction of sialylated oligosaccharide from the medium and/or Bacillus cells. 13. Способ по п. 12, в котором ферментационный бульон содержит лактозу.13. The method according to claim 12, wherein the fermentation broth contains lactose.
RU2022107329A 2019-09-03 2020-08-10 Production of sialylated oligosaccharides in bacillus cells RU2816764C1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP19195148.2 2019-09-03

Publications (1)

Publication Number Publication Date
RU2816764C1 true RU2816764C1 (en) 2024-04-04

Family

ID=

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007101862A1 (en) * 2006-03-09 2007-09-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
RU2593321C2 (en) * 2010-11-23 2016-08-10 Нестек С.А. Oligosaccharide composition for treating acute respiratory infections
WO2018122225A1 (en) * 2016-12-27 2018-07-05 Inbiose N.V. In vivo synthesis of sialylated compounds

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007101862A1 (en) * 2006-03-09 2007-09-13 Centre National De La Recherche Scientifique (Cnrs) Method of producing sialylated oligosaccharides
RU2593321C2 (en) * 2010-11-23 2016-08-10 Нестек С.А. Oligosaccharide composition for treating acute respiratory infections
WO2018122225A1 (en) * 2016-12-27 2018-07-05 Inbiose N.V. In vivo synthesis of sialylated compounds

Similar Documents

Publication Publication Date Title
KR20230113685A (en) Production of sialylated oligosaccharides in Bacillus cells
AU2021204574B2 (en) Probiotic and prebiotic compositions, and methods of use thereof for modulation of the microbiome
AU2015315110B2 (en) Alpha (1,3) fucosyltransferases for use in the production of fucosylated oligosaccharides
KR102424721B1 (en) Peptide-mediated delivery of rna-guided endonuclease into cells
KR102267412B1 (en) Rna trnascription vector and uses thereof
CA3098403C (en) Biosynthesis of human milk oligosaccharides in engineered bacteria
EP2970872B1 (en) Microorganisms and methods for producing sialylated and n-acetylglucosamine-containing oligosaccharides
Kobata Exo-and endoglycosidases revisited
Bouma et al. Sugar transport by the marine chitinolytic bacterium Vibrio furnissii: molecular cloning and analysis of the glucose and N-acetylglucosamine permeases
CN110267663A (en) Glycan polymers and related methods
KR20220020826A (en) Production of Fucosylated Oligosaccharides in Bacillus
CN111065740B (en) 2-O-sulfurylase mutants and 3-O-sulfurylase mutants and methods of using the same
TW202221129A (en) Cellular production of di- and/or oligosaccharides
Nishimoto et al. Identification of the putative proton donor residue of lacto-N-biose phosphorylase (EC 2.4. 1.211)
RU2816764C1 (en) Production of sialylated oligosaccharides in bacillus cells
US20120276131A1 (en) Anti-trypanosomiasis vaccines and diagnostics
Skåne et al. The fish pathogen Aliivibrio salmonicida LFI1238 can degrade and metabolize chitin despite gene disruption in the chitinolytic pathway
KR20210005178A (en) Therapeutic genome editing in X-linked high IGM syndrome
CN108699580A (en) The Heparan sulfate with high 3-O- sulphations ratio in aminoglucose saccharide residue
KR20120128647A (en) Process for production and purification of recombinant lysosomal alpha-mannosidase
HK40075120A (en) Production of sialylated oligosaccharides in bacillus cells
Watanabe et al. Molecular characterization of a novel β1, 3-galactosyltransferase for capsular polysaccharide synthesis by Streptococcus agalactiae type Ib
Sokolovskaya et al. Dysbiosis-associated gut bacterium Ruminococcus gnavus varies at the strain level in ability to utilize key mucin component sialic acid
US20140349339A1 (en) PmST3 ENZYME FOR CHEMOENZYMATIC SYNTHESIS OF ALPHA-2-3-SIALOSIDES
US7309600B2 (en) Haemophilus influenzae sialyltransferase and methods of use thereof