RU2796061C2

RU2796061C2 - T7 rna polymerase variants

Info

Publication number: RU2796061C2
Application number: RU2020103726A
Authority: RU
Inventors: Мэтью Г. МИЛЛЕР; Чинпинг Чнг; Оскар Алвизо; Мелисса Энн МЭЙО; Джеймс Николас РИГГИНС; Сян И; Джонатан С. ПЕНФИЛД; Гьялт В. ХЕЙСМАН
Original assignee: Кодексис, Инк.
Priority date: 2017-06-30
Filing date: 2018-06-19
Publication date: 2023-05-16

Abstract

FIELD: biotechnology.

SUBSTANCE: invention is a constructed RNA polymerase containing a polypeptide sequence having at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity with reference sequence SEQ ID NO: 4, where the specified polypeptide sequence contains at least the substitution 664W/F/Y, 404E/Y, 514F/I/L/Y, 661E/Y, 446W/Y, 136E/I, 137W, 357G/K/L/M/N/Q/R/S/T/V/W, 393L/Y, 394R, 397F/M/Q/W/Y, 401V, 444F/H/l/V, 478F/M/W, 513C/F /K/L/R/T/W/Y, 582N, 635F/R/W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W or 660A/C/M/S /T/W/F/N or any combination thereof, and wherein the amino acid positions of the said polypeptide sequence are numbered relative to SEQ ID NO: 4 or 15. The invention also relates to an expression vector and a host cell for producing engineered RNA polymerase.

EFFECT: invention makes it possible to obtain variants of RNA polymerase for selective incorporation of a symmetrically capped GTP analog with respect to GTP during transcription initiation in vitro.

52 cl, 1 dwg, 7 tbl, 7 ex

Description

[1] Настоящей заявке испрашивается приоритет по предварительной патентной заявке США с серийным номером №62/527764, поданной 30 июня 2017 года, и предварительной патентной заявке США с серийным номером №62/528846, поданной 5 июля 2017 года, обе из которых включены в настоящее описание в качестве ссылок в полном объеме для любых целей. [1] This application claims priority over U.S. Provisional Application Serial No. 62/527764, filed June 30, 2017, and U.S. Provisional Patent Application Serial No. 62/528846, filed July 5, 2017, both of which are included in this description as a reference in its entirety for any purpose.

ОБЛАСТЬ ИЗОБРЕТЕНИЯFIELD OF THE INVENTION

[2] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы и к их композициям, содержащим эти варианты. Кроме того, настоящее изобретение относится к сконструированным вариантам РНК-полимеразы T7 и к композициям, содержащим эти варианты. Эти варианты изменены для селективного включения аналога кэпа m7G(5')ppp(5')m7G относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к применению композиций, описанных в настоящем описании. [2] The present invention relates to engineered variants of RNA polymerase and their compositions containing these variants. In addition, the present invention relates to engineered variants of T7 RNA polymerase and compositions containing these variants. These variants are modified to selectively include the m7G(5')ppp(5')m7G cap analog relative to GTP upon in vitro transcription initiation. The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the use of the compositions described in the present description.

УКАЗАНИЕ НА СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ, ТАБЛИЦУ ИЛИ КОМПЬЮТЕРНУЮ ПРОГРАММУINDICATION TO A SEQUENCE LIST, TABLE OR COMPUTER PROGRAM

[3] Официальная копия списка последовательностей предоставлена одновременно с описанием в качестве текстового файла в формате ASCII через EFS-Web, с названием файла "CX8-168CUSP1_ST25.txt", датой создания 5 июля 2017 года и размером 184,320 байт. Список последовательностей, предоставленный через EFS-Web, является частью описания и включен в настоящее описание в качестве ссылки в полном объеме. [3] An official copy of the sequence listing is provided along with the description as an ASCII text file via EFS-Web, with the file name "CX8-168CUSP1_ST25.txt", creation date July 5, 2017, and size 184,320 bytes. The sequence listing provided via EFS-Web is part of the description and is incorporated herein by reference in its entirety.

УРОВЕНЬ ТЕХНИКИ, К КОТОРОМУ ОТНОСИТСЯ ИЗОБРЕТЕНИЕSTATE OF THE ART TO which THE INVENTION RELATES

[4] РНК-полимераза T7 (E.C. 2.7.7.6) представляет собой мономерную кодируемую бактериофагом DNA-направляемую РНК-полимеразу, которая катализирует образование РНК в направлении от 5' к 3'. В процессе инициации транскрипции РНК-полимераза T7 распознает конкретную промоторную последовательность (т.е. промотор T7). Встречающаяся в природе РНК-полимераза T7 содержит 883 аминокислоты. Она является высокогомологичной РНК-полимеразе T3 и в некоторой степени гомологичной РНК-полимеразе SP6. T7 содержит несколько доменов, включая N-концевой домен, "большой палец", "ладонь" и "пальцы" (см., например, Sousa and Mukherjee, Prog. Nucl. Acid Res. Mol. Biol., 73:1-41 [2003] и патент США №9193959). Конформация N-концевого домена меняется между фазами инициации и элонгации функционирующего фермента. [4] T7 RNA polymerase (EC 2.7.7.6) is a monomeric bacteriophage-encoded DNA-directed RNA polymerase that catalyzes the formation of RNA in the 5' to 3' direction. During transcription initiation, T7 RNA polymerase recognizes a specific promoter sequence (i.e., the T7 promoter). The naturally occurring T7 RNA polymerase contains 883 amino acids. It is highly homologous to T3 RNA polymerase and somewhat homologous to SP6 RNA polymerase. T7 contains several domains, including the N-terminal domain, "thumb", "palm" and "fingers" (see, for example, Sousa and Mukherjee, Prog. Nucl. Acid Res. Mol. Biol., 73:1-41 [2003] and US patent No. 9193959). The conformation of the N-terminal domain changes between the initiation and elongation phases of a functioning enzyme.

[5] Описано клонирование и экспрессия гена, кодирующего РНК-полимеразу T7 (см., например, патент США №4952496). Вследствие ее специфичности к промотору и высокой активности РНК-полимеразы, T7 используется для различных применений. Также она является пригодной для экспрессии на высоком уровне рекомбинантных генов в E. coli (См., Studier and Moffat, J. Mol. Biol., 18:113-130 [1986]). T7 также используется в различных способах амплификации нуклеиновых кислот, включая те, которые используются в диагностических способах. Поскольку стабильность и термостабильность часто являются важными факторами, которые должны учитываться при разработке компонентов диагностических способов, описана работа по повышению термостабильности и стабильности T7 (см., например, патенты США №9193959, 8551752 и 7507567 и т.д.). Тем не менее в данной области остается потребность в вариантах ферментов T7, которые демонстрируют улучшенные свойства по сравнению со встречающимся в природе ферментом. [5] The cloning and expression of a gene encoding T7 RNA polymerase has been described (see, for example, US Pat. No. 4,952,496). Due to its promoter specificity and high RNA polymerase activity, T7 is used for various applications. It is also suitable for high-level expression of recombinant genes in E. coli (See, Studier and Moffat, J. Mol. Biol., 18:113-130 [1986]). T7 is also used in various nucleic acid amplification methods, including those used in diagnostic methods. Because stability and thermal stability are often important factors to consider when developing components for diagnostic methods, work has been described to improve T7 thermal stability and stability (see, for example, US Pat. However, there remains a need in the art for variants of T7 enzymes that exhibit improved properties over the naturally occurring enzyme.

СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

[6] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы T7 и их композициям. Эти варианты изменены для селективного включения симметричного кэпированного аналога GTP относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к применению композиций, описанных в настоящем описании. [6] The present invention relates to engineered variants of T7 RNA polymerase and compositions thereof. These variants are modified to selectively include a symmetrically capped GTP analog relative to GTP when initiating transcription in vitro . The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the use of the compositions described in the present description.

[7] Настоящее изобретение относится сконструированным РНК-полимеразам, содержащим полипептидные последовательности, обладающие по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, или их функциональным фрагментам, где сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен в полипептидных последовательностях и где аминокислотные положения полипептидных последовательностей пронумерованы относительно SEQ ID NO: 4 или 15. [7] The present invention relates to engineered RNA polymerases containing polypeptide sequences having at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99 % or more sequence identity with the reference sequence of SEQ ID NO: 4 and/or 15, or functional fragments thereof, where the engineered RNA polymerases contain at least one substitution or set of substitutions in the polypeptide sequences and where the amino acid positions of the polypeptide sequences are numbered relative to SEQ ID NO: 4 or 15.

[8] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 32/357, 49/642, 97/357, 136, 137, 160/643, 167/514, 250, 302/513, 314/401, 357, 392, 393, 394, 397, 401, 404, 444, 446, 478, 513, 514, 582, 635, 636, 637, 639, 642, 643, 645, 653, 656, 660, 660/806, 661 и 664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 32V/357I, 49G/642L, 97D/357G, 136E/I, 137W, 160L/643S, 167N/514L, 250D, 302V/513G, 314C/401V, 357G/K/L/M/N/Q/R/S/T/V/W, 392D, 393L/Y, 394A/L/R, 397F/M/Q/W, 401A/I/L/S/V, 404E/Y, 444F/H/I/V, 446W/Y, 478F/M/W, 513C/F/K/L/R/T/W, 514F/I/L/Y, 582N, 635W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W, 660A/C/M/S/T/W, 660N/806Y, 661E/Y и 664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A32V/E357I, E49G/M642L, E97D/E357G, A136E/I, D137W, R160L/T643S, K167N/S514L, T250D, A302V/D513G, R314C/R401V, E357G/K/L/M/N/Q/R/S/T/V/W, Y392D, R393L/Y, K394A/L/R, A397F/M/Q/W, R401A/I/L/S/V, S404E/Y, N444F/H/I/V, M446W/Y, D478F/M/W, D513C/F/K/L/R/T/W, S514F/I/L/Y, A582N, S635W, V636L, T637G/P/S, R639H, M642L, T643A, A645V, F653C, Q656F/W, D660A/C/M/S/T/W, D660N/H806Y, T661E/Y и P664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [8] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 32/357, 49/642, 97/357, 136, 137, 160/643, 167/514, 250, 302/513, 314/401, 357, 392, 393, 394, 397, 401, 404, 444, 446, 478, 513, 514, 582, 635, 636, 637, 639, 642, 643, 645, 653 , 656, 660, 660/806, 661, and 664, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions which are selected from 32V/357I, 49G/642L, 97D/357G, 136E/I, 137W, 160L/643S, 167N/514L, 250D, 302V/513G, 314C/401V, 357G/K/L/M/N/ Q/R/S/T/V/W, 392D, 393L/Y, 394A/L/R, 397F/M/Q/W, 401A/I/L/S/V, 404E/Y, 444F/H/ I/V, 446W/Y, 478F/M/W, 513C/F/K/L/R/T/W, 514F/I/L/Y, 582N, 635W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W, 660A/C/M/S/T/W, 660N/806Y, 661E/Y and 664W, and/or any combination thereof, where amino acid positions are numbered according to SEQ ID NO: 4. In some additional embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A32V/E357I, E49G/M642L, E97D/E357G, A136E/I, D137W, R160L/T643S, K167N/ S514L, T250D, A302V/D513G, R314C/R401V, E357G/K/L/M/N/Q/R/S/T/V/W, Y392D, R393L/Y, K394A/L/R, A397F/M/ Q/W, R401A/I/L/S/V, S404E/Y, N444F/H/I/V, M446W/Y, D478F/M/W, D513C/F/K/L/R/T/W, S514F/I/L/Y, A582N, S635W, V636L, T637G/P/S, R639H, M642L, T643A, A645V, F653C, Q656F/W, D660A/C/M/S/T/W, D660N/H806Y, T661E/Y and P664W, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4.

[9] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397/513/635, 397/513/635/660, 513/660/664, 513/635/660, 513/635/664, 513/660/664 и 660/664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397F/513W/635W, 397F/513Y/635W, 397W/513Y/635W, 397W/513W/635W, 397W/513Y/635W/660F, 397W/513W/635W/660W, 397Y/513W/635W/660F, 475V/513W/635W/660Y, 513F/660W/664Y, 513W/635W/660F, 513W/635W/664W, 513Y/635W/660F, 513Y/635W/660Y, 513Y/660W/664W и 660Y/664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A397F/D513W/S635W, A397F/D513Y/S635W, A397W/D513Y/S635W, A397W/D513W/S635W, A397W/D513Y/S635W/D660F, A397W/D513W/S635W/D660W, A397Y/D513W/S635W/D660F, A475V/D513W/S635W/D660Y, D513F/D660W/P664Y, D513W/S635W/D660F, D513W/S635W/P664W, D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/D660W/P664W и D660Y/P664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [9] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397/513/635, 397/513/635/660, 513/660/664, 513/635/660, 513/635/664, 513/660/664, and 660/664, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases comprise at least one Replacement or set replacements selected from 397f/513W/635W, 397F/513Y/635W, 397W/513Y/635W, 397W/513W/635W, 397W/513Y/635W/660F, 397W/513W/635W/660W, 397y/397y/397y/397y/397y/397y/397y/397y/397y/397y/397y/397y 513W/635W/660F 475V/513W/635W/660Y 513F/660W/664Y 513W/635W/660F 513W/635W/664W 513Y/635W/660F 513Y/635W/660Y 513Y /660W/664W and 660Y/664W, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 4. In some additional embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A397F/D513W/S635W A397W/D513Y/S635W/D660F, A397W/D513W/S635W/D660W, A397Y/D513W/S635W/ D660F, A475V/D513W/S635W/D660Y D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/D660W/P664W and D660Y/P664W, and/or any combination thereof, where the provisions amino acids are numbered according to SEQ ID NO: 4.

[10] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397, 397/513, 397/513/635, 397/513/635, 397/513/635/656, 397/513/635/656/660, 397/513/635/656/660/664, 397/513/635/656/664, 397/513/635/660, 397/513/635/660/664, 397/513/635/664, 397/513/656/660, 397/513/660, 397/513/660/664, 397/513/664, 397/513, 397/635, 397/635/656/660/664, 397/635/656/664, 397/635/660, 397/635/664, 397/635/664/850, 397/660, 397/664, 397/660/664, 397/837, 399/635/660, 475/513/635/660, 513, 513/635, 513/635/656, 513/635/656/660, 513/635/656/664, 513/635/660, 513/635/660/664, 513/635/664, 513/656/660, 513/656/664, 513/660, 513/660/664, 513/664, 635, 635/656, 635/656/664, 635/660, 635/660/664, 635/664, 656/660/664, 658, 660, 660/664 и 664, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 397F, 397F/513F, 397F/513F/635F, 397F/513F/635W, 397F/513F/635W/660W, 397F/513W/635W, 397F/513W/635W/656F/664F, 397F/513W/664W, 397F/513Y, 397F/513Y/635W, 397F/513Y/635W/656W, 397F/513Y/635W/664F, 37F/513Y/656H/660W, 397F/635F/660W, 397F/635W, 397F/660W, 397F/664W, 397W, 397W/513F, 397W/513F/635F/656F/660F/664W, 397W/513F/635F/660W, 397W/513F/635W, 397W/513F/660F, 397W/513F/660W, 397W/513F/660Y/664F, 397W/513W, 397W/513W/635F, 397W/513W/635F/656W/660F, 397W/513W/635W, 397W/513W/635W/656Y, 397W/513W/635W/660W, 397W/513W/635W/660W/664Y, 397W/513W/635W/660Y/664Y, 397W/513W/660W, 397W/513W/660W/664Y, 397W/513W/664F, 397W/513W/664W, 397W/513Y/635F, 397W/513Y/635W/656Y/660W/664W, 397W/513Y/635W, 397W/513Y/635W/656Y/664Y, 397W/513Y/635W/660F, 397W/635F, 397W/635F/664F, 397W/635W, 397W/635W/656F/664F, 397W/635W/656F/664W, 397W/635W/656F/664Y, 397W/635W/660W, 397W/635W/660Y, 397W/635W/664F, 397W/635W/664W/850T, 397W/660F/664F, 397W/660F/664Y, 397W/660W, 397W/837K, 397Y, 397Y/513F/635W/656F/660W/664F, 397Y/513F/635W/664W, 397Y/513W/635F/664Y, 397Y/513W/635W/660F, 397Y/513W/656W/660W, 397Y/513Y, 397Y/513Y/635W, 397Y/635F, 397Y/635F/660W, 397Y/635W, 397Y/635W/656F/660Y/664W, 397Y/635W/660F, 397Y/660F/664W, 397Y/664F, 399E/635F/660W, 475V/513W/635W/660Y, 513F, 513F/635F, 513F/635W, 513F/635W/656W, 513F/635W/664W, 513F/660W, 513F/660W/664F, 513F/660W/664Y, 513W, 513W/635F, 513W/635W, 513Y/635F/660F/664Y, 513W/635W/656W/660F, 513W/635W/660F, 513W/635W/664W, 513W/656W/664W, 513W/656Y/660W, 513W/660F, 513W/660W, 513Y/635F, 513Y/635F/664W, 513Y/635R/656F/664Y, 513Y/635W, 513Y/635W/660F, 513Y/635W/660Y, 513Y/635W/660Y/664F, 513Y/660W, 513Y/660W/664W, 513Y/660Y/664F, 513Y/664Y, 635F/656F/664Y, 635F/656Y/664W, 635F/660W/664F, 635W, 635W/656W, 635W/660F, 635W/660W, 635W/664W, 656W/660F/664Y, 656W/660W/664Y, 658P, 660F, 660F/664F, 660F/664Y, 660W/664F, 660Y/664W, 664F и 664W, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из A397F, A397F/D513F, A397F/D513F/S635F, A397F/D513F/S635W, A397F/D513F/S635W/D660W, A397F/D513W/S635W, A397F/D513W/S635W/Q656F/P664F, A397F/D513W/P664W, A397F/D513Y, A397F/D513Y/S635W, A397F/D513Y/S635W/Q656W, A397F/D513Y/S635W/P664F, A397F/D513Y/Q656H/D660W, A397F/S635F/D660W, A397F/S635W, A397F/D660W, A397F/P664W, A397W, A397W/D513F, A397W/D513F/S635F/Q656F/D660F/P664W, A397W/D513F/S635F/D660W, A397W/D513F/S635W, A397W/D513F/D660F, A397W/D513F/D660W, A397W/D513F/D660Y/P664F, A397W/D513W, A397W/D513W/S635F, A397W/D513W/S635F/Q656W/D660F, A397W/D513W/S635W, A397W/D513W/S635W/Q656Y, A397W/D513W/S635W/D660W, A397W/D513W/S635W/D660W/P664Y, A397W/D513W/S635W/D660Y/P664Y, A397W/D513W/D660W, A397W/D513W/P664F, A397W/D513W/D660W/P664Y, A397W/D513W/P664W, A397W/D513Y/S635F, A397W/D513Y/S635W/Q656Y/D660W/P664W, A397W/D513Y/S635W, A397W/D513Y/S635W/Q656Y/P664Y, A397W/D513Y/S635W/D660F, A397W/S635F, A397W/S635F/P664F, A397W/S635W, A397W/S635W/Q656F/P664F, A397W/S635W/Q656F/P664W, A397W/S635W/Q656F/P664Y, A397W/S635W/D660W, A397W/S635W/D660Y, A397W/S635W/P664F, A397W/S635W/P664W/A850T, A397W/D660F/P664F, A397W/D660F/P664Y, A397W/D660W, A397W/E837K, A397Y, A397Y/D513F/S635W/Q656F/D660W/P664F, A397Y/D513F/S635W/P664W, A397Y/D513W/S635F/P664Y, A397Y/D513W/S635W/D660F, A397Y/D513W/Q656W/D660W, A397Y/D513Y, A397Y/D513Y/S635W, A397Y/S635F, A397Y/S635F/D660W, A397Y/S635W, A397Y/S635W/Q656F/D660Y/P664W, A397Y/S635W/D660F, A397Y/D660F/P664W, A397Y/P664F, K399E/S635F/D660W, A475V/D513W/S635W/D660Y, D513F, D513F/S635F, D513F/S635W, D513F/S635W/Q656W, D513F/S635W/P664W, D513F/D660W, D513F/D660W/P664F, D513F/D660W/P664Y, D513W, D513W/S635F, D513W/S635W, D513Y/S635F/D660F/P664Y, D513W/S635W/Q656W/D660F, D513W/S635W/D660F, D513W/S635W/P664W, D513W/Q656W/P664W, D513W/Q656Y/D660W, D513W/D660F, D513W/D660W, D513Y/S635F, D513Y/S635F/P664W, D513Y/S635R/Q656F/P664Y, D513Y/S635W, D513Y/S635W/D660F, D513Y/S635W/D660Y, D513Y/S635W/D660Y/P664F, D513Y/D660W, D513Y/D660W/P664W, D513Y/D660Y/P664F, D513Y/P664Y, S635F/Q656F/P664Y, S635F/Q656Y/P664W, S635F/D660W/P664F, S635W, S635W/Q656W, S635W/D660F, S635W/D660W, S635W/P664W, Q656W/D660F/P664Y, Q656W/D660W/P664Y, L658P, D660F, D660F/P664F, D660F/P664Y, D660W/P664F, D660Y/P664W, P664F/W и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 4. [10] In some embodiments, engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397, 397/513, 397/513/635, 397/513/635, 397/513/635/656, 397/513/635/656/660, 397/513/635/656/660/664, 397/513/635/656/664 397/513/635/664, 397/513/656/660, 397/513/660, 397/513/660/664 397/635/656/664 397/635/660 397/635/664 397/635/664/850 397/660 397/664 397/660/664 399/635/660 475/513/635/660 513 513/635 513/635/656 513/635/656/660 513/635/656/664 513/635/660 513/ 635/660/664 513/635/664 513/656/660 513/656/664 513/660 513/660/664 513/664 635 635/660, 635/660/664, 635/664, 656/660/664, 658, 660, 660/664 and 664, and/or any combination thereof, where the amino acid positions are numbered according to SEQ ID NO: 4. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 397F, 397F/513F, 397F/513F/635F, 397F/513F/635W, 397F/513F/635W/660W, 397F/ 397F/513Y/635W, 397F/513Y/635W/656W, 397F/513Y/635W/664F, 397F/513Y/635W/664F, 37F/513Y/ 397F/664W, 397W/513F, 397W/513F/635F/656F/660F/664W, 397W/513F/635 F/660W, 397W/ 397W/513W/635F, 397W/513W/635F/656W/660F, 397W /513W/635W, 397W/513W/635W/656Y, 397W/513W/635W/660W, 397W/513W/635W/660W/664Y 60W/664Y 397W/513W/664F, 397W/513W/664W, 397W/513Y/635F, 397W/513Y/635W/656Y/660W/664W 397W/513Y/ 397W/635W/656F/664W, 397W/635W/656F/664Y, 397W/635W /660W, 397W/ 635W/660Y, 397W/635W/664F, 397W/635W/664W/850T, 397W/660F/664F, 397W/660F/664Y, 397W/660W, 397W/837K W/656F/660W/ 664F 397Y/513F/635W/664W 397Y/513W/635F/664Y 397Y/513W/635W/660F /635F, 397Y/ 635F/660W 397Y/635W 397Y/635W/656F/660Y/664W 397Y/635W/660F 397Y/660F/664W /660Y, 513F, 513F/635F 513F/635W 513F/635W/656W 513F/635W/664W 513F/660W 513F/660W/664F 513F/660W/664Y 513W 513W/635F 513W/63 5W, 513Y/635F/ 660F/664Y 513W/635W/656W/660F 513W/635W/660F 513W/635W/664W 513W/656W/664W 513W/656Y/660W 513W/660F 513W/660W Y/635F, 513Y/ 513Y/635W/660Y, 513Y/635W/660Y/664F, 513Y/660W, 513Y/660W/664W , 513Y/660Y/ 664F, 513Y/664Y, 635F/656F/664Y, 635F/656Y/664W 60F/664Y, 656W/ 660W/664Y, 658P, 660F, 660F/664F, 660F/664Y, 660W/664F, 660Y/664W, 664F and 664W, and/or any combination thereof, where the amino acid positions are numbered according to SEQ ID NO: 4. In some in additional embodiments, engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from A397F, A397F/D513F, A397F/D513F/S635F, A397F/D513F/S635W, A397F/D513F/S635W/D660W, A397F/D513W/ A397F/D513Y/S635W, A397F/D513Y/S635W, A397F/D513Y/S635W/Q656W, A397F/D513Y/S6 35W/P664F, A397F/D513Y/Q656H/ A397W/D513F/S635F/Q656F/D660F/P664W, A397W/D5 13F/S635F/D660W, A397W/D513F/ S635W A397W/D513F/D660F A397W/D513F/D660W A397W/D513F/D660Y/P664F A397W/D513W A397W/D513W/S635F 60F, A397W/D513W/S635W, A397W/ A397W/D513W/S635W/D660W/P664Y, A397W/D513W/S635W/D660Y/P664Y, A397W/D513W/D660W, A3 97W/D513W/P664F, A397W/D513W/ A397W/D513Y/S635W/Q656Y/D660W/P664W, A397W/D513Y/S635W, A397W/D513Y/S635W/Q6 56Y/P664Y, A397W/D513Y/S635W/ A397W/S635W/Q656F/P664F, A397W/S635W/Q656F/P664W, A397W/S635W/Q656F/P664Y, A3 97W/S635W/D660W, A397W/S635W/ A397W/D660F/P664Y, A397W/D660W, A397W/E837K, A397Y, A397Y/D5 13F/S635W/Q656F/D660W/P664F, A397Y/D513F/S635W/P664W A397Y/D513W/S635F/P664Y A397Y/D513W/S635W/D660F 35W, A397Y/S635F, A397Y/S635F/ A397Y/D660F/P664W, A397Y/P664F, K399E/S635F/D660W, A475V/D5 13W/S635W/D660Y, D513F, D513F/ S635F D513F/S635W D513F/S635W/Q656W D513F/S635W/P664W D513F/D660W D513F/D660W/P664F D513F/D660W/P664Y D513W D513W/S635F D5 13W/S635W, D513Y/S635F/D660F/ D513W/S635W/P664W, D513W/Q656W/P664W, D513W/Q656Y/D660W, D513W/D660F, D513W/D6 60W, D513Y/S635F, D513Y/S635F/ P664W D513Y/S635R/Q656F/P664Y D513Y/S635W D513Y/S635W/D660F D513Y/S635W/D660Y D513Y/S635W/D660Y/P664F D513Y/D660W D513Y/D6 60W/P664W, D513Y/D660Y/P664F, D513Y/P664Y, S635F/Q656F/P664Y, S635F/Q656Y/P664W, S635F/D660W/P664F, S635W, S635W/Q656W, S635W/D660F, S635W/D660W, S635W/P664W, Q6 56W/D660F/P664Y, Q656W/D660W/ P664Y, L658P, D660F, D660F/P664F, D660F/P664Y, D660W/P664F, D660Y/P664W, P664F/W and/or any combination thereof, where amino acid positions are numbered according to SEQ ID NO: 4.

[11] В некоторых вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 113/137/513, 136/357/404/514, 136/357/514, 136/394/404/446, 136/401, 136/401/404, 136/404/446, 136/404/514, 136/446, 136/514, 137, 137/401, 137/401/513, 137/401/513, 137/513, 137/513/621, 137/635, 137/656, 357/394/401/404/514, 357/394/446/514, 357/514, 394/446/514, 401/404, 401/404/514, 401/513/635, 401/635, 513/635, 513/635/656, 513/660, 635/656, 635/660 и 660, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. В некоторых других вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из 113M/137W/513R,136E/357I/404Y/514I, 136I/357I/514F, 136I/357K/514F, 136I/394R/404Y/446W, 136I/401V, 136I/401V/404Y, 136E/404Y/446W, 136E/404Y/514F, 136I/446W, 136E/514F, 136I/514I, 137W, 137W/401I, 137W/401S, 137W/401S/513R, 137W/401S/513W, 137W/401V, 137W/513W, 137W/513R/621R, 137W/635W, 137W/656F, 357N/394R/446W/514I, 357R/394R/401V/404Y/514L, 357R/514F, 394R/446W/514I, 401S/513R/635W, 401S/635W, 401V/404Y, 401V/404Y/514L, 513L/635W, 513L/660W, 513R/635W/656F, 635W/656F, 635W/660T и 660S/T, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат по меньшей мере одну замену или набор замен, которые выбраны из L113M/D137W/D513R, A136E/E357I/S404Y/S514I, A136E/S404Y/M446W, A136E/S404Y/S514F, A136E/S514F, A136I/E357I/S514F, A136I/E357K/S514F, A136I/K394R/S404Y/M446W, A136I/R401V, A136I/R401V/S404Y, A136I/M446W, A136I/S514I, D137W, D137W/R401I, D137W/R401S, D137W/R401S/D513R, D137W/R401S/D513W, D137W/R401V, D137W/D513W, D137W/D513R/K621R, D137W/S635W, D137W/Q656F, E357N/K394R/M446W/S514I, E357R/K394R/R401V/S404Y/S514L, E357R/S514F, K394R/M446W/S514I, R401S/D513R/S635W, R401S/S635W, R401V/S404Y, R401V/S404Y/S514L, D513L/S635W, D513L/D660W, D513R/S635W/Q656F, S635W/Q656F, S635W/D660T и D660S/T, и/или любых их комбинаций, где положения аминокислот пронумерованы в соответствии с SEQ ID NO: 15. [11] In some embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 113/137/513, 136/357/404/514, 136/357/514, 136/394/404/ 446 136/401 136/401/404 136/404/446 136/404/514 136/446 136/514 137 137/401 137/401/513 137/513 137/513/621 137/635 137/656 357/394/401/404/514 357/394/446/514 357/514 394/446/514 401/404/514, 401/513/635, 401/635, 513/635, 513/635/656, 513/660, 635/656, 635/660 and 660, and/or any combination thereof, where the amino acid positions numbered according to SEQ ID NO: 15. In some other embodiments, the engineered RNA polymerases contain at least one substitution or set of substitutions that are selected from 113M/137W/513R,136E/357I/404Y/514I, 136I/357I/ 136I/401V/404Y, 136I/404Y/446W, 136E/404Y/514F, 136I/446W, 136E/514 F, 136I/514I, 137W 137W/401I 137W/401S 137W/401S/513R 137W/401S/513W 137W/401V 137W/513W 57N/394R/446W/ 401S/513R/635W, 401S/635W, 401V/404Y, 401V/404Y/514L, 513L/635 W, 513L/660W, 513R/635W/656F, 635W/656F, 635W/660T, and 660S/T, and/or any combination thereof, wherein the amino acid positions are numbered according to SEQ ID NO: 15. In some additional embodiments, the engineered RNA polymerases comprise at least at least one replacement or a set of replacements that are selected from L113M/D137W/D513R, A136E/E357I/S404Y/S514I, A136E/S404Y/M446W, A136E/S404Y/S514F, A136E/S514F, A136I/E357I/S514F, A1 36I/E357K/ S514F A136I/K394R/S404Y/M446W A136I/R401V A136I/R401V/S404Y A136I/M446W A136I/S514I D137W D137W/R401I D137W/R401S 01S/D513R, D137W/R401S/D513W, D137W/R401V, D137W/D513W, D137W/D513R/K621R, D137W/S635W, D137W/Q656F, E357N/K394R/M446W/S514I, E357R/K394R/R401V/S404Y/S514L, E3 57R/S514F, K394R/M446W/S514I, R401S/D513R/S635W, R401S/S635W, R401V/S404Y, R401V/S404Y/S514L, D513L/S635W, D513L/D660W, D513R/S635W/Q656F, S635W/Q656F, S635W/D6 60T and D660S/T, and/or any combinations thereof, where the amino acid positions are numbered according to SEQ ID NO: 15.

[12] В некоторых дополнительных вариантах осуществления сконструированные РНК-полимеразы содержат полипептидные последовательности, по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичные последовательности по меньшей мере одного варианта сконструированной РНК-полимеразы, указанного в таблице 5.3, 5.4, 5.5 и/или 5.6. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза представляет собой вариант сконструированной полимеразы, представленный в таблице 5.3, 5.4, 5.5 и/или 5.6. [12] In some additional embodiments, the engineered RNA polymerases contain polypeptide sequences of at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identical to at least one engineered RNA polymerase variant listed in Table 5.3, 5.4, 5.5 and/or 5.6. In some additional embodiments, the engineered RNA polymerase is the engineered polymerase variant shown in Table 5.3, 5.4, 5.5, and/or 5.6.

[13] В следующих дополнительных вариантах осуществления сконструированная РНК-полимераза содержит полипептидную последовательность, которая по меньшей мере на 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентична последовательности по меньшей мере одного варианта сконструированной РНК-полимеразы, указанного в SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и/или 39. В некоторых других вариантах осуществления сконструированная РНК-полимераза представляет собой вариант сконструированной полимеразы, указанный в SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 или 39. [13] In the following additional embodiments, the engineered RNA polymerase contains a polypeptide sequence that is at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , 99% or more identical to the sequence of at least one variant of the engineered RNA polymerase specified in SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and/ or 39. In some other embodiments, the engineered RNA polymerase is the engineered polymerase variant set forth in SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, or 39.

[14] В некоторых других вариантах осуществления сконструированная полимераза имеет по меньшей мере одно улучшенное свойство по сравнению с РНК-полимеразой T7 дикого типа. В некоторых следующих вариантах осуществления сконструированная РНК-полимераза демонстрирует по меньшей мере одно улучшенное свойство, выбранное из увеличенной селективности в отношении аналога кэпа относительно GTP в ходе инициации транскрипции, увеличенной экспрессии белка, увеличенной стабильности в буфере для хранения и увеличенной стабильности в условиях реакции. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза сохраняет выход РНК, точность транскрипции, термостабильность, экспрессию белка, стабильность при -20°C или стабильность в условиях реакции, эквивалентных РНК-полимеразе T7 дикого типа. В некоторых дополнительных вариантах осуществления сконструированная РНК-полимераза является очищенной. В некоторых других вариантах осуществления настоящее изобретение относится к композициям, содержащим по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании. [14] In some other embodiments, the engineered polymerase has at least one improved property over wild-type T7 RNA polymerase. In some of the following embodiments, the engineered RNA polymerase exhibits at least one improved property selected from increased cap analog selectivity for GTP during transcription initiation, increased protein expression, increased stability in storage buffer, and increased stability under reaction conditions. In some additional embodiments, the engineered RNA polymerase retains RNA yield, transcriptional fidelity, thermal stability, protein expression, stability at -20°C, or stability under reaction conditions equivalent to wild-type T7 RNA polymerase. In some additional embodiments, the engineered RNA polymerase is purified. In some other embodiments, the implementation of the present invention relates to compositions containing at least one engineered RNA polymerase described in the present description.

[15] Настоящее изобретение также относится к полинуклеотидным последовательностям, кодирующим по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании. В некоторых вариантах осуществления полинуклеотидные последовательности, кодирующие по меньшей мере одну сконструированную РНК-полимеразу, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, или их функциональным фрагментом, где сконструированная РНК-полимераза содержит по меньшей мере одну замену по меньшей мере в одном или более положениях аминокислот. В некоторых следующих вариантах осуществления полинуклеотидные последовательности, кодирующие сконструированные РНК-полимеразы, описанные в настоящем описании, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и/или 39, или их функциональным фрагментом. В некоторых следующих вариантах осуществления полинуклеотидные последовательности, кодирующие по меньшей мере одну сконструированную РНК-полимеразу, обладают по меньшей мере 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и/или 38. В некоторых дополнительных вариантах осуществления полинуклеотидные последовательности функционально связаны с контрольной последовательностью. В некоторых других вариантах осуществления полинуклеотидные последовательности являются кодон-оптимизированными. [15] The present invention also relates to polynucleotide sequences encoding at least one engineered RNA polymerase described in the present description. In some embodiments, polynucleotide sequences encoding at least one engineered RNA polymerase have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% , 99% or more sequence identity with the reference sequence SEQ ID NO: 4 and/or 15, or a functional fragment thereof, where the designed RNA polymerase contains at least one substitution in at least one or more amino acid positions. In some of the following embodiments, the polynucleotide sequences encoding the engineered RNA polymerases described herein have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity with SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and/or 39, or a functional fragment thereof. In some of the following embodiments, polynucleotide sequences encoding at least one engineered RNA polymerase have at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98 %, 99% or more sequence identity with SEQ ID NOs: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, and/or 38. In some further embodiments, polynucleotide sequences functionally linked to the control sequence. In some other embodiments, the polynucleotide sequences are codon-optimized.

[16] Настоящее изобретение также относится к экспрессирующим векторам, содержащим по меньшей мере одну полинуклеотидную последовательность, описанную в настоящем описании. Кроме того, настоящее изобретение относится к клеткам-хозяевам, содержащим по меньшей мере один экспрессирующий вектор, описанный в настоящем описании. Настоящее изобретение также относится к способам продуцирования сконструированной РНК-полимеразы в клетке-хозяине, включающим культивирование клетки-хозяина, описанной в настоящем описании, в подходящих условиях культивирования, чтобы продуцировалась по меньшей мере одна сконструированная РНК-полимераза. В некоторых вариантах осуществления способы дополнительно включают выделение по меньшей мере одной сконструированной РНК-полимеразы из культуры и/или клетки-хозяина. В некоторых дополнительных вариантах осуществления способы дополнительно включают стадию очистки по меньшей мере одной сконструированной РНК-полимеразы. [16] The present invention also relates to expression vectors containing at least one polynucleotide sequence described in the present description. In addition, the present invention relates to host cells containing at least one expression vector described in the present description. The present invention also provides methods for producing an engineered RNA polymerase in a host cell, comprising culturing the host cell described herein under suitable culture conditions such that at least one engineered RNA polymerase is produced. In some embodiments, the methods further comprise isolating at least one engineered RNA polymerase from a culture and/or host cell. In some additional embodiments, the methods further include the step of purifying at least one engineered RNA polymerase.

[17] Настоящее изобретение также относится к способам продуцирования кэпированных РНК-транскриптов, включающим предоставление композиции, содержащей: i) по меньшей мере одну сконструированную РНК-полимеразу, описанную в настоящем описании, динуклеотидный аналог кэпа, и ii) ДНК-матрицу; воздействие на ДНК-матрицу композиции в таких условиях, чтобы сконструированная РНК-полимераза продуцировала кэпированный РНК-транскрипт. В некоторых вариантах осуществления способов, динуклеотидный аналог кэпа представляет собой альфа, гамма-бис(N7-метилгуанозин)трифосфат (m7G(5')ppp(5')m7G) или антиреверсный аналог кэпа 3'-O-Me-m⁷G(5')ppp(5')G. В некоторых других вариантах осуществления способов динуклеотидный аналог кэпа представляет собой альфа, гамма-бис(N7-метилгуанозин)трифосфат. В некоторых дополнительных вариантах осуществления способов в реакционную смесь добавляют неорганическую пирофосфатазу. [17] The present invention also provides methods for producing capped RNA transcripts, comprising providing a composition comprising: i) at least one engineered RNA polymerase described herein, a cap dinucleotide analog, and ii) a DNA template; exposing the DNA template to the composition under such conditions that the engineered RNA polymerase produces a capped RNA transcript. In some embodiments of the methods, the dinucleotide cap analog is alpha, gamma-bis(N7-methylguanosine) triphosphate (m7G(5')ppp(5')m7G) or anti-reverse cap analog 3'-O-Me-m ⁷ G( 5')ppp(5')G. In some other embodiments of the methods, the dinucleotide analog of the cap is alpha,gamma-bis(N7-methylguanosine)triphosphate. In some additional embodiments of the methods, an inorganic pyrophosphatase is added to the reaction mixture.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

[18] На фиг.1 представлена химическая структура "m7G(5')ppp(5')m7G", также обозначаемого как "альфа, гамма-бис(N7-метилгуанозин)трифосфат", "кэпированный GTP", "симметричный аналог кэпа" или "кэп". [18] Figure 1 shows the chemical structure of "m7G(5')ppp(5')m7G", also referred to as "alpha, gamma-bis(N7-methylguanosine)triphosphate", "capped GTP", "symmetrical cap analog " or "cap".

ОПИСАНИЕ ИЗОБРЕТЕНИЯDESCRIPTION OF THE INVENTION

[19] Настоящее изобретение относится сконструированным вариантам РНК-полимеразы T7 и их композициям. Эти варианты изменены для селективного включения аналога кэпа m7G(5')ppp(5')m7G относительно GTP при инициации транскрипции in vitro. Настоящее изобретение также относится к способам применения вариантов, описанных в настоящем описании. Кроме того, настоящее изобретение относится к композициям, описанным в настоящем описании. Настоящее изобретение относится к композициям и способам для эффективного получения кэпированной РНК. Большинство мРНК-транскриптов эукариотических клеток и большинство мРНК-транскриптов вирусов эукариот, а также другие формы эукариотический РНК (например, малая ядреная РНК [мяРНК] и пре-микроРНК [пре-мкРНК]) блокированы или "кэпированы" на их 5'-концах (см., например, патент США №8846348, включенный в настоящее описание в качестве ссылки в полном объеме). Кэп представляет собой гуаниновый нуклеозид, который связан через его 5'-углерод с трифосфатной группой, которая связана с 5'-углеродом самого крайнего 5'-нуклеотида первичного мРНК-транскрипта. В большинстве эукариот азот в 7 положении гуанина в нуклеотиде кэпа является метилированным. [19] The present invention relates to engineered variants of T7 RNA polymerase and compositions thereof. These variants are modified to selectively include the m7G(5')ppp(5')m7G cap analog relative to GTP upon in vitro transcription initiation. The present invention also relates to methods of using the options described in the present description. In addition, the present invention relates to the compositions described in the present description. The present invention relates to compositions and methods for the efficient production of capped RNA. Most mRNA transcripts of eukaryotic cells and most mRNA transcripts of eukaryotic viruses, as well as other forms of eukaryotic RNA (for example, small nuclear RNA [snRNA] and pre-miRNA [pre-miRNA]) are blocked or "capped" at their 5' ends (See, for example, US patent No. 8846348, included in the present description by reference in its entirety). The cap is a guanine nucleoside that is linked through its 5' carbon to a triphosphate group that is linked to the 5' carbon of the outermost 5' nucleotide of the primary mRNA transcript. In most eukaryotes, the nitrogen at position 7 of the guanine in the cap nucleotide is methylated.

[20] 5'-кэпы этих молекул РНК играют важные роли в стабильности и процессинге РНК. Кэп играет очень важную роль в метаболизме мРНК и требуется для процессинга и созревания РНК-транскриптов в ядре, транспорта мРНК из ядра в цитоплазму, стабильности мРНК и эффективной трансляции мРНК в белок (см., например, Lewis et al., Eur. J. Biochem., 247:461-9 [1997].). Структура 5'-кэпа вовлечена в инициацию синтеза белка эукариотических и вирусных мРНК. 5'-кэп также обеспечивает резистентность к 5'-экзонуклеазной активности и его отсутствие приводит к быстрой деградации мРНК (см., например, патент США №8836348; и Furiichi et al., Nat., 266:235-9 [1997]). Вследствие преимуществ, обеспечиваемых кэпированием, эффективный синтез кэпированных РНК-транскриптов имеет большое значение для различных функций, включая, но не ограничиваясь ими, синтез белков in vitro и in vivo. [20] The 5' caps of these RNA molecules play important roles in the stability and processing of RNA. The cap plays a very important role in mRNA metabolism and is required for the processing and maturation of RNA transcripts in the nucleus, transport of mRNA from the nucleus to the cytoplasm, mRNA stability, and efficient translation of mRNA into protein (see, e.g., Lewis et al., Eur. J. Biochem., 247:461-9 [1997].). The 5'-cap structure is involved in the initiation of protein synthesis of eukaryotic and viral mRNAs. The 5'-cap also provides resistance to 5'-exonuclease activity and its absence leads to rapid mRNA degradation (see, for example, US patent No. 8836348; and Furiichi et al., Nat., 266:235-9 [1997]) . Because of the benefits provided by capping, the efficient synthesis of capped RNA transcripts is of great importance for various functions, including, but not limited to, in vitro and in vivo protein synthesis.

[21] Синтез in vitro кэпированной РНК практически можно проводить посредством одного из двух ферментативных путей. Кэпирующий фермент вируса коровьей оспы имеет две субъединицы и три вида ферментативной активности, которые присоединяют структуру 7-метилгуанозинового кэпа к 5'-фосфату транскрибируемой in vitro РНК (см., Mao and Shuman, J. Biol. Chem., 269:24472-9 [1994]). [21]Synthesis in vitro capped RNA can practically be carried out via one of two enzymatic pathways. The vaccinia capping enzyme has two subunits and three enzyme activities that attach the 7-methylguanosine cap structure to the 5'-phosphate of the transcribedin vitro RNA (see, Mao and Shuman, J. Biol. Chem., 269:24472-9 [1994]).

[22] Альтернативным способом синтеза in vitro кэпированной РНК является встраивание структуры кэпа в ходе транскрипции in vitro с использованием аналога кэпа. Эти 7-метилгуанозин-содержащие динуклеотиды содержат 5'-5'-трифосфатную связь и включаются в участок инициации транскрипции, что приводит к кэпированному 7-метилгуанозином РНК-продукту. РНК-полимераза T7 естественным образом инициирует транскрипцию включением гуанозина напротив остатка цитозина на матрице. Для достижения высокой эффективности кэпирования аналог гуанозинового кэпа должен присутствовать в реакции транскрипции in vitro в высокой концентрации относительно GTP, с которым он конкурирует за включение в первое положение мРНК. Одним полезным признаком котранскрипционного кэпирования in vitro является то, что, поскольку встраивание кэпа достигается в ходе инициации, конечная последовательность или вторичная структура полноразмерной мРНК не влияет на степень кэпирования. Кроме того, этот процесс требует использования только одного фермента (РНК-полимераза) в одностадийной реакции. Использование химически синтезированного аналога кэпа также повышает адаптируемость к использованию альтернативных структур нуклеотидных кэпов, которые не являются хорошо распознаваемыми для метилирования кэпирующим ферментом коровьей оспы. Однако аналог кэпа является дорогостоящим относительно нуклеотидов и других компонентов реакции и должен присутствовать в реакционной смеси в высокой концентрации. Настоящее изобретение относится к вариантам РНК-полимеразы T7, которые являются селективными в отношении включении аналогов кэпа относительно GTP при инициации транскрипции для обеспечения эффективного кэпирования при использовании сниженной концентрации аналога кэпа, обеспечивающей более экономичный и масштабируемый процесс продуцирования кэпированной РНК. [22] An alternative method for in vitro synthesis of capped RNA is the insertion of a cap structure during in vitro transcription using a cap analog. These 7-methylguanosine-containing dinucleotides contain a 5'-5'-triphosphate bond and are incorporated into the transcription initiation site, resulting in a 7-methylguanosine-capped RNA product. T7 RNA polymerase naturally initiates transcription by incorporating a guanosine opposite a cytosine residue on the template. To achieve high capping efficiency, the guanosine cap analog must be present in the in vitro transcription reaction at a high concentration relative to GTP, with which it competes for incorporation into the first position of the mRNA. One useful feature of in vitro co-transcriptional capping is that since cap insertion is achieved during initiation, the final sequence or secondary structure of the full-length mRNA does not affect the degree of capping. In addition, this process requires the use of only one enzyme (RNA polymerase) in a one-step reaction. The use of a chemically synthesized cap analog also increases adaptability to the use of alternative nucleotide cap structures that are not well recognized for methylation by the vaccinia capping enzyme. However, the cap analog is expensive relative to nucleotides and other reaction components and must be present in the reaction mixture at a high concentration. The present invention relates to variants of T7 RNA polymerase that are selective for incorporation of cap analogs over GTP at transcription initiation to allow for efficient capping at a reduced concentration of the cap analog, allowing for a more economical and scalable production of capped RNA.

[23] В некоторых вариантах осуществления изобретения неорганическая пирофосфатаза присутствует в ходе реакции транскрипции in vitro для деградации пирофосфата, ингибитора продукта транскрипции РНК-полимеразой, в ортофосфат. [23] In some embodiments, an inorganic pyrophosphatase is present during the in vitro transcription reaction to degrade pyrophosphate, an RNA polymerase transcription product inhibitor, into orthophosphate.

Сокращенные обозначения и определения:Abbreviations and definitions:

[24] Если не определено иначе, все технические и научные термины, используемые в настоящем описании, как правило обладают тем же значением, которое обычно подразумевает средний специалист в области, к которой настоящее изобретение относится. Как правило, номенклатура, используемая в настоящем описании, и лабораторные методики культивирования клеток, молекулярной генетики, микробиологии, биохимии, органической химии, аналитической химии и химии нуклеиновых кислот, описанные ниже, представляют собой номенклатуру и методики, хорошо известные и часто используемые в данной области. Такие способы хорошо известны и описаны в многочисленных пособиях и справочниках, хорошо известных специалистам в данной области. Для химического синтеза и химического анализа используются стандартные способы или их модификации. Все патенты, патентные заявки, статьи и публикации, упомянутые в настоящем описании, как выше, так и ниже, включены в настоящее описание в качестве ссылки в полном объеме. [24] Unless otherwise defined, all technical and scientific terms used in the present description, as a rule, have the same meaning, which usually means the average specialist in the field to which the present invention relates. In general, the nomenclature used herein and the cell culture, molecular genetics, microbiology, biochemistry, organic chemistry, analytical chemistry, and nucleic acid chemistry laboratory techniques described below are nomenclature and techniques well known and commonly used in the art. . Such methods are well known and are described in numerous manuals and reference books well known to those skilled in the art. For chemical synthesis and chemical analysis, standard methods or their modifications are used. All patents, patent applications, articles and publications mentioned in the present description, both above and below, are incorporated herein by reference in their entirety.

[25] Хотя для применения настоящего изобретения на практике применимы любые подходящие способы и материалы, сходные или эквивалентные тем, что описаны в настоящем описании, некоторые способы и материалы описаны в настоящем описании. Следует понимать, что настоящее изобретение не ограничивается конкретной описанной методологией, протоколами и реагентами, поскольку они могут варьироваться в зависимости от контекста, в котором они используются специалистами в данной области. Таким образом, термины, определенные непосредственно ниже, более полно описаны посредством заявки в целом. Все патенты, патентные заявки, статьи и публикации, упомянутые в настоящем описании, как выше, так и ниже, включены в настоящее описание в качестве ссылок в полном объеме. [25] Although any suitable methods and materials similar or equivalent to those described in the present description are applicable for the practice of the present invention, some methods and materials are described in the present description. It should be understood that the present invention is not limited to the specific methodology, protocols, and reagents described, as they may vary depending on the context in which they are used by those skilled in the art. Thus, the terms defined immediately below are more fully described by the application as a whole. All patents, patent applications, articles and publications mentioned in the present description, both above and below, are incorporated herein by reference in their entirety.

[26] Так же, как используют в рамках изобретения, форма единственного числа включает форму множественного числа упоминаемых объектов, если контекст явно не указывает на иное. [26] As used herein, the singular form includes the plural form of the entities referred to, unless the context clearly indicates otherwise.

[27] Числовые диапазоны являются охватывающими числа, определяющие диапазон. Таким образом, каждый числовой диапазон, описанный в настоящем описании, охватывает каждый более узкий числовой диапазон, который входит в такой более широкий числовой диапазон, как если бы все такие более узкие числовые диапазоны были прямо указаны в настоящем описании. Также подразумевается, что каждое максимальное (или минимальное) числовое ограничение, описанное в настоящем описании, включает каждое более низкое (или более высокое) числовое ограничение, как если бы такие более низкие (или более высокие) числовые ограничения были прямо указаны в настоящем описании. [27] Numerical ranges are enclosing the numbers that define the range. Thus, each numerical range described herein encompasses every narrower numerical range that falls within such broader numerical range, as if all such narrower numerical ranges were expressly stated herein. Each maximum (or minimum) numeric limit described herein is also intended to include every lower (or higher) numeric limit, as if such lower (or higher) numeric limit were expressly stated herein.

[28] Термин "приблизительно" означает допустимую погрешность конкретной величины. В некоторых случаях "приблизительно" означает в пределах 0,05%, 0,5%, 1,0% или 2,0% от данного числового диапазона. В некоторых случаях "приблизительно" означает в пределах 1, 2, 3 или 4 стандартных отклонений от данной величины. [28] The term "approximately" means the allowable error of a particular value. In some cases, "about" means within 0.05%, 0.5%, 1.0%, or 2.0% of a given numerical range. In some cases, "about" means within 1, 2, 3, or 4 standard deviations of a given value.

[29] Более того, заголовки, приведенные в настоящем описании, не являются ограничением различных аспектов или вариантов осуществления изобретения, которые могут быть отнесены к заявке в целом. [29] Moreover, the headings given in the present description are not intended to limit the various aspects or embodiments of the invention that may be referred to the application as a whole.

[30] Таким образом, термины, определенные непосредственно ниже, более полно определяются рассмотрением заявки в целом. Тем не менее для облегчения понимания изобретения ряд терминов определен ниже. [30] Thus, the terms defined immediately below are more fully defined by consideration of the application as a whole. However, to facilitate understanding of the invention, a number of terms are defined below.

[31] Если нет иных указаний, нуклеиновые кислоты приводятся слева направо в ориентации от 5' к 3'; аминокислотные последовательности приводятся слева направо в ориентации от амино к карбокси, соответственно. [31] Unless otherwise indicated, nucleic acids are listed from left to right in a 5' to 3'orientation; amino acid sequences are given from left to right in the amino to carboxy orientation, respectively.

[32] Как используют в рамках изобретения, термин "содержащий" и родственные ему термины используются в их включающем значении (т.е. эквивалентно термину "включающий" и его соответствующим родственным терминам). [32] As used herein, the term "comprising" and related terms are used in their inclusive meaning (ie , equivalent to the term "including" and its corresponding related terms).

[33] Номер "EC" относится к Номенклатуре фермента Комитета по номенклатуре Международного союза биохимии и молекулярной биологии (NC-IUBMB). Биохимическая классификация IUBMB представляет собой систему числовой классификации для ферментов на основе химических реакций, которые они катализируют. [33] The "EC" number refers to the Enzyme Nomenclature of the Committee on Nomenclature of the International Union of Biochemistry and Molecular Biology (NC-IUBMB). The IUBMB biochemical classification is a numerical classification system for enzymes based on the chemical reactions they catalyze.

[34] "ATCC" относится к Американской коллекции типовых культур, чье хранилище биологических материалов включает гены и штаммы. [34] "ATCC" refers to the American Type Culture Collection, whose repository of biological materials includes genes and strains.

[35] "NCBI" относится к Национальному центру биологической информации и базам данных, представленным в нем. [35] "NCBI" refers to the National Center for Biological Information and the databases provided therein.

[36] Как используют в рамках изобретения, "РНК-полимераза T7" относится к мономерной кодируемой бактериофагом T7 ДНК-направляемой РНК-полимеразе, которая катализирует образование РНК в направлении от 5' к 3'. [36] As used herein, "T7 RNA polymerase" refers to a monomeric bacteriophage T7-encoded DNA-directed RNA polymerase that catalyzes the formation of RNA in the 5' to 3' direction.

[37] Как используют в рамках изобретения, термин "кэп" относится к гуаниновому нуклеозиду, который связан через его 5'-углерод с трифосфатной группой, которая в свою очередь связана с 5'-углеродов самого крайнего 5'-нуклеотида мРНК-транскрипта. В некоторых вариантах осуществления азот в положении 7 гуанина в кэпе является метилированным. [37] As used herein, the term "cap" refers to a guanine nucleoside that is linked through its 5' carbon to a triphosphate group, which in turn is linked to the 5' carbons of the outermost 5' nucleotide of an mRNA transcript. In some embodiments, the nitrogen at position 7 of the guanine in the cap is methylated.

[38] Как используют в рамках изобретения, термины "кэпированная РНК", "5'-кэпированная РНК" и "кэпированная мРНК" относятся к РНК и мРНК, соответственно, которые содержат кэп. [38] As used herein, the terms "capped RNA", "5'-capped RNA" and "capped mRNA" refer to RNA and mRNA, respectively, that contain a cap.

[39] Как используют в рамках изобретения, "полинуклеотид" и "нуклеиновая кислота" относятся к двум или более нуклеозидам, которые ковалентно связаны друг с другом. Полинуклеотид может полностью состоять из рибонуклеотидов (т.е. РНК), полностью состоять из 2'-дезоксирибонуклеотидов (т.е. ДНК) или состоять из смесей рибо- и 2'-дезоксирибонуклеотидов. В то время как нуклеозиды, как правило, связаны между собой стандартными фосфодиэфирными связями, полинуклеотиды могут включать одну или более нестандартных связей. Полинуклеотид может быть одноцепочечным или двухцепочечным, или может включать как одноцепочечные области, так и двухцепочечные области. Более того, в то время как полинуклеотид обычно состоит из встречающихся в природе кодирующих нуклеиновых оснований (т.е. аденин, гуанин, урацил, тимин и цитозин), он может включать одно или более модифицированных и/или синтетических нуклеиновых оснований, например, таких как инозин, ксантин, гипоксантин и т.д. В некоторых вариантах осуществления такие модифицированные или синтетические нуклеиновые основания представляют собой нуклеиновые основания, кодирующие аминокислотные последовательности. [39] As used herein, "polynucleotide" and "nucleic acid" refer to two or more nucleosides that are covalently linked to each other. A polynucleotide may be composed entirely of ribonucleotides (ie RNA), entirely composed of 2'-deoxyribonucleotides (ie DNA), or composed of mixtures of ribo- and 2'-deoxyribonucleotides. While nucleosides are typically linked together by standard phosphodiester bonds, polynucleotides may include one or more non-standard bonds. The polynucleotide may be single-stranded or double-stranded, or may include both single-stranded regions and double-stranded regions. Moreover, while a polynucleotide typically consists of naturally occurring coding nucleobases (i.e., adenine, guanine, uracil, thymine, and cytosine), it may include one or more modified and/or synthetic nucleobases, such as like inosine, xanthine, hypoxanthine, etc. In some embodiments, such modified or synthetic nucleobases are nucleobases encoding amino acid sequences.

[40] "Белок", "полипептид" и "пептид" используются в настоящем описании взаимозаменяемо для обозначения полимера по меньшей мере из двух аминокислот, ковалентно связанных амидной связью, независимо от длины и посттрансляционной модификации (например, гликозилирование или фосфорилирование). [40] "Protein", "polypeptide" and "peptide" are used interchangeably herein to refer to a polymer of at least two amino acids covalently linked by an amide bond, regardless of length and post-translational modification (eg, glycosylation or phosphorylation).

[41] "Аминокислоты" обозначаются в настоящем описании посредством либо их широко известных трехбуквенных обозначений, либо посредством однобуквенных обозначений, рекомендованных Комиссией по биохимической номенклатуре IUPAC-IUB. Нуклеотиды, аналогично, могут обозначаться их общепринятыми однобуквенными кодами. [41] "Amino acids" are referred to herein by either their commonly known three-letter designations or by the one-letter designations recommended by the IUPAC-IUB Commission on Biochemical Nomenclature. Nucleotides, likewise, may be referred to by their common single-letter codes.

[42] Сокращения, используемые для генетически кодируемых аминокислот, являются общепринятыми и таковы: аланин (Ala или A), аргинин (Are или R), аспарагин (Asn или N), аспартат (Asp или D), цистеин (Cys или C), глутамат (Glu или E), глутамин (Gln или Q), гистидин (His или H), изолейцин (Ile или I), лейцин (Leu или L), лизин (Lys или K), метионин (Met или M), фенилаланин (Phe или F), пролин (Pro или P), серин (Ser или S), треонин (Thr или T), триптофан (Trp или W), тирозин (Tyr или Y) и валин (Val или V). [42] The abbreviations used for genetically encoded amino acids are generally accepted and are: alanine (Ala or A), arginine (Are or R), asparagine (Asn or N), aspartate (Asp or D), cysteine (Cys or C) , glutamate (Glu or E), glutamine (Gln or Q), histidine (His or H), isoleucine (Ile or I), leucine (Leu or L), lysine (Lys or K), methionine (Met or M), phenylalanine (Phe or F), proline (Pro or P), serine (Ser or S), threonine (Thr or T), tryptophan (Trp or W), tyrosine (Tyr or Y), and valine (Val or V).

[43] Когда используют трехбуквенные сокращенные обозначения, если только конкретно не предшествует "L" или "D" или если не очевидно из контекста, в котором используется сокращенное обозначение, аминокислота может быть либо в L-, либо в D-конфигурации у α-углерода (C_α). Например, в то время как "Ala" обозначает аланин без уточнения конфигурации у α-углерода, "D-Ala" и "L-Ala" обозначают D-аланин и L-аланин, соответственно. Когда используется однобуквенные сокращенные обозначения, прописные буквы обозначают аминокислоты в L-конфигурации у α-углерода и строчные буквы обозначают аминокислоты в D-конфигурации у α-углерода. Например, "A" обозначает L-аланин и "a" обозначает D-аланин. Когда полипептидные последовательности представлены в качестве нити однобуквенных или трехбуквенных сокращенных обозначений (или их смесей), последовательности приведены в направлении от амино (N) к карбокси (C) в соответствии с общими правилами. [43] When three-letter abbreviations are used, unless specifically preceded by "L" or "D" or unless it is clear from the context in which the abbreviation is used, the amino acid may be in either the L- or D-configuration of α- carbon ( _Cα ). For example, while "Ala" refers to alanine without specifying the configuration at the α-carbon, "D-Ala" and "L-Ala" refer to D-alanine and L-alanine, respectively. When one-letter abbreviations are used, uppercase letters denote amino acids in the L-configuration at the α-carbon and lowercase letters denote amino acids in the D-configuration at the α-carbon. For example, "A" is L-alanine and "a" is D-alanine. When polypeptide sequences are presented as a strand of one-letter or three-letter abbreviations (or mixtures thereof), the sequences are given in the direction from amino (N) to carboxy (C) in accordance with the general rules.

[44] Сокращенные обозначения, используемые для генетически кодируемых нуклеозидов, являются общепринятыми и таковы: аденозин (A); гуанозин (G); цитидин (C); тимидин (T) и уридин (U). Если не указано конкретно, сокращенно обозначаемые нуклеозиды могут представлять собой либо рибонуклеозиды, либо 2'-дезоксирабонуклеозиды. Уточнение в отношении того, являются ли нуклеозиды рибонуклеозидами или 2'-дезоксирибонуклеозидами приводится индивидуально или в совокупности. Когда последовательности нуклеиновых кислот приведены в качестве нити из однобуквенных сокращенных обозначений, последовательности приводятся в направлении от 5' к 3' в соответствии с общими правилами, и фосфаты не указываются. [44] The abbreviations used for genetically encoded nucleosides are generally accepted and are: adenosine (A); guanosine (G); cytidine (C); thymidine (T) and uridine (U). Unless otherwise stated, abbreviated nucleosides may be either ribonucleosides or 2'-deoxyrabonucleosides. Clarification as to whether the nucleosides are ribonucleosides or 2'-deoxyribonucleosides is given individually or collectively. When nucleic acid sequences are given as a string of single letter abbreviations, the sequences are given in the 5' to 3' direction according to the general rules, and phosphates are not given.

[45] Термины "сконструированный", "рекомбинантный", "не встречающийся в природе" и "вариантный", когда их используют в отношении клетки, полинуклеотида или полипептида, относится к материалу, соответствующему природной или нативной форме материала, модифицированному так, что он в ином случае не встречался бы в природе, или идентичному ему, но полученному или происходящему из синтетических материалов и/или путем манипуляции с использованием рекомбинантных способов. [45] The terms "engineered", "recombinant", "non-naturally occurring" and "variant", when used in relation to a cell, polynucleotide or polypeptide, refers to a material corresponding to the natural or native form of the material, modified so that it would not otherwise occur in nature, or be identical to it, but derived from or derived from synthetic materials and/or by manipulation using recombinant methods.

[46] Как используют в рамках изобретения, "дикий тип" и "встречающийся в природе" относятся к форме, встречающейся в природе. Например, последовательность полипептида или полинуклеотида представляет собой последовательность, присутствующую в организме, которая может быть выделена из источника в природе и которая преднамеренно модифицирована путем манипулирования человеком. [46] As used herein, "wild type" and "naturally occurring" refer to the naturally occurring form. For example, a polypeptide or polynucleotide sequence is a sequence present in an organism that can be isolated from a source in nature and that is deliberately modified by human manipulation.

[47] "Кодирующая последовательность" относится к той части нуклеиновой кислоты (например, гена), которая кодирует аминокислотную последовательность белка. [47] "Coding sequence" refers to that portion of a nucleic acid (eg, gene) that encodes the amino acid sequence of a protein.

[48] Термин "процентная (%) идентичность последовательностей" используют в настоящем описании для обозначения сравнений полинуклеотидов и полипептидов, и ее определяют путем сравнения двух оптимально выровненных последовательностей на протяжении окна сравнения, где часть последовательности полинуклеотида или полипептида в окне сравнения может включать вставки или делеции (т.е. пропуски) по сравнению с эталонной последовательностью для оптимального выравнивания двух последовательностей. Процент можно вычислять путем определения числа положений, в которых идентичные основания нуклеиновых кислот или аминокислотные остатки встречаются в обеих последовательностях с получением количества совпавших положений, деления количества совпавших положений на общее число положений в окне сравнения и умножения результата на 100 с получением процентной идентичности последовательностей. Альтернативно процент можно вычислять путем определения числа положений, в которых либо идентичные основания нуклеиновых кислот или аминокислотные остатки встречаются в обеих последовательностях, либо основания нуклеиновых кислот или аминокислотные остатки выравниваются с использованием пропуска с получением количества совпавших положений, деления количества совпавших положений на общее количество положений в окне сравнения и умножения результата на 100 с получением процента идентичности последовательностей. Специалистам в данной области будет понятно, что существует множество общепризнанных алгоритмов, доступных для выравнивания двух последовательностей. Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с использованием алгоритма локальной гомологии Smith и Waterman (Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), с использование алгоритма выравнивания гомологии Needleman и Wunsch (Needleman and Wunsch, J. Mol. Biol., 48:443 [1970), с использованием способа поиска сходства Pearson и Lipman (Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), с использованием компьютеризованных реализаций этих алгоритмов (например, GAP, BESTFIT, FASTA и TFASTA в GCG Wisconsin Software Package) или посредством визуального исследования, как известно в данной области. Примеры алгоритмов, которые пригодны для определения процентной идентичности последовательностей и сходства последовательностей, включают, но не ограничиваются ими, алгоритмы BLAST и BLAST 2.0, которые описаны Altschul et al. (см. Altschul et al., J. Mol. Biol., 215: 403-410 [1990] и Altschul et al., Nucleic Acids Res., 25:3389-3402 [1977], соответственно). Программное обеспечение для проведения анализов BLAST является общедоступным через web-сайт Национального центра по биотехнологической информации. Этот алгоритм вовлекает идентификацию сначала пар последовательностей с высокой оценкой (HSP) путем идентификации коротких слов длиной W в последовательности запроса, которые либо совпадают, либо удовлетворяют некоторому пороговому показателю T при выравнивании со словом той же длины в последовательности базы данных. T обозначает пороговое значение для соседнего слова (см., Altschul et al., выше). Эти первоначальные наилучшие совпадения для соседних слов выступают в качестве основ для инициации поиска более длинных HSP, содержащих их. Затем наилучшие совпадения удлиняют в обоих направлениях вдоль каждой последовательности насколько, насколько может быть увеличен совокупный показатель выравнивания. Совокупные показатели вычисляют с использованием, для нуклеотидных последовательностей, параметров M (показатель вознаграждения за пару совпавших остатков всегда >0) и N (показатель штрафа за не совпавшие остатки; всегда <0). Для аминокислотных последовательностей для вычисления совокупного показателя используют оценочную матрицу. Удлинение слов с наилучшим совпадением останавливается, когда: совокупный показатель выравнивания снижается на величину X от его максимальной достигнутой величины; совокупный показатель достигает нуля или ниже, вследствие накопления одного или более выравниваний остатков с отрицательной оценкой; или достигается конец любой из последовательностей. Параметры алгоритма BLAST W, T и X определяют чувствительность и скорость выравнивания. Программа BLASTN (для нуклеотидных последовательностей) использует в качестве параметров по умолчанию длину слова (W) 11, ожидание (E) 10, M=5, N=-4, и сравнение обеих цепей. Для аминокислотных последовательностей программа BLASTP использует в качестве параметров по умолчанию длину слова (W) 3, ожидание (E) 10 и оценочную матрицу BLOSUM62 (см., Henikoff и Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989]). Для иллюстративного проведения выравнивания последовательностей и определение % идентичности последовательностей можно использовать программы BESTFIT или GAP в пакете программ GCG Wisconsin Software (Accelrys, Madison WI) с использованием предоставленных параметров по умолчанию. [48] The term "percent (%) sequence identity" is used herein to refer to comparisons of polynucleotides and polypeptides, and is determined by comparing two optimally aligned sequences over a comparison window, where the portion of the polynucleotide or polypeptide sequence in the comparison window may include inserts or deletions (ie gaps) compared to the reference sequence for optimal alignment of the two sequences. The percentage can be calculated by determining the number of positions at which identical nucleic acid bases or amino acid residues occur in both sequences to obtain the number of matched positions, dividing the number of matched positions by the total number of positions in the comparison window, and multiplying the result by 100 to obtain percent sequence identity. Alternatively, the percentage can be calculated by determining the number of positions at which either identical nucleic acid bases or amino acid residues occur in both sequences, or nucleic acid bases or amino acid residues align using a skip to give the number of positions that matched, dividing the number of positions that matched by the total number of positions in comparison window and multiplying the result by 100 to get the percent sequence identity. Those skilled in the art will appreciate that there are many well-established algorithms available for aligning two sequences. Optimal sequence alignment for comparison can be performed, for example, using Smith and Waterman's local homology algorithm (Smith and Waterman, Adv. Appl. Math., 2:482 [1981]), using Needleman and Wunsch's homology alignment algorithm (Needleman and Wunsch , J. Mol. Biol., 48:443 [1970), using the Pearson and Lipman similarity search method (Pearson and Lipman, Proc. Natl. Acad. Sci. USA 85:2444 [1988]), using computerized implementations of these algorithms (eg, GAP, BESTFIT , FASTA, and TFASTA in the GCG Wisconsin Software Package) or through visual inspection, as is known in the art. Examples of algorithms that are suitable for determining percent sequence identity and sequence similarity include, but are not limited to, the BLAST and BLAST 2.0 algorithms as described by Altschul et al. (See Altschul et al . , J. Mol. Biol., 215: 403-410 [1990] and Altschul et al . , Nucleic Acids Res., 25:3389-3402 [1977], respectively). The BLAST analysis software is publicly available through the National Center for Biotechnology Information website. This algorithm involves identifying high scoring sequence pairs (HSPs) first by identifying short words of length W in the query sequence that either match or satisfy some threshold T when aligned with a word of the same length in the database sequence. T denotes the neighbor word threshold (see Altschul et al., supra). These initial best matches for adjacent words act as bases to initiate a search for longer HSPs containing them. The best matches are then lengthened in both directions along each sequence as much as the total alignment score can be increased. Aggregate scores are calculated using, for nucleotide sequences, the parameters M (reward score for a pair of matching residues always >0) and N (penalty score for mismatched residues; always <0). For amino acid sequences, a score matrix is used to calculate the cumulative score. The extension of the best matching words stops when: the cumulative alignment score falls by X from its maximum achieved value; the cumulative score reaches zero or below due to the accumulation of one or more negative-scoring residual alignments; or the end of either sequence is reached. The BLAST algorithm parameters W, T and X determine the sensitivity and speed of the alignment. The BLASTN program (for nucleotide sequences) uses as default parameters word length (W) 11, expectation (E) 10, M=5, N=-4, and comparison of both strands. For amino acid sequences, BLASTP uses word length (W) 3, expectation (E) 10, and BLOSUM62 scoring matrix as default parameters (see, Henikoff and Henikoff, Proc. Natl. Acad. Sci. USA 89:10915 [1989] ). To illustratively perform sequence alignment and determine % sequence identity, the BESTFIT or GAP programs in the GCG Wisconsin Software (Accelrys, Madison WI) can be used using the default parameters provided.

[49] "Эталонная последовательность" относится к определенной последовательности, используемой в качестве основы для сравнения последовательностей. Эталонная последовательность может представлять собой разновидность более крупной последовательности, например, сегмент полноразмерного гена или полипептидную последовательность. Как правило, эталонная последовательность имеет длину по меньшей мере 20 нуклеотидных или аминокислотных остатков, по меньшей мере 25 остатков, по меньшей мере 50 остатков, по меньшей мере 100 остатков или имеет полную длину нуклеиновой кислоты или полипептида. Поскольку каждый из двух полинуклеотидов или полипептидов может (1) содержать последовательность (т.е. часть полной последовательности), которая является сходной между двумя последовательности, и (2) может дополнительно содержать последовательность, которая различается между двумя последовательности, сравнение последовательностей двух (или более) полинуклеотидов или полипептидов обычно проводят путем сравнения последовательностей двух полинуклеотидов или полипептидов на протяжении "окна сравнения" для идентификации и сравнения локальных областей сходства последовательностей. В некоторых вариантах осуществления "эталонная последовательность" может быть основана на первичной аминокислотной последовательности, где эталонная последовательность представляет собой последовательность, которая может иметь одно или более изменений в первичной последовательности. [49] "Reference sequence" refers to a specific sequence used as a basis for comparing sequences. The reference sequence may be a subset of a larger sequence, such as a full length gene segment or a polypeptide sequence. Typically, the reference sequence is at least 20 nucleotide or amino acid residues, at least 25 residues, at least 50 residues, at least 100 residues, or the full length of the nucleic acid or polypeptide. Since each of the two polynucleotides or polypeptides may (1) contain a sequence (i.e., part of the total sequence) that is similar between the two sequences, and (2) may additionally contain a sequence that differs between the two sequences, comparing the sequences of the two (or more) polynucleotides or polypeptides is usually carried out by comparing the sequences of two polynucleotides or polypeptides over a "comparison window" to identify and compare local areas of sequence similarity. In some embodiments, a "reference sequence" may be based on a primary amino acid sequence, where the reference sequence is a sequence that may have one or more changes to the primary sequence.

[50] "Окно сравнения" относится к схематичному сегменту из по меньшей мере приблизительно 20 последовательных нуклеотидных положений или аминокислотных остатков, где последовательность может быть сравнена с эталонной последовательностью из по меньшей мере 20 последовательных нуклеотидов или аминокислот и где часть последовательности в окне сравнения может включать вставки или делеции (т.е. пропуски), составляющие 20 процентов или менее по сравнению с эталонной последовательностью (которая не включает вставок или делеций) для оптимального выравнивания двух последовательностей. Окно сравнения может составлять более 20 последовательно расположенных остатков и включает, необязательно 30, 40, 50, 100 или более длинные окна. [50] "Comparison window" refers to a schematic segment of at least about 20 consecutive nucleotide positions or amino acid residues, where the sequence can be compared to a reference sequence of at least 20 consecutive nucleotides or amino acid residues, and where the portion of the sequence in the comparison window can include insertions or deletions (ie, gaps) of 20 percent or less compared to a reference sequence (which does not include insertions or deletions) to optimally align the two sequences. The comparison window may be more than 20 consecutive residues and optionally includes 30, 40, 50, 100 or longer windows.

[51] "Согласно с", "по сравнению с" или "относительно" при использовании в контексте нумерации данной аминокислотной или полинуклеотидной последовательности относится к нумерации остатков определенной эталонной последовательности, когда данную аминокислотную или полинуклеотидную последовательность сравнивают с эталонной последовательностью. Иными словами, номер остатка или положение остатка данного полимера обозначают относительно эталонной последовательности, а не фактического числового положения остатка в данной аминокислотной или полинуклеотидной последовательности. Например, данную аминокислотную последовательность, такую как аминокислотная последовательность сконструированной РНК-полимеразы T7, можно выравнивать с эталонной последовательностью путем внесения пропусков для оптимизации соответствий остатков между двумя последовательностями. В этих случаях, хотя присутствуют пропуски, нумерацию остатка в данной аминокислотной или полинуклеотидной последовательности проводят относительно эталонной последовательности, с которой ее выравнивают. [51] "According to", "compared to", or "relative to" when used in the context of numbering a given amino acid or polynucleotide sequence refers to the numbering of residues of a particular reference sequence when the given amino acid or polynucleotide sequence is compared to a reference sequence. In other words, the residue number or residue position of a given polymer is relative to a reference sequence, not the actual numerical position of the residue in a given amino acid or polynucleotide sequence. For example, a given amino acid sequence, such as the amino acid sequence of engineered T7 RNA polymerase, can be aligned with a reference sequence by introducing gaps to optimize residue matches between the two sequences. In these cases, although gaps are present, the numbering of the residue in a given amino acid or polynucleotide sequence is relative to the reference sequence with which it is aligned.

[52] "Различие аминокислот" или "различие остатков" относится к отличию аминокислотных остатков в положении полипептидной последовательности относительно аминокислотных остатков в соответствующих положениях в эталонной последовательности. Положения различий аминокислот обычно обозначают в настоящем описании как "Xn", где n относится к соответствующему положению в эталонной последовательности, на котором основано различие остатков. Например, "различие остатков в положении X93 по сравнению с SEQ ID NO: 2" относится к различию аминокислотных остатков в положении полипептида, соответствующем положению 93 SEQ ID NO: 2. Таким образом, если эталонный полипептид SEQ ID NO: 2 имеет серин в положении 93, тогда "отличие остатка в положении X93 по сравнению с SEQ ID NO: 2" представляет собой аминокислотную замену в любом остатке, отличном от серина, в положении полипептида, соответствующем положению 93 SEQ ID NO: 2. В большинстве случаев, описанных в настоящем описании, конкретное различие аминокислотных остатков в данном положении обозначается как "XnY", где "Xn" обозначает соответствующее положение, как описано выше, и "Y" представляет собой однобуквенный идентификатор аминокислоты, находящейся в сконструированном полипептиде (т.е. остаток, отличный от эталонного полипептида). В некоторых случаях (например, в таблицах, приведенных в примерах настоящего описания), настоящее изобретение также относится к конкретным аминокислотным различиям, обозначаемым посредством общепринятого обозначения "AnB", где A представляет собой однобуквенный идентификатор остатка в эталонной последовательности, "n" представляет собой количество положений остатков в эталонной последовательности и B представляет собой однобуквенный идентификатор замены остатков в последовательности сконструированного полипептида. В некоторых случаях полипептид по настоящему изобретению может включать одно или более отличий аминокислотных остатков относительно эталонной последовательности, которые указываются посредством перечня указанных положений, где присутствуют различия остатков относительно эталонной последовательности. В некоторых вариантах осуществления, когда более одной аминокислоты может использоваться в конкретном положении остатка полипептида, различные аминокислотные остатки, которые могут использоваться, разделены "/" (например, X10H/X10P или X10H/P). В некоторых вариантах осуществления варианты ферментов включают более одной замены. Эти замены разделены слешем для простоты прочтения (например, C14A/K122A). Настоящая заявка включает сконструированные полипептидные последовательности, содержащие одно или более аминокислотных различий, которые включают либо консервативные, либо неконсервативные аминокислотные замены, или и те, и другие. [52] "Amino acid difference" or "residue difference" refers to the difference between amino acid residues at a position in a polypeptide sequence relative to amino acid residues at corresponding positions in a reference sequence. Amino acid difference positions are generally referred to herein as "Xn", where n refers to the corresponding position in the reference sequence on which the residue difference is based. For example, "residue difference at position X93 compared to SEQ ID NO: 2" refers to the difference in amino acid residues at the position of the polypeptide corresponding to position 93 of SEQ ID NO: 2. Thus, if the reference polypeptide of SEQ ID NO: 2 has a serine at position 93, then "residue difference at position X93 compared to SEQ ID NO: 2" is an amino acid substitution at any residue other than serine at the position of the polypeptide corresponding to position 93 of SEQ ID NO: 2. In most cases described herein description, a particular difference in amino acid residues at a given position is referred to as "XnY", where "Xn" denotes the corresponding position as described above, and "Y" is the single letter identifier for the amino acid found in the engineered polypeptide (i.e., a residue other than reference polypeptide). In some cases (for example, in the tables given in the examples of the present description), the present invention also refers to specific amino acid differences, denoted by the common designation "AnB", where A is a one-letter identifier of the residue in the reference sequence, "n" is the number the positions of the residues in the reference sequence; and B is the single letter identifier for the substitution of residues in the sequence of the constructed polypeptide. In some instances, a polypeptide of the present invention may include one or more amino acid residue differences relative to a reference sequence, which are indicated by a list of said positions where residue differences relative to a reference sequence are present. In some embodiments, when more than one amino acid may be used at a particular position of a polypeptide residue, the various amino acid residues that may be used are separated by "/" (eg, X10H/X10P or X10H/P). In some embodiments, the enzyme variants include more than one substitution. These substitutions are separated by a slash for ease of reading (eg C14A/K122A). The present application includes engineered polypeptide sequences containing one or more amino acid differences that include either conservative or non-conservative amino acid substitutions, or both.

[53] "Консервативная аминокислотная замена" относится к замене остатка отличающимся остатком, имеющим сходную боковую цепь и, таким образом, она обычно вовлекает замену аминокислоты в полипептиде аминокислотами в пределах одного и того же или сходного определенного класса аминокислот. В качестве неограничивающего примера, аминокислота с алифатической боковой цепью может быть заменена другой алифатической аминокислотой (например, аланин, валин, лейцин и изолейцин); аминокислота с гидроксильной боковой цепью заменена другой аминокислотой с гидрофильной боковой цепью (например, серином и треонином); аминокислоты, имеющие ароматические боковые цепи, заменены другой аминокислотой, имеющей ароматическую боковую цепь (например, фенилаланин, тирозин, триптофан и гистидин); аминокислота с основной боковой цепью заменена другой аминокислотой с основной боковой цепью (например, лизин и аргинин); аминокислота с кислотной боковой цепью заменена другой аминокислотой с кислотной боковой цепью (например, аспарагиновая кислота или глутаминовая кислота); и/или гидрофобная или гидрофильная аминокислота заменена другой гидрофобной или гидрофильной аминокислотой, соответственно. [53] "Conservative amino acid substitution" refers to the replacement of a residue with a different residue having a similar side chain and thus typically involves the substitution of an amino acid in a polypeptide with amino acids within the same or a similar defined class of amino acids. As a non-limiting example, an amino acid with an aliphatic side chain may be replaced with another aliphatic amino acid (eg, alanine, valine, leucine, and isoleucine); an amino acid with a hydroxyl side chain is replaced with another amino acid with a hydrophilic side chain (eg, serine and threonine); amino acids having aromatic side chains are replaced with another amino acid having an aromatic side chain (eg phenylalanine, tyrosine, tryptophan and histidine); a main side chain amino acid is replaced with another main side chain amino acid (eg, lysine and arginine); an acidic side chain amino acid is replaced with another acidic side chain amino acid (eg, aspartic acid or glutamic acid); and/or the hydrophobic or hydrophilic amino acid is replaced by another hydrophobic or hydrophilic amino acid, respectively.

[54] "Неконсервативная замена" относится к замене аминокислоты в пептиде аминокислотой со значительно отличающимися свойствами боковой цепи. В случае неконсервативных замен могут использоваться аминокислоты между, а не в пределах, определенными группами, и они влияют на (a) структуру пептидного остова в области замещения (например, пролин на глицин) (b) заряд или гидрофобность или (c) объем боковой цепи. В качестве неограничивающего примера иллюстративная неконсервативная замена может представлять собой кислотную аминокислоту, замещенную основной или алифатической аминокислотой; ароматическую аминокислоту, замещенную небольшой аминокислотой; и гидрофобную аминокислоту, замещенную гидрофобной аминокислотой. [54] "Non-conservative substitution" refers to the replacement of an amino acid in a peptide with an amino acid with significantly different side chain properties. In the case of non-conservative substitutions, amino acids between, rather than within, certain groups can be used and affect (a) the structure of the peptide backbone at the site of substitution (e.g., proline to glycine) (b) charge or hydrophobicity, or (c) side chain volume . As a non-limiting example, an illustrative non-conservative substitution may be an acidic amino acid substituted with a basic or aliphatic amino acid; an aromatic amino acid substituted with a small amino acid; and a hydrophobic amino acid substituted with a hydrophobic amino acid.

[55] "Делеция" относится к модификации полипептида путем удаления одной или более аминокислот из эталонного полипептида. Делеции могут включать удаление на 1 или более аминокислот, 2 или более аминокислот, 5 или более аминокислот, 10 или более аминокислот, 15 или более аминокислоты, или 20 или более аминокислот, вплоть до 10% от общего количества аминокислот, или вплоть до 20% от общего количества аминокислот, составляющих эталонный фермент, при сохранении ферментативной активности и/или сохранении усовершенствованных свойств сконструированного фермента. Делеции могут быть направлены на внутренние части и/или концевые части полипептида. В различных вариантах осуществления делеция может включать непрерывный сегмент или может прерываться. [55] "Deletion" refers to the modification of a polypeptide by removing one or more amino acids from a reference polypeptide. Deletions can include deletions of 1 or more amino acids, 2 or more amino acids, 5 or more amino acids, 10 or more amino acids, 15 or more amino acids, or 20 or more amino acids, up to 10% of the total amino acids, or up to 20% from the total number of amino acids that make up the reference enzyme, while maintaining the enzymatic activity and/or maintaining the improved properties of the engineered enzyme. Deletions may be directed to the interior and/or terminal portions of the polypeptide. In various embodiments, the implementation of the deletion may include a continuous segment or may be interrupted.

[56] "Инсерция" относится к модификации полипептида путем присоединения одной или более аминокислот из эталонного полипептида. Инсерции могут быть проведены во внутренних частях полипептида или на C-конце или N-конце. Инсерции, как используют в рамках изобретения, включают слитые белки, как известно в данной области. Инсерция может представлять собой непрерывный сегмент из аминокислот или может быть разделена одной или более аминокислотами встречающегося в природе полипептида. [56] "Insertion" refers to the modification of a polypeptide by adding one or more amino acids from a reference polypeptide. Insertions can be made in the internal parts of the polypeptide or at the C-terminus or N-terminus. Insertions, as used within the scope of the invention, include fusion proteins, as is known in the art. An insertion may be a continuous segment of amino acids or may be separated by one or more amino acids of a naturally occurring polypeptide.

[57] "Выделенный полипептид" относится к полипептиду, который по существу отделен от других компонентов, которые обычно сопровождают его (например, белок, липиды и полинуклеотиды). Термин охватывает полипептиды, которые извлечены или очищены из их встречающегося в природе окружения или экспрессирующей системы (например, клетка-хозяин или синтез in vitro). Рекомбинантные полипептиды РНК-полимеразы T7 могут присутствовать в клетке, могут присутствовать в клеточной среде или могут быть получены в различных формах, таких как лизаты или выделенные препараты. По существу, в некоторых вариантах осуществления рекомбинантные полипептиды РНК-полимеразы T7 могут представлять собой выделенные полипептиды. [57] "Isolated polypeptide" refers to a polypeptide that is substantially separated from other components that normally accompany it (eg, protein, lipids, and polynucleotides). The term encompasses polypeptides that are extracted or purified from their naturally occurring environment or expression system (eg, host cell or in vitro synthesis). The recombinant T7 RNA polymerase polypeptides may be present in the cell, may be present in the cellular environment, or may be prepared in various forms such as lysates or isolated preparations. As such, in some embodiments, the recombinant T7 RNA polymerase polypeptides may be isolated polypeptides.

[58] "По существу чистый полипептид" относится к композиции, в которой полипептидный компонент представляет собой преобладающий присутствующий компонент (т.е. на молярной или весовой основе он присутствует в большем количестве, чем любой другой отдельный макромолекулярный компонент в композиции), и обычно представляет собой по существу очищенную композицию, когда данный компонент составляет по меньшей мере приблизительно 50 процентов макромолекулярных компонентов на молярной основе или в % по массе. Как правило, по существу чистая композиция РНК-полимеразы T7 содержит 60% или более, приблизительно 70% или более, приблизительно 80% или более, приблизительно 90% или более, приблизительно 95% или более, и приблизительно 98% или всех макромолекулярных компонентов на молярной основе или в % по массе, присутствующих в композиции. В некоторых вариантах осуществления рассматриваемый компонент очищают по существу до однородности (т.е. загрязняющие компоненты не могут быть обнаружены общепринятыми способами детекции), где композиция по существу состоит из одного макромолекулярного компонента. Компоненты растворителей, низкомолекулярные соединения (<500 Дальтон) и компоненты в виде элементарных ионов не считаются макромолекулярными компонентами. В некоторых вариантах осуществления выделенные рекомбинантные полипептиды РНК-полимеразы T7 представляют собой по существу чистые полипептидные композиции. [58] "Substantially pure polypeptide" refers to a composition in which the polypeptide component is the predominant component present (i.e., on a molar or weight basis, it is present in greater amounts than any other single macromolecular component in the composition), and usually is a substantially purified composition when the component is at least about 50 percent of the macromolecular components on a molar basis or in % by weight. Typically, a substantially pure T7 RNA polymerase composition contains 60% or more, about 70% or more, about 80% or more, about 90% or more, about 95% or more, and about 98% or more of the macromolecular components per on a molar basis or in % by weight present in the composition. In some embodiments, the component in question is purified to substantially uniformity (ie, contaminants cannot be detected by conventional detection methods), where the composition essentially consists of a single macromolecular component. Solvent components, low molecular weight compounds (<500 Daltons) and elemental ion components are not considered macromolecular components. In some embodiments, the isolated recombinant T7 RNA polymerase polypeptides are substantially pure polypeptide compositions.

[59] "Усовершенствованное свойство фермента" РНК-полимеразы T7 относится к сконструированному полипептиду РНК-полимеразы T7, который демонстрирует улучшение какого-либо ферментного свойства по сравнению с эталонным полипептидом РНК-полимеразы T7 и/или полипептидом РНК-полимеразы T7 дикого типа и/или другим сконструированным полипептидом РНК-полимеразы T7. Усовершенствованные свойства включают, но не ограничиваются ими, такие свойства, как увеличенная селективность в отношении аналога кэпа относительно GTP, увеличенная точность репликации, увеличенный выход РНК, увеличенная экспрессия белка, увеличенная термоактивность, увеличенная термостабильность, увеличенная зависимая от pH активность, увеличенная стабильность, увеличенная ферментативная активность, увеличенная субстратная специфичность или аффинность, увеличенная удельная активность, увеличенная резистентность к субстрату или ингибирование конечного продукта (включая пирофосфат), увеличенная химическая стабильность, увеличенная стабильность в растворителях, увеличенная толерантность к кислотным или основным значениям pH, увеличенная толерантность к протеолитической активности (т.е. сниженная чувствительность к протеолизу), сниженная агрегация, увеличенная растворимость и измененный профиль температур. [59] "Improved enzyme property" of T7 RNA polymerase refers to an engineered T7 RNA polymerase polypeptide that exhibits an improvement in any enzymatic property compared to a reference T7 RNA polymerase polypeptide and/or a wild-type T7 RNA polymerase polypeptide and/ or another engineered T7 RNA polymerase polypeptide. Improved properties include, but are not limited to, increased cap analog selectivity for GTP, increased replication fidelity, increased RNA yield, increased protein expression, increased thermal activity, increased thermal stability, increased pH dependent activity, increased stability, increased enzymatic activity, increased substrate specificity or affinity, increased specific activity, increased substrate resistance or end product inhibition (including pyrophosphate), increased chemical stability, increased solvent stability, increased tolerance to acidic or basic pH values, increased tolerance to proteolytic activity ( ie reduced sensitivity to proteolysis), reduced aggregation, increased solubility and altered temperature profile.

[60] "Увеличенная ферментативная активность" или "усиленная каталитическая активность" относится к улучшенному свойству сконструированной РНК-полимеразы T7, которое может отражаться увеличением удельной активности (например, продуцированный продукт/время/масса белка) или увеличением процентного конвертирования субстрата в продукт (например, процентное конвертирование исходного количества субстрата в продут за определенный период времени с использованием определенного количества варианта РНК-полимеразы T7 по сравнению с эталонной РНК-полимеразой T7. Иллюстративные способы определения ферментативной активности приведены в примерах. Может изменяться любое свойство, касающееся ферментативной активности. [60] "Increased enzymatic activity" or "enhanced catalytic activity" refers to an improved property of the engineered T7 RNA polymerase, which may be reflected by an increase in specific activity (e.g., product produced/time/protein weight) or an increase in percentage conversion of substrate to product (e.g. , percent conversion of initial amount of substrate to products over a given period of time using a given amount of T7 RNA polymerase variant compared to a reference T7 RNA polymerase.

[61] "Жесткость гибридизации" относится к условиям гибридизации, таким как условия промывания, при гибридизации нуклеиновых кислот. Как правило, реакции гибридизации проводят в условиях более низкой жесткости, после чего проводят промывания варьирующей, но более высокой жесткости. Термин "умеренно жесткая гибридизация" относится к условиям, которые позволяют ДНК-мишени связать комплементарную нуклеиновую кислоту, которая обладает приблизительно 60% идентичностью, предпочтительно приблизительно 75% идентичностью, приблизительно 85% идентичностью с ДНК-мишенью, с более чем приблизительно 90% идентичностью с полинуклеотидом-мишенью. Иллюстративные условия умеренной жесткости представляют собой условия, эквивалентные гибридизации в 50% формамиде, 5× растворе Денхарта, 5×SSPE, 0,2% SDS при 42°C, с последующим промыванием в 0,2×SSPE, 0,2% SDS, при 42°C. "Гибридизация высокой жесткости" относится, главным образом, к условиям, которые приблизительно на 10°C или менее ниже температуры плавления T _m при определении в условиях раствора для определенной полинуклеотидной последовательности. В некоторых вариантах осуществления условия высокой жесткости относятся к условиям, которые позволяют гибридизацию только тех последовательностей нуклеиновых кислот, которые образуют стабильные гибриды в 0,018 M NaCl при 65°C (т.е. если гибрид не является стабильным в 0,018 M NaCl при 65°C, предусматривается, что он не будет стабильным в условиях высокой жесткости). Условия высокой жесткости могут быть обеспечены, например, гибридизацией в условиях, эквивалентных 50% формамиду, 5× раствору Денхарта, 5×SSPE, 0,2% SDS при 42°C, с последующим промыванием в 0,1×SSPE и 0,1% SDS при 65°C. Другими условиями высокой жесткости является гибридизация в условиях, эквивалентных гибридизации в 5X SSC, содержащем 0,1% (масс.:об.) SDS, при 65°C, и промывание в 0,1x SSC, содержащем 0,1% SDS, при 65°C. Другие условиях гибридизации высокой жесткости, а также условия умеренной жесткости, описаны в ссылках, цитированных выше. [61] "Hybridization stringency" refers to hybridization conditions, such as washing conditions, when nucleic acids are hybridized. Typically, hybridization reactions are carried out under conditions of lower stringency followed by washes of varying but higher stringency. The term "moderately stringent hybridization" refers to conditions that allow the target DNA to bind a complementary nucleic acid that has about 60% identity, preferably about 75% identity, about 85% identity with the target DNA, with more than about 90% identity with target polynucleotide. Exemplary moderate stringency conditions are equivalent to hybridization in 50% formamide, 5× Denhart's solution, 5×SSPE, 0.2% SDS at 42° C., followed by a wash in 0.2×SSPE, 0.2% SDS, at 42°C. "High stringency hybridization" refers primarily to conditions that are about 10° C. or less below the melting point T _m when determined under solution conditions for a particular polynucleotide sequence. In some embodiments, high stringency conditions refer to conditions that allow hybridization of only those nucleic acid sequences that form stable hybrids in 0.018 M NaCl at 65°C (i.e. , if the hybrid is not stable in 0.018 M NaCl at 65°C , it is envisaged that it will not be stable under conditions of high rigidity). High stringency conditions can be achieved, for example, by hybridization under conditions equivalent to 50% formamide, 5× Denhart's solution, 5×SSPE, 0.2% SDS at 42°C, followed by washing in 0.1×SSPE and 0.1 % SDS at 65°C. Other high stringency conditions are hybridization under conditions equivalent to hybridization in 5X SSC containing 0.1% (w:v) SDS at 65° C. and washing in 0.1x SSC containing 0.1% SDS at 65°C. Other high stringency hybridization conditions, as well as moderate stringency conditions, are described in the references cited above.

[62] "Кодон-оптимизированный" относится к изменениям в кодонах полинуклеотида, кодирующего белок, на кодоны, предпочтительно используемые в конкретном организме, так что кодируемый белок более эффективно экспрессируется в представляющем интерес организме. Хотя генетический код является вырожденным ввиду того, что большинству аминокислот соответствует несколько кодонов, называемых "синонимами" или "синонимическими" кодонами, хорошо известно, что использование кодонов конкретными организмами является неслучайным и предпочтительным с точки зрения конкретных кодоновых триплетов. Это предпочтение использования кодонов может быть более высоким для данного гена, генов с общей функцией или происхождением, высоко экспрессируемых белков против белков с низким числом копий, и составные области, кодирующие белки, генома организма. В некоторых вариантах осуществления полинуклеотиды, кодирующие ферменты РНК-полимеразы T7, могут быть кодон-оптимизированными для оптимального продуцирования из организма-хозяина, выбранного для экспрессии. [62] "Codon-optimized" refers to changes in the codons of a polynucleotide encoding a protein to codons preferably used in a particular organism, so that the encoded protein is more efficiently expressed in the organism of interest. Although the genetic code is degenerate due to the fact that most amino acids correspond to several codons, called "synonyms" or "synonymous" codons, it is well known that the use of codons by specific organisms is non-random and preferable in terms of specific codon triplets. This preference for codon use may be higher for a given gene, genes with a common function or origin, highly expressed proteins versus low copy number proteins, and component protein-coding regions of an organism's genome. In some embodiments, polynucleotides encoding T7 RNA polymerase enzymes may be codon-optimized for optimal production from the host organism selected for expression.

[63] "Последовательность контроля" относится в настоящем описании ко всем компонентам, которые являются необходимыми или преимущественными для экспрессии полинуклеотида и/или полипептида, описанного в настоящей заявке. Каждая последовательность контроля может быть нативной или чужеродной для последовательности нуклеиновой кислоты, кодирующей полипептид. Такие последовательности контроля включают, но не ограничиваются ими, лидерную последовательность, последовательность полиаденилирования, последовательность пропептида, промоторную последовательность, последовательность сигнального пептида, последовательность инициации и терминатор транскрипции. Как минимум, последовательности контроля включают промотор и стоп-сигналы транскрипции и трансляции. Последовательности контроля могут быть предоставлены с линкерами для внесения специальных участков рестрикции, облегчающих лигирование последовательностей контроля с кодирующей областью последовательности нуклеиновой кислоты, кодирующей полипептид. [63] "Control sequence" refers in the present description to all components that are necessary or advantageous for the expression of the polynucleotide and/or polypeptide described in this application. Each control sequence may be native or foreign to the nucleic acid sequence encoding the polypeptide. Such control sequences include, but are not limited to, a leader sequence, a polyadenylation sequence, a propeptide sequence, a promoter sequence, a signal peptide sequence, an initiation sequence, and a transcription terminator. At a minimum, control sequences include a promoter and transcriptional and translational stop signals. Control sequences can be provided with linkers to introduce special restriction sites to facilitate ligation of the control sequences to the coding region of a nucleic acid sequence encoding a polypeptide.

[64] "Функционально связанный" определяют в настоящем описании как конфигурацию, в которой последовательность контроля соответствующим образом помещена (т.е. в функциональной взаимосвязи) в таком положении относительно представляющего интерес полинуклеотида, что последовательность контроля направляет или регулирует экспрессию представляющего интерес полинуклеотида и/или полипептида. [64] "Operably linked" is defined herein as a configuration in which the control sequence is appropriately placed (i.e., in operative relationship) in such a position relative to the polynucleotide of interest that the control sequence directs or regulates the expression of the polynucleotide of interest and/ or a polypeptide.

[65] "Промоторная последовательность" относится к последовательности нуклеиновой кислоты, которая распознается клеткой-хозяином для экспрессии представляющего интерес полинуклеотида, такого как кодирующая последовательность. Промоторная последовательность содержит последовательности контроля транскрипции, которые опосредуют экспрессию представляющего интерес полинуклеотида. Промотор может представлять собой любую последовательность нуклеиновой кислоты, которая демонстрирует транскрипционную активность в выбранной клетке-хозяине, включая мутантный, укороченный и гибридный промотор, и может быть получена из генов, кодирующих внеклеточные или внутриклеточные полипептиды, либо гомологичные, либо гетерологичные для клетки-хозяина. [65] "Promoter sequence" refers to a nucleic acid sequence that is recognized by a host cell for expression of a polynucleotide of interest, such as a coding sequence. The promoter sequence contains transcription control sequences that mediate the expression of the polynucleotide of interest. A promoter can be any nucleic acid sequence that exhibits transcriptional activity in the host cell of choice, including mutant, truncated, and hybrid promoters, and can be derived from genes encoding extracellular or intracellular polypeptides, either homologous or heterologous to the host cell.

[66] "Подходящие условия реакции" относятся к условиям в реакционном растворе для ферментативного превращения (например, диапазоны загрузки фермента, загрузки субстрата, температура, pH, буферы, сорастворители и т.д.), в которых полипептид РНК-полимеразы T7, описанный в настоящей заявке, способен конвертировать субстрат в требуемое соединение-продукт. [66] "Suitable reaction conditions" refers to the conditions in the reaction solution for enzymatic conversion (e.g., enzyme loading ranges, substrate loadings, temperature, pH, buffers, co-solvents, etc.) under which the T7 RNA polymerase polypeptide described in this application, is capable of converting the substrate to the desired product compound.

[67] "Субстрат" в контексте процесса ферментативной реакции конвертирования относится к соединению или молекуле, на которую действует полипептид РНК-полимеразы T7. [67] "Substrate" in the context of an enzymatic conversion reaction process refers to a compound or molecule that is acted upon by a T7 RNA polymerase polypeptide.

[68] "Продукт" в контексте процесса ферментативного превращения относится к соединению или молекуле, образующимся в результате действия полипептида РНК-полимеразы T7 на субстрат. [68] "Product" in the context of an enzymatic conversion process refers to a compound or molecule resulting from the action of a T7 RNA polymerase polypeptide on a substrate.

[69] Как используют в рамках изобретения термин "культивирование" относится к выращиванию популяции микробных клеток в любых подходящих условиях (например, с использованием жидкости, геля или твердой среды). [69] As used herein, the term "culturing" refers to growing a population of microbial cells under any suitable conditions (eg, liquid, gel, or solid medium).

[70] Рекомбинантные полипептиды можно получать любыми подходящими способами, известными в данной области. Гены, кодирующие представляющий интерес полипептид дикого типа, можно клонировать в векторы, такие как плазмиды, и экспрессировать в желаемых хозяевах, таких как E. coli, S. Cerevisiae и т.д. Варианты рекомбинантных полипептидов можно получать различными способами, известными в данной области. Действительно, существует широкое множество различных способов мутагенеза, хорошо известных специалистам в данной области. Кроме того, также доступны наборы для мутагенеза от множества коммерческих молекулярно-биологических поставщиков. Доступны способы для проведения конкретных замен в определенных аминокислотах (сайт-направленных), конкретных или случайных мутаций в локализованной области гена (региоспецифических) или случайного мутагенеза по всему гена (например, насыщающий мутагенез). Специалистам в данной области хорошо известны многочисленные подходящие способы получения вариантов ферментов, включая, но не ограничиваясь ими, сайт-направленный мутагенез одноцепочечной ДНК или двухцепочечной ДНК с использованием ПЦР, кассетного мутагенеза, синтеза генов, ПЦР с пониженной точностью, шаффлинга и химического насыщающего мутагенеза, или любого другого подходящего способа, известного в данной области. Неограничивающие примеры способов, используемых для инженерии ДНК и белков, приведены в следующих патентах: патент США №6117679; патент США №6420175; патент США №6376246; патент США №6586182; патент США №7747391; патент США №7747393; патент США №7783428 и патент США №8383346. После получения вариантов их можно подвергать скринингу в отношении любого желаемого свойства (например, высокая или увеличенная активность, или низкая или сниженная активность, увеличенная термическая активность, увеличенная термическая стабильность и/или стабильность при кислых значениях pH и т.д.). [70] Recombinant polypeptides can be obtained by any suitable methods known in this field. Genes encoding a wild-type polypeptide of interest can be cloned into vectors such as plasmids and expressed in desired hosts such as E. coli, S. cerevisiae , etc. Variants of recombinant polypeptides can be obtained by various methods known in this field. Indeed, there are a wide variety of different mutagenesis methods well known to those skilled in the art. In addition, mutagenesis kits are also available from a variety of commercial molecular biology suppliers. Methods are available for making specific substitutions in certain amino acids (site-directed), specific or random mutations in a localized region of a gene (regiospecific), or random mutagenesis throughout the gene (eg, saturation mutagenesis). Numerous suitable methods for producing enzyme variants are well known to those skilled in the art, including, but not limited to, site-directed mutagenesis of single-stranded DNA or double-stranded DNA using PCR, cassette mutagenesis, gene synthesis, reduced precision PCR, shuffling, and chemical saturation mutagenesis, or any other suitable method known in the art. Non-limiting examples of methods used for engineering DNA and proteins are given in the following patents: US patent No. 6117679; US patent No. 6420175; US patent No. 6376246; US patent No. 6586182; US patent No. 7747391; US patent No. 7747393; US patent No. 7783428 and US patent No. 8383346. Once variants have been generated, they can be screened for any desired property (eg, high or increased activity, or low or decreased activity, increased thermal activity, increased thermal stability and/or stability at acidic pH values, etc.).

[71] В некоторых вариантах осуществления пригодными являются "рекомбинантные полипептиды РНК-полимеразы T7" (также обозначаемые в настоящем описании как "сконструированные полипептиды РНК-полимеразы T7", "варианты ферментов РНК-полимераз T7" и "варианты РНК-полимераз T7"). [71] In some embodiments, "recombinant T7 RNA polymerase polypeptides" (also referred to herein as "engineered T7 RNA polymerase polypeptides", "T7 RNA polymerase enzyme variants" and "T7 RNA polymerase variants") are useful. .

[72] Как используют в рамках изобретения, "вектор" представляет собой конструкцию ДНК для введения последовательности ДНК в клетку. В некоторых вариантах осуществления вектор представляет собой экспрессирующий вектор, который функционально связан с подходящей последовательностью контроля, способной обеспечивать экспрессию в подходящем хозяине полипептида, кодируемого в последовательности ДНК. В некоторых вариантах осуществления "экспрессирующий вектор" имеет промоторную последовательность, функционально связанную с последовательностью ДНК (например, трансгеном) для запуска экспрессии в клетке-хозяине и в некоторых вариантах осуществления также содержит последовательность терминатора транскрипции. [72] As used herein, a "vector" is a DNA construct for introducing a DNA sequence into a cell. In some embodiments, the vector is an expression vector that is operably linked to a suitable control sequence capable of allowing expression in a suitable host of the polypeptide encoded in the DNA sequence. In some embodiments, an "expression vector" has a promoter sequence operably linked to a DNA sequence (eg, a transgene) to drive expression in a host cell, and in some embodiments also contains a transcription terminator sequence.

[73] Как используют в рамках изобретения, термин "экспрессия" включает любую стадию, вовлеченную в продуцирование полипептида, включая, но не ограничиваясь ими, транскрипцию, посттранскрипционную модификацию, трансляцию и посттрансляционную модификацию. В некоторых вариантах осуществления термин также охватывает секрецию полипептида из клетки. [73] As used herein, the term "expression" includes any step involved in the production of a polypeptide, including, but not limited to, transcription, post-transcriptional modification, translation, and post-translational modification. In some embodiments, the implementation of the term also covers the secretion of the polypeptide from the cell.

[74] Как используют в рамках изобретения, термин "продуцирует" относится к продуцированию белков и/или других соединений клетками. Подразумевается, что термин охватывает любую стадию, вовлеченную в продуцирование полипептидов, включая, но не ограничиваясь ими, транскрипцию, посттранскрипционную модификацию, трансляцию и посттрансляционную модификацию. В некоторых вариантах осуществления термин также охватывает секрецию полипептида из клетки. [74] As used herein, the term "produces" refers to the production of proteins and/or other compounds by cells. The term is intended to cover any step involved in the production of polypeptides, including, but not limited to, transcription, post-transcriptional modification, translation, and post-translational modification. In some embodiments, the implementation of the term also covers the secretion of the polypeptide from the cell.

[75] Как используют в рамках изобретения, аминокислотная или нуклеотидная последовательность (например, промоторная последовательность, сигнальный пептид, терминаторная последовательность и т.д.) является "гетерологичной" для другой последовательности, с которой она функционально связана, если эти две последовательности не ассоциированы в природе. [75] As used herein, an amino acid or nucleotide sequence (e.g., promoter sequence, signal peptide, terminator sequence, etc.) is "heterologous" to another sequence to which it is operably linked if the two sequences are not associated. in nature.

[76] Как используют в рамках изобретения, термины "клетка-хозяин" и "штамм-хозяин" относятся к подходящим хозяевам для экспрессирующих векторов, содержащих ДНК, описанную в настоящем описании (например, полинуклеотиды, кодирующие варианты РНК-полимеразы T7). В некоторых вариантах осуществления клетки-хозяева представляют собой прокариотические или эукариотические клетки, трансформированные или трансфицированные векторами, сконструированными с использованием способов рекомбинантных ДНК, известных в данной области. [76] As used herein, the terms "host cell" and "host strain" refer to suitable hosts for expression vectors containing the DNA described herein (eg, polynucleotides encoding variants of T7 RNA polymerase). In some embodiments, the host cells are prokaryotic or eukaryotic cells transformed or transfected with vectors constructed using recombinant DNA methods known in the art.

[77] Термин "аналог", когда его используют в отношении полипептида, означает полипептид, обладающий более чем 70% идентичностью последовательности, но менее чем 100% идентичностью последовательности (например, более чем 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% идентичностью последовательности) с эталонным полипептидом. В некоторых вариантах осуществления аналог означает полипептиды, которые содержат один или более не встречающихся в природе аминокислотных остатков, включая, но не ограничиваясь ими, гомоаргинин, орнитин и норвалин, а также встречающиеся в природе аминокислоты. В некоторых вариантах осуществления аналог также включает один или более остатков D-аминокислот и непептидных связей между двумя или более аминокислотными остатками. [77] The term "analogue", when used in relation to a polypeptide, means a polypeptide having more than 70% sequence identity, but less than 100% sequence identity (for example, more than 75%, 78%, 80%, 83%, 85%, 88%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% sequence identity) with the reference polypeptide. In some embodiments, analogue means polypeptides that contain one or more non-naturally occurring amino acid residues, including, but not limited to, homoarginine, ornithine, and norvaline, as well as naturally occurring amino acids. In some embodiments, the analog also includes one or more D-amino acid residues and non-peptide bonds between two or more amino acid residues.

[78] Термин "эффективное количество" означает количество, достаточное для достижения желаемого результата. Специалист в данной области может определить эффективное количество с использованием стандартного экспериментирования. [78] The term "effective amount" means an amount sufficient to achieve the desired result. One of skill in the art can determine the effective amount using standard experimentation.

[79] Термины "выделенный" и "очищенный" используют для обозначения молекулы (например, выделенная нуклеиновая кислота, полипептид и т.д.) или другого компонента, который отделен от по меньшей мере одного другого компонента, с которым он ассоциирован в природе. Термин "очищенный" не требует абсолютной чистоты, скорее он предполагает относительное определение. [79] The terms "isolated" and "purified" are used to refer to a molecule (eg, isolated nucleic acid, polypeptide, etc.) or other component that is separated from at least one other component with which it is naturally associated. The term "purified" does not require absolute purity, rather it suggests a relative definition.

[80] Как используют в рамках изобретения, "композиция" и "состав" охватывают продукты, содержащие по меньшей мере одну сконструированную РНК-полимеразу T7 по настоящему изобретению, предназначенную для любого подходящего применения (например, научная деятельность, диагностика и т.д.). [80] As used herein, "composition" and "formulation" encompass products containing at least one engineered T7 RNA polymerase of the present invention for any suitable application (e.g., science, diagnostics, etc.). ).

[81] Термин "транскрипция" используют для обозначения процесса, в котором часть ДНК-матрицы копируется в РНК под действием фермента РНК-полимеразы. [81] The term "transcription" is used to refer to the process in which a portion of the DNA template is copied into RNA by the action of the enzyme RNA polymerase.

[82] Термин "ДНК-матрица" используют для обозначения двухцепочечной или одноцепочечной молекулы ДНК, включающей промоторную последовательность и последовательность, кодирующую РНК-продукт транскрипции. [82] The term "DNA template" is used to refer to a double-stranded or single-stranded DNA molecule comprising a promoter sequence and a sequence encoding an RNA transcript product.

[83] Термин "промотор" используют для обозначения последовательности ДНК, которая распознается РНК-полимеразой в качестве участка начала транскрипции. Промотор привлекает РНК-полимеразу и в случае РНК-полимеразы T7 определяет участок начала транскрипции. [83] The term "promoter" is used to refer to a DNA sequence that is recognized by RNA polymerase as the site of the start of transcription. The promoter attracts RNA polymerase and, in the case of T7 RNA polymerase, determines the transcription start site.

[84] Термин "РНК-полимераза" используют для обозначения ДНК-направленной РНК-полимеразы, которая копирует ДНК-матрицу в РНК-полинуклеотид, путем пошагового включения нуклеотидтрифосфатов в растущий полимер РНК. [84] The term "RNA polymerase" is used to refer to a DNA-directed RNA polymerase that copies a DNA template into an RNA polynucleotide by stepwise incorporation of nucleotide triphosphates into the growing RNA polymer.

[85] Термины "матричная РНК" и "мРНК" используют для обозначения молекул РНК, которые кодируют белок. Этот белок декодируется в ходе трансляции. [85] The terms "messenger RNA" and "mRNA" are used to refer to RNA molecules that encode a protein. This protein is decoded during translation.

[86] Термины "7-метилгуанозиновый кэп", "7meG", "кэп five-prime" и "5'-кэп" используют в отношении определенной модифицированной нуклеотидной структуры, присутствующей на 5'-конце эукариотических мРНК. Структура 7-метилгуанозинового кэпа связывается через 5'-5'-трифосфатную связь с первым нуклеотидом в мРНК. In vivo эта структура кэпа присоединяется к 5'-концу образующейся мРНК посредством последовательной активности множества ферментов. In vitro кэп может быть включен прямо при начале транскрипции РНК-полимеразой с использованием аналога кэпа. [86] The terms "7-methylguanosine cap", "7meG", "five-prime cap" and "5'-cap" are used in relation to a specific modified nucleotide structure present at the 5' end of eukaryotic mRNAs. The structure of the 7-methylguanosine cap is linked via a 5'-5'-triphosphate bond to the first nucleotide in the mRNA. In vivo , this cap structure is attached to the 5' end of the nascent mRNA through the sequential activity of multiple enzymes. In vitro , the cap can be turned on directly at the start of transcription by RNA polymerase using a cap analog.

[87] Термин "аналог кэпа" относится к динуклеотиду, содержащему 5'-5' ди-, три- или тетра-фосфатную связь. Один конец динуклеотида терминируется либо остатком гуанозина, либо остатком замещенного гуанозина; именно с этой формы конца РНК-полимераза будет инициировать транскрипцию путем удлинения от 3'-гидроксила. Другой конец динуклеотида представляет собой гуанозин, который имитирует структуру эукариотического кэпа и, как правило, имеет замещение 7-метилом, 7-бензилом или 7-этилом и/или замещение 7-аминометилом или 7-аминоэтилом. В некоторых случаях этот нуклеотид также является метоксизамещенным на 3'-гидроксильной группе для предупреждения инициации транскрипции с конца кэпа молекулы. [87] The term "cap analog" refers to a dinucleotide containing a 5'-5' di-, tri-, or tetra-phosphate bond. One end of the dinucleotide is terminated by either a guanosine residue or a substituted guanosine residue; it is from this end shape that RNA polymerase will initiate transcription by extending from the 3'-hydroxyl. The other end of the dinucleotide is a guanosine which mimics the structure of a eukaryotic cap and typically has a 7-methyl, 7-benzyl or 7-ethyl substitution and/or a 7-aminomethyl or 7-aminoethyl substitution. In some cases, this nucleotide is also methoxy-substituted on the 3'-hydroxyl group to prevent transcription initiation from the end of the cap of the molecule.

[88] Термины "ARCA" и "антиреверсный аналог кэпа" относятся к химически модифицированным формам аналогов кэпа, предназначенным для максимизации эффективной трансляции in vitro путем обеспечения надлежащего включения аналога кэпа в транскрипт в правильной ориентации. Эти аналоги применимы для усиления трансляции. В некоторых вариантах осуществления применимы ARCA, известные в данной области (например, Peng et al., Org. Lett., 4:161-164 [2002]). [88] The terms "ARCA" and "anti-reverse cap analog" refer to chemically modified forms of cap analogs designed to maximize efficient translation in vitro by ensuring that the cap analog is properly incorporated into the transcript in the correct orientation. These analogs are applicable to enhance translation. In some embodiments, ARCAs known in the art are applicable (eg, Peng et al., Org. Lett., 4:161-164 [2002]).

[89] Термин "рибопереключатель" используют для обозначения аутокаталитического РНК-фермента, который расщепляет сам себя или другую РНК в присутствии лиганда. [89] The term "riboswitch" is used to refer to an autocatalytic RNA enzyme that cleaves itself or another RNA in the presence of a ligand.

[90] Термин "точность" используют для обозначения безошибочности РНК-полимеразы при транскрибировании или копировании ДНК-матрицы в РНК-полинуклеотид. Неточная транскрипция может приводить к однонуклеотидным полиморфизмам (SNP) или инсерциям-делециям. [90] The term "accuracy" is used to refer to the infallibility of an RNA polymerase when transcribing or copying a DNA template into an RNA polynucleotide. Inaccurate transcription can lead to single nucleotide polymorphisms (SNPs) or insertions and deletions.

[91] Термины "однонуклеотидный полиморфизм" или "SNP" относятся к изменению нуклеотида, присутствующего в единичном положении полинуклеотида. В контексте транскрипции SNP могут быть результатом неправильного включения некомплементарного рибонуклеотида (A, C, G или U) РНК-полимеразой в некотором положении на ДНК-матрице. [91] The terms "single nucleotide polymorphism" or "SNP" refer to a change in the nucleotide present at a single position of a polynucleotide. In the context of transcription, SNPs may be the result of misincorporation of a non-complementary ribonucleotide (A, C, G, or U) by RNA polymerase at some position on the DNA template.

[92] Термин "инсерция-делеция" используют для обозначения инсерции или делеции одного или более полинуклеотидов. В контексте транскрипции РНК-полимеразой ошибки инсерций-делеций могут возникать в результате присоединения одного или более дополнительных рибонуклеотидов или не включения одного или более нуклеотидов в некотором положении на ДНК-матрице. [92] The term "insertion-deletion" is used to refer to the insertion or deletion of one or more polynucleotides. In the context of transcription by RNA polymerase, insertion-deletion errors can result from the addition of one or more additional ribonucleotides or from the omission of one or more nucleotides at a position on the DNA template.

[93] Термин "селективность" используют для обозначения признака наличия у фермента более высокой активности против одного субстрата по сравнению с другим субстратом в ходе катализируемой реакции. В контексте котранскрипционного кэпирования РНК-полимераза может иметь высокую или низкую селективность в отношении аналога кэпа относительно GTP. [93] The term "selectivity" is used to denote a sign that an enzyme has higher activity against one substrate compared to another substrate during the catalyzed reaction. In the context of co-transcriptional capping, an RNA polymerase may have high or low selectivity for the cap analog over GTP.

[94] Термин "неорганическая пирофосфатаза" используют для обозначения фермента, который деградирует неорганический пирофосфат в ортофосфат. [94] The term "inorganic pyrophosphatase" is used to refer to an enzyme that degrades inorganic pyrophosphate to orthophosphate.

Активность сконструированной РНК-полимеразы T7:Activity of engineered T7 RNA polymerase:

[95] В некоторых вариантах осуществления сконструированная РНК-полимераза T7, которая демонстрирует усовершенствованное свойство, обладает по меньшей мере приблизительно 85%, по меньшей мере приблизительно 88%, по меньшей мере приблизительно 90%, по меньшей мере приблизительно 91%, по меньшей мере приблизительно 92%, по меньшей мере приблизительно 93%, по меньшей мере приблизительно 94%, по меньшей мере приблизительно 95%, по меньшей мере приблизительно 96%, по меньшей мере приблизительно 97%, по меньшей мере приблизительно 98%, по меньшей мере приблизительно 99% или приблизительно 100% идентичностью аминокислотной последовательности с SEQ ID NO: 4 и/или 15, и различием аминокислотных остатков по сравнению с SEQ ID NO: 4 и/или 15, в одном или более положениях аминокислот (как например, в 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 20 или более положениях аминокислот по сравнению с SEQ ID NO: 4 и/или 15, или последовательностью, обладающей по меньшей мере 85%, по меньшей мере 88%, по меньшей мере 90%, по меньшей мере 91%, по меньшей мере 92%, по меньшей мере 93%, по меньшей мере 94%, по меньшей мере 95%, по меньшей мере 96%, по меньшей мере 97%, по меньшей мере 98%, по меньшей мере 99% или более идентичностью аминокислотной последовательности с SEQ ID NO: 4 и/или 15). В некоторых вариантах осуществления различие остатков по сравнению с SEQ ID NO: 4 в одном или более положениях включает по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более консервативных аминокислотных замен. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 представляет собой полипептид, приведенный в таблице 5.3, 5.5 и/или 5.6. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 выбран из SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39. В некоторых вариантах осуществления различие остатков по сравнению с SEQ ID NO: 15 в одном или более положениях может включать по меньшей мере 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более консервативных аминокислотных замен. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 представляет собой полипептид, приведенный в таблице 5.4. В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 выбран из SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39. [95] In some embodiments, the engineered T7 RNA polymerase that exhibits the improved property has at least about 85%, at least about 88%, at least about 90%, at least about 91%, at least about 92%, at least about 93%, at least about 94%, at least about 95%, at least about 96%, at least about 97%, at least about 98%, at least about 99% or approximately 100% amino acid sequence identity with SEQ ID NO: 4 and/or 15, and amino acid residue difference compared to SEQ ID NO: 4 and/or 15, at one or more amino acid positions (such as 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 20 or more amino acid positions compared to SEQ ID NO: 4 and/or 15, or a sequence having at least at least 85%, at least 88%, at least 90%, at least 91%, at least 92%, at least 93%, at least 94%, at least 95%, at least 96 %, at least 97%, at least 98%, at least 99% or more amino acid sequence identity with SEQ ID NO: 4 and/or 15). In some embodiments, the residue difference from SEQ ID NO: 4 at one or more positions includes at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more conservative amino acid substitutions. In some embodiments, the engineered T7 RNA polymerase polypeptide is the polypeptide shown in Table 5.3, 5.5 and/or 5.6. In some embodiments, the engineered T7 RNA polymerase polypeptide is selected from SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37, and/or 39. In some embodiments, residue differences from SEQ ID NO: 15 at one or more positions may include at least 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more conservative amino acid substitutions. In some embodiments, the engineered T7 RNA polymerase polypeptide is the polypeptide shown in Table 5.4. In some embodiments, the engineered T7 RNA polymerase polypeptide is selected from SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37, and/or 39.

[96] В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 включает функциональный фрагмент сконструированного полипептида РНК-полимеразы T7, охватываемый изобретением. Функциональные фрагменты обладают по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% или 99% активности сконструированного полипептида РНК-полимеразы T7, из которого они происходят (т.е. исходной сконструированной РНК-полимеразы T7). Функциональный фрагмент содержит по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% и даже 99% исходной последовательности сконструированной РНК-полимеразы T7. В некоторых вариантах осуществления функциональный фрагмент укорочен менее чем на 5, менее чем на 10, менее чем на 15, менее чем на 10, менее чем на 25, менее чем на 30, менее чем на 35, менее чем на 40, менее чем на 45 и менее чем на 50 аминокислот. [96] In some embodiments, the engineered T7 RNA polymerase polypeptide comprises a functional fragment of the engineered T7 RNA polymerase polypeptide encompassed by the invention. Functional fragments possess at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98%, or 99% of the activity of the engineered T7 RNA polymerase polypeptide from which they are derived (i.e., the original engineered T7 RNA polymerase). The functional fragment contains at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94% , 95%, 96%, 97%, 98% and even 99% of the original sequence of the engineered T7 RNA polymerase. In some embodiments, the functional fragment is shortened by less than 5, less than 10, less than 15, less than 10, less than 25, less than 30, less than 35, less than 40, less than 45 and less than 50 amino acids.

Полинуклеотиды, кодирующие сконструированные полипептиды, экспрессирующие векторы и клетки-хозяева:Polynucleotides encoding engineered polypeptides, expression vectors and host cells:

[97] Настоящее изобретение относится к полинуклеотидам, кодирующим сконструированные полипептиды РНК-полимеразы T7, описанные в настоящем описании. В некоторых вариантах осуществления полинуклеотиды функционально связаны с одной или более гетерологичными регуляторными последовательностями, которые контролируют экспрессию генов, с образованием рекомбинантного полинуклеотида, способного экспрессировать полипептид. Экспрессирующие конструкции, содержащие гетерологичный полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, можно вводить в соответствующие клетки-хозяева для экспрессии соответствующего полипептида РНК-полимеразы T7. [97] The present invention provides polynucleotides encoding the engineered T7 RNA polymerase polypeptides described herein. In some embodiments, the polynucleotides are operably linked to one or more heterologous regulatory sequences that control gene expression to form a recombinant polynucleotide capable of expressing the polypeptide. Expression constructs containing a heterologous polynucleotide encoding the engineered T7 RNA polymerase polypeptides can be introduced into appropriate host cells to express the corresponding T7 RNA polymerase polypeptide.

[98] Как будет понятно специалисту в данной области, доступность белковой последовательности и знание кодонов, соответствующих различным аминокислотам, обеспечивают описание всех полинуклеотидов, способных кодировать рассматриваемые полипептиды. Вырожденность генетического когда, где одни и те же аминокислоты кодируются альтернативными или синонимическими кодонами, позволяет получение чрезвычайно большого количества нуклеиновых кислот, все из которых кодируют сконструированный полипептид РНК-полимеразы T7. Таким образом, зная конкретную аминокислотную последовательность, специалисты в данной области могут получить любое количество различных нуклеиновых кислот, просто модифицируя последовательность одного или более кодонов так, чтобы аминокислотная последовательность белка не изменялась. В этом отношении настоящее изобретение конкретно предусматривает каждый возможный вариант полинуклеотидов, который может быть сконструирован так, чтобы он кодировал полипептиды, описанные в настоящем описании, посредством выбора комбинаций на основе выбора возможных кодонов, и все такие варианты считаются конкретно раскрытыми для любого полипептида, описанного в настоящем описании, включая варианты, приведенные в таблицах 5.3, 5.4, 5.5 и/или 5.6. [98] As will be appreciated by one of skill in the art, the availability of the protein sequence and knowledge of the codons corresponding to the various amino acids provide a description of all polynucleotides capable of encoding the polypeptides in question. The degeneracy of the genetic when, where the same amino acids are encoded by alternative or synonymous codons, allows the production of an extremely large number of nucleic acids, all of which encode the engineered T7 RNA polymerase polypeptide. Thus, knowing a particular amino acid sequence, those skilled in the art can make any number of different nucleic acids simply by modifying the sequence of one or more codons so that the amino acid sequence of the protein does not change. In this regard, the present invention specifically contemplates each possible polynucleotide variant that can be engineered to encode the polypeptides described herein by selecting combinations based on the choice of possible codons, and all such variants are considered to be specifically disclosed for any polypeptide described in this description, including the options given in tables 5.3, 5.4, 5.5 and/or 5.6.

[99] В различных вариантах осуществления кодоны предпочтительно выбирают так, чтобы они были подходящими для клетки-хозяина, в которой будет продуцироваться белок. Например, для экспрессии в бактериях используют предпочтительные кодоны, используемые бактериями. Следовательно, кодон-оптимизированные полинуклеотиды, кодирующие сконструированные полипептиды РНК-полимеразы T7, содержат предпочтительные кодоны в приблизительно 40%, 50%, 60%, 70%, 80% или более 90% положений кодонов полноразмерной кодирующей области. [99] In various embodiments, the codons are preferably chosen to be suitable for the host cell in which the protein will be produced. For example, for expression in bacteria, the preferred codons used by the bacteria are used. Therefore, codon-optimized polynucleotides encoding engineered T7 RNA polymerase polypeptides contain preferred codons at about 40%, 50%, 60%, 70%, 80%, or more than 90% of the codon positions of the full length coding region.

[100] В некоторых вариантах осуществления, как описано выше, полинуклеотид кодирует сконструированный полипептид, обладающий активностью РНК-полимеразы T7, со свойствами, описанными в настоящем описании, где полипептид содержит аминокислотную последовательность, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью с эталонной последовательностью, выбранной из SEQ ID NO: 4 и 15, или аминокислотную последовательность любого варианта, как описано в таблицах 5.3, 5.4., 5.5 и/или 5.6, и одно или более различий остатков по сравнению с эталонным полипептидом SEQ ID NO: 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и/или 39, или аминокислотную последовательность любого варианта, как описано в таблицах 5.3, 5.4, 5.5 и/или 5.6 (например 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или более положений аминокислотных остатков). В некоторых вариантах осуществления эталонная последовательность выбрана из SEQ ID NO: 4 и/или 15. В некоторых вариантах осуществления полинуклеотид кодирует сконструированный полипептид, обладающий активностью РНК-полимеразы T7, со свойствами, описанными в настоящем описании, где полипептид содержит аминокислотную последовательность, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более идентичностью последовательности с эталонной последовательностью SEQ ID NO: 4 и/или 15, и одно или более отличий остатков по сравнению с SEQ ID NO: 4 и/или 15 в положениях остатков, выбранных из положений остатков, приведенных в таблицах 5.3, 5.4, 5.5 и/или 5.6 при оптимальном выравнивании с полипептидом SEQ ID NO: 4 и/или 15. [100] In some embodiments, as described above, the polynucleotide encodes an engineered polypeptide having T7 RNA polymerase activity with the properties described herein, wherein the polypeptide contains an amino acid sequence having at least 80%, 81%, 82% , 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99 % or more identity with a reference sequence selected from SEQ ID NOs: 4 and 15, or an amino acid sequence of any variant as described in Tables 5.3, 5.4., 5.5 and/or 5.6, and one or more residue differences compared to the reference polypeptide SEQ ID NOs: 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 and/or 39, or the amino acid sequence of any variant as described in Tables 5.3, 5.4, 5.5 and/or 5.6 ( eg 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more amino acid residue positions). In some embodiments, the reference sequence is selected from SEQ ID NO: 4 and/or 15. In some embodiments, the polynucleotide encodes an engineered polypeptide having T7 RNA polymerase activity with the properties described herein, wherein the polypeptide contains an amino acid sequence having at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more sequence identity with the reference sequence of SEQ ID NO: 4 and/or 15, and one or more residue differences compared to SEQ ID NO: 4 and/or 15 in residue positions, selected from the positions of the residues shown in tables 5.3, 5.4, 5.5 and/or 5.6 in optimal alignment with the polypeptide of SEQ ID NO: 4 and/or 15.

[101] В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, содержит полинуклеотидную последовательность, выбранную из полинуклеотидной последовательности, кодирующей SEQ ID NO: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32, 33, 35, 37 и 39. В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, обладает по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 93%, 95%, 96%, 97%, 98%, 99% идентичностью нуклеотидных остатков с SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и 38. В некоторых вариантах осуществления полинуклеотид, кодирующий сконструированные полипептиды РНК-полимеразы T7, содержит полинуклеотидную последовательность, выбранную из SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36 и 38. [101] In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptides comprises a polynucleotide sequence selected from the polynucleotide sequence encoding SEQ ID NOs: 4, 15, 17, 19, 21, 23, 25, 27, 29, 32 , 33, 35, 37, and 39. In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptide has at least 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87% , 88%, 89%, 90%, 93%, 95%, 96%, 97%, 98%, 99% identical nucleotide residues with SEQ ID NO: 3, 14, 16, 18, 20, 22, 24, 26 , 28, 30, 32, 34, 36, and 38. In some embodiments, the polynucleotide encoding the engineered T7 RNA polymerase polypeptides comprises a polynucleotide sequence selected from SEQ ID NOs: 3, 14, 16, 18, 20, 22, 24 , 26, 28, 30, 32, 34, 36 and 38.

[102] В некоторых вариантах осуществления полинуклеотиды способные гибридизоваться в условиях высокой жесткости с эталонной полинуклеотидной последовательностью, выбранной из SEQ ID NO: 3 и/или 14, или комплементарной ей последовательностью, или полинуклеотидной последовательностью, кодирующей любой из вариантов полипептидов РНК-полимеразы T7, описанных в настоящем описании. В некоторых вариантах осуществления полинуклеотид, способный гибридизоваться в условиях высокой жесткости, кодирует полипептид РНК-полимеразы T7, содержащий аминокислотную последовательность, которая обладает одним или более различиями остатков по сравнению с SEQ ID NO: 4 и/или 15 в положениях остатков, выбранных из любых положений, как указано в таблице 5.3, 5.4, 5.5 и/или 5.6. [102] In some embodiments, polynucleotides capable of hybridizing under high stringency conditions to a reference polynucleotide sequence selected from SEQ ID NO: 3 and/or 14, or its complementary sequence, or a polynucleotide sequence encoding any of the T7 RNA polymerase polypeptide variants, described in the present description. In some embodiments, a polynucleotide capable of hybridizing under high stringency conditions encodes a T7 RNA polymerase polypeptide comprising an amino acid sequence that has one or more residue differences from SEQ ID NO: 4 and/or 15 at residue positions selected from any provisions as indicated in Table 5.3, 5.4, 5.5 and/or 5.6.

[103] В некоторых вариантах осуществления выделенный полинуклеотид, кодирующий любой из сконструированных полипептидов РНК-полимеразы T7, описанных в настоящем описании, подвергают различным манипуляциям для обеспечения экспрессии полипептида. В некоторых вариантах осуществления полинуклеотиды, кодирующие полипептиды, предоставляют в качестве экспрессирующих векторов, в которых присутствует одна или более последовательностей контроля для регуляции экспрессии полинуклеотидов и/или полипептидов. Манипулирование выделенным полинуклеотидом перед его встраиванием в вектор может быть желательным или необходимым в зависимости от экспрессирующего вектора. Способы модификации полинуклеотидов и последовательностей нуклеиновых кислот с использованием способов рекомбинантных ДНК хорошо известны в данной области. [103] In some embodiments, an isolated polynucleotide encoding any of the engineered T7 RNA polymerase polypeptides described herein is subjected to various manipulations to allow expression of the polypeptide. In some embodiments, polynucleotides encoding polypeptides are provided as expression vectors in which one or more control sequences are present to regulate expression of the polynucleotides and/or polypeptides. Manipulation of the isolated polynucleotide prior to insertion into the vector may be desirable or necessary, depending on the expression vector. Methods for modifying polynucleotides and nucleic acid sequences using recombinant DNA techniques are well known in the art.

[104] В некоторых вариантах осуществления последовательности контроля включают, среди прочих последовательностей, промоторы, лидерные последовательности, последовательности полиаденилирования, последовательности пропептидов, последовательности сигнальных пептидов и терминаторы транскрипции. Как известно в данной области, подходящие промоторы могут быть выбраны, исходя из используемых клеток-хозяев. Иллюстративные промоторы для клеток-хозяев в виде нитчатых грибов включают промоторы, полученные из генов для амилазы TAKA Aspergillus oryzae, аспарагиновой протеазы Rhizomucor miehei, нейтральной альфа-амилазы Aspergillus niger, устойчивой к кислотам альфа-амилазы Aspergillus niger, глюкоамилазы Aspergillus niger или Aspergillus awamori (glaA), липазы Rhizomucor miehei, щелочной протеазы Aspergillus oryzae, триозофосфатизомеразы Aspergillus oryzae, ацетамидазы Aspergillus nidulans и трипсин-подобной протеазы Fusarium oxysporum (см., например, WO 96/00787), а также промотор NA2-tpi (гибрид промоторов из генов нейтральной альфа-амилазы Aspergillus niger и триозофосфатизомеразы Aspergillus oryzae), и их мутантных, укороченных и гибридных промоторов. Иллюстративные промоторы дрожжевых клеток могут представлять собой промоторы из генов энолазы Saccharomyces cerevisiae (ENO-1), галактокиназы Saccharomyces cerevisiae (GAL1), алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae (ADH2/GAP) и 3-фосфоглицераткиназы Saccharomyces cerevisiae. В данной области известны другие пригодные промоторы для дрожжевых клеток (см., например, Romanos et al., Yeast 8:423-488 [1992]). Иллюстративные промоторы для применения в клетках млекопитающих включают, но не ограничиваются ими, промоторы из цитомегаловируса (CMV), вакуолизирующего вируса обезьян 40 (SV40), из фосфоглицераткиназы Homo sapiens, бета-актина, фактора элонгации 1a или глицеральдегид-3-фосфатдегидрогеназы, или из β-актина Gallus gallus. [104]In some embodiments, control sequences include, among other sequences, promoters, leader sequences, polyadenylation sequences, propeptide sequences, signal peptide sequences, and transcription terminators. As is known in the art, suitable promoters can be selected based on the host cells used. Exemplary promoters for filamentous fungal host cells include promoters derived from genes for TAKA amylase.Aspergillus oryzae, aspartic proteaseRhizomucor miehei, neutral alpha-amylaseAspergillus niger, acid-resistant alpha-amylaseAspergillus niger, glucoamylaseAspergillus niger orAspergillus awamori (glaA), lipasesRhizomucor miehei, alkaline proteaseAspergillus oryzae, triose phosphate isomeraseAspergillus oryzae, acetamidaseAspergillus nidulans and trypsin-like proteaseFusarium oxysporum (see, for example, WO 96/00787), as well as the NA2-tpi promoter (a hybrid of promoters from the neutral alpha-amylase genesAspergillus niger and triose phosphate isomeraseAspergillus oryzae), and their mutant, truncated and hybrid promoters. Exemplary yeast cell promoters may be promoters from enolase genes.Saccharomyces cerevisiae (ENO-1), galactokinaseSaccharomyces cerevisiae (GAL1), alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenaseSaccharomyces cerevisiae (ADH2/GAP) and 3-phosphoglycerate kinaseSaccharomyces cerevisiae. Other suitable promoters for yeast cells are known in the art (see, for example, Romanos et al., Yeast 8:423-488 [1992]). Exemplary promoters for use in mammalian cells include, but are not limited to, promoters from cytomegalovirus (CMV), simian vacuolating virus 40 (SV40), from phosphoglycerate kinaseHomo sapiens, beta-actin, elongation factor 1a or glyceraldehyde-3-phosphate dehydrogenase, or from β-actinGallus gallus.

[105] В некоторых вариантах осуществления последовательность контроля представляет собой подходящую последовательность терминатора транскрипции - последовательность, распознаваемую клеткой-хозяином для терминации транскрипции. Последовательность терминатора функционально связана с 3'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. В рамках настоящего изобретения применим любой терминатор, который является функциональным в клетке-хозяине. Например, иллюстративные терминаторы транскрипции для клеток-хозяев в виде нитчатых грибов могут быть получены из генов амилазы TAKA Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, альфа-глюкозидазы Aspergillus niger и трипсин-подобной протеазы Fusarium oxysporum. Иллюстративные терминаторы для дрожжевых клеток-хозяев могут быть получены из генов энолазы Saccharomyces cerevisiae, цитохрома С Saccharomyces cerevisiae (CYC1) и глицеральдегид-3-фосфатдегидрогеназы Saccharomyces cerevisiae. Другие пригодные терминаторы для дрожжевых клеток-хозяев известны в данной области (см., например, Romanos et al., выше). Иллюстративные терминаторы для клеток млекопитающих включают, но не ограничиваются ими, терминаторы из цитомегаловируса (CMV), вакуолизирующего вируса обезьян 40 (SV40) или из гормона роста Homo sapiens. [105] In some embodiments, the control sequence is a suitable transcription terminator sequence, a sequence recognized by the host cell to terminate transcription. The terminator sequence is operably linked to the 3' end of the nucleic acid sequence encoding the polypeptide. Any terminator that is functional in the host cell is applicable within the scope of the present invention. For example, exemplary transcription terminators for filamentous fungal host cells can be derived from the genes for Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Aspergillus niger alpha-glucosidase, and Fusarium oxysporum trypsin-like protease. Exemplary yeast host cell terminators can be derived from the Saccharomyces cerevisiae enolase, Saccharomyces cerevisiae cytochrome C (CYC1) and Saccharomyces cerevisiae glyceraldehyde-3-phosphate dehydrogenase genes. Other suitable terminators for yeast host cells are known in the art (see, for example, Romanos et al., supra). Illustrative terminators for mammalian cells include, but are not limited to, terminators from cytomegalovirus (CMV), simian vacuolating virus 40 (SV40), or from Homo sapiens growth hormone.

[106] В некоторых вариантах осуществления последовательность контроля представляет собой подходящую лидерную последовательность - нетранслируемую область мРНК, которая важна для трансляции клеткой-хозяином. Лидерная последовательность функционально связана с 5'-концом последовательности нуклеиновой кислоты, кодирующей полипептид. Можно использовать любую лидерную последовательность, которая функциональна в выбранной клетке-хозяине. Иллюстративные лидерные последовательности для клеток-хозяев в виде нитчатых грибов получают из генов амилазы TAKA Aspergillus oryzae и триозофосфатизомеразы Aspergillus nidulans. Подходящие лидерные последовательности для дрожжевых клеток-хозяев включают, но не ограничиваются ими, лидерные последовательности, полученные из генов энолазы Saccharomyces cerevisiae (ENO-1), 3-фосфоглицераткиназы Saccharomyces cerevisiae, альфа-фактора Saccharomyces cerevisiae и алкогольдегидрогеназы/глицеральдегид-3-фосфатдегидрогеназа Saccharomyces cerevisiae (ADH2/GAP). [106] In some embodiments, the control sequence is a suitable leader sequence, an untranslated region of mRNA that is important for translation by the host cell. The leader sequence is operably linked to the 5' end of the nucleic acid sequence encoding the polypeptide. You can use any leader sequence that is functional in the selected host cell. Exemplary leader sequences for filamentous fungal host cells are derived from the Aspergillus oryzae TAKA amylase and Aspergillus nidulans triose phosphate isomerase genes. Suitable leader sequences for yeast host cells include, but are not limited to, leader sequences derived from Saccharomyces cerevisiae enolase (ENO-1), Saccharomyces cerevisiae 3-phosphoglycerate kinase, Saccharomyces cerevisiae alpha-factor, and Saccharomyces alcohol dehydrogenase/glyceraldehyde-3-phosphate dehydrogenase genes . cerevisiae (ADH2/GAP).

[107] Последовательность контроля также может представлять собой последовательность полиаденилирования - последовательность, функционально связанную с 3'-концом последовательности нуклеиновой кислоты и которая при транскрипции распознается клеткой-хозяином в качестве сигнала для присоединения остатков полиаденозина к транскрибируемой мРНК. В рамках настоящего изобретения можно использовать любую последовательность полиаденилирования, которая является функциональной в выбранной клетке-хозяине. Иллюстративные последовательности полиаденилирования для клеток-хозяев в виде нитчатых грибов включают, но не ограничиваются ими, последовательности полиаденилирования из генов амилазы TAKA Aspergillus oryzae, глюкоамилазы Aspergillus niger, антранилатсинтазы Aspergillus nidulans, трипсин-подобной протеазы Fusarium oxysporum и альфа-глюкозидазы Aspergillus niger. Пригодные последовательности полиаденилирования для дрожжевых клеток-хозяев также известны в данной области (см., например, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995]). [107] The control sequence can also be a polyadenylation sequence - a sequence operably linked to the 3' end of the nucleic acid sequence and which upon transcription is recognized by the host cell as a signal for the attachment of polyadenosine residues to the transcribed mRNA. Any polyadenylation sequence that is functional in the selected host cell can be used within the scope of the present invention. Exemplary polyadenylation sequences for filamentous fungal host cells include, but are not limited to, polyadenylation sequences from the Aspergillus oryzae TAKA amylase, Aspergillus niger glucoamylase, Aspergillus nidulans anthranilate synthase, Fusarium oxysporum trypsin-like protease, and Aspergillus niger alpha-glucosidase genes. . Suitable polyadenylation sequences for yeast host cells are also known in the art (see, for example, Guo and Sherman, Mol. Cell. Bio., 15:5983-5990 [1995]).

[108] В некоторых вариантах осуществления последовательность контроля представляет собой кодирующую область сигнального пептида, которая кодирует аминокислотную последовательность, связанную с N-концом полипептида, и направляет кодируемый полипептид на секреторный путь клетки. 5'-конец кодирующей последовательности в последовательности нуклеиновой кислоты может по своей природе содержать область, кодирующую сигнальный пептид, естественным образом связанную в рамке считывания с сегментом кодирующей области, который кодирует секретируемый полипептид. Альтернативно 5'-конец кодирующей последовательности может содержать кодирующую область сигнального пептида, которая является чужеродной для кодирующей последовательности. Любая кодирующая область сигнального пептида, который направляет экспрессируемый полипептид на секреторный путь выбранной клетки-хозяина, является применимой для экспрессии сконструированных полипептидов РНК-полимеразы T7, описанных в настоящем описании. Эффективные кодирующие области сигнальных пептидов для клеток-хозяев в виде нитчатых дрожжей включают, но не ограничиваются ими, кодирующие области сигнальных пептидов, получаемые из генов амилазы TAKA Aspergillus oryzae, нейтральной амилазы Aspergillus niger, глюкоамилазы Aspergillus niger, аспарагиновой протеазы Rhizomucor miehei, целлюлазы Humicola insolens и липазы Humicola lanuginosa. Пригодные сигнальные пептиды для дрожжевых клеток-хозяев включают, но не ограничиваются ими, клетки-хозяева из генов альфа-фактора Saccharomyces cerevisiae и инвертазы Saccharomyces cerevisiae. Пригодные сигнальные пептиды для клеток-хозяев млекопитающих включают, но не ограничиваются ими, сигнальные пептиды из генов для иммуноглобулина-гамма (IgG). [108] In some embodiments, the control sequence is a signal peptide coding region that encodes the amino acid sequence associated with the N-terminus of the polypeptide and directs the encoded polypeptide to the secretory pathway of the cell. The 5' end of a coding sequence in a nucleic acid sequence may inherently contain a signal peptide coding region naturally linked in frame to a segment of the coding region that encodes a secreted polypeptide. Alternatively, the 5' end of the coding sequence may contain a signal peptide coding region that is foreign to the coding sequence. Any signal peptide coding region that directs the expressed polypeptide to the secretory pathway of the selected host cell is useful for expressing the engineered T7 RNA polymerase polypeptides described herein. Effective signal peptide coding regions for filamentous yeast host cells include, but are not limited to, signal peptide coding regions derived from Aspergillus oryzae TAKA amylase, Aspergillus niger neutral amylase, Aspergillus niger glucoamylase, Rhizomucor miehei aspartic protease, Humicola insolens cellulase genes. and Humicola lanuginosa lipase. Suitable signal peptides for yeast host cells include, but are not limited to, host cells from the Saccharomyces cerevisiae alpha factor and Saccharomyces cerevisiae invertase genes. Suitable signal peptides for mammalian host cells include, but are not limited to, signal peptides from immunoglobulin-gamma (IgG) genes.

[109] В некоторых вариантах осуществления последовательность контроля представляет собой область, кодирующую пропептид, которая кодирует аминокислотную последовательность, находящуюся на N-конце полипептида. Полученный пептид в некоторых случаях называют "проферментом", "прополипептидом" или "зимогеном". Прополипептид может конвертироваться в зрелый активный полипептид посредством каталитического или аутокаталитического отщепления пропептида от пропролипептида. [109] In some embodiments, the control sequence is a propeptide coding region that encodes an amino acid sequence located at the N-terminus of the polypeptide. The resulting peptide is sometimes referred to as a "proenzyme", "propolypeptide" or "zymogen". The propolypeptide can be converted to the mature active polypeptide by catalytic or autocatalytic cleavage of the propeptide from the proprolipid.

[110] В другом аспекте настоящее изобретение также относится к рекомбинантному экспрессирующему вектору, содержащему полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, и одну или более областей, регулирующих экспрессию, таких как промотор и терминатор, ориджин репликации и т.д., в зависимости от типа хозяев, в которых его вводят. В некоторых вариантах осуществления различные последовательности нуклеиновых кислот и последовательности контроля, описанные выше, связаны вместе с получением рекомбинантного экспрессирующего вектора, который включает один или более удобных участков рестрикции для обеспечения инсерции или замещения последовательности нуклеиновой кислоты, кодирующей вариант полипептида РНК-полимеразы T7 в таких участках. Альтернативно последовательность(и) полинуклеотида по настоящему изобретению экспрессируют путем встраивания последовательности полинуклеотида или конструкции нуклеиновой кислоты, содержащей последовательность полинуклеотида в надлежащий вектор для экспрессии. При конструировании экспрессирующего вектора кодирующую последовательность размещают в векторе так, чтобы кодирующая последовательность была функционально связана с надлежащими последовательностями контроля для экспрессии. [110] In another aspect, the present invention also provides a recombinant expression vector comprising a polynucleotide encoding an engineered T7 RNA polymerase polypeptide and one or more expression control regions such as a promoter and terminator, an origin of replication, etc., in depending on the type of hosts in which it is administered. In some embodiments, the various nucleic acid sequences and control sequences described above are linked together to produce a recombinant expression vector that includes one or more convenient restriction sites to allow insertion or replacement of a nucleic acid sequence encoding a T7 RNA polymerase variant polypeptide at such sites. . Alternatively, the polynucleotide sequence(s) of the present invention are expressed by inserting the polynucleotide sequence or a nucleic acid construct containing the polynucleotide sequence into an appropriate expression vector. When constructing an expression vector, a coding sequence is placed in the vector such that the coding sequence is operably linked to the appropriate control sequences for expression.

[111] Рекомбинантный экспрессирующий вектор может представлять собой любой вектор (например, плазмиду или вирус), который удобно подвергать способам рекомбинантных ДНК и который может обеспечивать экспрессию варианта последовательности полинуклеотида РНК-полимеразы T7. Выбор вектора, как правило, зависит от совместимости вектора с клеткой-хозяином, в которую намереваются вводить вектор. Векторы могут представлять собой линейные или замкнутые кольцевые плазмиды. [111] The recombinant expression vector can be any vector (eg, plasmid or virus) that is conveniently subjected to recombinant DNA techniques and that can express a T7 RNA polymerase polynucleotide sequence variant. The choice of vector generally depends on the compatibility of the vector with the host cell into which the vector is to be introduced. The vectors can be linear or closed circular plasmids.

[112] В некоторых вариантах осуществления экспрессирующий вектор представляет собой автономно реплицирующийся вектор (т.е. вектор, который существует в качестве внехромосомной структуры, репликация которой не зависит от хромосомной репликации, такой как плазмида, внехромосомный элемент, минихромосома или искусственная хромосома). Вектор может содержать любые средства для обеспечения саморепликации. В некоторых альтернативных вариантах осуществления вектор может представлять собой вектор, который при введении в клетку-хозяина встраивается в геном и реплицируется вместе с хромосомой(ами), в которую он встроился. Более того, можно использовать единый вектор или плазмиду или два или более векторов или плазмид, которые вместе содержат всю ДНК, подлежащую встраиванию в геном клетки-хозяина, или транспозон. [112] In some embodiments, the expression vector is an autonomously replicating vector (i.e., a vector that exists as an extrachromosomal structure whose replication is independent of chromosomal replication, such as a plasmid, extrachromosomal element, minichromosome, or artificial chromosome). The vector may contain any means to ensure self-replication. In some alternative embodiments, the vector may be a vector that, when introduced into a host cell, integrates into the genome and replicates along with the chromosome(s) into which it is inserted. Moreover, a single vector or plasmid, or two or more vectors or plasmids, which together contain all of the DNA to be inserted into the host cell's genome, or transposon, may be used.

[113] В некоторых вариантах осуществления экспрессирующий вектор предпочтительно содержит один или более селективных маркеров, которые позволяют простую селекцию трансформированных клеток. "Селективный маркер" представляет собой ген, продукт которого обеспечивает резистентность к биоциду или вирусу, резистентность к тяжелым металлам, прототрофию ауксотрофам и т.п. Подходящие маркеры для дрожжевых клеток включают, но не ограничиваются ими, ADE2, HIS3, LEU2, LYS2, MET3, TRP1 и URA3. Селективные маркеры для применения в клетках-хозяевах в виде нитчатых грибов включают, но не ограничиваются ими, amdS (ацетамидаза), argB (орнитинкарбамоилтрансферазы), bar (фосфинотрицинацетилтрансфераза), hph (гигромицинфосфотрансфераза), niaD (нитратредуктаза), pyrG (оротидин-5'-фосфатдекарбоксилаза), sC (сульфатаденилтрансфераза) и trpC (антранилатсинтаза), а также их эквиваленты. В другом аспекте настоящее изобретение относится клетке-хозяину, содержащей полинуклеотид, кодирующий по меньшей мере один сконструированный полипептид РНК-полимеразы T7, описанный в настоящей заявке, причем полинуклеотид функционально связан с одной или более последовательностями контроля для экспрессии сконструированного фермента(ов) РНК-полимеразы T7 в клетке-хозяине. Клетки-хозяева для экспрессии полипептидов, кодируемых экспрессирующими векторами по настоящему изобретению, хорошо известны в данной области и включают, но не ограничиваются ими, клетки грибов, такие как дрожжевые клетки (например, Saccharomyces cerevisiae и Pichia pastoris [например, номер доступа ATCC №201178]); клетки насекомых (например, клетки Drosophila S2 и Spodoptera Sf9), клетки растений, клетки животных (например, CHO, COS и BHK) и клетки человека (например, клеточные линии HEK293T, фибробластов человека, THP-1, Jurkat и меланомы Bowes). [113] In some embodiments, the expression vector preferably contains one or more selectable markers that allow easy selection of transformed cells. A "selectable marker" is a gene whose product provides biocide or virus resistance, heavy metal resistance, prototrophy to auxotrophs, and the like. Suitable markers for yeast cells include, but are not limited to, ADE2, HIS3, LEU2, LYS2, MET3, TRP1, and URA3. Selectable markers for use in filamentous fungal host cells include, but are not limited to, amdS (acetamidase), argB (ornithine carbamoyltransferases), bar (phosphinothricin acetyltransferase), hph (hygromycin phosphotransferase), niaD (nitrate reductase), pyrG (orotidin-5' -phosphate decarboxylase), sC (sulfate adenyl transferase) and trpC (anthranilate synthase), as well as their equivalents. In another aspect, the present invention provides a host cell comprising a polynucleotide encoding at least one engineered T7 RNA polymerase polypeptide described herein, wherein the polynucleotide is operably linked to one or more control sequences for expression of the engineered RNA polymerase enzyme(s). T7 in the host cell. Host cells for expression of the polypeptides encoded by the expression vectors of the present invention are well known in the art and include, but are not limited to, fungal cells such as yeast cells (e.g., Saccharomyces cerevisiae and Pichia pastoris [e.g., ATCC accession number 201178 ]); insect cells (eg, Drosophila S2 and Spodoptera Sf9 cells), plant cells, animal cells (eg, CHO, COS, and BHK), and human cells (eg, HEK293T, human fibroblast, THP-1, Jurkat, and Bowes melanoma cell lines).

[114] Таким образом, в другом аспекте настоящее изобретение относится к способам получения сконструированных полипептидов РНК-полимеразы T7, где способы включают культивирование клетки-хозяина, способной экспрессировать полинуклеотид, кодирующий сконструированный полипептид РНК-полимеразы T7, в условиях, пригодных для экспрессии полипептида. В некоторых вариантах осуществления способы дополнительно включают стадии выделения и/или очистки полипептидов РНК-полимеразы T7, как описано в настоящем описании. [114] Thus, in another aspect, the present invention relates to methods for producing engineered T7 RNA polymerase polypeptides, wherein the methods comprise culturing a host cell capable of expressing a polynucleotide encoding an engineered T7 RNA polymerase polypeptide under conditions suitable for expression of the polypeptide. In some embodiments, the methods further comprise the steps of isolating and/or purifying T7 RNA polymerase polypeptides as described herein.

[115] Надлежащие культуральные среды и условия выращивания описанных выше клеток-хозяев хорошо известны в данной области. Полинуклеотиды для экспрессии полипептидов РНК-полимеразы T7 можно вводить в клетки различными способами, известными в данной области. Способы включают, среди прочих, электропорацию, бомбардировку биолистическими частицами, опосредуемую липосомами трансфекцию, трансфекцию с хлоридом кальция и слияние протопластов. [115] Proper culture media and growing conditions for the host cells described above are well known in the art. Polynucleotides for expressing T7 RNA polymerase polypeptides can be introduced into cells by various methods known in the art. Methods include electroporation, biolistic particle bombardment, liposome-mediated transfection, calcium chloride transfection, and protoplast fusion, among others.

[116] Сконструированную РНК-полимеразу T7 со свойствами, описанными в настоящим описании, можно получать, подвергая полинуклеотид, кодирующий встречающийся в природе или сконструированный полипептид РНК-полимеразы T7, способам мутагенеза и/или направленной эволюции, известным в данной области, и как описано в настоящем описании. Иллюстративным способом направленной эволюции является мутагенез и/или шаффлинг ДНК (см., например, Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767 и патент США 6537746). Другие способы направленной эволюции, которые можно использовать, включают, среди прочих, способ ступенчатой достройки (StEP), рекомбинацию in vitro (см., например, Zhao et al., Nat. Biotechnol., 16:258-261 [1998]), мутагенную ПЦР (см., например, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994]) и кассетный мутагенез (см., например, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996]). [116] An engineered T7 RNA polymerase with the properties described herein can be obtained by subjecting a polynucleotide encoding a naturally occurring or engineered T7 RNA polymerase polypeptide to mutagenesis and/or directed evolution methods known in the art and as described in this description. An exemplary method of directed evolution is DNA mutagenesis and/or shuffling (see, e.g., Stemmer, Proc. Natl. Acad. Sci. USA 91:10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/ 35966; WO 98/27230; WO 00/42651; WO 01/75767 and US Patent 6,537,746). Other directed evolution methods that can be used include, among others, stepwise completion (StEP), in vitro recombination (see, for example, Zhao et al., Nat. Biotechnol., 16:258-261 [1998]), mutagenic PCR (see, for example, Caldwell et al., PCR Methods Appl., 3:S136-S140 [1994]) and cassette mutagenesis (see, for example, Black et al., Proc. Natl. Acad. Sci. USA 93:3525-3529 [1996]).

[117] Например, способы мутагенеза и направленной эволюции можно без труда применять в отношении полинуклеотидов для получения вариантов библиотек, которые можно экспрессировать, подвергать скринингу и оценивать. Способы мутагенеза и направленной эволюции хорошо известны в данной области (см., например, патенты США №5605793, 5811238, 5830721, 5834252, 5837458, 5928905, 6096548, 6117679, 6132970, 6165793, 6180406, 6251674, 6277638, 6287861, 6287862, 6291242, 6297053, 6303344, 6309883, 6319713, 6319714, 6323030, 6326204, 6335160, 6335198, 6344356, 6352859, 6355484, 6358740, 6358742, 6365377, 6365408, 6368861, 6372497, 6376246, 6379964, 6387702, 6391552, 6391640, 6395547, 6406855, 6406910, 6413745, 6413774, 6420175, 6423542, 6426224, 6436675, 6444468, 6455253, 6479652, 6482647, 6489146, 6506602, 6506603, 6519065, 6521453, 6528311, 6537746, 6573098, 6576467, 6579678, 6586182, 6602986, 6613514, 6653072, 6716631, 6777218, 6917882, 6946296, 6961664, 6995017, 7024312, 7058515, 7105297, 7148054, 7288375, 7421347, 7430477, 7534564, 7620500, 7620502, 7629170, 7702464, 7747391, 7747393, 7751986, 7776598, 7783428, 7795030, 7853410, 7868138, 7873477, 7873499, 7904249, 7957912, 8014961, 8029988, 8058001, 8076138, 8018150, 8170806, 8377681, 8383346, 8457903, 8504498, 8589085, 8762066, 8849575, 8876066, 8768871, 9593326, 9665694 и все родственные аналоги, происходящие из США и не США; Ling et al., Anal. Biochem., 254(2):157-78 [1997]; Dale et al., Meth. Mol. Biol., 57:369-74 [1996]; Smith, Ann. Rev. Genet., 19:423-462 [1985]; Botstein et al., Science, 229:1193-1201 [1985]; Carter, Biochem. J., 237:1-7 [1986]; Kramer et al., Cell, 38:879-887 [1984]; Wells et al., Gene, 34:315-323 [1985]; Minshull et al., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al., Nature, 391:288-291 [1998]; Crameri, et al., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al., Proc. Nat. Acad. Sci. U.S.A., 94:4504-4509 [1997]; Crameri et al., Nat. Biotechnol., 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. Sci. USA, 91:10747-10751 [1994]; публикации патентных заявок США №2008/0220990, US 2009/0312196, US 2014/0005057, US 2014/0214391, US 2014/0221216; US 2015/0050658, US 2015/0133307, US 2015/0134315 и все родственные аналоги, происходящие из США и не США; WO 95/22625, WO 97/0078, WO 97/35966, WO 98/27230, WO 00/42651, WO 01/75767 и WO 2009/152336; все из которых включены в настоящее описание в качестве ссылок). [117] For example, mutagenesis and directed evolution techniques can be readily applied to polynucleotides to generate library variants that can be expressed, screened, and evaluated. Methods for mutagenesis and directed evolution are well known in the art (see, for example , US Pat. Nos. 5,605,793; 5,811,238; 406, 6251674, 6277638, 6287861, 6287862, 6291242 6323030, 6326204, 6335160, 6335198, 6344356, 6352859, 6355484, 6358740, 63 6365377, 6365408, 6368861, 6372497, 6376246, 6379964, 6387702, 6391552, 6391640, 6395547, 6406855 6406910 6413745 6413774 6420175 6423542 6426224 6436675 6444468 6455253 6479652 6482647 6489146 6506602 65 6521453, 6528311, 6537746, 6573098, 6576467, 6579678, 6586182, 6602986, 6613514, 6653072 , 6716631 6777218 6917882 6946296 6961664 6995017 7024312 7058515 7105297 7148054 7288375 7421347 7430477 75 34564, 7620500, 7620502, 7629170, 7702464, 7747391, 7747393, 7751986, 7776598, 7783428, 7795030, 7853410 , 7868138 7873477 7873499 7904249 7957912 8014961 8029988 8058001 8076138 8018150 8170806 8377681 57903, 8504498, 8589085, 8762066, 8849575, 8876066, 8768871, 9593326, 9665694 and all related analogues originating from the USA and not the USA; Ling et al ., Anal. Biochem . , 254(2):157-78 [1997]; Dale et al ., Meth. Mol. biol . , 57:369-74 [1996]; Smith, Ann. Rev. Genet . , 19:423-462 [1985]; Botstein et al ., Science, 229:1193-1201 [1985]; Carter, Biochem. J. , 237:1-7 [1986]; Kramer et al ., Cell, 38:879-887 [1984]; Wells et al ., Gene, 34:315-323 [1985]; Minshull et al ., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians et al ., Nat. Biotechnol., 17:259-264 [1999]; Crameri et al ., Nature, 391:288-291 [1998]; Crameri, et al ., Nat. Biotechnol., 15:436-438 [1997]; Zhang et al ., Proc. Nat. Acad. sci. USA . 94:4504-4509 [1997]; Crameri et al ., Nat. Biotechnol. , 14:315-319 [1996]; Stemmer, Nature, 370:389-391 [1994]; Stemmer, Proc. Nat. Acad. sci. USA 91:10747-10751 [1994]; US Patent Application Publication No. 2008/0220990, US 2009/0312196, US 2014/0005057, US 2014/0214391, US 2014/0221216; US 2015/0050658, US 2015/0133307, US 2015/0134315 and all related US and non-US origins; WO 95/22625, WO 97/0078, WO 97/35966, WO 98/27230, WO 00/42651, WO 01/75767 and WO 2009/152336; all of which are incorporated herein by reference).

[118] В некоторых вариантах осуществления варианты ферментов, полученные после мутагенной обработки, подвергают скринингу, подвергая варианты ферментов воздействию определенной температуры (или других условиях анализа) и измеряя величину ферментативной активности после термической обработки или других условий анализа. Затем ДНК, содержащую полинуклеотид, кодирующий полипептид РНК-полимеразы T7, выделяют из клетки-хозяина, секвенируют для идентификации изменений нуклеотидной последовательности (при наличии) и используют для экспрессии фермента в отличающейся или той же клетке-хозяине. Определение ферментативной активности в экспрессирующих библиотеках можно проводить с использованием любого подходящего способа, известного в данной области (например, стандартные способы биохимии, таки как анализ с использованием ВЭЖХ). [118] In some embodiments, enzyme variants obtained after mutagenic treatment are screened by exposing the enzyme variants to a certain temperature (or other assay conditions) and measuring the amount of enzymatic activity after heat treatment or other assay conditions. DNA containing a polynucleotide encoding a T7 RNA polymerase polypeptide is then isolated from a host cell, sequenced to identify nucleotide sequence changes (if any), and used to express the enzyme in a different or the same host cell. Determination of enzyme activity in expression libraries can be performed using any suitable method known in the art (eg, standard biochemistry methods such as HPLC analysis).

[119] Для сконструированных полипептидов известной последовательности полинуклеотиды, кодирующие фермент, можно получать стандартными твердофазными способами в соответствии с известными способами синтеза. В некоторых вариантах осуществления фрагменты длиной вплоть до приблизительно 100 оснований можно синтезировать по отдельности, а затем соединять (например, способами ферментативного или химического лигирования или опосредуемыми полимеразами способами) с получением любой желаемой непрерывной последовательности. Например, полинуклеотиды и олигонуклеотиды, описанные в настоящем описании, можно получать посредством химического синтеза с использованием классического способа с фосфорамидитом (cм., например, Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; и Matthes et al., EMBO J., 3:801-05 [1984]), поскольку он обычно применяется на практике в автоматизированных способах синтеза. В соответствии со способом с фосфорамидитом олигонуклеотиды синтезируют (например, в автоматизированном устройстве для синтеза ДНК), очищают, подвергают отжигу, лигируют и клонируют в подходящие векторы. [119] For engineered polypeptides of known sequence, polynucleotides encoding the enzyme can be prepared by standard solid phase methods according to known synthetic methods. In some embodiments, fragments up to about 100 bases in length can be individually synthesized and then joined (eg, by enzymatic or chemical ligation methods or polymerase-mediated methods) to produce any desired contiguous sequence. For example, the polynucleotides and oligonucleotides described herein can be prepared by chemical synthesis using the classic phosphoramidite method (see, e.g., Beaucage et al., Tetra. Lett., 22:1859-69 [1981]; and Matthes et al., EMBO J., 3:801-05 [1984]), since it is commonly practiced in automated synthesis methods. According to the phosphoramidite method, oligonucleotides are synthesized (eg in an automated DNA synthesis machine), purified, annealed, ligated and cloned into appropriate vectors.

[120] Таким образом, в некоторых вариантах осуществления способ получения сконструированного полипептида РНК-полимеразы T7 может включать: (a) синтез полинуклеотида, кодирующего полипептид, содержащий аминокислотную последовательность, выбранную из аминокислотной последовательности любого варианта, приведенного в таблице 5.3, 5.4, 5.5 и/или 5.6, а также SEQ ID NO: 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 и 39, и (b) экспрессию полипептида РНК-полимеразы T7, кодируемого полинуклеотидом. В некоторых вариантах осуществления способа аминокислотная последовательность, кодируемая полинуклеотидом, необязательно может иметь одну или более (например, вплоть до 3, 4, 5 или вплоть 10) делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность необязательно имеет 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1-20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 или 1-50 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность имеет необязательно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 или 50 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления аминокислотная последовательность имеет необязательно 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 или 25 делеций, инсерций и/или замен аминокислотных остатков. В некоторых вариантах осуществления замены могут представлять собой консервативные или неконсервативные замены. [120] Thus, in some embodiments, a method for producing a T7 RNA polymerase engineered polypeptide may include: (a) synthesizing a polynucleotide encoding a polypeptide containing an amino acid sequence selected from the amino acid sequence of any of the variants shown in Tables 5.3, 5.4, 5.5, and /or 5.6, as well as SEQ ID NOs: 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37 and 39, and (b) expression of the T7 RNA polymerase polypeptide encoded by the polynucleotide. In some embodiments of the method, the amino acid sequence encoded by the polynucleotide may optionally have one or more (eg, up to 3, 4, 5, or up to 10) deletions, insertions, and/or substitutions of amino acid residues. In some embodiments, the amino acid sequence optionally has 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-15, 1- 20, 1-21, 1-22, 1-23, 1-24, 1-25, 1-30, 1-35, 1-40, 1-45 or 1-50 deletions, insertions and/or substitutions of amino acid residues . In some embodiments, the amino acid sequence is optionally 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 30, 35, 40, 45 or 50 deletions, insertions and/or substitutions of amino acid residues. In some embodiments, the amino acid sequence is optionally 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 21, 22, 23, 24 or 25 deletions, insertions and/or substitutions of amino acid residues. In some embodiments, the substitutions may be conservative or non-conservative substitutions.

[121] Экспрессируемый сконструированный полипептид РНК-полимеразы T7 можно оценивать в отношении любого желаемого усовершенствованного свойства (например, активность, селективность, стабильность, устойчивость к действию кислот, чувствительность к протеазам и т.д.), с использованием любого подходящего способа анализа, известного в данной области, включая, но не ограничиваясь ими способы анализа и условия, описанные в настоящем описании. [121] An expressed engineered T7 RNA polymerase polypeptide can be assessed for any desired improved property (e.g., activity, selectivity, stability, acid resistance, protease sensitivity, etc.) using any suitable assay method known in the art. in this field, including, but not limited to, the methods of analysis and conditions described in the present description.

[122] В некоторых вариантах осуществления любой из сконструированных полипептидов РНК-полимеразы T7, экспрессируемых в клетке-хозяине, выделяют из клеток и/или культуральной среды с использованием любого одного или более из хорошо известных способов очистки белков, включая, среди прочих, обработку лизоцимом, обработку ультразвуком, фильтрацию, высаливание, ультрацентрифугирование и хроматографию. [122] In some embodiments, any of the engineered T7 RNA polymerase polypeptides expressed in the host cell are isolated from the cells and/or culture medium using any one or more of the well-known protein purification methods, including but not limited to lysozyme treatment. , sonication, filtration, salting out, ultracentrifugation and chromatography.

[123] Хроматографические способы выделения полипептидов T7 РНК-полимеразы включают, среди прочих, обращено-фазовую хроматографию, высокоэффективную жидкостную хроматографию, ионообменную хроматографию, хроматографию гидрофобного взаимодействия, гель-электрофорез и аффинную хроматографию. Условия для очистки конкретных ферментов зависят, частично, от таких факторов, как суммарный заряд, гидрофобность, гидрофильность, молекулярная масса, молекулярная форма и т.д., и станут понятными специалистам в данной области. В некоторых вариантах осуществления аффинные способы можно использовать для выделения усовершенствованных вариантов ферментов РНК-полимеразы. В некоторых вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, может использоваться любое антитело, которое специфически связывает вариант полипептида РНК-полимеразы T7. В некоторых вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, могут использоваться белки, которые связываются с гликанами, ковалентно связанными с РНК-полимеразой T7. В других вариантах осуществления, в которых используется очистка посредством аффинной хроматографии, может использоваться любое низкомолекулярное соединение, которое связывается с активным центром РНК-полимеразы T7. Для продуцирования антител различных животных-хозяев, включая, но не ограничиваясь ими, кроликов, мышей, крыс и т.д., иммунизируют посредством инъекции полипептида РНК-полимеразы T7 (например, варианта РНК-полимеразы T7) или его фрагмента. В некоторых вариантах осуществления полипептид РНК-полимераза T7 или его фрагмент связан с подходящим носителем, таким как BSA, через функциональную группу боковой цепи или линкеры, связанные с функциональной группой боковой цепи. [123] Chromatographic methods for isolating T7 RNA polymerase polypeptides include reverse phase chromatography, high performance liquid chromatography, ion exchange chromatography, hydrophobic interaction chromatography, gel electrophoresis, and affinity chromatography, among others. Conditions for purification of particular enzymes depend, in part, on factors such as net charge, hydrophobicity, hydrophilicity, molecular weight, molecular shape, etc., and will be understood by those skilled in the art. In some embodiments, affinity methods can be used to isolate improved variants of RNA polymerase enzymes. In some embodiments that use affinity chromatography purification, any antibody that specifically binds a variant T7 RNA polymerase polypeptide can be used. In some embodiments that use affinity chromatography purification, proteins can be used that bind to glycans covalently linked to T7 RNA polymerase. In other embodiments that use affinity chromatography purification, any small molecular weight compound that binds to the active site of T7 RNA polymerase can be used. For antibody production, various host animals, including but not limited to rabbits, mice, rats, etc., are immunized by injection of a T7 RNA polymerase polypeptide (eg, a T7 RNA polymerase variant) or fragment thereof. In some embodiments, the T7 RNA polymerase polypeptide or fragment thereof is linked to a suitable carrier, such as BSA, via a side chain functional group or linkers linked to the side chain functional group.

[124] В некоторых вариантах осуществления сконструированный полипептид РНК-полимеразы T7 продуцируют в клетке-хозяине способом, включающим культивирование клетки-хозяина (например, S. cerevisiae, Daucus carota, Nicotiana tabacum, H. sapiens (например, HEK293T) или Cricetulus griseus (например, CHO)), содержащей последовательность полинуклеотида, кодирующую сконструированный полипептид РНК-полимеразы T7, как описано в настоящем описании, в условиях, способствующих продуцированию сконструированного полипептида РНК-полимеразы T7, и выделение сконструированного полипептида РНК-полимеразы T7 из клеток и/или культуральной среды. [124] In some embodiments, the engineered T7 RNA polymerase polypeptide is produced in a host cell by a method comprising culturing the host cell (e.g., S. cerevisiae, Daucus carota, Nicotiana tabacum, H. sapiens (e.g., HEK293T) or Cricetulus griseus ( e.g., CHO)) containing a polynucleotide sequence encoding an engineered T7 RNA polymerase polypeptide as described herein under conditions conducive to the production of the engineered T7 RNA polymerase polypeptide, and isolating the engineered T7 RNA polymerase polypeptide from cells and/or culture media. environment.

[125] В некоторых вариантах осуществления изобретение охватывает способ продуцирования сконструированного полипептида РНК-полимеразы T7, включающий культивирование рекомбинантной эукариотической клетки, содержащей последовательность полинуклеотида, кодирующего сконструированный полипептид РНК-полимеразы T7, обладающую по меньшей мере 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% или 100% идентичностью последовательности с эталонными последовательностями SEQ ID NO: 4 и/или 15, и одно или более отличий аминокислотных остатков по сравнению с SEQ ID NO: 4 и/или 15, выбранных из различий, приведенных в таблицах 5.3, 5.4, 5.5 и/или 5.6, и/или их комбинаций при оптимальном выравнивании с аминокислотной последовательностью SEQ ID NO: 4 и/или 15 в подходящих условиях культивирования для обеспечения продуцирования сконструированного полипептида РНК-полимеразы T7, и необязательно выделение сконструированного полипептида РНК-полимеразы T7 из культуры и/или культивируемых бактериальных клеток. [125] In some embodiments, the invention encompasses a method for producing an engineered T7 RNA polymerase polypeptide, comprising culturing a recombinant eukaryotic cell containing a polynucleotide sequence encoding an engineered T7 RNA polymerase polypeptide having at least 80%, 81%, 82%, 83 %, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 95%, 96%, 97%, 98%, 99% or 100% sequence identity with reference sequences SEQ ID NO: 4 and/or 15, and one or more differences in amino acid residues compared to SEQ ID NO: 4 and/or 15, selected from the differences shown in tables 5.3, 5.4, 5.5 and/or 5.6, and/or combinations thereof in optimal alignment with the amino acid sequence of SEQ ID NO: 4 and/or 15 under suitable culture conditions to allow production of the engineered T7 RNA polymerase polypeptide, and optionally isolating the engineered T7 RNA polymerase polypeptide from culture and/or cultured bacterial cells.

[126] В некоторых вариантах осуществления после выделения сконструированных полипептидов РНК-полимеразы T7 из рекомбинантных клеток-хозяев или среды для культивирования клеток, их далее очищают любым подходящим способом(ами), известным в данной области. В некоторых дополнительных вариантах осуществления очищенные полипептиды РНК-полимеразы T7 комбинируют с другими ингредиентами и соединениями для обеспечения композиций и составов, содержащих сконструированный полипептид РНК-полимеразы T7, надлежащим образом для различных способов использования и применений (например, фармацевтические композиции). В некоторых дополнительных вариантах осуществления очищенные полипептиды РНК-полимеразы T7 или составленные полипептиды РНК-полимеразы T7 являются лиофилизированными. [126] In some embodiments, after isolation of engineered T7 RNA polymerase polypeptides from recombinant host cells or cell culture media, they are further purified by any suitable method(s) known in the art. In some additional embodiments, the purified T7 RNA polymerase polypeptides are combined with other ingredients and compounds to provide compositions and formulations containing the engineered T7 RNA polymerase polypeptide appropriately for various uses and applications (eg, pharmaceutical compositions). In some additional embodiments, the purified T7 RNA polymerase polypeptides or formulated T7 RNA polymerase polypeptides are lyophilized.

Композиции:Compositions:

[127] Настоящее изобретение относится к различным композициям и форматам, включая, но не ограничиваясь ими, композиции и форматы, описанные ниже. В некоторых вариантах осуществления настоящее изобретение относится сконструированным полипептидам РНК-полимеразы T7, пригодным для применения в композициях для диагностических целей. [127] The present invention relates to various compositions and formats, including, but not limited to, the compositions and formats described below. In some embodiments, the present invention provides engineered T7 RNA polymerase polypeptides suitable for use in compositions for diagnostic purposes.

ЭКСПЕРИМЕНТАЛЬНАЯ ЧАСТЬEXPERIMENTAL PART

[128] Следующие примеры, включая эксперименты и достигнутые результаты, предоставлены только для иллюстративных целей, и их не следует истолковывать как ограничивающие настоящее изобретение. [128] The following examples, including experiments and results achieved, are provided for illustrative purposes only and should not be construed as limiting the present invention.

[129] В описании экспериментальной части ниже используются следующие сокращенные обозначения: м.д. (части на миллион); M (молярный); мМ (миллимолярный), мкМ (микромолярный); нМ (наномолярный); моль (количество моль); г (граммы); мг (миллиграммы); мкг (микрограммы); л (литры); мл (миллилитры); см (сантиметры); мм (миллиметры); мкм (микрометры); с (секунды); мин (минута(ы)); ч (час(ы)); Е (единицы); ММ (молекулярная масса); об/мин (обороты в минуту); rcf (относительная центробежная сила); °C (градусы Цельсия); CDS (кодирующая последовательность); ДНК (дезоксирибонуклеиновая кислота); РНК (рибонуклеиновая кислота); E. coli W3110 (часто используемый лабораторный штамм E. coli, доступный от Coli Genetic Stock Center [CGSC], New Haven, CT); ВЭЖХ (жидкостная хроматография высокого давления); MWCO (предел молекулярной массы); SDS-PAGE (полиакриламидный гель-электрофорез с додецилсульфатом натрия); T7RNAP (РНК-полимераза T7); PES (полиэфирсульфон); CFSE (сукцинимидиловый эфир карбоксифлуоресцеина); IPTG (изопропил β-D-1-тиогалактопиранозид); PMBS (сульфат полимиксина B); NADPH (никотинамидадениндинуклеотидфосфат); GIDH (глутаматдегидрогеназа); FIOPC (кратность улучшения относительно положительного контроля); LB (бульон Луриа); MeOH (метанол); Athens Research (Athens Research Technology, Athens, GA); NEB (New England Biolabs, Ipswich, MA); Ion Torrent (Ion Torrent, Gilford, NH); ProSpec (ProSpec Tany Technogene, East Brunswick, NJ); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Ram Scientific (Ram Scientific, Inc., Yonkers, NY); Pall Corp. (Pall, Corp., Pt. Washington, NY); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Kuhner (Adolf Kuhner, AG, Basel, Switzerland); Axygen (Axygen, Inc., Union City, CA); Toronto Research Chemicals (Toronto Research Chemicals Inc., Toronto, Ontario, Canada); Cambridge Isotope Laboratories, (Cambridge Isotope Laboratories, Inc., Tewksbury, MA); Applied Biosystems (Applied Biosystems, part of Life Technologies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (part of Thermo Fisher Scientific, Waltham, MA); Ion Torrent NGS (Ion Torrent Next Generation Sequencing); Li-COR (Li-COR, Lincoln, NE); UVP (UVP, Upland, CA); Biotium (Biotium, Inc., Fremont, CA); Corning (Corning, Inc., Palo Alto, CA); Megazyme (Megazyme International, Wicklow, Ireland); Enzo (Enzo Life Sciences, Inc., Farmingdale, NY); GE Healthcare (GE Healthcare Bio-Sciences, Piscataway, NJ); Pierce (Pierce Biotechnology (now part of Thermo Fisher Scientific), Rockford, IL); LI-COR (LI-COR Biotechnology, Lincoln, NE); Amicus (Amicus Therapeutics, Cranbury, NJ); Phenomenex (Phenomenex, Inc., Torrance, CA); Optimal (Optimal Biotech Group, Belmont, CA); и Bio-Rad (Bio-Rad Laboratories, Hercules, CA). [129]In the description of the experimental part below, the following abbreviations are used: ppm. (parts per million); M (molar); mM (millimolar), µM (micromolar); nM (nanomolar); mole (number of moles); g (grams); mg (milligrams); mcg (micrograms); l (liters); ml (milliliters); cm (centimeters); mm (millimeters); µm (micrometers); s (seconds); min (minute(s)); h (hour(s)); E (units); MM (molecular weight); rpm (revolutions per minute); rcf (relative centrifugal force); °C (degrees Celsius); CDS (coding sequence); DNA (deoxyribonucleic acid); RNA (ribonucleic acid);E. coli W3110 (commonly used laboratory strainE. coli, available from Coli Genetic Stock Center [CGSC], New Haven, CT); HPLC (high pressure liquid chromatography); MWCO (molecular weight limit); SDS-PAGE (polyacrylamide gel electrophoresis with sodium dodecyl sulfate); T7RNAP (T7 RNA polymerase); PES (polyethersulfone); CFSE (carboxyfluorescein succinimidyl ether); IPTG (isopropyl β-D-1-thiogalactopyranoside); PMBS (polymyxin B sulfate); NADPH (nicotinamide adenine dinucleotide phosphate); GIDH (glutamate dehydrogenase); FIOPC (fold improvement relative to positive control); LB (Luria broth); MeOH (methanol); Athens Research (Athens Research Technology, Athens, GA); NEB (New England Biolabs, Ipswich, MA); Ion Torrent (Ion Torrent, Gilford, NH); ProSpec (ProSpec Tany Technogene, East Brunswick, NJ); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Ram Scientific (Ram Scientific, Inc., Yonkers, NY); Pal Corp. (Pall, Corp., Pt. Washington, NY); Millipore (Millipore, Corp., Billerica MA); Difco (Difco Laboratories, BD Diagnostic Systems, Detroit, MI); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Kuhner (Adolf Kuhner, AG, Basel, Switzerland); Axygen (Axygen, Inc., Union City, CA); Toronto Research Chemicals (Toronto Research Chemicals Inc., Toronto, Ontario, Canada); Cambridge Isotope Laboratories, (Cambridge Isotope Laboratories, Inc., Tewksbury, MA); Applied Biosystems (Applied Biosystems, part of Life Technologies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (part of Thermo Fisher Scientific, Waltham, MA); Ion Torrent NGS (Ion Torrent Next Generation Sequencing); Li-COR (Li-COR, Lincoln, N.E.); UVP (UVP, Upland, CA); Biotium (Biotium, Inc., Fremont, Calif.); Corning (Corning, Inc., Palo Alto, CA); Megazyme (Megazyme International, Wicklow, Ireland); Enzo (Enzo Life Sciences, Inc., Farmingdale, NY); GE Healthcare (GE Healthcare Bio-Sciences, Piscataway, NJ); Pierce (Pierce Biotechnology (now part of Thermo Fisher Scientific), Rockford, IL); LI-COR (LI-COR Biotechnology, Lincoln, NE); Amicus (Amicus Therapeutics, Cranbury, NJ); Phenomenex (Phenomenex, Inc., Torrance, CA); Optimal (Optimal Biotech Group, Belmont, CA); and Bio-Rad (Bio-Rad Laboratories, Hercules, CA).

[130] Следующие полинуклеотидные или полипептидные последовательности применимы в рамках настоящего изобретения. В некоторых случаях (как показано ниже) после полинуклеотидной последовательности следует кодируемый полипептид. [130] The following polynucleotide or polypeptide sequences are applicable within the scope of the present invention. In some cases (as shown below), the polynucleotide sequence is followed by the encoded polypeptide.

ПРИМЕР 1EXAMPLE 1

Получение гена РНК-полимеразы T7 и конструирование экспрессирующих векторовGeneration of the T7 RNA polymerase gene and construction of expression vectors

[131] Фермент РНК-полимераза T7 дикого типа (WT) (SEQ ID NO: 2) кодируется геномом бактериофага T7 (SEQ ID NO: 1). Синтетический ген (SEQ ID NO: 3), кодирующий меченную 6-гистидином версию РНК-полимеразы T7 (SEQ ID NO: 4), конструировали и субклонировали в экспрессирующий вектор Escherichia coli pCK100900i (см., например, патент США №7629157 и публикацию патентной заявки США №2016/0244787, обе из которых включены в настоящее описание в качестве ссылок). Эти плазмидные конструкции трансформировали в штамм E. Coli, происходящий из W3110. Способы направленной эволюции, общеизвестные специалистам в данной области, использовали для получения библиотек вариантов генов из этих плазмид (см., например, патент США №8383346 и WO 2010/144103, оба из которых включены в настоящее описание в качестве ссылок). Замены в вариантах ферментов, описанных в настоящем описании, указаны относительно фермента 6His-меченной РНК-полимеразы T7 WT (т.е. SEQ ID NO: 4) или их вариантов, как указано. [131] The wild-type (WT) T7 RNA polymerase enzyme (SEQ ID NO: 2) is encoded by the bacteriophage T7 genome (SEQ ID NO: 1). A synthetic gene (SEQ ID NO: 3) encoding a 6-histidine labeled version of T7 RNA polymerase (SEQ ID NO: 4) was constructed and subcloned into the Escherichia coli pCK100900i expression vector (see, for example, US Patent No. 7,629,157 and Patent Publication US Application No. 2016/0244787, both of which are incorporated herein by reference). These plasmid constructs were transformed into an E. coli strain derived from W3110. Guided evolution methods well known to those skilled in the art have been used to generate libraries of gene variants from these plasmids (see, for example, US Pat. No. 8,383,346 and WO 2010/144103, both of which are incorporated herein by reference). Substitutions in the enzyme variants described herein are relative to the WT 6His-labeled T7 RNA polymerase enzyme (ie, SEQ ID NO: 4) or variants thereof, as indicated.

ПРИМЕР 2EXAMPLE 2

Высокопроизводительная (HTP) экспрессия и очистка РНК-полимеразы T7High throughput (HTP) expression and purification of T7 RNA polymerase

[132] В этом примере описаны эксперименты, проведенные в отношении экспрессии и очистки РНК-полимеразы T7 и ее вариантов. [132] This example describes the experiments carried out in relation to the expression and purification of T7 RNA polymerase and its variants.

Высокопроизводительное (HTP) выращивание ДНК-полимеразы T7 и вариантовHigh Throughput (HTP) Growth of T7 DNA Polymerase and Variants

[133] Трансформированные клетки E. coli подвергали селекции путем посева на чашки с агаром LB, содержавшие 1% глюкозу и 30 мкг/мл хлорамфеникола. После инкубации в течение ночи при 37°C, колонии помещали в лунки 96-луночных неглубоких планшетов с плоским дном NUNC™ (Thermo-Scientific), заполненных 180 мкл/лунка средой LB, дополненной 1% глюкозой и 30 мкг/мл хлорамфеникола. Культурам позволяли расти ночью в течение 18-20 часов в устройстве для встряхивания (200 об/мин, 30°C и относительная влажность 85%; Kuhner). Образцы, подвергнутые выращиванию в течение ночи (20 мкл), переносили в 96-луночные глубоки планшеты Costar, заполненные 380 мкл среды Terrific Broth, дополненной 30 мкг/мл хлорамфеникола. Планшеты инкубировали в течение 120 минут в устройстве для встряхивания (250 об/мин, 30°C и относительная влажность 85%; Kuhner) до достижения OD₆₀₀ 0,4-0,8. Затем клетки индуцировали посредством 40 мкл 10 мМ IPTG в стерильной воде и инкубировали в течение ночи в течение 18-20 часов в устройстве для встряхивания (250 об/мин, 30°C и относительная влажность 85%; Kuhner). Клетки осаждали (4000 об/мин×20 мин), супернатанты удаляли и клетки замораживали при -80°C перед анализом. [133] Transformed E. coli cells were selected by plating on LB agar plates containing 1% glucose and 30 μg/ml chloramphenicol. After overnight incubation at 37° C., colonies were plated in wells of NUNC™ 96-well shallow flat bottom plates (Thermo-Scientific) filled with 180 μl/well LB medium supplemented with 1% glucose and 30 μg/ml chloramphenicol. The cultures were allowed to grow overnight for 18-20 hours in a shaker (200 rpm, 30° C. and 85% relative humidity; Kuhner). Overnight grown samples (20 μl) were transferred to Costar 96-well deep plates filled with 380 μl Terrific Broth supplemented with 30 μg/ml chloramphenicol. The plates were incubated for 120 minutes in a shaker (250 rpm, 30° C. and 85% relative humidity; Kuhner) until an OD ₆₀₀ of 0.4-0.8 was reached. The cells were then induced with 40 μl of 10 mM IPTG in sterile water and incubated overnight for 18-20 hours in a shaker (250 rpm, 30° C. and 85% relative humidity; Kuhner). Cells were pelleted (4000 rpm×20 min), supernatants were removed and cells were frozen at -80°C prior to analysis.

Лизис осадков HTPHTP precipitation lysis

[134] Клеточные осадки ресуспендировали в 400 мкл лизирующего буфера (20 мМ Tris, pH 7,5, 1 MgSO₄, 1 мг/мл лизоцима и 0,5 мг/мл сульфата полимиксина B) и встряхивали в течение 1,5 ч при комнатной температуре. Затем лизаты осаждали (4000 об/мин×5 мин) и отделенные от примесей супернатанты сохраняли для очистки. [134] Cell pellets were resuspended in 400 μl of lysis buffer (20 mM Tris, pH 7.5, 1 MgSO ₄ , 1 mg/ml lysozyme and 0.5 mg/ml polymyxin B sulfate) and shaken for 1.5 h at room temperature. Then the lysates were precipitated (4000 rpm×5 min) and the supernatants separated from impurities were stored for purification.

Очистка HTP T7RNAP из неочищенных лизатовPurification of HTP T7RNAP from crude lysates

[135] T7RNAP очищали из отделенных от примесей лизатов E. coli посредством металл-аффинной хроматографии с использованием покрытых никелем планшетов HIS-Select® большого объема (HC) (Sigma) в соответствии с инструкциями изготовителя. Планшеты HIS-Select® уравновешивали всего 800 мкл промывочного буфера (50 мМ фосфат натрия, pH 7,5, 300 мМ NaCl, 25 мМ имидазол, 0,1% об./об. реагента TWEEN-20^® [Sigma]) на лунку. Затем 200 мкл лизата HTP, содержавшего T7RNAP, и 200 мкл промывочного буфера перемешивали, помещали в планшет и центрифугировали в течение 1 мин при относительной центробежной силе 2000 (rcf) и 4°C. Планшет промывали два раза 600 мкл промывочного буфера на лунку с центрифугированием в течение 3 мин при 3000 rcf и 4°C для каждого промывания. Образцы ферментов элюировали добавлением 200 мкл элюирующего буфера (50 мМ фосфат натрия, pH 7,5, 300 мМ NaCl, 250 мМ имидазола, 0,1% об./об. реагента TWEEN^®-20) посредством центрифугирования в течение 1 мин при 3000 rcf при 4°C. [135] T7RNAP was purified from contaminant-free E. coli lysates by metal affinity chromatography using nickel plated HIS-Select® high volume (HC) plates (Sigma) according to the manufacturer's instructions. HIS-Select® plates were equilibrated with a total of 800 µl wash buffer (50 mM sodium phosphate, pH 7.5, 300 mM NaCl, 25 mM imidazole, 0.1% v/v TWEEN- ^20® reagent [Sigma]) per well . Then 200 μl of HTP lysate containing T7RNAP and 200 μl of wash buffer were mixed, placed in a plate and centrifuged for 1 min at a relative centrifugal force of 2000 (rcf) and 4°C. The plate was washed twice with 600 μl of wash buffer per well with centrifugation for 3 min at 3000 rcf and 4°C for each wash. Enzyme samples were eluted by adding 200 µl of elution buffer (50 mM sodium phosphate, pH 7.5, 300 mM NaCl, 250 mM imidazole, 0.1% v/v TWEEN ^® -20 reagent) by centrifugation for 1 min at 3000 rcf at 4°C.

[136] Элюаты подвергали замене буфера с использованием обессоливающих планшетов Zeba™ Spin (Thermo Fisher). В кратком изложении, планшеты уравновешивали два раза посредством 375 мкл 2× буфера для хранения T7RNAP (100 мМ Tris.HCl, pH 8,0, 200 мМ NaCl, 2 мМ DTT, 2 мМ EDTA, 0,2% масс./об. Triton X-100) на лукну и центрифугировали в течение 2 мин при 1100 xg при 4°C. В обессоливающие планшеты помещали 100 мкл элюата с планшета для образца HIS-Select® и центрифугировали в течение 2 мин при 1100 rcf при 4°C. Элюат с обессоливающего планшета сохраняли и смешивали с равным объемом глицерина для конечной концентрации буфера для хранения, содержавшего 50 мМ Tris HCl pH 8,0, 100 мМ NaCl, 1 мМ DTT, 1 мМ EDTA, 0,1% об./об. Triton X-100 и 50% глицерин (об./об.). [136] The eluates were buffer exchanged using Zeba™ Spin desalting plates (Thermo Fisher). Briefly, the plates were equilibrated two times with 375 μl of 2x T7RNAP storage buffer (100 mM Tris.HCl, pH 8.0, 200 mM NaCl, 2 mM DTT, 2 mM EDTA, 0.2% w/v Triton X-100) on onion and centrifuged for 2 min at 1100 xg at 4°C. 100 μl of eluate from the HIS-Select® sample plate was placed in desalting plates and centrifuged for 2 min at 1100 rcf at 4°C. The eluate from the desalting plate was saved and mixed with an equal volume of glycerol for final concentration of storage buffer containing 50 mM Tris HCl pH 8.0, 100 mM NaCl, 1 mM DTT, 1 mM EDTA, 0.1% v/v. Triton X-100 and 50% glycerin (v/v).

[137] Отсутствие контаминации РНК-азой в очищенных образцах подтверждали с использованием анализа RNase Alert (IDT, Life Technologies). Анализ SDS-PAGE для образцов T7RNAP продемонстрировал отсутствие поддающихся обнаружению соответствующих контаминации полос для большинства образцов. [137] The absence of RNase contamination in the purified samples was confirmed using the RNase Alert assay (IDT, Life Technologies). SDS-PAGE analysis of T7RNAP samples showed no detectable bands corresponding to contamination for most of the samples.

[138] Для реакций транскрипции in vitro с использованием HTP-очищенной T7RNAP, очищенную полимеразу добавляли до конечной концентрации 10% общего объема реакции (5% для фермента из культур во вращающихся флаконах). [138] For in vitro transcription reactions using HTP-purified T7RNAP, purified polymerase was added to a final concentration of 10% of the total reaction volume (5% for enzyme from shake flask cultures).

ПРИМЕР 3EXAMPLE 3

Экспрессия во вращающихся флаконах и очистка РНК-полимеразы T7Roller flask expression and purification of T7 RNA polymerase

[139] В этом примере описаны эксперименты, вовлекающие экспрессию во вращающихся флаконах и очистку T7RNAP. [139] This example describes experiments involving spin flask expression and purification of T7RNAP.

Экспрессия во вращающихся флаконахExpression in spinner flasks

[140] Отобранные культуры HTP, выращенные как описано в примере 2, высевали на чашки с агаром LB с 1% глюкозой и 30 мкг/мл хлорамфеникола и выращивали в течение ночи при 37°C. Единичную колонию из каждой культуры переносили в 6 мл бульона LB с 1% глюкозой и 30 мкг/мл хлорамфеникола. Культуры выращивали в течение 18 ч при 30°C, 250 об/мин и субкультивировали при разведении приблизительно 1:10 в 250 мл среды Terrific Broth с 30 мкг/мл хлорамфеникола до конечной OD₆₀₀ 0,2. Культуры инкубировали в течение приблизительно 3 часов при 30°C, 250 об/мин, до OD₆₀₀ 0,6-0,8, а затем индуцировали добавлением IPTG в конечной концентрации 1 мМ. Индуцированные культуры инкубировали в течение 20 ч при 30°C, 250 об/мин. После этого периода инкубации культуры центрифугировали при 4000 об/мин×10 мин. Культуральный супернатант удаляли и осадки ресуспендировали в 35 мл лизирующего буфера (50 мМ NaH₂PO₄, pH 7,5, 500 мМ NaCl, 0,1% Tween-20, 10 мМ имидазол). Эту клеточную суспензию охлаждали на ледяной бане и лизировали с использованием устройства для разрушения клеток Microfluidizer (Microfluidics M‐110L). Неочищенный лизат осаждали центрифугированием (16000 об/мин в течение 60 мин при 4°C), а затем супернатант фильтровали через 0,2-мкм мембрану PES для дальнейшей очистки лизата. [140] Selected HTP cultures grown as described in Example 2 were plated on LB agar plates with 1% glucose and 30 μg/ml chloramphenicol and grown overnight at 37°C. A single colony from each culture was transferred to 6 ml LB broth with 1% glucose and 30 μg/ml chloramphenicol. Cultures were grown for 18 hours at 30°C, 250 rpm and subcultured at a dilution of approximately 1:10 in 250 ml Terrific Broth with 30 μg/ml chloramphenicol to a final OD ₆₀₀ of 0.2. Cultures were incubated for approximately 3 hours at 30°C, 250 rpm, to an OD ₆₀₀ of 0.6-0.8, and then induced by adding IPTG at a final concentration of 1 mm. The induced cultures were incubated for 20 h at 30°C, 250 rpm. After this incubation period, the cultures were centrifuged at 4000 rpm x 10 min. The culture supernatant was removed and the pellets were resuspended in 35 ml of lysis buffer (50 mM NaH ₂ PO ₄ , pH 7.5, 500 mM NaCl, 0.1% Tween-20, 10 mM imidazole). This cell suspension was cooled in an ice bath and lysed using a Microfluidizer cell disruptor (Microfluidics M-110L). The crude lysate was precipitated by centrifugation (16,000 rpm for 60 min at 4°C) and then the supernatant was filtered through a 0.2 μm PES membrane for further purification of the lysate.

Очистка РНК-полимеразы T7 из лизатов из вращающихся флаконовPurification of T7 RNA polymerase from spinner vial lysates

[141] Лизаты T7RNAP очищали с использованием системы для очистки AKTA Start и 5-мл колонки HisTrap FF (GE Healthcare) с использованием условий AC Step HiF (рабочие параметры приведены ниже). Промывочный буфер SF содержал 50 мМ фосфат натрия, pH 7,5, 500 мМ NaCl, 0,1% об./об. реагента TWEEN-20^® (Sigma) и 25 мМ имидазол. Элюирующий буфер SF содержал 50 мМ фосфат натрия, pH 7,5, 500 мМ NaCl, 0,1% об./об. реагента TWEEN-20^® (Sigma) и 300 мМ имидазол. [141]Lysates T7RNAP was purified using the AKTA Start purification system and a 5 ml HisTrap FF column (GE Healthcare) using AC Step HiF conditions (operating parameters are shown below). Wash buffer SF contained 50 mM sodium phosphate, pH 7.5, 500 mM NaCl, 0.1% v/v. TWEEN-20 reagent^® (Sigma) and 25 mM imidazole. The SF elution buffer contained 50 mM sodium phosphate, pH 7.5, 500 mM NaCl, 0.1% v/v. TWEEN-20 reagent^® (Sigma) and 300 mM imidazole.

Таблица 2.1 Параметры очисткиTable 2.1 Cleaning parameters ПараметрParameter VolumeVolume Объем колонкиColumn volume 5 мл5 ml Скорость потокаFlow rate 5 мл/мин5 ml/min Предел давленияpressure limit 0,3 МПа0.3 MPa Объем образцаSample Volume 35 мл35 ml Уравновешивающий объемBalancing volume 5 объемов колонки (CV) = 25 мл5 column volumes (CV) = 25 ml Объем промывания без связыванияFlush volume without binding 15 CV=75 мл15CV=75 ml ЭлюированиеElution Изократическое (пошаговое)Isocratic (step by step) Объем элюированияElution volume 5 CV=25 мл5CV=25 ml Объем фракцииFraction volume 3 мл3 ml RE‐уравновешивающий объемRE-balancing volume 5 CV=25 мл5CV=25 ml

[142] Пять единичных наиболее концентрированных 3-мл фракций идентифицировали посредством УФ-поглощения (A280) и подвергали диализу в течение ночи в 2× буфере для хранения T7RNAP (100 мМ Tris HCl pH 8,0, 200 мМ NaCl, 2 мМ DTT, 2 мМ EDTA, 0,2% об./об. Triton X-100) в течение ночи в кассете для диализа 10K Slide-A-Lyzer™ (Thermo Fisher) для замены буфера в течение 16 часов, за которой следовала вторая замена буфера на 24 часа. К подвергнутому диализу материалу добавляли равный объем глицерина. Концентрации ферментов в препаратах количественно определяли посредством денситометрии на геле и по поглощению при 280 нм. [142] The five single most concentrated 3 ml fractions were identified by UV absorption (A280) and dialyzed overnight in 2× T7RNAP storage buffer (100 mM Tris HCl pH 8.0, 200 mM NaCl, 2 mM DTT, 2 mM EDTA, 0.2% v/v Triton X-100) overnight in a 10K Slide-A-Lyzer™ dialysis cassette (Thermo Fisher) for buffer exchange within 16 hours followed by a second buffer exchange for 24 hours. An equal volume of glycerol was added to the dialyzed material. Enzyme concentrations in preparations were quantified by gel densitometry and by absorbance at 280 nm.

ПРИМЕР 4EXAMPLE 4

Реакции транскрипцииTranscription reactions

[143] Реакции транскрипции проводили с аналогом кэпа альфа, гамма-бис(N7-метилгуанозин)трифосфатом (также обозначаемым в настоящем описании как "m7G(5')ppp(5')m7G," "кэпированный GTP" или "Cap") (см., Grudzien et. al., RNA, 10:1479-87 [2004]). Сконструированная ДНК-матрица для транскрипции GlmS-16A (SEQ ID NO: 5) включает промоторную последовательность T7RNAP, связанную с кодирующей последовательностью для рибопереключателя GlmS Bacillus anthracis (SEQ ID NO: 6). При индукции посредством его лиганда глюкозамин-6-фосфата рибопереключатель GlmS подвергается саморасщеплению и высвобождает 16-мерный РНК-нуклеотид (SEQ ID NO: 7) с 5'-конца транскрипта, который включает структуру кэпа или некэпированный 5'-фосфат. Этот небольшой 16-мерный продукт расщепления РНК-олигонуклеотида подвергали ионизации и анализу посредством LC-MS, который использовали, чтобы отличить кэпированные и некэпированные типы. [143]Transcription reactions were performed with the alpha cap analog, gamma-bis(N7-methylguanosine)triphosphate (also referred to herein as "m7G(5')ppp(5')m7G," "capped GTP" or "Cap") (see , Grudzienet. al.,RNA, 10:1479-87 [2004]). The engineered DNA template for GlmS-16A transcription (SEQ ID NO: 5) includes a T7RNAP promoter sequence linked to a coding sequence for the GlmS riboswitchBacillus anthracis(SEQ ID NO: 6). When induced by its glucosamine-6-phosphate ligand, the GlmS riboswitch undergoes self-cleavage and releases a 16-mer RNA nucleotide (SEQ ID NO: 7) from the 5' end of the transcript, which includes a cap structure or an uncapped 5'-phosphate. This small 16mer RNA oligonucleotide digest was ionized and analyzed by LC-MS, which was used to distinguish between capped and uncapped types.

[144] Реакции (30 мкл) проводили с конечными концентрациями 50 мМ Tris HCl pH 7,9, 30 мМ MgCl₂, 10 мМ DTT, 6 мМ ATP, 6 мМ CTP, 6 мМ UTP, 4,8 мМ GTP, 1,2 мМ m7G(5')ppp(5')m7G, 50 нг/мкл матрицы транкрипции GlmS-16A, 1 Е/мкл ингибитора RNasin, и 6,4 мМ глюкозамин-6-фосфат. Глюкозамин-6-фосфат включали в начале реакции и расщеплению рибопереключателя позволяли протекать в ходе транскрипции in vitro в течение 4 часов. Для HTP-скрининга реакционные смеси гасили равным (30 мкл) объемом 40 мМ EDTA. Общее количество m7G(5')ppp(5')m7G и GTP поддерживали на уровне 6 мМ. [144] Reactions (30 µl) were performed with final concentrations of 50 mM Tris HCl pH 7.9, 30 mM MgCl ₂ , 10 mM DTT, 6 mM ATP, 6 mM CTP, 6 mM UTP, 4.8 mM GTP, 1, 2 mM m7G(5')ppp(5')m7G, 50 ng/µl GlmS-16A transcription template, 1 U/µl RNasin inhibitor, and 6.4 mM glucosamine-6-phosphate. Glucosamine-6-phosphate was included at the start of the reaction and riboswitch cleavage was allowed to proceed during in vitro transcription for 4 hours. For HTP screening, reaction mixtures were quenched with an equal (30 μl) volume of 40 mM EDTA. The total amount of m7G(5')ppp(5')m7G and GTP was maintained at 6 mM.

ПРИМЕР 5EXAMPLE 5

Анализ активности LC-MSLC-MS Activity Analysis

[145] В этом примере описан способ LC-MS, разработанный для разделения фрагментов РНК меньшего размера с использованием системы Thermo LTQ MS для анализа более коротких кэпированных 5'- и некэпированных 5'-трифосфатных продуктов расщепления. [145] This example describes an LC-MS method designed to separate smaller RNA fragments using the Thermo LTQ MS system to analyze shorter capped 5' and uncapped 5' triphosphate cleavages.

[146] Кэпированные 7meG и 5'-трифосфатные некэпированные 16-мерные продукты расщепления (SEQ ID NO: 7) подвергали хроматографическому разделению (cм. фиг.1) от реагентов и более высокомолекулярных РНК с использованием способа обращено-фазовой ВЭЖХ с образованием ионных пар с использованием колонки C18 и подвижной фазы HFIP, обычно используемой для разделения олигонуклеотидов посредством масс-спектрометрии (см. таблицу 5.1). [146] Capped 7meG and 5'-triphosphate non-capped 16-mer cleavage products (SEQ ID NO: 7) were subjected to chromatographic separation (see FIG. 1) from reagents and higher molecular weight RNAs using a reversed-phase HPLC method with the formation of ion pairs using a C18 column and an HFIP mobile phase commonly used to separate oligonucleotides by mass spectrometry (see Table 5.1).

Таблица 5.1 Способ LC-MS, использованный для детекции кэпированных и некэпированных 16-мерных продуктов расщепленияTable 5.1 LC-MS Method Used to Detect Capped and Uncapped 16-mer Cleavages

УстройствоDevice Accela HPLC, сопряженное с системой Thermo LTQ MS; трубки из плавленого кварца от колонки к MS; обходной УФ. УФ-детектор переподсоединяли для скрининговых экспериментов стадии 2 для обеспечения количественного определения расщепленного продуктаAccela HPLC interfaced with Thermo LTQ MS system; fused silica tubing from column to MS; bypass UV. The UV detector was reconnected for stage 2 screening experiments to allow for the quantification of the digested product. КолонкаColumn Waters Xterra MS C18, 50×2,1 мм, 5 мкм, с защитной колонкой Phenomenex C18 Waters Xterra MS C18, 50×2.1 mm, 5 µm, with Phenomenex C18 guard column Подвижная фазаmobile phase A: 400 мМ HFIP, ~16,3 мМ* TEA в воде, pH 7,9 (*TEA доводили для достижения требуемого pH)
(взвесить HFIP, медленно растворить добавляемую TEA)
B: 200 мМ HFIP, ~8,15 мМ TEA в смеси вода/метанол 50/50 (использовать A для получения B)A: 400 mM HFIP, ~16.3 mM* TEA in water, pH 7.9 (*TEA adjusted to desired pH)
(weigh HFIP, slowly dissolve added TEA)
B: 200 mM HFIP, ~8.15 mM TEA in water/methanol 50/50 (use A to make B) Скорость потокаFlow rate 240 мкл/мин240 µl/min ГрадиентGradient 60%A в момент времени 0'; снижение до 50%A в момент времени 1,25'; снижение до 20%A в момент 5'; возвращение 60% A в момент времени 5,5' и удержание 60%A до момента времени 7,5' (конец).60%A at time 0'; reduction to 50%A at time 1.25'; decrease to 20%A at time 5'; returning 60% A at time 5.5' and holding 60% A until time 7.5' (end). Детекцияdetection LTQ; отведение потока от MS между 0-2 мин и вновь между 5,5-7,5 мин.
Экстрагированные ионы BP для:
- Некэпированного 16-мерного продукта=903,8, 1084,6, 1355,9, 1361,4, 1808,1, 1815,6, 1820,8
- Кэпированного 16-мерного продукта=952,7, 1143,4, 1429,2, 1438,7, 1906,1, 1918,6, 1931,3LTQ; flow diversion from MS between 0-2 min and again between 5.5-7.5 min.
Extracted BP ions for:
- Uncapped 16-dimensional product = 903.8, 1084.6, 1355.9, 1361.4, 1808.1, 1815.6, 1820.8
- Capped 16-dimensional product = 952.7, 1143.4, 1429.2, 1438.7, 1906.1, 1918.6, 1931.3 Условия MS MS Terms Полярность MS: отрицательная; Ионизация: ESI; Режим: Q1 Scan 800-2000; высота зонда: B; защитный газ: 20; вспомогательный газ: 5; продувочный газ: 0; V распыления: 5; температура крышки: 275°C; V крышки: -20; линза трубки: -85; мультиполь 00: 3,5; линза 0: 5,5; мультиполь 0: 5,75; линза 1: 38; гейт: 78; мультиполь 1: 16; мультиполь RF: 400; передняя линза: 5,75.Polarity MS: negative; Ionization: ESI; Mode: Q1 Scan 800-2000; probe height: B; shielding gas: 20; auxiliary gas: 5; purge gas: 0; V spray: 5; lid temperature: 275°C; V caps: -20; tube lens: -85; multipole 00: 3.5; lens 0:5.5; multipole 0: 5.75; lens 1:38; gate: 78; multipole 1:16; multipole RF: 400; front lens: 5.75. Температура колонки Column temperature 35°C35°C Температура пробоотборника Sampler temperature 7°C7°C Инжектируемый объемInjection volume 10 мкл 10 µl Время анализаAnalysis time 7,5 мин (с временем цикла инжектора он отнимает ~8,4 мин/образец)7.5 min (with injector cycle time it takes ~8.4 min/sample) Детали идентификации пиковPeak Identification Details RT кэпированных и некэпированных продуктов: ~4,5 мин (сдвиги RT для каждой партии подвижной фазы)RT capped and uncapped products: ~4.5 min (RT shifts for each mobile phase batch)

[147] Определение основных пиков для кэпированных и некэпированных 16-мерных продуктов расщепления проводили с использованием семи ионов для каждого типа, включая множество отрицательных заряженных ионов и аддуктов металлов. Интенсивность пика для этих семи ионов использовали для получения сигнала для каждого из кэпированных и некэпированных 16-мерных продуктов расщепления. Эти оны включают множество заряженных состояний, а также аддукты натрия и калия (см. таблицу 5.2). Все ионы наблюдали в пределах 1 единицы массы от ожидаемых величин. [147] The determination of the main peaks for capped and uncapped 16-mer cleavage products was performed using seven ions for each type, including many negative charged ions and metal adducts. The peak intensity for these seven ions was used to generate a signal for each of the capped and uncapped 16-mer cleavage products. These ones include many charged states, as well as sodium and potassium adducts (see Table 5.2). All ions were observed within 1 mass unit of the expected values.

Таблица 5.2 Ионы, подвергнутые определению для масс-спектрометрической интеграцииTable 5.2 Ions determined for mass spectrometric integration

ПродуктProduct Название ионаIon name Состояние зарядаState of charge АддуктAdduct Теоре-тическое m/zTheoretical m/z Измеренное m/zMeasured m/z Измеренное - теоре-тическое m/zMeasured - theoretical m/z Некэпированный 16-мерUncapped 16-mer (M-6H)/6(M-6H)/6 6-6- 903,7903.7 903,8903.8 0,10.1 (M-5H)/5(M-5H)/5 5-5- 1084,61084.6 1084,61084.6 00 (M-4H)/4(M-4H)/4 4-4- 13561356 1355,91355.9 -0,1-0.1 (M+Na-5H)/4(M+Na-5H)/4 4-4- NaNa 1361,51361.5 1361,41361.4 -0,1-0.1 (M-3H)/3(M-3H)/3 3-3- 1808,31808.3 1808,11808.1 -0,2-0.2 (M+Na-4H)/3(M+Na-4H)/3 3-3- NaNa 1815,71815.7 1815,61815.6 -0,1-0.1 (M+K-4H)/3(M+K-4H)/3 3-3- KK 18211821 1820,81820.8 -0,2-0.2 Кэпированный 16-мерCapped 16 gauge (M-6H)/6(M-6H)/6 6-6- 952,9952.9 952,7952.7 -0,02-0.02 (M-5H)/5(M-5H)/5 5-5- 1143,61143.6 1143,41143.4 -0,02-0.02 (M-4H)/4(M-4H)/4 4-4- 1429,81429.8 1429,21429.2 -0,06-0.06 (M+K-5H)/4(M+K-5H)/4 4-4- KK 1439,31439.3 1438,71438.7 -0,06-0.06 (M-3H)/3(M-3H)/3 3-3- 1906,71906.7 1906,11906.1 -0,06-0.06 (M+K-4H)/3(M+K-4H)/3 3-3- KK 1919,41919.4 1918,61918.6 -0,08-0.08 (M+2K-5H)/3(M+2K-5H)/3 3-3- 2K2K 1932,11932.1 1931,31931.3 -0,08-0.08

[148] Эффективность кэпирования в отношении WT T7RNAP (т.е "кратность улучшения относительно исходной молекулы" или "FIOP") вычисляли путем деления отношений интенсивности пиков кэпированных/некэпированных молекул для каждого образца на отношения, вычисленные для исходных контролей WT, присутствующих в каждом планшете (n=6-10). Величину FIOP использовали для ранжирования эффективности вариантов относительно WT T7RNAP или исходной молекулы из библиотеки, которые были включены в каждый планшет в качестве контролей. С использованием этого способа относительного количественного определения было возможным нивелирование различий в ионизации, которые присущи кэпированным и некэпированным молекулам, а также вариаций сигнала, обеспечиваемых партией подвижной фазы HFIP и концентрацией EDTA. [148] Capping efficiency against T7RNAP WT (i.e., "fold improvement over parent molecule" or "FIOP") was calculated by dividing the peak intensity ratios of the capped/uncapped molecules for each sample by the ratios calculated for the original WT controls present in each tablet (n=6-10). The FIOP value was used to rank the potency of the variants relative to WT T7RNAP or the original molecule from the library, which were included in each plate as controls. Using this relative quantitation method, it was possible to level out the differences in ionization that are inherent in capped and uncapped molecules, as well as the signal variations provided by the HFIP mobile phase batch and EDTA concentration.

Реакции транскрипции in vitro проводили, как описано в примере 4, с временем реакции и концентрациями m7G(5')ppp(5')m7G, как указано в таблицах, которые приведены ниже. В таблице 5.3, 5.4 и 5.5 представлено среднее увеличение активности для 3-6 реплик. В таблице 5.6 представлено среднее улучшение активности для вариантов, где была доступна информация для реплик. In vitro transcription reactions were carried out as described in Example 4 with reaction times and concentrations of m7G(5')ppp(5')m7G as indicated in the tables below. Tables 5.3, 5.4 and 5.5 show the average increase in activity for 3-6 replicas. Table 5.6 shows the average improvement in activity for cases where replica information was available.

Таблица 5.3 Увеличение активности вариантов T7RNAP Table 5.3 Increase in activity of T7RNAP variants

№ вариантаoption number Увеличение активностиIncrease in activity Аминокислотные замены относительно SEQ ID NO: 4Amino acid substitutions relative to SEQ ID NO: 4 11 ++++++ A397WA397W 22 ++++++ R401VR401V 33 ++++++ A397MA397M 44 ++++++ A397FA397F 55 ++++++ R401SR401S 66 ++++++ R401IR401I 77 ++++++ E357RE357R 88 ++++++ E357KE357K 99 ++++++ A32V/E357IA32V/E357I 1010 ++++++ K394RK394R 11eleven ++++++ E357NE357N 1212 ++++++ E357WE357W 1313 ++++++ K394AK394A 1414 ++++++ K394LK394L 1515 ++++ E97D/E357GE97D/E357G 1616 ++++ E357QE357Q 1717 ++++ E357LE357L 1818 ++++ E357SE357S 1919 ++++ A397QA397Q 2020 ++++ E357ME357M 2121 ++++ E357VE357V 2222 ++++ E357TE357T 2323 ++++ R639HR639H 2424 ++++ E357LE357L 2525 ++++ E357GE357G 2626 ++++++++ P664WP664W 2727 ++++++ D660WD660W 2828 ++++++ D513WD513W 2929 ++++++ D660TD660T 30thirty ++++++ D660SD660S 3131 ++++++ K167N/S514LK167N/S514L 3232 ++++++ D660CD660C 3333 ++++++ D513RD513R 3434 ++++ S514LS514L 3535 ++++ D513LD513L 3636 ++++ S514IS514I 3737 ++++ A136IA136I 3838 ++++ D513TD513T 3939 ++++ A136EA136E 4040 ++++ S514FS514F 4141 ++++ D660AD660A 4242 ++++ D513CD513C 4343 ++++ D513FD513F 4444 ++++ D660N/H806YD660N/H806Y 4545 ++ A302V/D513GA302V/D513G 4646 ++ D660MD660M 4747 ++ S514YS514Y 4848 ++ D513KD513K 4949 ++++++ S635WS635W 5050 ++++++ D137WD137W 5151 ++++++ T637GT637G 5252 ++++++ Q656FQ656F 5353 ++++ S404YS404Y 5454 ++++ R314C/R401VR314C/R401V 5555 ++++ M446WM446W 5656 ++++ T661ET661E 5757 ++++ T637GT637G 5858 ++ T250DT250D 5959 ++ T643AT643A 6060 ++ R401LR401L 6161 ++ D478FD478F 6262 ++ A582NA582N 6363 ++ Q656WQ656W 6464 ++ N444IN444I 6565 ++ S404ES404E 6666 ++ N444FN444F 6767 ++ V636LV636L 6868 ++ N444VN444V 6969 ++ T661YT661Y 7070 ++ Y392DY392D 7171 ++ T637PT637P 7272 ++ F653CF653C 7373 ++ E49G/M642LE49G/M642L 7474 ++ M446YM446Y 7575 ++ D478MD478M 7676 ++ R393LR393L 7777 ++ R401AR401A 7878 ++ T637ST637S 7979 ++ R160L/T643SR160L/T643S 8080 ++ M642LM642L 8181 ++ D478WD478W 8282 ++ R393YR393Y 8383 ++ N444HN444H 8484 ++ A645VA645V Реакции проводили с 1,2 мМ m7G(5')ppp(5')m7G и 4,8 мМ GTP в течение 4 часов. Уровни активности определяли относительно эталонного полипептида SEQ ID NO: 4. Величины увеличения активности соответствуют:Reactions were performed with 1.2 mM m7G(5')ppp(5')m7G and 4.8 mM GTP for 4 hours. Activity levels were determined relative to the reference polypeptide SEQ ID NO: 4. The increase in activity values correspond to: ++++ =++++ = >5>5 +++ =+++ = 1,9-4,991.9-4.99 ++ =++= 1,5-1,891.5-1.89 + =+= 1,3-1,491.3-1.49

Таблица 5.4Table 5.4 Увеличение активности вариантаIncreasing variant activity T7RNAPT7RNAP

№ вариантаoption number Увеличение активностиIncrease in activity Аминокислотные изменения относительно SEQ ID NO: 15Amino acid changes relative to SEQ ID NO: 15 8585 ++++++ D513L/D660WD513L/D660W 8686 ++++++ S635W/D660TS635W/D660T 8787 ++++++ D137W/R401S/D513RD137W/R401S/D513R 8888 ++++++ D137W/R401ID137W/R401I 8989 ++++++ D137W/Q656FD137W/Q656F 9090 ++++++ S635W/Q656FS635W/Q656F 9191 ++++++ D137W/S635WD137W/S635W 9292 ++++++ D660TD660T 9393 ++++++ D137W/D513WD137W/D513W 9494 ++++++ D137W/D513R/K621RD137W/D513R/K621R 9595 ++++ D137W/R401S/D513WD137W/R401S/D513W 9696 ++++ D137W/R401VD137W/R401V 9797 ++++ L113M/D137W/D513RL113M/D137W/D513R 9898 ++++ D137W/R401SD137W/R401S 9999 ++++ D513R/S635W/Q656FD513R/S635W/Q656F 100100 ++++ D137W/R401SD137W/R401S 101101 ++ D513L/S635WD513L/S635W 102102 ++ D660SD660S 103103 ++ D137WD137W 104104 ++ R401S/S635WR401S/S635W 105105 ++ R401S/D513R/S635WR401S/D513R/S635W 106106 ++++++ E357R/K394R/R401V/S404Y/S514LE357R/K394R/R401V/S404Y/S514L 107107 ++++++ R401V/S404Y/S514LR401V/S404Y/S514L 108108 ++++++ A136I/K394R/S404Y/M446WA136I/K394R/S404Y/M446W 109109 ++++ A136E/S404Y/M446WA136E/S404Y/M446W 110110 ++++ A136I/R401V/S404YA136I/R401V/S404Y 111111 ++++ R401V/S404YR401V/S404Y 112112 ++++ A136E/E357I/S404Y/S514IA136E/E357I/S404Y/S514I 113113 ++ A136I/E357I/S514FA136I/E357I/S514F 114114 ++ A136E/S404Y/S514FA136E/S404Y/S514F 115115 ++ E357R/S514FE357R/S514F 116116 ++ A136I/E357K/S514FA136I/E357K/S514F 117117 ++ A136I/M446WA136I/M446W 118118 ++ E357N/K394R/M446W/S514IE357N/K394R/M446W/S514I 119119 ++ A136I/R401VA136I/R401V 120120 ++ A136E/S514FA136E/S514F 121121 ++ A136I/S514IA136I/S514I 122122 ++ K394R/M446W/S514IK394R/M446W/S514I Скрининг проводили с 1 мМ m7G(5')ppp(5')m7G, 5 мМ GTP в реакции длительностью 16 часов. Уровень активности определяли относительно эталонного полипептида SEQ ID NO: 15. Сообщенные величины увеличения активности соответствуют:Screening was performed with 1 mM m7G(5')ppp(5')m7G, 5 mM GTP in a 16 hour reaction. The level of activity was determined relative to the reference polypeptide SEQ ID NO: 15. The reported increase in activity values correspond to: +++ =+++ = ≥2,5≥2.5 ++ =++= 2-2,492-2.49 + =+= 1,3-1,991.3-1.99

[149] Отмечалось, что вариант 85 имел не поддающиеся обнаружению уровни некэпированной мРНК в анализе LC-MS. [149] Option 85 was noted to have undetectable levels of uncapped mRNA in LC-MS analysis.

Таблица 5.5 Увеличение активности варианта T7RNAPTable 5.5 Increase in T7RNAP variant activity

№ вариантаoption number Увеличение активностиIncrease in activity Аминокислотные изменения относительно SEQ ID NO: 4Amino acid changes relative to SEQ ID NO: 4 123123 ++++++ D513W/S635W/D660FD513W/S635W/D660F 124124 ++++++ D513Y/D660W/P664WD513Y/D660W/P664W 125125 ++++++ D513W/S635W/D660FD513W/S635W/D660F 126126 ++++++ D513W/S635W/P664WD513W/S635W/P664W 127127 ++++++ A475V/D513W/S635W/D660YA475V/D513W/S635W/D660Y 128128 ++++++ D660Y/P664WD660Y/P664W 129129 ++++ D513F/D660W/P664YD513F/D660W/P664Y 130130 ++++ A397W/D513W/S635W/D660WA397W/D513W/S635W/D660W 131131 ++++ A397W/D513W/S635WA397W/D513W/S635W 132132 ++++ A397Y/D513W/S635W/D660FA397Y/D513W/S635W/D660F 133133 ++ D513Y/S635W/D660FD513Y/S635W/D660F 134134 ++ D513Y/S635W/D660YD513Y/S635W/D660Y 135135 ++ A397F/D513W/S635WA397F/D513W/S635W 136136 ++ A397W/D513Y/S635W/D660FA397W/D513Y/S635W/D660F 137137 ++ A397W/D513Y/S635WA397W/D513Y/S635W 138138 ++ A397F/D513Y/S635WA397F/D513Y/S635W Скрининг проводили с 1 мМ m7G(5')ppp(5')m7G, 5 мМ GTP в реакции длительностью 16 часов. Уровень активности определяли относительно эталонного полипептида SEQ ID NO: 15. Сообщенные величины увеличения активности соответствуют:Screening was performed with 1 mM m7G(5')ppp(5')m7G, 5 mM GTP in a 16 hour reaction. The level of activity was determined relative to the reference polypeptide SEQ ID NO: 15. The reported increase in activity values correspond to: +++ =+++ = ≥2,5≥2.5 ++ =++= 2 -2,492 -2.49 + = += 1,3-1,991.3-1.99

Таблица 5.6 Увеличение активности варианта T7RNAPTable 5.6 Increase in T7RNAP variant activity

№ вариантаoption number Увеличение активностиIncrease in activity Аминокислотные изменения относительно
SEQ ID NO: 4amino acid changes relative to
SEQ ID NO: 4 130130 ++++++ A397W/D513W/S635W/D660WA397W/D513W/S635W/D660W 123123 ++++++ D513W/S635W/D660FD513W/S635W/D660F 124124 ++++++ D513Y/D660W/P664WD513Y/D660W/P664W 131131 ++++++ A397W/D513W/S635WA397W/D513W/S635W 128128 ++++++ D660Y/P664WD660Y/P664W 129129 ++++++ D513F/D660W/P664YD513F/D660W/P664Y 135135 ++++++ A397F/D513W/S635WA397F/D513W/S635W 127127 ++++++ A475V/D513W/S635W/D660YA475V/D513W/S635W/D660Y 139139 ++++++ A397Y/D660F/P664WA397Y/D660F/P664W 126126 ++++++ D513W/S635W/P664WD513W/S635W/P664W 140140 ++++++ A397W/D513W/S635W/Q656YA397W/D513W/S635W/Q656Y 134134 ++++++ D513Y/S635W/D660YD513Y/S635W/D660Y 141141 ++++++ A397W/S635W/Q656F/P664WA397W/S635W/Q656F/P664W 133133 ++++++ D513Y/S635W/D660FD513Y/S635W/D660F 136136 ++++++ A397W/D513Y/S635W/D660FA397W/D513Y/S635W/D660F 142142 ++++++ D660W/P664FD660W/P664F 132132 ++++++ A397Y/D513W/S635W/D660FA397Y/D513W/S635W/D660F 143143 ++++ A397F/D513F/S635W/D660WA397F/D513F/S635W/D660W 137137 ++++ A397W/D513Y/S635WA397W/D513Y/S635W 144144 ++++ S635F/Q656Y/P664WS635F/Q656Y/P664W 145145 ++++ D513W/S635WD513W/S635W 146146 ++++ A397W/D513W/S635W/D660Y/P664YA397W/D513W/S635W/D660Y/P664Y 147147 ++++ A397Y/D513Y/S635WA397Y/D513Y/S635W 148148 ++++ S635W/D660WS635W/D660W 138138 ++++ A397F/D513Y/S635WA397F/D513Y/S635W 149149 ++++ A397W/D513Y/S635W/Q656Y/D660W/P664WA397W/D513Y/S635W/Q656Y/D660W/P664W 150150 ++++ A397W/D513F/S635WA397W/D513F/S635W 151151 ++++ D513F/D660W/P664FD513F/D660W/P664F 152152 ++++ D513F/S635W/P664WD513F/S635W/P664W 153153 ++++ D513F/S635W/Q656WD513F/S635W/Q656W 154154 ++++ A397W/D513W/P664WA397W/D513W/P664W 155155 ++++ S635W/P664WS635W/P664W 156156 ++++ A397W/S635W/D660WA397W/S635W/D660W 157157 ++++ D513Y/S635W/D660Y/P664FD513Y/S635W/D660Y/P664F 158158 ++++ A397Y/D513F/S635W/P664WA397Y/D513F/S635W/P664W 159159 ++++ S635W/D660FS635W/D660F 160160 ++++ A397W/D660F/P664YA397W/D660F/P664Y 161161 ++++ A397W/S635WA397W/S635W 162162 ++++ A397F/D513W/S635W/Q656F/P664FA397F/D513W/S635W/Q656F/P664F 163163 ++++ D513Y/S635WD513Y/S635W 164164 ++++ A397F/D513F/S635WA397F/D513F/S635W 165165 ++++ A397W/D513W/S635FA397W/D513W/S635F 166166 ++++ A397W/D660F/P664FA397W/D660F/P664F 167167 ++++ A397W/S635W/D660YA397W/S635W/D660Y 168168 ++++ A397F/D513Y/S635W/P664FA397F/D513Y/S635W/P664F 169169 ++++ A397W/D513F/D660Y/P664FA397W/D513F/D660Y/P664F 170170 ++++ P664WP664W 171171 ++++ S635W/Q656WS635W/Q656W 172172 ++++ A397Y/S635W/D660FA397Y/S635W/D660F 173173 ++++ A397W/S635W/P664FA397W/S635W/P664F 174174 ++++ D513Y/S635F/P664WD513Y/S635F/P664W 175175 ++++ A397F/P664WA397F/P664W 176176 ++++ A397Y/S635WA397Y/S635W 177177 ++ L658PL658P 178178 ++ S635F/Q656F/P664YS635F/Q656F/P664Y 179179 ++ A397W/S635F/P664FA397W/S635F/P664F 180180 ++ D513Y/D660Y/P664FD513Y/D660Y/P664F 181181 ++ A397Y/D513W/S635F/P664YA397Y/D513W/S635F/P664Y 182182 ++ D660F/P664YD660F/P664Y 183183 ++ A397F/S635WA397F/S635W 184184 ++ A397F/D513W/P664WA397F/D513W/P664W 185185 ++ A397W/D513F/D660WA397W/D513F/D660W 186186 ++ A397W/S635W/P664W/A850TA397W/S635W/P664W/A850T 187187 ++ A397W/D513F/S635F/Q656F/D660F/P664WA397W/D513F/S635F/Q656F/D660F/P664W 188188 ++ A397W/D513W/P664FA397W/D513W/P664F 189189 ++ A397W/S635W/Q656F/P664YA397W/S635W/Q656F/P664Y 190190 ++ A397W/D513F/S635F/D660WA397W/D513F/S635F/D660W 191191 ++ D513F/S635WD513F/S635W 192192 ++ A397W/S635W/Q656F/P664FA397W/S635W/Q656F/P664F 193193 ++ A397W/D513Y/S635W/Q656Y/P664YA397W/D513Y/S635W/Q656Y/P664Y 194194 ++ S635WS635W 195195 ++ D513W/S635W/Q656W/D660FD513W/S635W/Q656W/D660F 196196 ++ D513Y/S635R/Q656F/P664YD513Y/S635R/Q656F/P664Y 197197 ++ D513W/S635FD513W/S635F 198198 ++ Q656W/D660W/P664YQ656W/D660W/P664Y 199199 ++ A397W/D660WA397W/D660W 200200 ++ A397W/D513W/S635W/D660W/P664YA397W/D513W/S635W/D660W/P664Y 201201 ++ D513W/Q656Y/D660WD513W/Q656Y/D660W 202202 ++ K399E/S635F/D660WK399E/S635F/D660W 203203 ++ D513W/D660WD513W/D660W 204204 ++ A397Y/S635W/Q656F/D660Y/P664WA397Y/S635W/Q656F/D660Y/P664W 205205 ++ D660F/P664FD660F/P664F 206206 ++ A397W/S635FA397W/S635F 207207 ++ A397Y/D513W/Q656W/D660WA397Y/D513W/Q656W/D660W 208208 ++ D513Y/S635F/D660F/P664YD513Y/S635F/D660F/P664Y 209209 ++ A397F/D513Y/S635W/Q656WA397F/D513Y/S635W/Q656W 210210 ++ D513F/D660WD513F/D660W 211211 ++ D513W/D660FD513W/D660F 212212 ++ A397W/D513FA397W/D513F 213213 ++ A397W/D513WA397W/D513W 214214 ++ Q656W/D660F/P664YQ656W/D660F/P664Y 215215 ++ D513Y/P664YD513Y/P664Y 216216 ++ A397W/D513Y/S635FA397W/D513Y/S635F 217217 ++ D513W/Q656W/P664WD513W/Q656W/P664W 218218 ++ A397W/D513W/D660WA397W/D513W/D660W 219219 ++ A397W/D513F/D660FA397W/D513F/D660F 220220 ++ A397F/D660WA397F/D660W 221221 ++ A397F/S635F/D660WA397F/S635F/D660W 222222 ++ A397Y/S635F/D660WA397Y/S635F/D660W 223223 ++ D513Y/D660WD513Y/D660W 224224 ++ A397Y/P664FA397Y/P664F 225225 ++ A397W/D513W/D660W/P664YA397W/D513W/D660W/P664Y 226226 ++ P664FP664F 227227 ++ A397Y/D513F/S635W/Q656F/D660W/P664FA397Y/D513F/S635W/Q656F/D660W/P664F 228228 ++ S635F/D660W/P664FS635F/D660W/P664F 229229 ++ A397F/D513Y/Q656H/D660WA397F/D513Y/Q656H/D660W 230230 ++ A397F/D513F/S635FA397F/D513F/S635F 231231 ++ A397WA397W 232232 ++ A397Y/S635FA397Y/S635F 233233 ++ A397Y/D513YA397Y/D513Y 234234 ++ D513F/S635FD513F/S635F 235235 ++ A397F/D513FA397F/D513F 236236 ++ A397F/D513YA397F/D513Y 237237 ++ D513WD513W 238238 ++ A397YA397Y 239239 ++ A397FA397F 240240 ++ D513FD513F 241241 ++ A397W/D513W/S635F/Q656W/D660FA397W/D513W/S635F/Q656W/D660F 242242 ++ A397W/E837KA397W/E837K 243243 ++ D660FD660F 244244 ++ D513Y/S635FD513Y/S635F Скрининг с 1 мМ m7G(5')ppp(5')m7G, 5 мМ GTP. Уровень активности определяли относительно эталонного полипептида SEQ ID NO: 4. Величины увеличения активности соответствуют:
+++ = ≥15
++ = 7-14,9
+ = 2-6,9Screening with 1 mM m7G(5')ppp(5')m7G, 5 mM GTP. The level of activity was determined relative to the reference polypeptide SEQ ID NO: 4. The increase in activity values correspond to:
+++ = ≥15
++ = 7-14.9
+=2-6.9

ПРИМЕР 6EXAMPLE 6

Определение выхода РНКDetermination of RNA yield

[150] Реакции транскрипции in vitro проводили, как описано в примере 4, но с использованием матрицы люциферазы (SEQ ID NO: 10). Выход мРНК из реакций транскрипции in vitro определяли в соответствии с протоколом изготовителя набора Quant-iT РНК Assay kit (широкий диапазон, Q-33140, Thermo Fisher). Содержание мРНК вычисляли с использованием стандартной кривой, построенной для стандартов мРНК, предоставленных с набором для анализа. [150]Transcription reactions in vitro was performed as described in Example 4, but using a luciferase template (SEQ ID NO: 10). mRNA release from transcription reactionsin vitro determined according to the manufacturer's protocol for the Quant-iT RNA Assay kit (wide range, Q-33140, Thermo Fisher). The mRNA content was calculated using a standard curve generated from the mRNA standards provided with the assay kit.

Таблица 6.1 Выход РНКTable 6.1 RNA yield SEQ ID NO:SEQID NO: ID NO для вариантаID NO for variant Выход РНКRNA yield 44 N/AN/A ++++ 1515 2626 ++++ 1717 8686 ++ 1919 8585 ++ 30thirty 125125 ++++ 3333 134134 ++++ 3535 107107 ++++ 3737 106106 ++++ Сообщенные величины выхода соответствуют:
++ = > выход РНК 1,8 мг/мл, The reported output values correspond to:
++ => RNA yield 1.8 mg/ml, + = выход РНК 1-1,8 мкг/мкл.+ = RNA yield 1-1.8 µg/µl.

ПРИМЕР 7EXAMPLE 7

Определение точности транскрипции варианта T7RNAPDetermination of Transcription Accuracy of the T7RNAP Variant

[151] Точность полимеразы определяли на основе прямого секвенирования большого количества клонов ОТ-ПЦР, полученных из мРНК, транскрибированной с варианта полимеразы. Реакции транскрипции in vitro проводили, как описано в примере 4, с использованием 0,5 мМ m7G(5')ppp(5')m7G, 5,5 мМ GTP и без использования глюкозамин-6-фосфата. Включение m7G(5')ppp(5')m7G позволяло количественное определение вклада этого аналога кэпа (при его наличии) в уровень погрешности для WT и вариантов полимераз в связанных со способом условиях. ДНК-матрица люциферазы размером 1,7 т.п.н. (SEQ ID NO: 8) служила в качестве ДНК-матрицы для транскрипции с использованием RNAP T7 дикого типа и вариантов RNAP T7 для получения полноразмерных мРНК-транскриптов. РНК выделяли с использованием набора Zymo RNA Clean and concentrator-25 (Zymo Research) и остаточную ДНК удаляли из образцов РНК посредством двух последовательных обработок набором DNA-free DNAase I (Ambion/ Thermo Fisher). Образцы подвергали обратной транскрипции и использованием обратной транскриптазы Accuprime (Agilent) с использованием олиго-(dT)₂₅ праймера (SEQ ID NO: 40), гибридизующегося с поли(A)-хвостовой частью на матрице люциферазы. Затем реакционную смесь RT подвергали амплификации с использованием высокоточной ДНК-полимеразы PHUSION^® с использованием буфера HF (New England Biolabs) посредством ПЦР с получением ампликона размером 1675 п.н. с использованием специфических для гена праймеров (SEQ ID NO: 12, SEQ ID NO: 13), гибридизующихся с кодирующей последовательностью люциферазы. Амплифицированные фрагменты расщепляли посредством BglI (New England Biolabs), лигировали в клонирующий вектор и трансформировали с получением единичных клонов в E. coli. [151] The accuracy of the polymerase was determined based on direct sequencing of a large number of RT-PCR clones obtained from mRNA transcribed from a polymerase variant. In vitro transcription reactions were performed as described in Example 4 using 0.5 mM m7G(5')ppp(5')m7G, 5.5 mM GTP and no glucosamine-6-phosphate. The inclusion of m7G(5')ppp(5')m7G allowed the quantification of the contribution of this cap analog (if present) to the error rate for WT and polymerase variants under method-related conditions. Luciferase DNA template 1.7 kb. (SEQ ID NO: 8) served as template DNA for transcription using wild-type T7 RNAP and T7 RNAP variants to generate full-length mRNA transcripts. RNA was isolated using the Zymo RNA Clean and concentrator-25 kit (Zymo Research) and residual DNA was removed from the RNA samples by two consecutive treatments with the DNA-free DNAase I kit (Ambion/Thermo Fisher). Samples were reverse transcribed using Accuprime reverse transcriptase (Agilent) using an oligo-(dT) ₂₅ primer (SEQ ID NO: 40) hybridizing to the poly(A) tail on a luciferase template. The RT reaction mixture was then amplified using ^PHUSION® high fidelity DNA polymerase using HF buffer (New England Biolabs) by PCR to obtain a 1675 bp amplicon. using gene-specific primers (SEQ ID NO: 12, SEQ ID NO: 13) hybridizing to the luciferase coding sequence. The amplified fragments were digested with BglI (New England Biolabs), ligated into a cloning vector, and transformed into single clones in E. coli .

[152] Индивидуальные клоны отбирали и секвенировали с использованием стратегии мультиплексного баркодирования на платформе Ion Torrent PGM (Thermo Fisher). Баркодированные считанные последовательности подвергали обратной свертке, а затем последовательности индивидуальных клонов вновь собирали против предполагаемой последовательности матрицы для области размером 1632 п.н. между SEQ ID NO: 12 и SEQ ID NO: 13. Мутации, включая небольшие инсерции, делеции (т.е. инсерции-делеции) и однонуклеотидные полиморфизмы, регистрировали. Большинство мутаций представляли собой замены, хотя также наблюдались инсерции и делеции. Общее количество мутаций на пару оснований отсеквенированных происходящих из мРНК клонов вычисляли, и оно представлено в таблицах 7.1 и 7.2. Ожидаемые общие частоты мутаций на пару оснований, исходя из литературных данных, представляют собой сумму ошибок вследствие T7RNAP (1×10^-4) (Huang et al., Biochem., 39:11571-11580 [2000]), обратной транскриптазы Accuscript (6×10-5) (Agilent; См., product literature) и ДНК-полимеразы Phusion (1,2×10-5) (20 циклов; см. литературу о продукте NEB) или в общем 1,72×10^-4. Большинство вариантов полимераз продемонстрировали показатели ошибок, близкие к описанной в литературе величине для T7RNAP, даже в присутствии 0,5 мМ m7G(5')ppp(5')m7G. [152] Individual clones were selected and sequenced using a multiplex barcoding strategy on the Ion Torrent PGM platform (Thermo Fisher). The barcoded read sequences were defolded and then the individual clone sequences were reassembled against the predicted template sequence for the 1632 bp region. between SEQ ID NO: 12 and SEQ ID NO: 13. Mutations, including small insertions, deletions (ie insertions-deletions) and single nucleotide polymorphisms, were recorded. Most of the mutations were substitutions, although insertions and deletions were also observed. The total number of mutations per base pair of sequenced mRNA-derived clones was calculated and is presented in Tables 7.1 and 7.2. The expected total mutation rates per base pair, based on the literature data, are the sum of errors due to T7RNAP (1×10 ^-4 ) (Huang et al., Biochem., 39:11571-11580 [2000]), Accuscript reverse transcriptase (6 x10-5) (Agilent; See product literature) and Phusion DNA polymerase (1.2 x 10-5) (20 cycles; see NEB product literature) or 1.72 x 10 ^-4 in total. Most of the polymerase variants showed error rates close to those reported in the literature for T7RNAP, even in the presence of 0.5 mM m7G(5')ppp(5')m7G.

[153] Односторонний (правосторонний) биноминальный критерий использовали для вычисления случайности выборки для наблюдаемого количества ошибок (или более), учитывая количество отсеквенированных оснований, если фактический уровень ошибки в эксперименте равен наблюдаемой общей частоте ошибок для T7RNAP-WT в отдельных экспериментах, представленных в таблицах 7.1 и 7.2. Точность данного варианта считалась неотличимой от WT T7RNAP в этом анализе для величин p более 0,05. В таблице 7.1 "+" составляет менее 1,7*10^-4, и "-" превышает 1,7*10^-4в столбце результата "наблюдаемая частота ошибок", в то время как "+" представляет собой p > 0,05 и "-" представляет собой 0< 0,05 в столбце результата "биномиальный критерий". В таблице 7.2 "+" составляет менее 1,5×10^-4и "-" превышает 1,5×10^-4в столбце результата "наблюдаемая частота ошибок", в то время как "+" представляет собой p > 0,05 и "-" представляет собой p < 0,05 в столбце результата "биномиальный критерий". [153] A one-tailed (right-tailed) binomial test was used to calculate the randomness of sampling for the observed number of errors (or more) given the number of sequenced bases, if the actual error rate in the experiment is equal to the observed total error rate for T7RNAP-WT in the individual experiments presented in the tables. 7.1 and 7.2. The accuracy of this variant was considered indistinguishable from WT T7RNAP in this assay for p-values greater than 0.05. In Table 7.1, "+" is less than 1.7*10 ^-4 and "-" is greater than 1.7*10 ^-4 in the result column "observed error rate", while "+" represents p > 0, 05 and "-" represents 0<0.05 in the "binomial test" result column. In Table 7.2, "+" is less than 1.5×10 ^-4 and "-" is greater than 1.5×10 ^-4 in the result column "observed error rate", while "+" is p > 0.05 and "-" represents p < 0.05 in the result column "binomial test".

Таблица 7.1 Частоты ошибок для некоторых вариантов T7RNAP Table 7.1 Error rates for some T7RNAP variants

SEQ ID NO:SEQID NO: ID NO вариантаVariant ID NO Наблюдаемая частота ошибок Observed Error Rate Биномиальный критерийBinomial test 44 N/AN/A ++ ++ 1515 2626 ++ ++ 1717 8686 ++ ++ 1919 8585 ++ -- 2121 8787 ++ ++ 2323 9393 -- -- 2525 9595 ++ ++ 2727 8888 ++ ++

Таблица 7.2 Частоты ошибок для некоторых вариантов T7RNAPTable 7.2 Error rates for some T7RNAP variants

SEQ ID NO: SEQID NO: ID NO вариантаVariant ID NO Наблюдаемая частота ошибок Observed Error Rate Биномиальный критерийBinomial test 44 N/AN/A ++ ++ 2929 108108 ++ ++ 3131 125125 -- -- 3333 134134 ++ ++ 3535 107107 ++ ++ 3737 106106 ++ ++ 3939 133133 ++ --

[154] Хотя изобретение описано применительно к конкретным вариантам осуществления, могут быть осуществлены различные изменения и эквиваленты могут быть заменены для приспособления к конкретной мутации, материалу, композиции, процессу, стадии или стадиям процесса, тем самым обеспечивая пользу изобретения без отклонения от объема формулы изобретения. [154] While the invention has been described in terms of specific embodiments, various changes may be made and equivalents may be substituted to suit a particular mutation, material, composition, process, process step or steps, thereby providing the benefit of the invention without departing from the scope of the claims. .

[155] Для всех целей в США каждая публикация и патентный документ, цитированные в настоящем описании, включены в настоящее описание в качестве ссылок, как если бы было конкретно и индивидуально указано, что каждая такая публикация включена в настоящее описание в качестве ссылки. Цитирование публикаций и патентных документов не предназначено для указания на то, что какой-либо из таких документов является соответствующим документом уровня техники, а также не является допущение в отношении его содержания или даты. [155] For all US purposes, each publication and patent document cited herein is incorporated herein by reference, as if it were specifically and individually indicated that each such publication is incorporated herein by reference. The citation of publications and patent documents is not intended to indicate that any such document is a relevant prior art document, nor is it an admission as to its content or date.

--->--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

<110> CODEXIS, INC.<110> CODEXIS, INC.

ALEXION PHARMACEUTICALS, INC. ALEXION PHARMACEUTICALS, INC.

<120> ВАРИАНТЫ РНК-ПОЛИМЕРАЗЫ T7<120> T7 RNA POLYMERASE VARIANTS

<130> CX8-168USP1<130>CX8-168USP1

<140> ЕЩЕ НЕ ПРИСВОЕН<140> NOT YET ASSIGNED

<141> ПРИГАЛАЕТСЯ СЮДА<141> COMES HERE

<160> 40<160> 40

<210> 1<210> 1

<211> 2649<211> 2649

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> T7РНКP дикого типа<223> Wild-type T7RNAP

<400> 1<400> 1

atgaacacga ttaacatcgc taagaacgac ttctctgaca tcgaactggc tgctatcccg 60atgaacacga ttaacatcgc taagaacgac ttctctgaca tcgaactggc tgctatcccg 60

ttcaacactc tggctgacca ttacggtgag cgtttagctc gcgaacagtt ggcccttgag 120ttcaacactc tggctgacca ttacggtgag cgtttagctc gcgaacagtt ggcccttgag 120

catgagtctt acgagatggg tgaagcacgc ttccgcaaga tgtttgagcg tcaacttaaa 180catgagtctt acgagatggg tgaagcacgc ttccgcaaga tgtttgagcg tcaacttaaa 180

gctggtgagg ttgcggataa cgctgccgcc aagcctctca tcactaccct actccctaag 240gctggtgagg ttgcggataa cgctgccgcc aagcctctca tcactaccct actccctaag 240

atgattgcac gcatcaacga ctggtttgag gaagtgaaag ctaagcgcgg caagcgcccg 300atgattgcac gcatcaacga ctggtttgag gaagtgaaag ctaagcgcgg caagcgcccg 300

acagccttcc agttcctgca agaaatcaag ccggaagccg tagcgtacat caccattaag 360acagccttcc agttcctgca agaaatcaag ccggaagccg tagcgtacat caccattaag 360

accactctgg cttgcctaac cagtgctgac aatacaaccg ttcaggctgt agcaagcgca 420accactctgg cttgcctaac cagtgctgac aatacaaccg ttcaggctgt agcaagcgca 420

atcggtcggg ccattgagga cgaggctcgc ttcggtcgta tccgtgacct tgaagctaag 480atcggtcggg ccattgagga cgaggctcgc ttcggtcgta tccgtgacct tgaagctaag 480

cacttcaaga aaaacgttga ggaacaactc aacaagcgcg tagggcacgt ctacaagaaa 540cacttcaaga aaaacgttga ggaacaactc aacaagcgcg tagggcacgt ctacaagaaa 540

gcatttatgc aagttgtcga ggctgacatg ctctctaagg gtctactcgg tggcgaggcg 600gcatttatgc aagttgtcga ggctgacatg ctctctaagg gtctactcgg tggcgaggcg 600

tggtcttcgt ggcataagga agactctatt catgtaggag tacgctgcat cgagatgctc 660tggtcttcgt ggcataagga agactctatt catgtaggag tacgctgcat cgagatgctc 660

attgagtcaa ccggaatggt tagcttacac cgccaaaatg ctggcgtagt aggtcaagac 720attgagtcaa ccggaatggt tagcttacac cgccaaaatg ctggcgtagt aggtcaagac 720

tctgagacta tcgaactcgc acctgaatac gctgaggcta tcgcaacccg tgcaggtgcg 780tctgagacta tcgaactcgc acctgaatac gctgaggcta tcgcaacccg tgcaggtgcg 780

ctggctggca tctctccgat gttccaacct tgcgtagttc ctcctaagcc gtggactggc 840ctggctggca tctctccgat gttccaacct tgcgtagttc ctcctaagcc gtggactggc 840

attactggtg gtggctattg ggctaacggt cgtcgtcctc tggcgctggt gcgtactcac 900attactggtg gtggctattg ggctaacggt cgtcgtcctc tggcgctggt gcgtactcac 900

agtaagaaag cactgatgcg ctacgaagac gtttacatgc ctgaggtgta caaagcgatt 960agtaagaaag cactgatgcg ctacgaagac gtttacatgc ctgaggtgta caaagcgatt 960

aacattgcgc aaaacaccgc atggaaaatc aacaagaaag tcctagcggt cgccaacgta 1020aacattgcgc aaaacaccgc atggaaaatc aacaagaaag tcctagcggt cgccaacgta 1020

atcaccaagt ggaagcattg tccggtcgag gacatccctg cgattgagcg tgaagaactc 1080atcaccaagt ggaagcattg tccggtcgag gacatccctg cgattgagcg tgaagaactc 1080

ccgatgaaac cggaagacat cgacatgaat cctgaggctc tcaccgcgtg gaaacgtgct 1140ccgatgaaac cggaagacat cgacatgaat cctgaggctc tcaccgcgtg gaaacgtgct 1140

gccgctgctg tgtaccgcaa ggacaaggct cgcaagtctc gccgtatcag ccttgagttc 1200gccgctgctg tgtaccgcaa ggacaaggct cgcaagtctc gccgtatcag ccttgagttc 1200

atgcttgagc aagccaataa gtttgctaac cataaggcca tctggttccc ttacaacatg 1260atgcttgagc aagccaataa gtttgctaac cataaggcca tctggttccc ttacaacatg 1260

gactggcgcg gtcgtgttta cgctgtgtca atgttcaacc cgcaaggtaa cgatatgacc 1320gactggcgcg gtcgtgttta cgctgtgtca atgttcaacc cgcaaggtaa cgatatgacc 1320

aaaggactgc ttacgctggc gaaaggtaaa ccaatcggta aggaaggtta ctactggctg 1380aaaggactgc ttacgctggc gaaaggtaaa ccaatcggta aggaaggtta ctactggctg 1380

aaaatccacg gtgcaaactg tgcgggtgtc gataaggttc cgttccctga gcgcatcaag 14401440

ttcattgagg aaaaccacga gaacatcatg gcttgcgcta agtctccact ggagaacact 1500ttcattgagg aaaaccacga gaacatcatg gcttgcgcta agtctccact ggagaacact 1500

tggtgggctg agcaagattc tccgttctgc ttccttgcgt tctgctttga gtacgctggg 1560tggtgggctg agcaagattc tccgttctgc ttccttgcgt tctgctttga gtacgctggg 1560

gtacagcacc acggcctgag ctataactgc tcccttccgc tggcgtttga cgggtcttgc 1620gtacagcacc acggcctgag ctataactgc tcccttccgc tggcgtttga cgggtcttgc 1620

tctggcatcc agcacttctc cgcgatgctc cgagatgagg taggtggtcg cgcggttaac 1680tctggcatcc agcacttctc cgcgatgctc cgagatgagg taggtggtcg cgcggttaac 1680

ttgcttccta gtgaaaccgt tcaggacatc tacgggattg ttgctaagaa agtcaacgag 1740ttgcttccta gtgaaaccgt tcaggacatc tacgggattg ttgctaagaa agtcaacgag 1740

attctacaag cagacgcaat caatgggacc gataacgaag tagttaccgt gaccgatgag 1800attctacaag cagacgcaat caatgggacc gataacgaag tagttaccgt gaccgatgag 1800

aacactggtg aaatctctga gaaagtcaag ctgggcacta aggcactggc tggtcaatgg 1860aacactggtg aaatctctga gaaagtcaag ctgggcacta aggcactggc tggtcaatgg 1860

ctggcttacg gtgttactcg cagtgtgact aagcgttcag tcatgacgct ggcttacggg 1920ctggcttacg gtgttactcg cagtgtgact aagcgttcag tcatgacgct ggcttacggg 1920

tccaaagagt tcggcttccg tcaacaagtg ctggaagata ccattcagcc agctattgat 1980tccaaagagt tcggcttccg tcaacaagtg ctggaagata ccattcagcc agctattgat 1980

tccggcaagg gtctgatgtt cactcagccg aatcaggctg ctggatacat ggctaagctg 2040tccggcaagg gtctgatgtt cactcagccg aatcaggctg ctggatacat ggctaagctg 2040

atttgggaat ctgtgagcgt gacggtggta gctgcggttg aagcaatgaa ctggcttaag 2100atttgggaat ctgtgagcgt gacggtggta gctgcggttg aagcaatgaa ctggcttaag 2100

tctgctgcta agctgctggc tgctgaggtc aaagataaga agactggaga gattcttcgc 2160tctgctgcta agctgctggc tgctgaggtc aaagataaga agactggaga gattcttcgc 2160

aagcgttgcg ctgtgcattg ggtaactcct gatggtttcc ctgtgtggca ggaatacaag 2220aagcgttgcg ctgtgcattg ggtaactcct gatggtttcc ctgtgtggca ggaatacaag 2220

aagcctattc agacgcgctt gaacctgatg ttcctcggtc agttccgctt acagcctacc 2280aagcctattc agacgcgctt gaacctgatg ttcctcggtc agttccgctt acagcctacc 2280

attaacacca acaaagatag cgagattgat gcacacaaac aggagtctgg tatcgctcct 2340attaacacca acaaagatag cgagattgat gcacacaaac aggagtctgg tatcgctcct 2340

aactttgtac acagccaaga cggtagccac cttcgtaaga ctgtagtgtg ggcacacgag 2400aactttgtac acagccaaga cggtagccac cttcgtaaga ctgtagtgtg ggcacacgag 2400

aagtacggaa tcgaatcttt tgcactgatt cacgactcct tcggtaccat tccggctgac 2460aagtacggaa tcgaatcttt tgcactgatt cacgactcct tcggtaccat tccggctgac 2460

gctgcgaacc tgttcaaagc agtgcgcgaa actatggttg acacatatga gtcttgtgat 2520gctgcgaacc tgttcaaagc agtgcgcgaa actatggttg acacatatga gtcttgtgat 2520

gtactggctg atttctacga ccagttcgct gaccagttgc acgagtctca attggacaaa 2580gtactggctg atttctacga ccagttcgct gaccagttgc acgagtctca attggacaaa 2580

atgccagcac ttccggctaa aggtaacttg aacctccgtg acatcttaga gtcggacttc 2640atgccagcac ttccggctaa aggtaacttg aacctccgtg acatcttaga gtcggacttc 2640

gcgttcgcg 2649gcgttcgcg 2649

<210> 2<210> 2

<211> 883<211> 883

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> T7РНКP дикого типа<223> Wild-type T7RNAP

<400> 2<400> 2

Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu Met Asn Thr Ile Asn Ile Ala Lys Asn Asp Phe Ser Asp Ile Glu Leu

1 5 10 15 1 5 10 15

Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp His Tyr Gly Glu Arg Leu

20 25 30 20 25 30

Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu Ala Arg Glu Gln Leu Ala Leu Glu His Glu Ser Tyr Glu Met Gly Glu

35 40 45 35 40 45

Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val Ala Arg Phe Arg Lys Met Phe Glu Arg Gln Leu Lys Ala Gly Glu Val

50 55 60 50 55 60

Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys Ala Asp Asn Ala Ala Ala Lys Pro Leu Ile Thr Thr Leu Leu Pro Lys

65 70 75 80 65 70 75 80

Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg Met Ile Ala Arg Ile Asn Asp Trp Phe Glu Glu Val Lys Ala Lys Arg

85 90 95 85 90 95

Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu Gly Lys Arg Pro Thr Ala Phe Gln Phe Leu Gln Glu Ile Lys Pro Glu

100 105 110 100 105 110

Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser Ala Val Ala Tyr Ile Thr Ile Lys Thr Thr Leu Ala Cys Leu Thr Ser

115 120 125 115 120 125

Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala Ala Asp Asn Thr Thr Val Gln Ala Val Ala Ser Ala Ile Gly Arg Ala

130 135 140 130 135 140

Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys Ile Glu Asp Glu Ala Arg Phe Gly Arg Ile Arg Asp Leu Glu Ala Lys

145 150 155 160 145 150 155 160

His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His His Phe Lys Lys Asn Val Glu Glu Gln Leu Asn Lys Arg Val Gly His

165 170 175 165 170 175

Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser Val Tyr Lys Lys Ala Phe Met Gln Val Val Glu Ala Asp Met Leu Ser

180 185 190 180 185 190

Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp Lys Gly Leu Leu Gly Gly Glu Ala Trp Ser Ser Trp His Lys Glu Asp

195 200 205 195 200 205

Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr Ser Ile His Val Gly Val Arg Cys Ile Glu Met Leu Ile Glu Ser Thr

210 215 220 210 215 220

Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp Gly Met Val Ser Leu His Arg Gln Asn Ala Gly Val Val Gly Gln Asp

225 230 235 240 225 230 235 240

Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr Ser Glu Thr Ile Glu Leu Ala Pro Glu Tyr Ala Glu Ala Ile Ala Thr

245 250 255 245 250 255

Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val Arg Ala Gly Ala Leu Ala Gly Ile Ser Pro Met Phe Gln Pro Cys Val

260 265 270 260 265 270

Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala Val Pro Pro Lys Pro Trp Thr Gly Ile Thr Gly Gly Gly Tyr Trp Ala

275 280 285 275 280 285

Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Arg Thr His Ser Lys Lys Ala

290 295 300 290 295 300

Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile Leu Met Arg Tyr Glu Asp Val Tyr Met Pro Glu Val Tyr Lys Ala Ile

305 310 315 320 305 310 315 320

Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala Asn Ile Ala Gln Asn Thr Ala Trp Lys Ile Asn Lys Lys Val Leu Ala

325 330 335 325 330 335

Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile Val Ala Asn Val Ile Thr Lys Trp Lys His Cys Pro Val Glu Asp Ile

340 345 350 340 345 350

Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp Pro Ala Ile Glu Arg Glu Glu Leu Pro Met Lys Pro Glu Asp Ile Asp

355 360 365 355 360 365

Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val Met Asn Pro Glu Ala Leu Thr Ala Trp Lys Arg Ala Ala Ala Ala Val

370 375 380 370 375 380

Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe Tyr Arg Lys Asp Lys Ala Arg Lys Ser Arg Arg Ile Ser Leu Glu Phe

385 390 395 400 385 390 395 400

Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Asn His Lys Ala Ile Trp Phe

405 410 415 405 410 415

Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Val Tyr Ala Val Ser Met Phe

420 425 430 420 425 430

Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys Asn Pro Gln Gly Asn Asp Met Thr Lys Gly Leu Leu Thr Leu Ala Lys

435 440 445 435 440 445

Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly Gly Lys Pro Ile Gly Lys Glu Gly Tyr Tyr Trp Leu Lys Ile His Gly

450 455 460 450 455 460

Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys Ala Asn Cys Ala Gly Val Asp Lys Val Pro Phe Pro Glu Arg Ile Lys

465 470 475 480 465 470 475 480

Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro Phe Ile Glu Glu Asn His Glu Asn Ile Met Ala Cys Ala Lys Ser Pro

485 490 495 485 490 495

Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu Leu Glu Asn Thr Trp Trp Ala Glu Gln Asp Ser Pro Phe Cys Phe Leu

500 505 510 500 505 510

Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr Ala Phe Cys Phe Glu Tyr Ala Gly Val Gln His His Gly Leu Ser Tyr

515 520 525 515 520 525

Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln Asn Cys Ser Leu Pro Leu Ala Phe Asp Gly Ser Cys Ser Gly Ile Gln

530 535 540 530 535 540

His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn His Phe Ser Ala Met Leu Arg Asp Glu Val Gly Gly Arg Ala Val Asn

545 550 555 560 545 550 555 560

Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys Leu Leu Pro Ser Glu Thr Val Gln Asp Ile Tyr Gly Ile Val Ala Lys

565 570 575 565 570 575

Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn Lys Val Asn Glu Ile Leu Gln Ala Asp Ala Ile Asn Gly Thr Asp Asn

580 585 590 580 585 590

Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys Glu Val Val Thr Val Thr Asp Glu Asn Thr Gly Glu Ile Ser Glu Lys

595 600 605 595 600 605

Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly Val Lys Leu Gly Thr Lys Ala Leu Ala Gly Gln Trp Leu Ala Tyr Gly

610 615 620 610 615 620

Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Val Met Thr Leu Ala Tyr Gly

625 630 635 640 625 630 635 640

Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Leu Glu Asp Thr Ile Gln

645 650 655 645 650 655

Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Met Phe Thr Gln Pro Asn Gln

660 665 670 660 665 670

Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr Ala Ala Gly Tyr Met Ala Lys Leu Ile Trp Glu Ser Val Ser Val Thr

675 680 685 675 680 685

Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys Val Val Ala Ala Val Glu Ala Met Asn Trp Leu Lys Ser Ala Ala Lys

690 695 700 690 695 700

Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg Leu Leu Ala Ala Glu Val Lys Asp Lys Lys Thr Gly Glu Ile Leu Arg

705 710 715 720 705 710 715 720

Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp Lys Arg Cys Ala Val His Trp Val Thr Pro Asp Gly Phe Pro Val Trp

725 730 735 725 730 735

Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu Gln Glu Tyr Lys Lys Pro Ile Gln Thr Arg Leu Asn Leu Met Phe Leu

740 745 750 740 745 750

Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu Gly Gln Phe Arg Leu Gln Pro Thr Ile Asn Thr Asn Lys Asp Ser Glu

755 760 765 755 760 765

Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His Ile Asp Ala His Lys Gln Glu Ser Gly Ile Ala Pro Asn Phe Val His

770 775 780 770 775 780

Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu Ser Gln Asp Gly Ser His Leu Arg Lys Thr Val Val Trp Ala His Glu

785 790 795 800 785 790 795 800

Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr Lys Tyr Gly Ile Glu Ser Phe Ala Leu Ile His Asp Ser Phe Gly Thr

805 810 815 805 810 815

Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met Ile Pro Ala Asp Ala Ala Asn Leu Phe Lys Ala Val Arg Glu Thr Met

820 825 830 820 825 830

Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln Val Asp Thr Tyr Glu Ser Cys Asp Val Leu Ala Asp Phe Tyr Asp Gln

835 840 845 835 840 845

Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu Phe Ala Asp Gln Leu His Glu Ser Gln Leu Asp Lys Met Pro Ala Leu

850 855 860 850 855 860

Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe Pro Ala Lys Gly Asn Leu Asn Leu Arg Asp Ile Leu Glu Ser Asp Phe

865 870 875 880 865 870 875 880

Ala Phe Ala Ala Phe Ala

<210> 3<210> 3

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> 6His-T7РНКP <223> 6His-T7RNAP

<400> 3<400> 3

atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60atgcaccatc accatcacca tatgaacacg attaacatcg ctaagaacga cttctctgac 60

atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120atcgaactgg ctgctatccc gttcaacact ctggctgacc attacggtga gcgtttagct 120

cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180cgcgaacagt tggcccttga gcatgagtct tacgagatgg gtgaagcacg cttccgcaag 180

atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240atgtttgagc gtcaacttaa agctggtgag gttgcggata acgctgccgc caagcctctc 240

atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300atcactaccc tactccctaa gatgattgca cgcatcaacg actggtttga ggaagtgaaa 300

gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360gctaagcgcg gcaagcgccc gacagccttc cagttcctgc aagaaatcaa gccggaagcc 360

gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga caatacaacc 420

gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480gttcaggctg tagcaagcgc aatcggtcgg gccattgagg acgaggctcg cttcggtcgt 480

atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540atccgtgacc ttgaagctaa gcacttcaag aaaaacgttg aggaacaact caacaagcgc 540

gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600gtagggcacg tctacaagaa agcatttatg caagttgtcg aggctgacat gctctctaag 600

ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660ggtctactcg gtggcgaggc gtggtcttcg tggcataagg aagactctat tcatgtagga 660

gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720gtacgctgca tcgagatgct cattgagtca accggaatgg ttagcttaca ccgccaaaat 720

gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780gctggcgtag taggtcaaga ctctgagact atcgaactcg cacctgaata cgctgaggct 780

atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840atcgcaaccc gtgcaggtgc gctggctggc atctctccga tgttccaacc ttgcgtagtt 840

cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900cctcctaagc cgtggactgg cattactggt ggtggctatt gggctaacgg tcgtcgtcct 900

ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960ctggcgctgg tgcgtactca cagtaagaaa gcactgatgc gctacgaaga cgtttacatg 960

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga ggacatccct 1080

gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140gcgattgagc gtgaagaact cccgatgaaa ccggaagaca tcgacatgaa tcctgaggct 1140

ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc tcgcaagtct 1200

cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320atctggttcc cttacaacat ggactggcgc ggtcgtgttt acgctgtgtc aatgttcaac 1320

ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgatatgac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380

aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440aaggaaggtt actactggct gaaaatccac ggtgcaaact gtgcgggtgt cgataaggtt 1440

ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500ccgttccctg agcgcatcaa gttcattgag gaaaaccacg agaacatcat ggcttgcgct 1500

aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ctccgttctg cttccttgcg 1560

ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620ttctgctttg agtacgctgg ggtacagcac cacggcctga gctataactg ctcccttccg 1620

ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680ctggcgtttg acgggtcttg ctctggcatc cagcacttct ccgcgatgct ccgagatgag 1680

gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740gtaggtggtc gcgcggttaa cttgcttcct agtgaaaccg ttcaggacat ctacgggatt 1740

gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800gttgctaaga aagtcaacga gattctacaa gcagacgcaa tcaatgggac cgataacgaa 1800

gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860gtagttaccg tgaccgatga gaacactggt gaaatctctg agaaagtcaa gctgggcact 1860

aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gcagtgtgac taagcgttca 1920

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagat 1980

accattcagc cagctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc cagctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040

gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100gctggataca tggctaagct gatttgggaa tctgtgagcg tgacggtggt agctgcggtt 2100

gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160gaagcaatga actggcttaa gtctgctgct aagctgctgg ctgctgaggt caaagataag 2160

aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220aagactggag agattcttcg caagcgttgc gctgtgcatt gggtaactcc tgatggtttc 2220

cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280cctgtgtggc aggaatacaa gaagcctatt cagacgcgct tgaacctgat gttcctcggt 2280

cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340cagttccgct tacagcctac cattaacacc aacaaagata gcgagattga tgcacacaaa 2340

caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400caggagtctg gtatcgctcc taactttgta cacagccaag acggtagcca ccttcgtaag 2400

actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460actgtagtgt gggcacacga gaagtacgga atcgaatctt ttgcactgat tcacgactcc 2460

ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520ttcggtacca ttccggctga cgctgcgaac ctgttcaaag cagtgcgcga aactatggtt 2520

gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580gacacatatg agtcttgtga tgtactggct gatttctacg accagttcgc tgaccagttg 2580

cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640cacgagtctc aattggacaa aatgccagca cttccggcta aaggtaactt gaacctccgt 2640

gacatcttag agtcggactt cgcgttcgcg taa 2673gacatcttag agtcggactt cgcgttcgcg taa 2673

<210> 4<210> 4

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> 6His-T7РНКP<223> 6His-T7RNAP

<400> 4<400> 4

Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn Met His His His His His His Met Asn Thr Ile Asn Ile Ala Lys Asn

1 5 10 15 1 5 10 15

Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala Asp Phe Ser Asp Ile Glu Leu Ala Ala Ile Pro Phe Asn Thr Leu Ala

20 25 30 20 25 30

Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His Asp His Tyr Gly Glu Arg Leu Ala Arg Glu Gln Leu Ala Leu Glu His

35 40 45 35 40 45

Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg Glu Ser Tyr Glu Met Gly Glu Ala Arg Phe Arg Lys Met Phe Glu Arg

50 55 60 50 55 60

Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu Gln Leu Lys Ala Gly Glu Val Ala Asp Asn Ala Ala Ala Lys Pro Leu

65 70 75 80 65 70 75 80

Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe Ile Thr Thr Leu Leu Pro Lys Met Ile Ala Arg Ile Asn Asp Trp Phe

85 90 95 85 90 95

Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe Glu Glu Val Lys Ala Lys Arg Gly Lys Arg Pro Thr Ala Phe Gln Phe

100 105 110 100 105 110

Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr Leu Gln Glu Ile Lys Pro Glu Ala Val Ala Tyr Ile Thr Ile Lys Thr

115 120 125 115 120 125

Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Asp Asn Thr Thr Val Gln Ala Val

130 135 140 130 135 140

Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg Ala Ser Ala Ile Gly Arg Ala Ile Glu Asp Glu Ala Arg Phe Gly Arg

145 150 155 160 145 150 155 160

Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln Ile Arg Asp Leu Glu Ala Lys His Phe Lys Lys Asn Val Glu Glu Gln

165 170 175 165 170 175

Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val Leu Asn Lys Arg Val Gly His Val Tyr Lys Lys Ala Phe Met Gln Val

180 185 190 180 185 190

Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp Val Glu Ala Asp Met Leu Ser Lys Gly Leu Leu Gly Gly Glu Ala Trp

195 200 205 195 200 205

Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile Ser Ser Trp His Lys Glu Asp Ser Ile His Val Gly Val Arg Cys Ile

210 215 220 210 215 220

Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn Glu Met Leu Ile Glu Ser Thr Gly Met Val Ser Leu His Arg Gln Asn

225 230 235 240 225 230 235 240

Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu Ala Gly Val Val Gly Gln Asp Ser Glu Thr Ile Glu Leu Ala Pro Glu

245 250 255 245 250 255

Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser Tyr Ala Glu Ala Ile Ala Thr Arg Ala Gly Ala Leu Ala Gly Ile Ser

260 265 270 260 265 270

Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile Pro Met Phe Gln Pro Cys Val Val Pro Pro Lys Pro Trp Thr Gly Ile

275 280 285 275 280 285

Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val Thr Gly Gly Gly Tyr Trp Ala Asn Gly Arg Arg Pro Leu Ala Leu Val

290 295 300 290 295 300

Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met Arg Thr His Ser Lys Lys Ala Leu Met Arg Tyr Glu Asp Val Tyr Met

305 310 315 320 305 310 315 320

Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys Pro Glu Val Tyr Lys Ala Ile Asn Ile Ala Gln Asn Thr Ala Trp Lys

325 330 335 325 330 335

Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys Ile Asn Lys Lys Val Leu Ala Val Ala Asn Val Ile Thr Lys Trp Lys

340 345 350 340 345 350

His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Glu Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro

355 360 365 355 360 365

Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp Met Lys Pro Glu Asp Ile Asp Met Asn Pro Glu Ala Leu Thr Ala Trp

370 375 380 370 375 380

Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Lys Asp Lys Ala Arg Lys Ser

385 390 395 400 385 390 395 400

Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala

405 410 415 405 410 415

Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg Asn His Lys Ala Ile Trp Phe Pro Tyr Asn Met Asp Trp Arg Gly Arg

420 425 430 420 425 430

Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Met Thr Lys

435 440 445 435 440 445

Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr Gly Leu Leu Thr Leu Ala Lys Gly Lys Pro Ile Gly Lys Glu Gly Tyr

450 455 460 450 455 460

Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val Tyr Trp Leu Lys Ile His Gly Ala Asn Cys Ala Gly Val Asp Lys Val

465 470 475 480 465 470 475 480

Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile Pro Phe Pro Glu Arg Ile Lys Phe Ile Glu Glu Asn His Glu Asn Ile

485 490 495 485 490 495

Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln Met Ala Cys Ala Lys Ser Pro Leu Glu Asn Thr Trp Trp Ala Glu Gln

500 505 510 500 505 510

Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp Gln His His Gly Leu Ser Tyr Asn Cys Ser Leu Pro Leu Ala Phe Asp

530 535 540 530 535 540

Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu Gly Ser Cys Ser Gly Ile Gln His Phe Ser Ala Met Leu Arg Asp Glu

545 550 555 560 545 550 555 560

Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp Val Gly Gly Arg Ala Val Asn Leu Leu Pro Ser Glu Thr Val Gln Asp

565 570 575 565 570 575

Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp Ile Tyr Gly Ile Val Ala Lys Lys Val Asn Glu Ile Leu Gln Ala Asp

580 585 590 580 585 590

Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn Ala Ile Asn Gly Thr Asp Asn Glu Val Val Thr Val Thr Asp Glu Asn

595 600 605 595 600 605

Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala Thr Gly Glu Ile Ser Glu Lys Val Lys Leu Gly Thr Lys Ala Leu Ala

610 615 620 610 615 620

Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Ser Val Thr Lys Arg Ser

625 630 635 640 625 630 635 640

Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln Val Met Thr Leu Ala Tyr Gly Ser Lys Glu Phe Gly Phe Arg Gln Gln

645 650 655 645 650 655

Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile Met Phe Thr Gln Pro Asn Gln Ala Ala Gly Tyr Met Ala Lys Leu Ile

675 680 685 675 680 685

Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn Trp Glu Ser Val Ser Val Thr Val Val Ala Ala Val Glu Ala Met Asn

690 695 700 690 695 700

Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys Trp Leu Lys Ser Ala Ala Lys Leu Leu Ala Ala Glu Val Lys Asp Lys

705 710 715 720 705 710 715 720

Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr Lys Thr Gly Glu Ile Leu Arg Lys Arg Cys Ala Val His Trp Val Thr

725 730 735 725 730 735

Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr Pro Asp Gly Phe Pro Val Trp Gln Glu Tyr Lys Lys Pro Ile Gln Thr

740 745 750 740 745 750

Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile Arg Leu Asn Leu Met Phe Leu Gly Gln Phe Arg Leu Gln Pro Thr Ile

755 760 765 755 760 765

Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly Asn Thr Asn Lys Asp Ser Glu Ile Asp Ala His Lys Gln Glu Ser Gly

770 775 780 770 775 780

Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys Ile Ala Pro Asn Phe Val His Ser Gln Asp Gly Ser His Leu Arg Lys

785 790 795 800 785 790 795 800

Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu Thr Val Val Trp Ala His Glu Lys Tyr Gly Ile Glu Ser Phe Ala Leu

805 810 815 805 810 815

Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe Ile His Asp Ser Phe Gly Thr Ile Pro Ala Asp Ala Ala Asn Leu Phe

820 825 830 820 825 830

Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val Lys Ala Val Arg Glu Thr Met Val Asp Thr Tyr Glu Ser Cys Asp Val

835 840 845 835 840 845

Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln Leu Ala Asp Phe Tyr Asp Gln Phe Ala Asp Gln Leu His Glu Ser Gln

850 855 860 850 855 860

Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg Leu Asp Lys Met Pro Ala Leu Pro Ala Lys Gly Asn Leu Asn Leu Arg

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 5<210> 5

<211> 3060<211> 3060

<212> ДНК<212> DNA

<220><220>

<223> ДНК-матрица<223> DNA template

<400> 5<400> 5

gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 60gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac 60

cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 120cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa 120

ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttagccc 180ctggcttcag cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttagccc 180

accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 240accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag 240

tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac 300tggctgctgc cagtggcgat aagtcgtgtc ttaccggggtt ggactcaaga cgatagttac 300

cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 360cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc 360

gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 420gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc 420

ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 480ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca 480

cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 540cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc 540

tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg 600tctgacttga gcgtcgattt ttgtgatgct cgtcagggggg gcggagccta tggaaaaacg 600

ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 660ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct 660

ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 720ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata 720

ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg 780ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaaggcg 780

agagtaggga actgccaggc atcaaactaa gcagaaggcc cctgacggat ggcctttttg 840aggtaggga actgccaggc atcaaactaa gcagaaggcc cctgacggat ggcctttttg 840

cgtttctaca aactctttct gtgttgtaaa acgacggcca gtcttaagct cgggccccct 900cgtttctaca aactctttct gtgttgtaaa acgacggcca gtcttaagct cgggccccct 900

gggcggttct gataacgagt aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg 960gggcggttct gataacgagt aatcgttaat ccgcaaataa cgtaaaaacc cgcttcggcg 960

ggttttttta tggggggagt ttagggaaag agcatttgtc agaatattta agggcgcctg 1020ggttttttta tggggggagt ttagggaaag agcatttgtc agaatattta agggcgcctg 1020

tcactttgct tgatatatga gaattattta accttataaa tgagaaaaaa gcaacgcact 1080tcactttgct tgatatatga gaattattta accttataaa tgagaaaaaa gcaacgcact 1080

ttaaataaga tacgttgctt tttcgattga tgaacaccta taattaaact attcatctat 1140ttaaataaga tacgttgctt tttcgattga tgaacaccta taattaaact attcatctat 1140

tatttatgat tttttgtata tacaatattt ctagtttgtt aaagagaatt aagaaaataa 1200tatttatgat tttttgtata tacaatattt ctagtttgtt aaagagaatt aagaaaataa 1200

atctcgaaaa taataaaggg aaaatcagtt tttgatatca aaattataca tgtcaacgat 1260atctcgaaaa taataaaggg 1260

aatacaaaat ataatacaaa ctataagatg ttatcagtat ttattatgca tttagaataa 13201320

attttgtgtc gcccttgtac ttagtcgctg aataatacga ctcactatag cggaacccaa 1380attttgtgtc gcccttgtac ttagtcgctg aataatacga ctcactatag cggaacccaa 1380

gctaagcgcc agaactggca ccttcgggtg ccagttgacg aggtggggtt tatcgagatt 14401440

tcggcggatg actcccggtt gttcatcaca accgcaagct tttacttaaa tcattaaggt 1500tcggcggatg actcccggtt gttcatcaca accgcaagct tttacttaaa tcattaaggt 1500

gacttagtgg acaaaggtga aagtgtgatg aaacccgacc tggacggagg cgcgcccgag 15601560

atgagtaggc tgtcccatca ggggaggaat cggggacggc tgaaaggcga gggcgccgaa 1620atgagtaggc tgtcccatca ggggaggaat cggggacggc tgaaaggcga gggcgccgaa 1620

gcgagcagag ttcctcccgc tctgcttggc tgggggtgag gggaataccc ttaccactgt 16801680

cgcgaaagcg gagagccgtc caggatcccg tcaaaagggc gacaccccat aattagcccg 1740cgcgaaagcg gagagccgtc caggatcccg tcaaaagggc gacaccccat aattagcccg 1740

ggcgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 1800ggcgaaaggc ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct 1800

actctcgcat ggggagtccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 1860actctcgcat ggggagtccc cacactacca tcggcgctac ggcgtttcac ttctgagttc 1860

ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaacaagg ggtgttatga 1920ggcatggggt caggtgggac caccgcgcta ctgccgccag gcaaacaagg ggtgttatga 1920

gccatattca ggtataaatg ggctcgcgat aatgttcaga attggttaat tggttgtaac 1980gccatattca ggtataaatg ggctcgcgat aatgttcaga attggttaat tggttgtaac 1980

actgacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2040actgacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca 2040

ataaccctga taaatgcttc aataatattg aaaaaggaag aatatgagta ttcaacattt 2100ataaccctga taaatgcttc aataatattg aaaaaggaag aatatgagta ttcaacattt 2100

ccgtgtcgcc cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga 2160ccgtgtcgcc cttattccct ttttgcggc attttgcctt cctgtttttg ctcacccaga 2160

aacgctggtg aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga 2220aacgctggtg aaagtaaaag atgctgaaga tcagttggggt gcacgagtgg gttacatcga 2220

actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2280actggatctc aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat 2280

gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2340gatgagcact tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca 2340

agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2400agagcaactc ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt 2400

cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2460cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac 2460

catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2520catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct 2520

aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2580aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga 2580

gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag cgatggcaac 2640gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgtag cgatggcaac 2640

aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2700aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat 2700

agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2760agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg 2760

ctggtttatt gctgataaat ccggagccgg tgagcgtggt tctcgcggta tcatcgcagc 2820ctggtttatt gctgataaat ccggagccgg tgagcgtggt tctcgcggta tcatcgcagc 2820

gctggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2880gctggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc 2880

aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2940aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg 2940

gtaaaagcag agcattacgc tgacttgacg ggacggcgca agctcatgac caaaatccct 3000gtaaaagcag agcattacgc tgacttgacg ggacggcgca agctcatgac caaaatccct 3000

taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 3060taacgtgagt tacgcgcgcg tcgttccact gagcgtcaga ccccgtagaa aagatcaaag 3060

<210> 6<210> 6

<211> 334<211> 334

<212> РНК<212> RNA

<220><220>

<223> РНК-транскрипт<223> RNA transcript

<400> 6<400> 6

gcggaaccca agcuaagcgc cagaacuggc accuucgggu gccaguugac gagguggggu 60gcggaaccca agcuaagcgc cagaacuggc accuucgggu gccaguugac gagguggggu 60

uuaucgagau uucggcggau gacucccggu uguucaucac aaccgcaagc uuuuacuuaa 120120

aucauuaagg ugacuuagug gacaaaggug aaagugugau gaaacccgac cuggacggag 180aucauuaagg ugacuuagug gacaaaggug aaagugugau gaaacccgac cuggacggag 180

gcgcgcccga gaugaguagg cugucccauc aggggaggaa ucggggacgg cugaaaggcg 240gcgcgcccga gaugaguagg cugucccauc aggggaggaa ucggggacgg cugaaaggcg 240

agggcgccga agcgagcaga guuccucccg cucugcuugg cuggggguga ggggaauacc 300agggcgccga agcgagcaga guuccuccg cucugcuugg cuggggguga ggggaauacc 300

cuuaccacug ucgcgaaagc ggagagccgu ccag 334cuuaccacug ucgcgaaagc ggagagccgu ccag 334

<210> 7<210> 7

<211> 16<211> 16

<212> РНК<212> RNA

<220><220>

<223> Продукт расщепления РНК<223> RNA cleavage product

<400> 7<400> 7

gcggaaccca agcuaa 16gcggaaccca agcuaa 16

<210> 8<210> 8

<211> 4671<211> 4671

<212> ДНК<212> DNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 8<400> 8

gagttacgcg cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 60gagttacgcg cgcgtcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 60

cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 120cttgagatcc ttttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 120

cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 180cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 180

tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta gcccaccact 240tcagcagagc gcagatacca aatactgttc ttctagtgta gccgtagtta gcccaccact 240

tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 300tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 300

ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 360ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 360

aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 420aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 420

cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 480cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 480

ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 540ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggag cgcacgaggg 540

agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 600agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 600

ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 660ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 660

acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 720acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg 720

cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 780cgttatcccc tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc 780

gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ggcgagagta 840gccgcagccg aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa ggcgagagta 840

gggaactgcc aggcatcaaa ctaagcagaa ggcccctgac ggatggcctt tttgcgtttc 900gggaactgcc aggcatcaaa ctaagcagaa ggcccctgac ggatggcctt tttgcgtttc 900

tacaaactct ttctgtgttg taaaacgacg gccagtctta agctcgggcc ccctgggcgg 960tacaaactct ttctgtgttg taaaacgacg gccagtctta agctcgggcc ccctgggcgg 960

ttctgataac gagtaatcgt taatccgcaa ataacgtaaa aacccgcttc ggcgggtttt 1020ttctgataac gagtaatcgt taatccgcaa ataacgtaaa aacccgcttc ggcggggtttt 1020

tttatggggg gagtttaggg aaagagcatt tgtcagaata tttaagggcg cctgtcactt 1080tttatggggg gagtttaggg aaagagcatt tgtcagaata tttaagggcg cctgtcactt 1080

tgcttgatat atgagaatta tttaacctta taaatgagaa aaaagcaacg cactttaaat 1140tgcttgatat atgagaatta tttaacctta taaatgagaa aaaagcaacg cactttaaat 1140

aagatacgtt gctttttcga ttgatgaaca cctataatta aactattcat ctattattta 1200aagatacgtt gctttttcga ttgatgaaca cctataatta aactattcat ctattattta 1200

tgattttttg tatatacaat atttctagtt tgttaaagag aattaagaaa ataaatctcg 12601260

aaaataataa agggaaaatc agtttttgat atcaaaatta tacatgtcaa cgataataca 1320aaaataataa agggaaaatc agtttttgat atcaaaatta tacatgtcaa cgataataca 1320

aaatataata caaactataa gatgttatca gtatttatta tgcatttaga atacgtactc 1380aaatataata caaactataa gatgttatca gtatttatta tgcatttaga atacgtactc 1380

agcgtctggg ttccccatcg gtgatgtcgt ataagagacg tataggagac ctatagtgtc 1440agcgtctggg ttccccatcg gtgatgtcgt ataagagacg tataggagac ctatagtgtc 1440

ttcggggtaa tacgactcac tatagcggaa cccaagcttg gcattccggt actgttggta 1500ttcggggtaa tacgactcac tatagcggaa cccaagcttg gcattccggt actgttggta 1500

aagccaccat ggaagatgcg aagaacataa agaaaggtcc cgccccattt tacccactcg 15601560

aggatggaac agctggggag caactgcaca aggccatgaa gcgctatgcg ttggtgccgg 1620aggatggaac agctggggag caactgcaca aggccatgaa gcgctatgcg ttggtgccgg 1620

gaaccatcgc gttcaccgac gcacacatcg aagtgaacat cacttacgcc gagtactttg 1680gaaccatcgc gttcaccgac gcacacatcg aagtgaacat cacttacgcc gagtactttg 1680

agatgagcgt caggctggcc gaggctatga agcgatacgg tctgaacacc aaccaccgga 1740agatgagcgt caggctggcc gaggctatga agcgatacgg tctgaacacc aaccaccggga 1740

tcgtggtctg ctctgaaaac agcctgcagt tcttcatgcc ggtcctgggg gccctgttca 1800tcgtggtctg ctctgaaaac agcctgcagt tcttcatgcc ggtcctgggg gccctgttca 1800

tcggcgtggc cgtggcaccc gccaacgata tctacaacga gagagaattg ctgaactcga 1860tcggcgtggc cgtggcaccc gccaacgata tctacaacga gagagaattg ctgaactcga 1860

tgaacatctc ccagcctacc gtggtgttcg tgtcgaagaa ggggttgcag aagatcctga 1920tgaacatctc ccagcctacc gtggtgttcg tgtcgaagaa ggggttgcag aagatcctga 1920

acgtgcagaa gaagctgccc atcattcaaa agattatcat tatggattcc aaaaccgact 1980acgtgcagaa gaagctgccc atcattcaaa agattatcat tatggattcc aaaaccgact 1980

accagggttt ccagtcaatg tataccttcg tgacctccca tctgccccct ggcttcaacg 2040accagggttt ccagtcaatg tataccttcg tgacctccca tctgccccct ggcttcaacg 2040

aatacgactt cgtgcctgaa agcttcgacc gcgacaagac gatcgccctc atcatgaact 2100aatacgactt cgtgcctgaa agcttcgacc gcgacaagac gatcgccctc atcatgaact 2100

cgtccggctc gaccgggctg cccaaaggag tggccctgcc acaccggacc gcttgcgtgc 2160cgtccggctc gaccgggctg cccaaaggag tggccctgcc acaccggacc gcttgcgtgc 2160

ggttctccca cgcccgggac cctattttcg gcaatcagat cattccggac actgccatcc 2220ggttctccca cgcccgggac cctattttcg gcaatcagat cattccggac actgccatcc 2220

tgagcgtggt ccccttccat cacgggtttg ggatgtttac cactctgggc tacctcatct 2280tgagcgtggt ccccttccat cacgggtttg ggatgtttac cactctgggc tacctcatct 2280

gcggattcag ggtggtgctg atgtaccggt tcgaggaaga acttttcctg cggagcctgc 2340gcggattcag ggtggtgctg atgtaccggt tcgaggaaga acttttcctg cggagcctgc 2340

aggattacaa gatccagtcc gccctcctcg tgccaaccct cttctcattc ttcgctaagt 2400aggattacaa gatccagtcc gccctcctcg tgccaaccct cttctcattc ttcgctaagt 2400

ccactctcat cgataagtac gacctgtcga atctccacga aattgcgtcc ggtggtgcac 2460ccactctcat cgataagtac gacctgtcga atctccacga aattgcgtcc ggtggtgcac 2460

cgctgtccaa ggaggtcggc gaagccgtgg ccaagcgctt ccacctcccg ggaatacgcc 2520cgctgtccaa ggaggtcggc gaagccgtgg ccaagcgctt ccacctcccg ggaatacgcc 2520

agggatacgg cctgactgaa acgaccagcg cgattctgat caccccggag ggcgacgaca 2580agggatacgg cctgactgaa acgaccagcg cgattctgat caccccggag ggcgacgaca 2580

agccgggtgc cgtggggaaa gtggtgccgt tcttcgaagc aaaggtcgtg gatctggata 2640agccgggtgc cgtggggaaa gtggtgccgt tcttcgaagc aaaggtcgtg gatctggata 2640

ccggaaagac tctgggcgtg aaccagagag gggaactttg tgtgcgcgga ccgatgatta 2700ccggaaagac tctgggcgtg aaccagagag gggaactttg tgtgcgcgga ccgatgatta 2700

tgtccggata tgtcaacaac cccgaggcca ctaatgccct gatcgacaag gacggatggt 2760tgtccggata tgtcaacaac cccgaggcca ctaatgccct gatcgacaag gacggatggt 2760

tgcatagcgg cgacatcgca tactgggacg aggacgagca ctttttcatt gtggatcggc 2820tgcatagcgg cgacatcgca tactgggacg aggacgagca ctttttcatt gtggatcggc 2820

tcaagtccct gatcaagtac aagggatacc aggtcgcccc tgccgaactt gagtccatcc 2880tcaagtccct gatcaagtac aagggatacc aggtcgcccc tgccgaactt gagtccatcc 2880

tgctgcaaca tccgaacatt ttcgacgcgg gcgtcgctgg ccttcctgat gatgacgccg 2940tgctgcaaca tccgaacatt ttcgacgcgg gcgtcgctgg ccttcctgat gatgacgccg 2940

gagagctgcc cgcggccgtg gtggtgctcg aacacggaaa aactatgacc gagaaggaaa 3000gagagctgcc cgcggccgtg gtggtgctcg aacacggaaa aactatgacc gagaaggaaa 3000

tcgtggacta cgtggcgtca caagtcacca ctgccaagaa actgcgcggc ggagtcgtgt 3060tcgtggacta cgtggcgtca caagtcacca ctgccaagaa actgcgcggc ggagtcgtgt 3060

tcgtggacga ggtgcccaag ggcctgaccg gaaagctgga cgctagaaag atccgggaga 31203120

tcctgattaa ggccaagaag ggaggaaagt ccaagctctg agatctagag ggccctattc 3180tcctgattaa ggccaagaag ggaggaaagt ccaagctctg agatctagag ggccctattc 3180

tatagtgtca cctaaatgct aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 32403240

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 33003300

gaattcaaaa gaagaccata tacgtctcct ataggtctcg tatactgctt cctatacgac 3360gaattcaaaa gaagaccata tacgtctcct ataggtctcg tatactgctt cctatacgac 3360

atcaccgatg gggaacacga agcgatccag ccccccttat tagcccgggc gaaaggccca 3420atcaccgatg gggaacacga agcgatccag ccccccttat tagcccgggc gaaaggccca 3420

gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact ctcgcatggg 3480gtctttcgac tgagcctttc gttttatttg atgcctggca gttccctact ctcgcatggg 3480

gagtccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc atggggtcag 3540gagtccccac actaccatcg gcgctacggc gtttcacttc tgagttcggc atggggtcag 3540

gtgggaccac cgcgctactg ccgccaggca aacaaggggt gttatgagcc atattcaggt 3600gtgggaccac cgcgctactg ccgccaggca aacaaggggt gttatgagcc atattcaggt 3600

ataaatgggc tcgcgataat gttcagaatt ggttaattgg ttgtaacact gacccctatt 3660ataaatgggc tcgcgataat gttcagaatt ggttaattgg ttgtaacact gacccctatt 3660

tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 37203720

atgcttcaat aatattgaaa aaggaagaat atgagtattc aacatttccg tgtcgccctt 3780atgcttcaat aatattgaaa aaggaagaat atgagtattc aacatttccg tgtcgccctt 3780

attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 3840attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 3840

gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 3900gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 3900

agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 39603960

aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 4020aaagttctgc tatgtggcgc ggtattatcc cgtattgacg cggggcaaga gcaactcggt 4020

cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 4080cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 4080

cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 4140cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 4140

actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 4200actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 4200

cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 4260cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 4260

ataccaaacg acgagcgtga caccacgatg cctgtagcga tggcaacaac gttgcgcaaa 4320ataccaaacg acgagcgtga caccacgatg cctgtagcga tggcaacaac gttgcgcaaa 4320

ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 4380ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 4380

gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 4440gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 4440

gataaatccg gagccggtga gcgtggttct cgcggtatca tcgcagcgct ggggccagat 4500gataaatccg gagccggtga gcgtggttct cgcggtatca tcgcagcgct ggggccagat 4500

ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 4560ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 4560

cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta agcagagcat 4620cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta agcagagcat 4620

tacgctgact tgacgggacg gcgcaagctc atgaccaaaa tcccttaacg t 4671tacgctgact tgacgggacg gcgcaagctc atgaccaaaa tcccttaacg t 4671

<210> 9<210> 9

<211> 1697<211> 1697

<212> РНК<212> RNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 9<400> 9

gcggaaccca agcuuggcau uccgguacug uugguaaagc caccauggaa gaugcgaaga 60gcggaaccca agcuuggcau uccgguacug uugguaaagc caccauggaa gaugcgaaga 60

acauaaagaa aggucccgcc ccauuuuacc cacucgagga uggaacagcu ggggagcaac 120acauaaagaa aggucccgcc ccauuuuacc cacucgagga uggaacagcu ggggagcaac 120

ugcacaaggc caugaagcgc uaugcguugg ugccgggaac caucgcguuc accgacgcac 180ugcacaaggc caugaagcgc uaugcguugg ugccgggaac caucgcguuc accgacgcac 180

acaucgaagu gaacaucacu uacgccgagu acuuugagau gagcgucagg cuggccgagg 240acaucgaagu gaacaucacu uacgccgagu acuuugagau gagcgucagg cuggccgagg 240

cuaugaagcg auacggucug aacaccaacc accggaucgu ggucugcucu gaaaacagcc 300cuaugaagcg auacggucug aacaccaacc accggaucgu ggucugcucu gaaaacagcc 300

ugcaguucuu caugccgguc cugggggccc uguucaucgg cguggccgug gcacccgcca 360ugcaguucuu caugccgguc cugggggccc uguucaucgg cguggccgug gcacccgcca 360

acgauaucua caacgagaga gaauugcuga acucgaugaa caucucccag ccuaccgugg 420acgauaucua caacgagaga gaauugcuga acucgaugaa caucucccag ccuaccgugg 420

uguucguguc gaagaagggg uugcagaaga uccugaacgu gcagaagaag cugcccauca 480uguucguguc gaagaagggg uugcagaaga uccugaacgu gcagaagaag cugcccauca 480

uucaaaagau uaucauuaug gauuccaaaa ccgacuacca ggguuuccag ucaauguaua 540uucaaaagau uaucauuaug gauuccaaaa ccgacuacca ggguuuccag ucaauguaua 540

ccuucgugac cucccaucug cccccuggcu ucaacgaaua cgacuucgug ccugaaagcu 600ccuucgugac cucccaucug cccccuggcu ucaacgaaua cgacuucgug ccugaaagcu 600

ucgaccgcga caagacgauc gcccucauca ugaacucguc cggcucgacc gggcugccca 660ucgaccgcga caagacgauc gcccucauca ugaacucguc cggcucgacc gggcugccca 660

aaggaguggc ccugccacac cggaccgcuu gcgugcgguu cucccacgcc cgggacccua 720aaggaguggc ccugccacac cggaccgcuu gcgugcgguu cucccacgcc cgggacccua 720

uuuucggcaa ucagaucauu ccggacacug ccauccugag cguggucccc uuccaucacg 780uuuucggcaa ucagaucauu ccggacacug ccauccugag cguggucccc uuccaucacg 780

gguuugggau guuuaccacu cugggcuacc ucaucugcgg auucagggug gugcugaugu 840gguuugggau guuuaccacu cugggcuacc ucaucugcgg auucagggug gugcugaugu 840

accgguucga ggaagaacuu uuccugcgga gccugcagga uuacaagauc caguccgccc 900accgguucga ggaagaacuu uuccugcgga gccugcagga uuacaagauc caguccgccc 900

uccucgugcc aacccucuuc ucauucuucg cuaaguccac ucucaucgau aaguacgacc 960uccucgugcc aacccucuuc ucauucuucg cuaaguccac ucucaucgau aaguacgacc 960

ugucgaaucu ccacgaaauu gcguccggug gugcaccgcu guccaaggag gucggcgaag 1020ugucgaaucu ccacgaaauu gcguccggug gugcaccgcu guccaaggag gucggcgaag 1020

ccguggccaa gcgcuuccac cucccgggaa uacgccaggg auacggccug acugaaacga 1080ccgggccaa gcgcuuccac cucccgggaa uacgccaggg auacggccug acugaaacga 1080

ccagcgcgau ucugaucacc ccggagggcg acgacaagcc gggugccgug gggaaagugg 1140ccagcgcgau ucugaucacc ccggagggcg acgacaagcc gggugccgug gggaaagugg 1140

ugccguucuu cgaagcaaag gucguggauc uggauaccgg aaagacucug ggcgugaacc 1200ugccguucuu cgaagcaaag gucguggauc uggauaccgg aaagacucug ggcgugaacc 1200

agagagggga acuuugugug cgcggaccga ugauuauguc cggauauguc aacaaccccg 1260agagagggga acuuugugug cgcggaccga ugauuauguc cggauauuguc aacaaccccg 1260

aggccacuaa ugcccugauc gacaaggacg gaugguugca uagcggcgac aucgcauacu 13201320

gggacgagga cgagcacuuu uucauugugg aucggcucaa gucccugauc aaguacaagg 1380gggacgagga cgagcacuuu uucauugugg aucggcucaa gucccugauc aaguacaagg 1380

gauaccaggu cgccccugcc gaacuugagu ccauccugcu gcaacauccg aacauuuucg 1440gauaccaggu cgccccugcc gaacuugagu ccauccugcu gcaacauccg aacauuuucg 1440

acgcgggcgu cgcuggccuu ccugaugaug acgccggaga gcugcccgcg gccguggugg 1500acgcgggcgu cgcuggccuu ccugaugaug acgccggaga gcugcccgcg gccguggugg 1500

ugcucgaaca cggaaaaacu augaccgaga aggaaaucgu ggacuacgug gcgucacaag 1560ugcucgaaca cggaaaaacu augaccgaga aggaaaucgu ggacuacgug gcgucacaag 1560

ucaccacugc caagaaacug cgcggcggag ucguguucgu ggacgaggug cccaagggcc 1620ucaccacugc caagaaacug cgcggcggag ucguguucgu ggacgaggug cccaagggcc 1620

ugaccggaaa gcuggacgcu agaaagaucc gggagauccu gauuaaggcc aagaagggag 1680ugaccggaaa gcuggacgcu agaaagaucc gggagauccu gauuaaggcc aagaagggag 1680

gaaaguccaa gcucuga 1697gaaaguccaa gcucuga 1697

<210> 10<210> 10

<211> 4945<211> 4945

<212> ДНК<212> DNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 10<400> 10

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 60

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 120

cagcgctgcg atgataccgc gagaaccacg ctcaccggct ccggatttat cagcaataaa 180cagcgctgcg atgataccgc gagaaccacg ctcaccggct ccggatttat cagcaataaa 180

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 240

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 300

cgttgttgcc atcgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360cgttgttgcc atcgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 360

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 420

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 480

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 540

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 600

ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660ctcttgcccg gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct 660

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 720

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 780

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 840840

acggaaatgt tgaatactca tattcttcct ttttcaatat tattgaagca tttatcaggg 900acggaaatgt tgaatactca tattcttcct ttttcaatat tattgaagca tttatcaggg 900

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 960

cagtgttaca accaattaac caattctgaa cattatcgcg agcccattta tacctgaata 1020cagtgttaca accaattaac caattctgaa cattatcgcg agcccattta tacctgaata 1020

tggctcataa caccccttgt ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1080tggctcataa caccccttgt ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1080

tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggact ccccatgcga 1140tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggact ccccatgcga 1140

gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt 12001200

cgcccgggct aattatgggg tgtcgccctt cgctgaaggg gtaatacgac tcactatagg 1260cgcccgggct aattatgggg tgtcgccctt cgctgaaggg gtaatacgac tcactatagg 1260

gaaataagag agaaaagaag agtaagaaga aatataagag ccaccatgga agatgcgaag 1320gaaataagag agaaaagaag agtaagaaga aatataagag ccaccatgga agatgcgaag 1320

aacataaaga aaggtcccgc cccattttac ccactcgagg atggaacagc tggggagcaa 13801380

ctgcacaagg ccatgaagcg ctatgcgttg gtgccgggaa ccatcgcgtt caccgacgca 1440ctgcacaagg ccatgaagcg ctatgcgttg gtgccgggaa ccatcgcgtt caccgacgca 1440

cacatcgaag tgaacatcac ttacgccgag tactttgaga tgagcgtcag gctggccgag 1500cacatcgaag tgaacatcac ttacgccgag tactttgaga tgagcgtcag gctggccgag 1500

gctatgaagc gatacggtct gaacaccaac caccggatcg tggtctgctc tgaaaacagc 1560gctatgaagc gatacggtct gaacaccaac caccggatcg tggtctgctc tgaaaacagc 1560

ctgcagttct tcatgccggt cctgggggcc ctgttcatcg gcgtggccgt ggcacccgcc 1620ctgcagttct tcatgccggt cctgggggcc ctgttcatcg gcgtggccgt ggcacccgcc 1620

aacgatatct acaacgagag agaattgctg aactcgatga acatctccca gcctaccgtg 1680aacgatatct acaacgagag agaattgctg aactcgatga acatctccca gcctaccgtg 1680

gtgttcgtgt cgaagaaggg gttgcagaag atcctgaacg tgcagaagaa gctgcccatc 1740gtgttcgtgt cgaagaaggg gttgcagaag atcctgaacg tgcagaagaa gctgcccatc 1740

attcaaaaga ttatcattat ggattccaaa accgactacc agggtttcca gtcaatgtat 1800attcaaaaga ttatcattat ggattccaaa accgactacc agggtttcca gtcaatgtat 1800

accttcgtga cctcccatct gccccctggc ttcaacgaat acgacttcgt gcctgaaagc 1860accttcgtga cctcccatct gccccctggc ttcaacgaat acgacttcgt gcctgaaagc 1860

ttcgaccgcg acaagacgat cgccctcatc atgaactcgt ccggctcgac cgggctgccc 1920ttcgaccgcg acaagacgat cgccctcatc atgaactcgt ccggctcgac cgggctgccc 1920

aaaggagtgg ccctgccaca ccggaccgct tgcgtgcggt tctcccacgc ccgggaccct 19801980

attttcggca atcagatcat tccggacact gccatcctga gcgtggtccc cttccatcac 2040attttcggca atcagatcat tccggacact gccatcctga gcgtggtccc cttccatcac 2040

gggtttggga tgtttaccac tctgggctac ctcatctgcg gattcagggt ggtgctgatg 2100gggtttggga tgtttaccac tctgggctac ctcatctgcg gattcaggggt ggtgctgatg 2100

taccggttcg aggaagaact tttcctgcgg agcctgcagg attacaagat ccagtccgcc 2160taccggttcg aggaagaact tttcctgcgg agcctgcagg attacaagat ccagtccgcc 2160

ctcctcgtgc caaccctctt ctcattcttc gctaagtcca ctctcatcga taagtacgac 2220ctcctcgtgc caaccctctt ctcattcttc gctaagtcca ctctcatcga taagtacgac 2220

ctgtcgaatc tccacgaaat tgcgtccggt ggtgcaccgc tgtccaagga ggtcggcgaa 2280ctgtcgaatc tccacgaaat tgcgtccggt ggtgcaccgc tgtccaagga ggtcggcgaa 2280

gccgtggcca agcgcttcca cctcccggga attcgccagg gatacggcct gactgaaacg 2340gccgtggcca agcgcttcca cctcccggga attcgccagg gatacggcct gactgaaacg 2340

accagcgcga ttctgatcac cccggagggc gacgacaagc cgggtgccgt ggggaaagtg 2400accagcgcga ttctgatcac cccggagggc gacgacaagc cgggtgccgt ggggaaagtg 2400

gtgccgttct tcgaagcaaa ggtcgtggat ctggataccg gaaagactct gggcgtgaac 2460gtgccgttct tcgaagcaaa ggtcgtggat ctggataccg gaaagactct gggcgtgaac 2460

cagagagggg aactttgtgt gcgcggaccg atgattatgt ccggatatgt caacaacccc 2520cagagagggg aactttgtgt gcgcggaccg atgattatgt ccggatatgt caacaacccc 2520

gaggccacta atgccctgat cgacaaggac ggatggttgc atagcggcga catcgcatac 2580gaggcacta atgccctgat cgacaaggac ggatggttgc atagcggcga catcgcatac 2580

tgggacgagg acgagcactt tttcattgtg gatcggctca agtccctgat caagtacaag 2640tgggacgagg acgagcactt tttcattgtg gatcggctca agtccctgat caagtacaag 2640

ggataccagg tcgcccctgc cgaacttgag tccatcctgc tgcaacatcc gaacattttc 2700ggataccagg tcgcccctgc cgaacttgag tccatcctgc tgcaacatcc gaacattttc 2700

gacgcgggcg tcgctggcct tcctgatgat gacgccggag agctgcccgc ggccgtggtg 2760gacgcgggcg tcgctggcct tcctgatgat gacgccggag agctgcccgc ggccgtggtg 2760

gtgctcgaac acggaaaaac tatgaccgag aaggaaatcg tggactacgt ggcgtcacaa 28202820

gtcaccactg ccaagaaact gcgcggcgga gtcgtgttcg tggacgaggt gcccaagggc 2880gtcaccactg ccaagaaact gcgcggcgga gtcgtgttcg tggacgaggt gcccaagggc 2880

ctgaccggaa agctggacgc tagaaagatc cgggagatcc tgattaaggc caagaaggga 2940ctgaccggaa agctggacgc tagaaagatc cgggagatcc tgattaaggc caagaaggga 2940

ggaaagtcca agctctgaat ctgctgcctt ctgcggggct tgccttctgg ccatgccctt 3000ggaaagtcca agctctgaat ctgctgcctt ctgcggggct tgccttctgg ccatgccctt 3000

cttctctccc ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtgagg 3060cttctctccc ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtgagg 3060

gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 31203120

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaagga agagcgctgc 31803180

ctccttcaga gtctgctcac gagctcggtc tcggatcccc tatacgacat caccgatggg 3240ctccttcaga gtctgctcac gagctcggtc tcggatcccc tatacgacat caccgatggg 3240

gaacacgaag cgatccagcc ccccttatta gcccgggcga aaggcccagt ctttcgactg 3300gaacacgaag cgatccagcc ccccttatta gcccgggcga aaggcccagt ctttcgactg 3300

agcctttcgt tttatttgat gcctggcagt tccctactct cgcatgggga gtccccacac 3360agcctttcgt tttatttgat gcctggcagt tccctactct cgcatgggga gtccccacac 3360

taccatcggc gctacggcgt ttcacttctg agttcggcat ggggtcaggt gggaccaccg 3420taccatcggc gctacggcgt ttcacttctg agttcggcat ggggtcaggt gggaccaccg 3420

cgctactgcc gccaggcaaa caaggggtgt tatgagccat attcaggtat aaatgggctc 3480cgctactgcc gccaggcaaa caaggggtgt tatgagccat attcaggtat aaatgggctc 3480

gcgaaaacgt caaaagggcg acacaaaatt tattctaaat gcataataaa tactgataac 3540tactgataac 3540

atcttatagt ttgtattata ttttgtatta tcgttgacat gtataatttt gatatcaaaa 36003600

actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 3660actgattttc cctttattat tttcgagatt tattttctta attctcttta acaaactaga 3660

aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 3720aatattgtat atacaaaaaa tcataaataa tagatgaata gtttaattat aggtgttcat 3720

caatcgaaaa agcaacgtat cttatttaaa gtgcgttgct tttttctcat ttataaggtt 37803780

aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 3840aaataattct catatatcaa gcaaagtgac aggcgccctt aaatattctg acaaatgctc 3840

tttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 3900ttttccctaaa ctccccccat aaaaaaaccc gccgaagcgg gtttttacgt tatttgcgga 3900

ttaacgatta ctcgttatca gaaccgccca gggggcccga gcttaagact ggccgtcgtt 39603960

ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 4020ttacaacaca gaaagagttt gtagaaacgc aaaaaggcca tccgtcaggg gccttctgct 4020

tagtttgatg cctggcagtt ccctactctc gccttccgct tcctcgctca ctgactcgct 40804080

gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 4140gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 4140

atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 4200atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 4200

caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 4260caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 4260

gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 4320gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 4320

ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 4380ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 4380

cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4440cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 4440

taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4500taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 4500

cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4560cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 4560

acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4620acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 4620

aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 4680aggcggtgct acagagttct tgaagtggtg ggctaactac ggctacacta gaagaacagt 4680

atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4740atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 4740

atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4800atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 4800

gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4860gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 4860

gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 4920gtggaacgac gcgcgcgtaa ctcacgttaa gggattttgg tcatgagctt gcgccgtccc 4920

gtcaagtcag cgtaatgctc tgctt 4945gtcaagtcag cgtaatgctc tgctt 4945

<210> 11<210> 11

<211> 1955<211> 1955

<212> РНК<212> RNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 11<400> 11

gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gaagaugcga 60gggaaauaag agagaaaaga agaguaagaa gaaauauaag agccaccaug gaagaugcga 60

agaacauaaa gaaagguccc gccccauuuu acccacucga ggauggaaca gcuggggagc 120agaacauaaa gaaagguccc gccccauuuu acccacucga ggauggaaca gcuggggagc 120

aacugcacaa ggccaugaag cgcuaugcgu uggugccggg aaccaucgcg uucaccgacg 180aacugcacaa ggccaugaag cgcuaugcgu uggugccggg aaccaucgcg uucaccgacg 180

cacacaucga agugaacauc acuuacgccg aguacuuuga gaugagcguc aggcuggccg 240cacacaucga agugaacauc acuuacgccg aguacuuuga gaugagcguc aggcuggccg 240

aggcuaugaa gcgauacggu cugaacacca accaccggau cguggucugc ucugaaaaca 300aggcuaugaa gcgauacggu cugaacacca accaccggau cguggucugc ucugaaaaca 300

gccugcaguu cuucaugccg guccuggggg cccuguucau cggcguggcc guggcacccg 360gccugcaguu cuucaugccg guccuggggg cccuguucau cggcguggcc guggcacccg 360

ccaacgauau cuacaacgag agagaauugc ugaacucgau gaacaucucc cagccuaccg 420ccaacgauau cuacaacgag agagaauugc ugaacucgau gaacaucucc cagccuaccg 420

ugguguucgu gucgaagaag ggguugcaga agauccugaa cgugcagaag aagcugccca 480ugguguucgu gucgaagaag ggguugcaga agauccugaa cgugcagaag aagcugccca 480

ucauucaaaa gauuaucauu auggauucca aaaccgacua ccaggguuuc cagucaaugu 540ucauucaaaa gauuaucauu auggauucca aaaccgacua ccaggguuuc cagucaaugu 540

auaccuucgu gaccucccau cugcccccug gcuucaacga auacgacuuc gugccugaaa 600auaccuucgu gaccucccau cugcccccug gcuucaacga auacgacuuc gugccugaaa 600

gcuucgaccg cgacaagacg aucgcccuca ucaugaacuc guccggcucg accgggcugc 660gcuucgaccg cgacaagacg aucgcccuca ucaugaacuc guccggcucg accgggcugc 660

ccaaaggagu ggcccugcca caccggaccg cuugcgugcg guucucccac gcccgggacc 720ccaaaggagu ggccugcca caccggaccg cuugcgugcg guucucccac gcccgggacc 720

cuauuuucgg caaucagauc auuccggaca cugccauccu gagcgugguc cccuuccauc 780cuauuuucgg caaucagauc auuccggaca cugccauccu gagcgugguc cccuuccauc 780

acggguuugg gauguuuacc acucugggcu accucaucug cggauucagg guggugcuga 840acggguuugg gauguuuacc acucugggcu accucaucug cggauucagg guggugcuga 840

uguaccgguu cgaggaagaa cuuuuccugc ggagccugca ggauuacaag auccaguccg 900uguaccgguu cgaggaagaa cuuuuccugc ggagccugca ggauuacaag auccaguccg 900

cccuccucgu gccaacccuc uucucauucu ucgcuaaguc cacucucauc gauaaguacg 960cccuccucgu gccaacccuc uucucauucu ucgcuaaguc cacucucauc gauaaguacg 960

accugucgaa ucuccacgaa auugcguccg guggugcacc gcuguccaag gaggucggcg 1020accugucgaa ucuccacgaa auugcguccg guggugcacc gcuguccaag gaggucggcg 1020

aagccguggc caagcgcuuc caccucccgg gaauucgcca gggauacggc cugacugaaa 1080aagccguggc caagcgcuuc caccucccgg gaauucgcca gggauacggc cugacugaaa 1080

cgaccagcgc gauucugauc accccggagg gcgacgacaa gccgggugcc guggggaaag 1140cgaccagcgc gauucugauc accccgggagg gcgacgacaa gccgggugcc guggggaaag 1140

uggugccguu cuucgaagca aaggucgugg aucuggauac cggaaagacu cugggcguga 1200uggugccguu cuucgaagca aaggucgugg aucuggauac cggaaagacu cugggcguga 1200

accagagagg ggaacuuugu gugcgcggac cgaugauuau guccggauau gucaacaacc 1260accagagagg ggaacuuugu gugcgcggac cgaugauuau guccggauau gucaacaacc 1260

ccgaggccac uaaugcccug aucgacaagg acggaugguu gcauagcggc gacaucgcau 1320ccgaggccac uaaugccug aucgacaagg acggaugguu gcauagcggc gacaucgcau 1320

acugggacga ggacgagcac uuuuucauug uggaucggcu caagucccug aucaaguaca 1380acugggacga ggacgagcac uuuuucauug uggaucggcu caagucccug aucaaguaca 1380

agggauacca ggucgccccu gccgaacuug aguccauccu gcugcaacau ccgaacauuu 1440agggauacca ggucgccccu gccgaacuug aguccauccu gcugcaacau ccgaacauuu 1440

ucgacgcggg cgucgcuggc cuuccugaug augacgccgg agagcugccc gcggccgugg 1500ucgacgcggg cgucgcuggc cuuccugaug augacgccgg agagcugccc gcggccgugg 1500

uggugcucga acacggaaaa acuaugaccg agaaggaaau cguggacuac guggcgucac 1560uggugcucga acacggaaaa acuaugaccg agaaggaaau cguggacuac guggcgucac 1560

aagucaccac ugccaagaaa cugcgcggcg gagucguguu cguggacgag gugcccaagg 1620aagucaccac ugccaagaaa cugcgcggcg gagucguguu cguggacgag gugcccaagg 1620

gccugaccgg aaagcuggac gcuagaaaga uccgggagau ccugauuaag gccaagaagg 1680gccugaccgg aaagcuggac gcuagaaaga uccgggagau ccugauuaag gccaagaagg 1680

gaggaaaguc caagcucuga aucugcugcc uucugcgggg cuugccuucu ggccaugccc 1740gaggaaaguc caagcucuga aucugcugcc uucugcgggg cuugccuucu ggccaugccc 1740

uucuucucuc ccuugcaccu guaccucuug gucuuugaau aaagccugag uaggaaguga 1800uucuucucuc ccuugcaccu guaccucuug gucuuugaau aaagccugag uaggaaguga 1800

gggaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 18601860

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaag gaagagcgcu 19201920

gccuccuuca gagucugcuc acgagcucgg ucucg 1955gccuccuuca gagucugcuc acgagcucgg ucucg 1955

<210> 12<210> 12

<211> 57<211> 57

<212> ДНК<212> DNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 12<400> 12

tctagaggcc agcctggcca taaggagata tacatcggta ctgttggtaa agccacc 57tctagaggcc agcctggcca taaggagata tacatcggta ctgttggtaa agccacc 57

<210> 13<210> 13

<211> 50<211> 50

<212> ДНК<212> DNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 13<400> 13

taatgaggcc aaactggcca ccatcaccat cagagcttgg actttcctcc 50taatgaggcc aaactggcca ccatcaccat cagagcttgg actttcctcc 50

<210> 14<210> 14

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 14<400> 14

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040

<210> 15<210> 15

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 15<400> 15

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Asp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 16<210> 16

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 16<400> 16

gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgctga taatacaacc 420

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac aaagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac aaagcgttca 1920

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaaacc 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaaacc 1980

<210> 17<210> 17

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 17<400> 17

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser Gly Gln Trp Leu Ala Tyr Gly Val Thr Arg Trp Val Thr Lys Arg Ser

625 630 635 640 625 630 635 640

645 650 655 645 650 655

Val Leu Glu Thr Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Thr Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 18<210> 18

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 18<400> 18

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

aagtctccac tggagaacac ttggtgggct gagcaattgt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaattgt ctccgttctg cttccttgcg 1560

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatgg 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatgg 1980

<210> 19<210> 19

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 19<400> 19

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

Leu Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Leu Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

Val Leu Glu Trp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Trp Thr Ile Gln Trp Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 20<210> 20

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 20<400> 20

gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcttg gaatacaacc 420

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260agtcgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

aagtctccac tggagaacac ttggtgggct gagcaacggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaacggt ctccgttctg cttccttgcg 1560

<210> 21<210> 21

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 21<400> 21

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ala Trp Asn Thr Thr Val Gln Ala Val

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Ser Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

Arg Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Arg Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 22<210> 22

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 22<400> 22

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatggt ctccgttctg cttccttgcg 1560

<210> 23<210> 23

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 23<400> 23

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Trp Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 24<210> 24

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 24<400> 24

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

<210> 25<210> 25

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 25<400> 25

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 26<210> 26

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 26<400> 26

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

atacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260atacgtatca gccttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

<210> 27<210> 27

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 27<400> 27

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

Ile Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Ile Arg Ile Ser Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 28<210> 28

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 28<400> 28

gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtataga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtataga caatacaacc 420

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga agacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtcga agacatccct 1080

ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca gagacaaggc tcgcaagtct 1200

cgccgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260cgccgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

ccgcaaggta acgattggac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380ccgcaaggta acgattggac caaaggactg cttacgctgg cgaaaggtaa accaatcggt 1380

aagtctccac tggagaacac ttggtgggct gagcaagatt ccccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatt ccccgttctg cttccttgcg 1560

<210> 29<210> 29

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 29<400> 29

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

Thr Leu Ala Cys Leu Thr Ser Ile Asp Asn Thr Thr Val Gln Ala Val Thr Leu Ala Cys Leu Thr Ser Ile Asp Asn Thr Thr Val Gln Ala Val

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser Lys Arg Ala Ala Ala Ala Val Tyr Arg Arg Asp Lys Ala Arg Lys Ser

385 390 395 400 385 390 395 400

Arg Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Arg Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala

405 410 415 405 410 415

420 425 430 420 425 430

Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Trp Thr Lys Val Tyr Ala Val Ser Met Phe Asn Pro Gln Gly Asn Asp Trp Thr Lys

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 30<210> 30

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 30<400> 30

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200ctcaccgcgt ggaaacgtgc tgccgctgct gtgtaccgca aggacaaggc gcgcaagtct 1200

aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920aaggcactgg ctggtcaatg gctggcttac ggtgttactc gctgggtgac taagcgttca 1920

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaattc 1980

accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040accattcagc ctgctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040

<210> 31<210> 31

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 31<400> 31

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Phe Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 32<210> 32

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 32<400> 32

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaatatt ctccgttctg cttccttgcg 1560

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatac 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaatac 1980

<210> 33<210> 33

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 33<400> 33

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Tyr Ser Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

Val Leu Glu Tyr Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu Val Leu Glu Tyr Thr Ile Gln Pro Ala Ile Asp Ser Gly Lys Gly Leu

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 34<210> 34

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 34<400> 34

gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420gtagcgtaca tcaccattaa gaccactctg gcttgcctaa ccagtgcgga caatacaacc 420

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260gttcgtatct atcttgagtt catgcttgag caagccaata agtttgctaa ccataaggcc 1260

aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560aagtctccac tggagaacac ttggtgggct gagcaagatc tcccgttctg cttccttgcg 1560

gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagac 1980gtcatgacgc tggcttacgg gtccaaagag ttcggcttcc gtcaacaagt gctggaagac 1980

<210> 35<210> 35

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 35<400> 35

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala Val Arg Ile Tyr Leu Glu Phe Met Leu Glu Gln Ala Asn Lys Phe Ala

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val Asp Leu Pro Phe Cys Phe Leu Ala Phe Cys Phe Glu Tyr Ala Gly Val

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 36<210> 36

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 36<400> 36

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtccg ggacatccct 1080gtcctagcgg tcgccaacgt aatcaccaag tggaagcatt gtccggtccg ggacatccct 1080

actattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040actattcagt gggctattga ttccggcaag ggtctgatgt tcactcagcc gaatcaggct 2040

<210> 37<210> 37

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 37<400> 37

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

His Cys Pro Val Arg Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro His Cys Pro Val Arg Asp Ile Pro Ala Ile Glu Arg Glu Glu Leu Pro

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 38<210> 38

<211> 2673<211> 2673

<212> ДНК<212> DNA

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 38<400> 38

cctgaggtgt acaaagcgat taacattgcg caaaacaccg catggaaaat caacaagaaa 10201020

<210> 39<210> 39

<211> 890<211> 890

<212> БЕЛОК<212> PROTEIN

<220><220>

<223> Вариант T7РНКP<223> T7RNAP variant

<400> 39<400> 39

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

50 55 60 50 55 60

65 70 75 80 65 70 75 80

85 90 95 85 90 95

100 105 110 100 105 110

115 120 125 115 120 125

130 135 140 130 135 140

145 150 155 160 145 150 155 160

165 170 175 165 170 175

180 185 190 180 185 190

195 200 205 195 200 205

210 215 220 210 215 220

225 230 235 240 225 230 235 240

245 250 255 245 250 255

260 265 270 260 265 270

275 280 285 275 280 285

290 295 300 290 295 300

305 310 315 320 305 310 315 320

325 330 335 325 330 335

340 345 350 340 345 350

355 360 365 355 360 365

370 375 380 370 375 380

385 390 395 400 385 390 395 400

405 410 415 405 410 415

420 425 430 420 425 430

435 440 445 435 440 445

450 455 460 450 455 460

465 470 475 480 465 470 475 480

485 490 495 485 490 495

500 505 510 500 505 510

515 520 525 515 520 525

530 535 540 530 535 540

545 550 555 560 545 550 555 560

565 570 575 565 570 575

580 585 590 580 585 590

595 600 605 595 600 605

610 615 620 610 615 620

625 630 635 640 625 630 635 640

645 650 655 645 650 655

660 665 670 660 665 670

675 680 685 675 680 685

690 695 700 690 695 700

705 710 715 720 705 710 715 720

725 730 735 725 730 735

740 745 750 740 745 750

755 760 765 755 760 765

770 775 780 770 775 780

785 790 795 800 785 790 795 800

805 810 815 805 810 815

820 825 830 820 825 830

835 840 845 835 840 845

850 855 860 850 855 860

865 870 875 880 865 870 875 880

Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala Asp Ile Leu Glu Ser Asp Phe Ala Phe Ala

885 890 885 890

<210> 40<210> 40

<211> 25<211> 25

<212> ДНК<212> DNA

<220><220>

<223> Субстрат и т.д.<223> Substrate, etc.

<400> 40<400> 40

tttttttttt tttttttttt ttttt 25tttttttttt tttttttttt tttttt 25

<---<---

Claims

1. Constructed RNA polymerase containing a polypeptide sequence having at least 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more identity sequence with the reference sequence of SEQ ID NO: 4, where the specified polypeptide sequence contains at least the substitution 664W/F/Y, 404E/Y, 514F/I/L/Y, 661E/Y, 446W/Y, 136E/I, 137W , 357G/K/L/M/N/Q/R/S/T/V/W, 393L/Y, 394R, 397F/M/Q/W/Y, 401V, 444F/H/l/V, 478F /M/W, 513C/F/K/L/R/T/W/Y, 582N, 635F/R/W, 636L, 637G/P/S, 639H, 642L, 643A, 645V, 653C, 656F/W or 660A/C/M/S/T/W/F/N or any combination thereof, and wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4 or 15.

2. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 664W/F/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

3. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 404E/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

4. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 514F/I/L/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

5. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 661E/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

6. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 446W/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

7. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 136E/I substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

8. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 137W substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

9. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 357G/K/L/M/N/Q/R/S/T/V/W substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

10. The engineered RNA polymerase of claim 9, wherein said polypeptide sequence contains at least a 357R substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

11. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 393L/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

12. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 394R substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

13. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a 397F/M/Q/W/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

14. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 401V substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

15. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 444F/H/l/V substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

16. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 478F/M/W substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

17. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least the 513C/F/K/L/R/T/W/Y substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

18. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 582N substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

19. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 635F/R/W substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

20. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 636L substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

21. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 637G/P/S substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

22. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 639H substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

23. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 642L substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

24. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 643A substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

25. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 645V substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

26. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 653C substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

27. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 656F/W substitution, wherein the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

28. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a 660A/C/M/S/T/W/F/N substitution, where the amino acid positions of said polypeptide sequence are numbered relative to SEQ ID NO: 4.

29. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least the substitution 664W, 357R, 394R, 404Y, 514L/I/F, 661E, 446W, or 136I, or any combination thereof, wherein the amino acid positions of said polypeptide sequence numbered relative to SEQ ID NO: 4.

30. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a substitution or group of substitutions 397F/513W/635W, 397F/513Y/635W, 397W/513Y/635W, 397W/513W/635W, 397W/513Y 513W/635W/660F, 513W/635W/664W, 513W/635W/664W, 513Y/635W /660F, 513Y/635W/660Y, 513Y/660W/664W or 660Y/664W, where the amino acid positions are numbered relative to SEQ ID NO: 4.

31. The engineered RNA polymerase according to claim 1, wherein said polypeptide sequence contains at least a substitution or group of substitutions 397F, 397F/513F, 397F/513F/635F, 397F/513F/635W, 397F/513F/635W/660W, 397F /513W/635W, 397F/513W/635W/656F/664F, 397F/513W/664W, 397F/513Y, 397F/513Y/635W, 397F/513Y/635W/656W, 37F/513Y 397W/664W, 397W/513F, 397W/513F/635F/656F/660F/664W, 397W/513F/635 F/660W, 397W 397W/513W/635F, 397W/513W/635F/656W/660F, 397W /513W/635W , 397W/513W/635W/656Y, 397W/513W/635W/660W, 397W/513W/635W/660W/664Y /660W/664Y , 397W/513W/664F, 397W/513W/664W, 397W/513Y/635F, 397W/513Y/635W/656Y/660W/664W , 397W/513Y 397W/635W/656F/664W, 397W/635W/656F/664Y, 397W/635W /660W, 397W 397W/660F/664Y, 397W/660W, 397W/837K, 397Y, 397Y/513F/635 W/656F/660W 397Y/513F/635W/664W, 397Y/513W/635F/664Y, 397Y/513W/635W/660F, 397Y/513W/656W/660W /635F, 397Y 397Y/664W, 397Y/664F, 399E/635F/660W, 475V/513W/635W /660Y, 513F 513F/635F 513F/635W 513F/635W/656W 513F/635W/664W 513F/660W 513F/660W/664F 513F/660W/664Y 635W, 513Y/635F /660F/664Y 513W/635W/656W/660F 513W/635W/660F 513W/635W/664W 513W/656W/664W 513W/656Y/660W 513W/660F Y/635F, 513Y 513Y/635W/660Y, 513Y/635W/660Y/664F, 513Y/660W, 513Y/660W/664W , 513Y/660Y 635F/660W/664F, 635W, 635W/656W, 635W/660F, 635W/660W, 635W/664W, 656W/6 60F/664Y, 656W /660W/664Y, 658P, 660F, 660F/664F, 660F/664Y, 660W/664F, 660Y/664W, 664F or 664W, where the amino acid positions are numbered relative to SEQ ID NO: 4.

32. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains at least a substitution or group of substitutions 113M/137W/513R, 136E/357I/404Y/514I, 136I/357I/514F, 136I/357K/514F, 136I 137W/401V/401V 4R/446W/514I 357R/394R/401V/404Y/514L, 357R/514F, 401S/513R/635W, 401S/635W 35W/656F, 635W /660T, 660S/T, where amino acid positions are numbered relative to SEQ ID NO: 15.

33. The engineered RNA polymerase of claim 1, wherein said engineered RNA polymerase is the engineered polymerase variant shown in Table 5.3, 5.4, 5.5 and/or 5.6.

34. The engineered RNA polymerase of claim 1, wherein said polypeptide sequence contains SEQ ID NO: 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, or 39.

35. The engineered RNA polymerase of any one of claims 1 to 34, wherein said engineered polymerase has at least one improved property over wild-type T7 RNA polymerase.

36. The engineered RNA polymerase of claim 35, wherein said at least one improved property is selected from increased selectivity for the cap analog for GTP during translation initiation, increased protein expression, increased stability in storage buffer, and increased stability under reaction conditions .

37. The engineered RNA polymerase of any one of claims 1 to 36, wherein the polymerase retains RNA yield, transcriptional fidelity, thermal stability, protein expression, -20°C stability, or stability under reaction conditions equivalent to wild-type T7 RNA polymerase.

38. An engineered RNA polymerase according to any one of claims 1-37, wherein said engineered polymerase is purified.

39. A polynucleotide encoding at least one engineered RNA polymerase according to any one of claims 1-37.

40. The polynucleotide of claim 39, wherein said polynucleotide is operably linked to a control sequence.

41. A polynucleotide according to claim 39 or 40, containing a polynucleotide sequence that is codon-optimized.

42. An expression vector containing at least one polynucleotide according to any one of claims 39-41.

43. A host cell for producing the engineered RNA polymerase according to any one of claims 1 to 37, comprising at least one expression vector according to claim 42.

44. The host cell of claim 43, wherein said cell is a prokaryotic cell.

45. A method for producing an engineered RNA polymerase in a host cell, comprising culturing the host cell according to claim 43 or 44 under suitable culture conditions such that at least one engineered RNA polymerase is produced.

46. The method of claim 45, further comprising isolating at least one engineered RNA polymerase from the culture and/or host cell.

47. The method of claim 45 or 46, further comprising the step of purifying said at least one engineered RNA polymerase.

48. An RNA transcript production composition comprising at least one engineered RNA polymerase according to any one of claims 1 to 38 and at least a DNA template.

49. A method for producing capped RNA transcripts, comprising providing a composition comprising: i) at least one engineered RNA polymerase according to any one of claims 1 to 38, a dinucleotide analogue of a cap, and ii) a DNA template; exposing said DNA template to said composition under conditions such that said engineered RNA polymerase produces a capped RNA transcript.

50. The method of claim 49, wherein the dinucleotide cap analog is alpha, gamma-bis(N7-methylguanosine) triphosphate (m7G(5')ppp(5')m7G) or anti-reverse cap analog 3'-O-Me-m ^7G (5')ppp(5')G.

51. The method of claim 49 or 50, wherein the dinucleotide analog of the cap is alpha,gamma-bis(N7-methylguanosine)triphosphate.

52. The method according to any one of claims 49-51, further comprising adding an inorganic pyrophosphatase.