[go: up one dir, main page]

RU2808756C1 - Improved transgene expression and processing - Google Patents

Improved transgene expression and processing Download PDF

Info

Publication number
RU2808756C1
RU2808756C1 RU2019139048A RU2019139048A RU2808756C1 RU 2808756 C1 RU2808756 C1 RU 2808756C1 RU 2019139048 A RU2019139048 A RU 2019139048A RU 2019139048 A RU2019139048 A RU 2019139048A RU 2808756 C1 RU2808756 C1 RU 2808756C1
Authority
RU
Russia
Prior art keywords
mar
expression
cell
transgene
seq
Prior art date
Application number
RU2019139048A
Other languages
Russian (ru)
Inventor
Валери ЛЯ ФОРН
Николас МЕРМО
Александр РЕГАМИ
Монтс БЮСЕТА
Дебора ЛЭЙ
Ниам ХАРРАГИ
Кая КОСТИРКО
Пьер-Ален ЖИРО
Давид КАЛАБРЕС
Original Assignee
Селексис С.А.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Селексис С.А. filed Critical Селексис С.А.
Application granted granted Critical
Publication of RU2808756C1 publication Critical patent/RU2808756C1/en

Links

Images

Abstract

FIELD: biotechnology.
SUBSTANCE: invention relates to a recombinant nucleic acid molecule for increasing the efficiency of production of a transgene expressed in a mammalian cell. The recombinant nucleic acid molecule under the invention is designed to include a 5'-3' transposon-specific terminal repeat ITR, a nucleic acid encoding a TEP transgene protein or TEP RNA, and is complemented by an epigenetic regulatory element. In addition, a recombinant expression vector, a host cell, a method of expressing the encoded TEP, a method of transfecting a cell, and a kit for performing cell transfection are described.
EFFECT: in comparison with the known analogues, the invention demonstrates advantages in terms of the magnitude and quality of expression, including high stability of transgene expression and, if required, transport of the expressed product out of the cell.
20 cl, 4 tbl, 22 dwg

Description

ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD

Настоящее изобретение направлено на обеспечение конструкций нуклеиновых кислот и белков, которые вовлечены или воздействуют на метаболические пути, опосредующие или влияющие на метаболизм клетки, например, на перемещение через мембрану эндоплазматического ретикулума (ЭР) и/или секрецию через цитоплазматическую мембрану, а также на способы влияния на клеточный метаболизм. Настоящее изобретение также направлено на получение и применение рекомбинантных клеток млекопитающих, в которых, например, модифицированы перемещение/секреция большого разнообразия гетерологичных белков (продуктов экспрессии трансгенов). Указанные способы, конструкции нуклеиновых кислот, как правило, разработаны таким образом, чтобы улучшить экспрессию трансгена.The present invention is directed to providing nucleic acid and protein constructs that are involved in or affect metabolic pathways mediating or influencing cellular metabolism, such as trafficking across the endoplasmic reticulum (ER) membrane and/or secretion across the cytoplasmic membrane, as well as methods for influencing on cellular metabolism. The present invention is also directed to the production and use of recombinant mammalian cells in which, for example, the movement/secretion of a wide variety of heterologous proteins (transgene expression products) is modified. These methods, nucleic acid constructs, are typically designed to improve transgene expression.

УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART

Получение терапевтических белков биотехнологическими способами, а также генная и клеточная терапия зависят от успешной экспрессии трансгенов, внедренных в эукариотическую клетку. Для успешной экспрессии трансгена, как правило, требуется встраивание трансгена в хромосому хозяина, при этом указанная экспрессия ограничена, среди прочего, количеством встроенных копий трансгена и эпигенетическими эффектами, которые могут вызывать низкий уровень или нестабильность транскрипции и/или высокую клональную изменчивость. Недостаточный или пониженный транспорт продукта экспрессии трансгена из клетки также часто ограничивает получение терапевтических белков, а также генную и клеточную терапию.The production of therapeutic proteins by biotechnological methods, as well as gene and cell therapy, depend on the successful expression of transgenes introduced into the eukaryotic cell. Successful expression of a transgene typically requires integration of the transgene into the host chromosome, with expression limited by, among other things, the number of transgene copies inserted and epigenetic effects, which can cause low levels or instability of transcription and/or high clonal variability. Insufficient or reduced transport of the transgene expression product out of the cell also often limits the production of therapeutic proteins, as well as gene and cell therapy.

Публикации и другие материалы, включая патенты, заявки на патент и номера доступа, используемые в данной заявке для иллюстрации настоящего изобретения и, в частности, для предоставления дополнительных подробностей касательно осуществления настоящего изобретения, полностью включены в данную заявку посредством ссылки.Publications and other materials, including patents, patent applications and accession numbers used in this application to illustrate the present invention and, in particular, to provide additional details regarding the implementation of the present invention, are incorporated herein by reference in their entirety.

Для повышения и стабилизации экспрессии трансгена в клетках млекопитающих все чаще применяют эпигенетические регуляторы, для того чтобы защитить трансгены от отрицательных эффектов положения (Bell и Felsenfeld, 1999). Данные эпигенетические регуляторы включают граничные или инсуляторные элементы, регуляторные области локусов (LCR), стабилизирующие и антирепрессорные (STAR) элементы, универсальные элементы, открывающие хроматин (UCOE), и упомянутые выше участки прикрепления к матриксу (MAR). Все эти эпигенетические регуляторы применялись для получения рекомбинантного белка в линиях клеток млекопитающих (Zahn-Zabal и др., 2001; Kim и др., 2004) и в способах генной терапии (Agarwal и др., 1998; Allen и др., 1996; Castilla и др., 1998).Epigenetic regulators are increasingly used to enhance and stabilize transgene expression in mammalian cells to protect transgenes from negative positional effects (Bell and Felsenfeld, 1999). These epigenetic regulators include boundary or insulator elements, locus regulatory regions (LCRs), stabilizing and antirepressor (STAR) elements, universal chromatin opening elements (UCOEs), and the aforementioned matrix attachment sites (MARs). All of these epigenetic regulators have been used to produce recombinant protein in mammalian cell lines (Zahn-Zabal et al., 2001; Kim et al., 2004) and in gene therapy techniques (Agarwal et al., 1998; Allen et al., 1996; Castilla et al., 1998).

Процессинг и транспорт из клетки продукта экспрессии трансгена часто сопряжен с различными затруднениями. Клетка, которая снабжена лишь средствами для процессинга и транспорта ее нативных белков, может быстро испытать перегрузку от транспорта некоторых типов продуктов экспрессии трансгенов, особенно когда они продуцируются на аномально высоких уровнях, что часто желательно, что приводит к агрегации продукта внутри клетки и/или, например, препятствует правильному фолдингу функционального белкового продукта.Processing and transport of the transgene expression product from the cell is often associated with various difficulties. A cell that is equipped with only the means to process and transport its native proteins can quickly become overwhelmed by the transport of certain types of transgene expression products, especially when they are produced at abnormally high levels, which are often desirable, resulting in product aggregation within the cell and/or, for example, interferes with the correct folding of a functional protein product.

Для преодоления затруднений, связанных с транспортом и процессингом, использовались различные подходы. Например, сконструированы клетки СНО с улучшенными секреторными свойствами путем экспрессии белков семейства SM Munc18c или Sly1, которые действуют как регуляторы транспорта мембранных везикул и, следовательно, экзоцитоза секретируемых белков (публикация заявки на патент США 20090247609). Х-бокс-связывающий белок 1 (Xbp1) - фактор транскрипции, который регулирует дифференцировку секреторных клеток и поддержание и экспансию ЭР, или различные протеиндисульфидизомеразы (PDI) применяли для снижения стресса ЭР и повышения секреции белка (Mohan и др. 2007). Другие попытки повышения секреции белка включали экспрессию шаперонов ERp57, кальнексина, кальретикулина и BiP1 в клетках СНО (Chung и др., 2004). Было показано, что экспрессия белка, индуцированного Холодовым шоком, в частности, индуцированного холодом РНК-связывающего белка (CIRP), повышает выход рекомбинантного гамма-интерферона. Также были предприняты попытки сверхэкспрессировать белки секреторных комплексов. Тем не менее, например, Lakkaraju и др. (2008) сообщили, что экспрессия экзогенного SRP14 в человеческих клетках дикого типа (например, в клетках, которые не были сконструированы для экспрессии низких уровней SRP14) не улучшала эффективность секреции секретируемого белка щелочной фосфатазы.Various approaches have been used to overcome the difficulties associated with transport and processing. For example, CHO cells have been engineered to have improved secretory properties by expressing SM family proteins Munc18c or Sly1, which act as regulators of membrane vesicle transport and hence exocytosis of secreted proteins (US Patent Application Publication 20090247609). X-box binding protein 1 (Xbp1), a transcription factor that regulates secretory cell differentiation and ER maintenance and expansion, or various protein disulfide isomerases (PDIs) have been used to reduce ER stress and increase protein secretion (Mohan et al. 2007). Other attempts to increase protein secretion have included expression of the chaperones ERp57, calnexin, calreticulin, and BiP1 in CHO cells (Chung et al., 2004). Expression of cold shock-induced protein, particularly cold-induced RNA-binding protein (CIRP), has been shown to increase the yield of recombinant interferon gamma. Attempts have also been made to overexpress proteins of the secretory complexes. However, for example, Lakkaraju et al. (2008) reported that expression of exogenous SRP14 in wild-type human cells (e.g., cells that were not engineered to express low levels of SRP14) did not improve the secretion efficiency of the secreted alkaline phosphatase protein.

Таким образом, существует потребность в эффективной, надежной экспрессии трансгена, например, при получении рекомбинантного белка и для генной терапии. Также существует потребность в успешном транспорте продукта экспрессии трансгена за пределы клетки.Thus, there is a need for efficient, reliable transgene expression, for example, in recombinant protein production and for gene therapy. There is also a need to successfully transport the transgene expression product outside the cell.

На удовлетворение данной и других потребностей, существующих в данной области техники, направлены варианты реализации настоящего изобретения.Embodiments of the present invention are directed to meet this and other needs existing in the art.

КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION

Настоящее изобретение в одном варианте реализации направлено на рекомбинантную молекулу нуклеиновой кислоты, содержащую:The present invention, in one embodiment, is directed to a recombinant nucleic acid molecule comprising:

(a) 5'- и 3'-транспозон-специфичный инвертированный концевой повтор (ITR),(a) 5' and 3' transposon-specific inverted terminal repeat (ITR),

(b) по меньшей мере одну последовательность нуклеиновой кислоты, кодирующую белок экспрессии/процессинга трансгена (ТЕР), или функциональную РНК ТЕР, расположенную между 5'- и 3'-ITR, которая находится под контролем промотора, и(b) at least one nucleic acid sequence encoding a transgene expression/processing protein (TEP), or a functional TEP RNA located between the 5' and 3' ITR, which is under the control of a promoter, and

(c) возможно по меньшей мере один трансген, также расположенный между 5'- и 3'-ITR, который находится под контролем трансгенного промотора, при этом указанная молекула нуклеиновой кислоты необязательно является частью вектора.(c) optionally at least one transgene, also located between the 5' and 3' ITR, which is under the control of a transgene promoter, wherein said nucleic acid molecule is optionally part of a vector.

Указанная рекомбинантная молекула нуклеиновой кислоты может содержать по меньшей мере один эпигенетический регуляторный элемент, в частности, по меньшей мере один элемент MAR (участок прикрепления к матриксу).Said recombinant nucleic acid molecule may contain at least one epigenetic regulatory element, in particular at least one MAR (matrix attachment site) element.

Элемент MAR может быть расположен между 5'- и 3'-ITR. Трансген, такой как ген устойчивости к антибиотику или ген, кодирующий иммуноглобулин, возможно под контролем дополнительного промотора, может быть расположен между 5'- и 3'-ITR, например, между 5'-ITR и MAR.The MAR element may be located between the 5' and 3' ITR. A transgene, such as an antibiotic resistance gene or a gene encoding an immunoglobulin, possibly under the control of an additional promoter, may be located between the 5' and 3' ITR, for example between the 5' ITR and the MAR.

Белок ТЕР или функциональная РНК ТЕР может представлять собой белок или функциональную РНК, которая непосредственно или опосредованно вовлечена во встраивание последовательностей нуклеиновых кислот в геном, в процессинг или трансляцию продукта трансгенной РНК или участвует в перемещении в ЭР, секреции, процессинге, фолдинге, транспорте ЭР-Гольджи-плазматическая мембрана, гликозилировании и/или другой посттрансляционной модификации белков, таких как продукты экспрессии трансгенов.TEP protein or functional RNA TEP may be a protein or functional RNA that is directly or indirectly involved in the insertion of nucleic acid sequences into the genome, in the processing or translation of a transgene RNA product, or is involved in ER trafficking, secretion, processing, folding, ER transport. Golgi-plasma membrane, glycosylation and/or other post-translational modification of proteins, such as transgene expression products.

Белок ТЕР может представлять собой белок пути секреции белка, белок путей рекомбинации или репарации ДНК, белок процессинга белка или метаболический белок, включая шапероны, такие как BiP, или комбинацию перечисленных белков.The TEP protein may be a protein secretion pathway protein, a recombination or DNA repair pathway protein, a protein processing protein, or a metabolic protein including chaperones such as BiP, or a combination of these proteins.

Белок ТЕР может представлять собой один или более из следующих белков пути секреции белка: SRP14 человека (hSRP14), hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ и hCANX.The TEP protein may be one or more of the following protein secretion pathway proteins: human SRP14 (hSRP14), hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ, and hCANX.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков пути секреции белка: hSRP14 с последовательностью SEQ ID NO: 13, hSec61α1 с последовательностью SEQ ID NO: 15, hSec61β с последовательностью SEQ ID NO: 17, hSec61γ с последовательностью SEQ ID NO: 19, hSRP54 с последовательностью SEQ ID NO: 21, hSRP9 с последовательностью SEQ ID NO: 23, hSRPRα с последовательностью SEQ ID NO: 25, hSRPβ с последовательностью SEQ ID NO: 27 и hCANX с последовательностью SEQ ID NO: 29 и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following protein secretion pathway protein amino acid sequences: hSRP14 with SEQ ID NO: 13, hSec61α1 with SEQ ID NO: 15, hSec61β with SEQ ID NO: 17, hSec61γ with SEQ ID NO: : 19, hSRP54 with the sequence SEQ ID NO: 21, hSRP9 with the sequence SEQ ID NO: 23, hSRPRα with the sequence SEQ ID NO: 25, hSRPβ with the sequence SEQ ID NO: 27 and hCANX with the sequence SEQ ID NO: 29 and/or may correspond to amino acid sequences that are more than 80%, 90%, 95%, or 98% identical to the stated sequences.

Белок ТЕР может представлять собой один или более из следующих белков процессинга белка или метаболических белков: hUCP4, hCMPSAT, ST6Gal1 крысы (rST6Gal1), hCOMSC, Т-синтазу человека, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, беклин-1 человека, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 и hDRiP78.The TEP protein may be one or more of the following protein processing or metabolic proteins: hUCP4, hCMPSAT, rat ST6Gal1 (rST6Gal1), hCOMSC, human T synthase, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, human beclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 and hDRiP78.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков процессинга белка или метаболических белков: hUCP4 с последовательностью SEQ ID NO: 31, hCMPSAT с последовательностью SEQ ID NO: 33, rST6Gal1 с последовательностью SEQ ID NO: 35, hCOMSC с последовательностью SEQ ID NO: 37, Т-синтазы человека с последовательностью SEQ ID NO: 39, hP4HA1 с последовательностью SEQ ID NO: 41, hP4HB с последовательностью SEQ ID NO: 43, hGILZ с последовательностью SEQ ID NO: 45, hCyPB с последовательностью SEQ ID NO: 47, hNRF2 с последовательностью SEQ ID NO: 49, hHK1 с последовательностью SEQ ID NO: 51, hPDI с последовательностью SEQ ID NO: 53, hPIN1 с последовательностью SEQ ID NO: 55, hSEPW1 с последовательностью SEQ ID NO: 57, hCALR с последовательностью SEQ ID NO: 59, hDDOST с последовательностью SEQ ID NO: 62, hHSP40 с последовательностью SEQ ID NO: 64, hATP5A1 с последовательностью SEQ ID NO: 66, hSERCA2 с последовательностью SEQ ID NO: 68, hPDIA4 с последовательностью SEQ ID NO: 70, hHSC70 /HSPA8 с последовательностью SEQ ID NO: 72, hHYOU1 с последовательностью SEQ ID NO: 74, hCMP-SAS с последовательностью SEQ ID NO: 76, беклина-1 человека с последовательностью SEQ ID NO: 78, hERdj3 с последовательностью SEQ ID NO: 80, CHO-AGE с последовательностью SEQ ID NO: 82, hWip1 с последовательностью SEQ ID NO: 84, hRTP4 с последовательностью SEQ ID NO: 86, hREEP2 с последовательностью SEQ ID NO: 88, hDPM1 с последовательностью SEQ ID NO: 90 и hDRiP78 с последовательностью SEQ ID NO: 92 и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following amino acid sequences of protein processing proteins or metabolic proteins: hUCP4 with the sequence SEQ ID NO: 31, hCMPSAT with the sequence SEQ ID NO: 33, rST6Gal1 with the sequence SEQ ID NO: 35, hCOMSC with the sequence SEQ ID NO: 35 ID NO: 37, Human T synthases with SEQ ID NO: 39, hP4HA1 with SEQ ID NO: 41, hP4HB with SEQ ID NO: 43, hGILZ with SEQ ID NO: 45, hCyPB with SEQ ID NO : 47, hNRF2 with the sequence SEQ ID NO: 49, hHK1 with the sequence SEQ ID NO: 51, hPDI with the sequence SEQ ID NO: 53, hPIN1 with the sequence SEQ ID NO: 55, hSEPW1 with the sequence SEQ ID NO: 57, hCALR with with the sequence SEQ ID NO: 59, hDDOST with the sequence SEQ ID NO: 62, hHSP40 with the sequence SEQ ID NO: 64, hATP5A1 with the sequence SEQ ID NO: 66, hSERCA2 with the sequence SEQ ID NO: 68, hPDIA4 with the sequence SEQ ID NO: 70, hHSC70 /HSPA8 with the sequence SEQ ID NO: 72, hHYOU1 with the sequence SEQ ID NO: 74, hCMP-SAS with the sequence SEQ ID NO: 76, human beclin-1 with the sequence SEQ ID NO: 78, hERdj3 with the sequence SEQ ID NO: 80, CHO-AGE with SEQ ID NO: 82, hWip1 with SEQ ID NO: 84, hRTP4 with SEQ ID NO: 86, hREEP2 with SEQ ID NO: 88, hDPM1 with SEQ ID NO: 90 and hDRiP78 having the sequence SEQ ID NO: 92 and/or may correspond to amino acid sequences more than 80%, 90%, 95% or 98% identical to the indicated sequences.

Белок ТЕР может представлять собой шаперон, в частности, белок BiP, а конкретнее, модифицированное производное белка BiP дрозофилы (DroBiP), последовательность которого идентична на 80%, 90%, 95% или 100% последовательности SEQ ID NO: 60.The TEP protein may be a chaperone, in particular a BiP protein, and more specifically a modified derivative of the Drosophila BiP protein (DroBiP) having 80%, 90%, 95% or 100% sequence identity to SEQ ID NO: 60.

Элемент MAR можно выбрать из последовательностей SEQ ID NO: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (MAR лизоцима цыпленка), или он предпочтительно представляет собой сконструированный, в частности, перестроенный аналог, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична любой из последовательностей SEQ ID NO: с 1 по 5 или любой из последовательностей SEQ ID NO: с 6 по 10.The MAR element can be selected from the sequences SEQ ID NO: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (chicken lysozyme MAR), or is preferably designed, in particular, the rearranged analog and/or its sequence is at least 80%, 90%, 95%, 98%, 99% or 100% identical to any of the sequences of SEQ ID NO: 1 to 5 or any of the sequences of SEQ ID NO: from 6 to 10.

Функциональная РНК ТЕР внутри указанной клетки может включать/состоять из последовательности нуклеиновых кислот, кодирующей функциональную РНК, предпочтительно микроРНК или короткую шпилечную РНК (кшРНК), которая препятствует экспрессии по меньшей мере одного белка пути рекомбинации или репарации ДНК, такого как, но не ограничиваясь перечисленными: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, циклин D1, Ercc, MDC1, Bard1, лигаза 1, Mre11 и/или 53BP1.The functional TEP RNA within said cell may include/consist of a nucleic acid sequence encoding a functional RNA, preferably a microRNA or short hairpin RNA (shRNA), that interferes with the expression of at least one recombination or DNA repair pathway protein, such as but not limited to : Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, cyclin D1, Ercc, MDC1, Bard1, ligase 1, Mre11 and/or 53BP1.

Функциональная РНК ТЕР также может препятствовать экспрессии генов, последовательность которых по меньшей мере на 80%, 90%, 95%, 98% или 100% идентична Rad51 с последовательностью SEQ ID NO: 93, Rad51B с последовательностью SEQ ID NO: 94, Rad51C с последовательностью SEQ ID NO: 95, Rad51D с последовательностью SEQ ID NO: 96, Xrcc2 с последовательностью SEQ ID NO: 99, Xrcc3 с последовательностью SEQ ID NO: 100, Rad52 с последовательностью SEQ ID NO: 97, Rad54 с последовательностью SEQ ID NO: 98, Brca1 с последовательностью SEQ ID NO: 101, Brca2 с последовательностью SEQ ID NO: 102, циклину D1 с последовательностью SEQ ID NO: 103, Ercc1 с последовательностью SEQ ID NO: 104, MDC1 с последовательностью SEQ ID NO: 105, Bard1 с последовательностью SEQ ID NO: 106, лигазе 1 с последовательностью SEQ ID NO: 107, Mre11 с последовательностью SEQ ID NO: 108 и/или 53BP1 с последовательностью SEQ ID NO: 109.Functional TEP RNA can also interfere with the expression of genes that have at least 80%, 90%, 95%, 98%, or 100% sequence identity with Rad51 SEQ ID NO: 93, Rad51B with SEQ ID NO: 94, Rad51C with with the sequence SEQ ID NO: 95, Rad51D with the sequence SEQ ID NO: 96, Xrcc2 with the sequence SEQ ID NO: 99, Xrcc3 with the sequence SEQ ID NO: 100, Rad52 with the sequence SEQ ID NO: 97, Rad54 with the sequence SEQ ID NO: 98, Brca1 with the sequence SEQ ID NO: 101, Brca2 with the sequence SEQ ID NO: 102, cyclin D1 with the sequence SEQ ID NO: 103, Ercc1 with the sequence SEQ ID NO: 104, MDC1 with the sequence SEQ ID NO: 105, Bard1 with sequence SEQ ID NO: 106, ligase 1 with sequence SEQ ID NO: 107, Mre11 with sequence SEQ ID NO: 108 and/or 53BP1 with sequence SEQ ID NO: 109.

Длина рекомбинантной молекулы нуклеиновой кислоты может составлять по меньшей мере 5000, 6000, 7000, 8000, 90000 или 10000 п.о.The length of the recombinant nucleic acid molecule may be at least 5000, 6000, 7000, 8000, 90,000 or 10,000 bp.

5'- и 3'-ITR могут представлять собой 5'- и 3'-ITR транспозона Спящая Красавица или предпочтительно транспозона PiggyBac.The 5' and 3' ITRs may be the 5' and 3' ITRs of the Sleeping Beauty transposon or preferably the PiggyBac transposon.

После первой трансфекции клетки млекопитающего одной из указанных рекомбинантных молекул нуклеиновых кислот и второй последующей трансфекции дополнительной рекомбинантной молекулой нуклеиновой кислоты, содержащей трансген, встраивание и/или экспрессия трансгена могут быть повышены в указанной клетке по сравнению с клеткой, не подвергнутой указанной первой трансфекции.Following first transfection of a mammalian cell with one of said recombinant nucleic acid molecules and a second subsequent transfection with an additional recombinant nucleic acid molecule containing the transgene, insertion and/or expression of the transgene may be increased in said cell compared to a cell not subjected to said first transfection.

Последовательность, кодирующая ТЕР, или функциональная РНК ТЕР, упомянутые в данной заявке, могут представлять собой часть вектора, включая вектор экспрессии. Указанный вектор может содержать единичный элемент MAR, два или более элементов MAR, при этом указанный элемент(ы) может быть расположен между 5'- и 3'-ITR.The TEP coding sequence or functional TEP RNA mentioned herein may be part of a vector, including an expression vector. Said vector may contain a single MAR element, two or more MAR elements, and said element(s) may be located between the 5' and 3' ITR.

Например, указанный вектор может содержать два элемента MAR. Первый элемент MAR может быть расположен в 3'-5' направлении от ТЕР или функциональной РНК ТЕР и второй элемент MAR может быть расположен в 5'-3' направлении от ТЕР или функциональной РНК ТЕР, при этом указанный первый элемент MAR может включать элемент MAR 1_6 и/или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 2, в частности, перестроенные MAR на основе MAR 1-6, а конкретнее, элементы, последовательности которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентичны последовательности SEQ ID NO: 8 (MAR 1_6R2), и второй элемент MAR может включать элемент MAR 1-68 и/или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1.For example, the specified vector may contain two MAR elements. The first MAR element may be located in the 3'-5' direction of TEP or functional TEP RNA and the second MAR element may be located in the 5'-3' direction of TEP or functional TEP RNA, wherein the first MAR element may include a MAR element 1_6 and/or an element which is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical to SEQ ID NO: 2, in particular, rearranged MARs based on MARs 1-6, and more specifically, elements that are at least 80%, 90%, 95%, 98%, 99%, or 100% sequence identical to SEQ ID NO: 8 (MAR 1_6R2), and the second MAR element may include a MAR element 1-68 and/or an element that is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical to SEQ ID NO: 1.

Вектор также может содержать единичный элемент MAR. Указанный единичный элемент MAR может быть расположен в 5'-3' направлении от ТЕР или функциональной РНК ТЕР, при этом указанный единичный элемент MAR может представлять собой MAR 1-68, или элемент MAR Х-29, и/или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1 или 3, в частности, перестроенный MAR на основе MAR 1-68 или MAR Х-29, в частности, элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 6, 7 или 10 (MAR 1_68R, 1_68R2 или X_29R3) или 9, и может предпочтительно представлять собой элемент MAR Х-29 и/или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3.The vector may also contain a single MAR element. Said MAR unit element may be located in the 5'-3' direction of TEP or functional TEP RNA, wherein said MAR unit element may be MAR 1-68, or MAR X-29 element, and/or an element whose sequence is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 1 or 3, in particular, a rearranged MAR based on MAR 1-68 or MAR X-29, in particular, an element that has at least 80%, 90%, 95%, 98%, 99%, or 100% sequence identity to SEQ ID NO: 6, 7, or 10 (MAR 1_68R, 1_68R2, or X_29R3) or 9, and may preferably be a MAR X-29 element and/or an element that is at least 80%, 90%, 95%, 98%, 99%, or 100% sequence identical to SEQ ID NO: 3.

ТЕР или функциональная РНК ТЕР может находиться под контролем промотора EF1-альфа, и за ним возможно следует поли(А) сигнал гормона роста быка (BGH).TEP or functional TEP RNA may be under the control of the EF1-alpha promoter and possibly followed by a poly(A) bovine growth hormone (BGH) signal.

Вектор может содержать промотор(ы) и/или энхансер(ы) или продукты их слияния, такие как промотор(ы) и/или энхансер(ы) GAPDH, SV40p, CMV, EF1-альфа клеток СНО, Actb СНО и/или Hspa5 СНО, или сконструированные продукты их слияния, такие как CGAPDH.The vector may contain promoter(s) and/or enhancer(s) or fusion products thereof, such as GAPDH, SV40p, CMV, EF1alpha cell CHO, Actb CHO and/or Hspa5 promoter(s) and/or enhancer(s) CHO, or engineered fusion products thereof, such as CGAPDH.

Промоторы, которые являются частью вектора, могут представлять собой GAPDH с последовательностью SEQ ID NO: 111, SV40p с последовательностью SEQ ID NO: 114, CMVp с последовательностью SEQ ID NO: 113, EF1-альфа СНО с последовательностью SEQ ID NO: 112, Actb СНО с последовательностью SEQ ID NO: 115, Hspa5 СНО с последовательностью SEQ ID NO: 116, и/или продукты их слияния, такие как CGAPDH с последовательностью SEQ ID NO: 11, или их последовательности нуклеиновых кислот могут быть идентичны указанным последовательностям более чем на 80%, 90%, 95% или 98%.The promoters that are part of the vector may be GAPDH with the sequence SEQ ID NO: 111, SV40p with the sequence SEQ ID NO: 114, CMVp with the sequence SEQ ID NO: 113, EF1-alpha CHO with the sequence SEQ ID NO: 112, Actb CHO with the sequence SEQ ID NO: 115, Hspa5 CHO with the sequence SEQ ID NO: 116, and/or fusion products thereof, such as CGAPDH with the sequence SEQ ID NO: 11, or their nucleic acid sequences may be identical to these sequences by more than 80%, 90%, 95% or 98%.

Настоящее изобретение также направлено на способ экспрессии ТЕР или функциональной РНК ТЕР, включающий:The present invention is also directed to a method for expressing TEP or functional TEP RNA, comprising:

обеспечение рекомбинантной клетки млекопитающего, содержащей трансген, и вектор представляет собой вектор экспрессии, который экспрессирует ТЕР или функциональную РНК ТЕР, при этом ТЕР или функциональная РНК ТЕР, экспрессируемая с указанного вектора, возможно повышает экспрессию трансгена в указанной клетке млекопитающего на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%.providing a recombinant mammalian cell containing a transgene, and the vector is an expression vector that expresses TEP or functional TEP RNA, wherein the TEP or functional TEP RNA expressed from said vector is capable of increasing expression of the transgene in said mammalian cell by at least 10% , at least 20%, at least 30%, at least 40%, at least 50%, at least 60% or at least 70%.

Указанный вектор может содержать единичный элемент MAR Х-29 и/или последовательность нуклеиновой кислоты, которая по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3, и при этом через более чем 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 недель культивирования ТЕР или функциональная РНК ТЕР, экспрессируемая с указанного вектора, может повышать экспрессию интересующего гена на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%.Said vector may contain a single MAR X-29 element and/or a nucleic acid sequence that is at least 80%, 90%, 95%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 3, and wherein after more than 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 or 14 weeks of culture, TEP or functional TEP RNA expressed from said vector can increase expression of the gene of interest by at least 10%, according to at least 20%, at least 30%, at least 40%, at least 50%, at least 60% or at least 70%.

Настоящее изобретение также направлено на рекомбинантную клетку млекопитающего, содержащую не более чем 20, 15, 10 или 5 рекомбинантных молекул нуклеиновых кислот, предпочтительно встроенных в геном указанной клетки в виде единичных копий.The present invention is also directed to a recombinant mammalian cell containing no more than 20, 15, 10 or 5 recombinant nucleic acid molecules, preferably integrated into the genome of said cell in single copy form.

Выше отмечено, что белок ТЕР может представлять собой один или более из следующих белков пути секреции белка: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ и hCANX.As noted above, the TEP protein may be one or more of the following protein secretion pathway proteins: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ and hCANX.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков пути секреции белка: hSRP14 с последовательностью SEQ ID NO: 13, hSec61α1 с последовательностью SEQ ID NO: 15, hSec61β с последовательностью SEQ ID NO: 17, hSec61γ с последовательностью SEQ ID NO: 19, hSRP54 с последовательностью SEQ ID NO: 21, hSRP9 с последовательностью SEQ ID NO: 23, hSRPRα с последовательностью SEQ ID NO: 25, hSRPβ с последовательностью SEQ ID NO: 27 и hCANX с последовательностью SEQ ID NO: 29, и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following protein secretion pathway protein amino acid sequences: hSRP14 with SEQ ID NO: 13, hSec61α1 with SEQ ID NO: 15, hSec61β with SEQ ID NO: 17, hSec61γ with SEQ ID NO: : 19, hSRP54 with the sequence SEQ ID NO: 21, hSRP9 with the sequence SEQ ID NO: 23, hSRPRα with the sequence SEQ ID NO: 25, hSRPβ with the sequence SEQ ID NO: 27 and hCANX with the sequence SEQ ID NO: 29, and/ or may correspond to amino acid sequences that are more than 80%, 90%, 95%, or 98% identical to the stated sequences.

Белок ТЕР может представлять собой один или более из следующих белков процессинга белка или метаболических белков: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, T-синтазу человека, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, беклин-1 человека, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 и hDRiP78.The TEP protein may be one or more of the following protein processing or metabolic proteins: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, human T synthase, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, human beclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 and hDRiP78.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков процессинга белка или метаболических белков: hUCP4 с последовательностью SEQ ID NO: 31, hCMPSAT с последовательностью SEQ ID NO: 33, rST6Gal1 с последовательностью SEQ ID NO: 35, hCOMSC с последовательностью SEQ ID NO: 37, Т-синтазы человека с последовательностью SEQ ID NO: 39, hP4HA1 с последовательностью SEQ ID NO: 41, hP4HB с последовательностью SEQ ID NO: 43, hGILZ с последовательностью SEQ ID NO: 45, hCyPB с последовательностью SEQ ID NO: 47, hNRF2 с последовательностью SEQ ID NO: 49, hHK1 с последовательностью SEQ ID NO: 51, hPDI с последовательностью SEQ ID NO: 53, hPIN1 с последовательностью SEQ ID NO: 55, hSEPWI с последовательностью SEQ ID NO: 57, hCALR с последовательностью SEQ ID NO: 59, hDDOST с последовательностью SEQ ID NO: 62, hHSP40 с последовательностью SEQ ID NO: 64, ИАТР5А1 с последовательностью SEQ ID NO: 66, hSERCA2 с последовательностью SEQ ID NO: 68, hPDIA4 с последовательностью SEQ ID NO: 70, hHSC70/HSPA8 с последовательностью SEQ ID NO: 72, hHYOU1 с последовательностью SEQ ID NO: 74, hCMP-SAS с последовательностью SEQ ID NO: 76, беклина-1 человека с последовательностью SEQ ID NO: 78, hERdj3 с последовательностью SEQ ID NO: 80, CHO-AGE с последовательностью SEQ ID NO: 82, hWip1 с последовательностью SEQ ID NO: 84, hRTP4 с последовательностью SEQ ID NO: 86, hREEP2 с последовательностью SEQ ID NO: 88, hDPM1 с последовательностью SEQ ID NO: 90 и hDRiP78 с последовательностью SEQ ID NO: 92, и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following amino acid sequences of protein processing proteins or metabolic proteins: hUCP4 with the sequence SEQ ID NO: 31, hCMPSAT with the sequence SEQ ID NO: 33, rST6Gal1 with the sequence SEQ ID NO: 35, hCOMSC with the sequence SEQ ID NO: 35 ID NO: 37, Human T synthases with SEQ ID NO: 39, hP4HA1 with SEQ ID NO: 41, hP4HB with SEQ ID NO: 43, hGILZ with SEQ ID NO: 45, hCyPB with SEQ ID NO : 47, hNRF2 with the sequence SEQ ID NO: 49, hHK1 with the sequence SEQ ID NO: 51, hPDI with the sequence SEQ ID NO: 53, hPIN1 with the sequence SEQ ID NO: 55, hSEPWI with the sequence SEQ ID NO: 57, hCALR with with the sequence SEQ ID NO: 59, hDDOST with the sequence SEQ ID NO: 62, hHSP40 with the sequence SEQ ID NO: 64, IATP5A1 with the sequence SEQ ID NO: 66, hSERCA2 with the sequence SEQ ID NO: 68, hPDIA4 with the sequence SEQ ID NO: 70, hHSC70/HSPA8 with the sequence SEQ ID NO: 72, hHYOU1 with the sequence SEQ ID NO: 74, hCMP-SAS with the sequence SEQ ID NO: 76, human beclin-1 with the sequence SEQ ID NO: 78, hERdj3 with the sequence SEQ ID NO: 80, CHO-AGE with SEQ ID NO: 82, hWip1 with SEQ ID NO: 84, hRTP4 with SEQ ID NO: 86, hREEP2 with SEQ ID NO: 88, hDPM1 with SEQ ID NO: 90 and hDRiP78 having the sequence SEQ ID NO: 92, and/or may correspond to amino acid sequences more than 80%, 90%, 95% or 98% identical to the indicated sequences.

Белок ТЕР может представлять собой шаперон, в частности, белок BiP, а конкретнее, сконструированное производное белка BiP дрозофилы (DroBiP), последовательность которого на 80%, 90%, 95% или 100% идентична последовательности SEQ ID NO: 60.The TEP protein may be a chaperone, particularly a BiP protein, and more specifically an engineered derivative of the Drosophila BiP protein (DroBiP) that is 80%, 90%, 95%, or 100% sequence identical to SEQ ID NO: 60.

Функциональная РНК ТЕР внутри рекомбинантной клетки млекопитающего может включать/состоять из последовательности нуклеиновой кислоты (последовательностей нуклеиновых кислот), кодирующей функциональную РНК, предпочтительно микроРНК или кшРНК, которая препятствует экспрессии по меньшей мере одного белка рекомбинации, предпочтительно гена гомологичной рекомбинации, такого как, но не ограничиваясь перечисленными: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, циклин D1, Ercc1, MDC1, Bard1, лигаза 1, Mre11 и/или 53BP1. Последовательность нуклеиновых кислот может быть по меньшей мере на 80%, 90%, 95%, 98% или 100% идентична Rad51 с последовательностью SEQ ID NO: 93, Rad51B с последовательностью SEQ ID NO: 94, Rad51C с последовательностью SEQ ID NO: 95, Rad51D с последовательностью SEQ ID NO: 96, Xrcc2 с последовательностью SEQ ID NO: 99, Xrcc3 с последовательностью SEQ ID NO: 100, Rad52 с последовательностью SEQ ID NO: 97, Rad54 с последовательностью SEQ ID NO: 98, Brca1 с последовательностью SEQ ID NO: 101, Brca2 с последовательностью SEQ ID NO: 102, циклину D1 с последовательностью SEQ ID NO: 103, Ercc1 с последовательностью SEQ ID NO: 104, MDC1 с последовательностью SEQ ID NO: 105, Bard1 с последовательностью SEQ ID NO: 106, лигазе 1 с последовательностью SEQ ID NO: 107, Mre11 с последовательностью SEQ ID NO: 108 и/или 53BP1 с последовательностью SEQ ID NO: 109.The functional TEP RNA within a recombinant mammalian cell may include/consist of a nucleic acid sequence(s) encoding a functional RNA, preferably a microRNA or shRNA, that interferes with the expression of at least one recombination protein, preferably a homologous recombination gene such as but not limited to the following: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, cyclin D1, Ercc1, MDC1, Bard1, ligase 1, Mre11 and/or 53BP1. The nucleic acid sequence may be at least 80%, 90%, 95%, 98% or 100% identical to Rad51 SEQ ID NO: 93, Rad51B to SEQ ID NO: 94, Rad51C to SEQ ID NO: 95 , Rad51D with the sequence SEQ ID NO: 96, Xrcc2 with the sequence SEQ ID NO: 99, Xrcc3 with the sequence SEQ ID NO: 100, Rad52 with the sequence SEQ ID NO: 97, Rad54 with the sequence SEQ ID NO: 98, Brca1 with the sequence SEQ ID NO: 101, Brca2 with SEQ ID NO: 102, Cyclin D1 with SEQ ID NO: 103, Ercc1 with SEQ ID NO: 104, MDC1 with SEQ ID NO: 105, Bard1 with SEQ ID NO: 106 , ligase 1 with the sequence SEQ ID NO: 107, Mre11 with the sequence SEQ ID NO: 108 and/or 53BP1 with the sequence SEQ ID NO: 109.

Рекомбинантная клетка млекопитающего может представлять собой первичную стволовую клетку, клетку хомячка, например, клетку яичника китайского хомячка (СНО), или клетку человека, например, клетку НЕK293.The recombinant mammalian cell may be a primary stem cell, a hamster cell, such as a Chinese hamster ovary (CHO) cell, or a human cell, such as a HEK293 cell.

Настоящее изобретение также направлено на рекомбинантную клетку млекопитающего, содержащую:The present invention is also directed to a recombinant mammalian cell containing:

а.) по меньшей мере одну функциональную РНК ТЕР и/или по меньшей мере одну рекомбинантную последовательность нуклеиновой кислоты, кодирующую белок ТЕР или кодирующую функциональную РНК ТЕР,a.) at least one functional TEP RNA and/or at least one recombinant nucleic acid sequence encoding a TEP protein or encoding a functional TEP RNA,

иAnd

b.) рекомбинантную молекулу нуклеиновой кислоты, содержащую:b.) a recombinant nucleic acid molecule containing:

(i) по меньшей мере один интересующий трансген, и(i) at least one transgene of interest, and

(ii) возможно, элемент MAR.(ii) possibly a MAR element.

Выше отмечено, что белок ТЕР может представлять собой один или более из следующих белков пути секреции белка: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ и hCANX.As noted above, the TEP protein may be one or more of the following protein secretion pathway proteins: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ and hCANX.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков пути секреции белка: hSRP14 с последовательностью SEQ ID NO: 13, hSec61α1 с последовательностью SEQ ID NO: 15, hSec61β с последовательностью SEQ ID NO: 17, hSec61γ с последовательностью SEQ ID NO: 19, hSRP54 с последовательностью SEQ ID NO: 21, hSRP9 с последовательностью SEQ ID NO: 23, hSRPRα с последовательностью SEQ ID NO: 25, hSRPβ с последовательностью SEQ ID NO: 27, и hCANX с последовательностью SEQ ID NO: 29 и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following protein secretion pathway protein amino acid sequences: hSRP14 with SEQ ID NO: 13, hSec61α1 with SEQ ID NO: 15, hSec61β with SEQ ID NO: 17, hSec61γ with SEQ ID NO: : 19, hSRP54 with the sequence SEQ ID NO: 21, hSRP9 with the sequence SEQ ID NO: 23, hSRPRα with the sequence SEQ ID NO: 25, hSRPβ with the sequence SEQ ID NO: 27, and hCANX with the sequence SEQ ID NO: 29 and/ or may correspond to amino acid sequences that are more than 80%, 90%, 95%, or 98% identical to the stated sequences.

Белок ТЕР может представлять собой один или более из следующих белков процессинга белка или метаболических белков: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, T-синтазу человека, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70 /HSPA8, hHYOU1, hCMP-SAS, беклин-1 человека, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 и hDRiP78.The TEP protein may be one or more of the following protein processing or metabolic proteins: hUCP4, hCMPSAT, rST6Gal1, hCOMSC, human T synthase, hP4HA1, hP4HB, hGILZ, hCyPB, hNRF2, hHK1, hPDI, hPIN1, hSEPW1, hCALR, hDDOST, hHSP40, hATP5A1, hSERCA2, hPDIA4, hHSC70/HSPA8, hHYOU1, hCMP-SAS, human Beclin-1, hERdj3, CHO-AGE, hWip1, hRTP4, hREEP2, hDPM1 and hDRiP78.

Белок ТЕР также может соответствовать одной или более из следующих последовательностей аминокислот белков процессинга белка или метаболических белков: hUCP4 с последовательностью SEQ ID NO: 31, hCMPSAT с последовательностью SEQ ID NO: 33, rST6Gal1 с последовательностью SEQ ID NO: 35, hCOMSC с последовательностью SEQ ID NO: 37, Т-синтазы человека с последовательностью SEQ ID NO: 39, hP4HA1 с последовательностью SEQ ID NO: 41, hP4HB с последовательностью SEQ ID NO: 43, hGILZ с последовательностью SEQ ID NO: 45, hCyPB с последовательностью SEQ ID NO: 47, hNRF2 с последовательностью SEQ ID NO: 49, hHK1 с последовательностью SEQ ID NO: 51, hPDI с последовательностью SEQ ID NO: 53, hPIN1 с последовательностью SEQ ID NO: 55, hSEPW1 с последовательностью SEQ ID NO: 57, hCALR с последовательностью SEQ ID NO: 59, hDDOST с последовательностью SEQ ID NO: 62, hHSP40 с последовательностью SEQ ID NO: 64, ИАТР5А1 с последовательностью SEQ ID NO: 66, hSERCA2 с последовательностью SEQ ID NO: 68, hPDIA4 с последовательностью SEQ ID NO: 70, hHSC70/HSPA8 с последовательностью SEQ ID NO: 72, hHYOU1 с последовательностью SEQ ID NO: 74, hCMP-SAS с последовательностью SEQ ID NO: 76, беклина-1 человека с последовательностью SEQ ID NO: 78, hERdj3 с последовательностью SEQ ID NO: 80, CHO-AGE с последовательностью SEQ ID NO: 82, hWip1 с последовательностью SEQ ID NO: 84, hRTP4 с последовательностью SEQ ID NO: 86, hREEP2 с последовательностью SEQ ID NO: 88, hDPM1 с последовательностью SEQ ID NO: 90 и hDRiP78 с последовательностью SEQ ID NO: 92 и/или может соответствовать последовательностям аминокислот, идентичным более чем на 80%, 90%, 95% или 98% указанным последовательностям.The TEP protein may also correspond to one or more of the following amino acid sequences of protein processing proteins or metabolic proteins: hUCP4 with the sequence SEQ ID NO: 31, hCMPSAT with the sequence SEQ ID NO: 33, rST6Gal1 with the sequence SEQ ID NO: 35, hCOMSC with the sequence SEQ ID NO: 35 ID NO: 37, Human T synthases with SEQ ID NO: 39, hP4HA1 with SEQ ID NO: 41, hP4HB with SEQ ID NO: 43, hGILZ with SEQ ID NO: 45, hCyPB with SEQ ID NO : 47, hNRF2 with the sequence SEQ ID NO: 49, hHK1 with the sequence SEQ ID NO: 51, hPDI with the sequence SEQ ID NO: 53, hPIN1 with the sequence SEQ ID NO: 55, hSEPW1 with the sequence SEQ ID NO: 57, hCALR with with the sequence SEQ ID NO: 59, hDDOST with the sequence SEQ ID NO: 62, hHSP40 with the sequence SEQ ID NO: 64, IATP5A1 with the sequence SEQ ID NO: 66, hSERCA2 with the sequence SEQ ID NO: 68, hPDIA4 with the sequence SEQ ID NO: 70, hHSC70/HSPA8 with the sequence SEQ ID NO: 72, hHYOU1 with the sequence SEQ ID NO: 74, hCMP-SAS with the sequence SEQ ID NO: 76, human beclin-1 with the sequence SEQ ID NO: 78, hERdj3 with the sequence SEQ ID NO: 80, CHO-AGE with SEQ ID NO: 82, hWip1 with SEQ ID NO: 84, hRTP4 with SEQ ID NO: 86, hREEP2 with SEQ ID NO: 88, hDPM1 with SEQ ID NO: 90 and hDRiP78 having the sequence SEQ ID NO: 92 and/or may correspond to amino acid sequences more than 80%, 90%, 95% or 98% identical to the indicated sequences.

Белок ТЕР может представлять собой шаперон, в частности, белок BiP, а конкретнее, синтетическое производное белка BiP дрозофилы (DroBiP), последовательность которого на 80%, 90%, 95% или 100% идентична последовательности SEQ ID NO: 60.The TEP protein may be a chaperone, in particular a BiP protein, and more specifically, a synthetic derivative of the Drosophila BiP protein (DroBiP), the sequence of which is 80%, 90%, 95% or 100% identical to the sequence of SEQ ID NO: 60.

Функциональная РНК может представлять собой временно трансфицированную миРНК или кшРНК, которая транскрибируется с указанной по меньшей мере одной изолированной последовательности нуклеиновой кислоты, при этом указанная миРНК или указанная процессированная кшРНК представляет собой антисмысловую РНК длиной 20, 21, 22, 23, 24 или 25 пар оснований, которая полностью комплементарна 20, 21, 22, 23, 24 или 25 последовательным нуклеотидам мРНК по меньшей мере одного целевого гена, который является частью рекомбинантного пути НГСК (негомологичного соединения концов), ГР (гомологичной рекомбинации), ОМСК (опосредованного микрогомологией соединения концов) или представляет собой белок репарации ДНК, такой как MDC1 (медиатор контрольных точек повреждения ДНК 1).The functional RNA may be a transiently transfected siRNA or shRNA that is transcribed from said at least one isolated nucleic acid sequence, wherein said siRNA or said processed shRNA is an antisense RNA of 20, 21, 22, 23, 24 or 25 base pairs in length , which is fully complementary to 20, 21, 22, 23, 24, or 25 consecutive nucleotides of the mRNA of at least one target gene that is part of the recombinant pathway NGJK (non-homologous end joining), GR (homologous recombination), OMJK (microhomology-mediated end joining) or is a DNA repair protein such as MDC1 (mediator of DNA damage checkpoint 1).

Указанный по меньшей мере один целевой ген, который может быть частью:Said at least one target gene, which may be part of:

- репарации ДНК и НГСК, представляет собой- DNA repair and NGSC, represents

53ВР1 (белок 1, связывающий опухолевый супрессор р53),53BP1 (p53 tumor suppressor binding protein 1),

- ГР, представляет собой- GR, represents

Rad51 (белок репарации ДНК RAD51), Rad51B (гомолог 2 белка репарации ДНК RAD51), Rad51C (гомолог 3 белка репарации ДНК RAD51),Rad51 (DNA repair protein RAD51), Rad51B (homologue 2 of DNA repair protein RAD51), Rad51C (homologue 3 of DNA repair protein RAD51),

Rad51D (гомолог 4 белка репарации ДНК RAD51), Rad52 (белок репарации ДНК RAD52), Rad54 (белок репарации и рекомбинации ДНК RAD54),Rad51D (homologue 4 of DNA repair protein RAD51), Rad52 (DNA repair protein RAD52), Rad54 (DNA repair and recombination protein RAD54),

Xrcc2 (репарация после облучения рентгеновскими лучами, исправляющая (комплементирующая) нарушенную репарацию в клетках китайского хомячка 2),Xrcc2 (repair after X-ray irradiation, correcting (complementing) impaired repair in Chinese hamster cells 2),

Xrcc3 (репарация после облучения рентгеновскими лучами, комплементирующая нарушенную репарацию в клетках китайского хомячка 3),Xrcc3 (repair after X-ray irradiation, complementing impaired repair in Chinese hamster cells 3),

Brca1 (рак молочной железы 1, раннее начало),Brca1 (breast cancer 1, early onset),

Brca2 (рак молочной железы 2, раннее начало),Brca2 (breast cancer 2, early onset),

Bard1 (ассоциированный с BRCA1 RING-домен 1),Bard1 (BRCA1-associated RING domain 1),

- ОМСК, представляет собой- OMSK represents

Ercc1 (эксцизионная репарация, кросс-комплементирующая нарушенную репарацию у грызунов, группа комплементации 1),Ercc1 (excision repair cross-complementing defective repair in rodents, complementation group 1),

Mre11 (мейотическая рекомбинация 11)Mre11 (meiotic recombination 11)

лигазу 1 (ДНК-лигаза 1),ligase 1 (DNA ligase 1),

и/илиand/or

представляет собой белок репарации ДНК MDC1.is a DNA repair protein MDC1.

Целевые гены могут представлять собой нуклеиновые кислоты, последовательность которых по меньшей мере на 80%, 90%, 95%, 98% или 100% идентична Rad51 с последовательностью SEQ ID NO: 93, Rad51B с последовательностью SEQ ID NO: 94, Rad51C с последовательностью SEQ ID NO: 95, Rad51D с последовательностью SEQ ID NO: 96, Xrcc2 с последовательностью SEQ ID NO: 99, Xrcc3 с последовательностью SEQ ID NO: 100, Rad52 с последовательностью SEQ ID NO: 97, Rad54 с последовательностью SEQ ID NO: 98, Brca1 с последовательностью SEQ ID NO: 101, Brca2 с последовательностью SEQ ID NO: 102, циклину D1 с последовательностью SEQ ID NO: 103, Ercd с последовательностью SEQ ID NO: 104, MDC1 с последовательностью SEQ ID NO: 105, Bard1 с последовательностью SEQ ID NO: 106, лигазе 1 с последовательностью SEQ ID NO: 107, Mre11 с последовательностью SEQ ID NO: 108 и/или 53BP1 с последовательностью SEQ ID NO: 109.The target genes may be nucleic acids that have at least 80%, 90%, 95%, 98%, or 100% sequence identity with Rad51 of SEQ ID NO: 93, Rad51B with SEQ ID NO: 94, Rad51C with sequence SEQ ID NO: 95, Rad51D with SEQ ID NO: 96, Xrcc2 with SEQ ID NO: 99, Xrcc3 with SEQ ID NO: 100, Rad52 with SEQ ID NO: 97, Rad54 with SEQ ID NO: 98 , Brca1 with the sequence SEQ ID NO: 101, Brca2 with the sequence SEQ ID NO: 102, cyclin D1 with the sequence SEQ ID NO: 103, Ercd with the sequence SEQ ID NO: 104, MDC1 with the sequence SEQ ID NO: 105, Bard1 with the sequence SEQ ID NO: 106, ligase 1 with the sequence SEQ ID NO: 107, Mre11 with the sequence SEQ ID NO: 108 and/or 53BP1 with the sequence SEQ ID NO: 109.

С указанного по меньшей мере одного трансгена можно экспрессировать терапевтический белок, такой как иммуноглобулин, гормон, такой как эритропоэтин, или фактор роста, и при этом необязательно встраивание и/или экспрессия трансгена повышена в рекомбинантной клетке млекопитающего по сравнению с клеткой, не содержащей указанную рекомбинантную молекулу(ы) нуклеиновой кислоты.Said at least one transgene can express a therapeutic protein, such as an immunoglobulin, a hormone, such as erythropoietin, or a growth factor, and optionally the insertion and/or expression of the transgene is increased in the recombinant mammalian cell compared to a cell not containing the recombinant nucleic acid molecule(s).

Рекомбинантная клетка млекопитающего может содержать по меньшей мере две функциональные РНК ТЕР, при этом одна или обе РНК ТЕР представляют собой временно трансфицированные миРНК, или экспрессируются с указанной изолированной последовательности(ей) нуклеиновой кислоты, кодирующей функциональную РНК ТЕР.A recombinant mammalian cell may contain at least two functional TEP RNAs, wherein one or both TEP RNAs are transiently transfected siRNAs, or expressed from the specified isolated nucleic acid sequence(s) encoding the functional TEP RNA.

Рекомбинантная клетка млекопитающего может содержать элемент MAR.The recombinant mammalian cell may contain a MAR element.

Настоящее изобретение также направлено на способ трансфекции клеток млекопитающих, в частности, клеток хомячка, включающий:The present invention is also directed to a method for transfecting mammalian cells, in particular hamster cells, comprising:

трансфекцию, возможно при первой трансфекции, указанных клеток млекопитающихtransfection, possibly upon first transfection, of said mammalian cells

(i) по меньшей мере одной из указанных рекомбинантных молекул нуклеиновых кислот по любому из пп. 1-13 и/или(i) at least one of said recombinant nucleic acid molecules according to any one of claims. 1-13 and/or

(ii) по меньшей мере одной изолированной функциональной РНК ТЕР и по меньшей мере одним трансгеном, который необязательно является частью рекомбинантной молекулы нуклеиновой кислоты, которой возможно трансфицируют при второй, последующей трансфекции, возможно вместе с изолированной нуклеиновой кислотой или мРНК, экспрессирующей транспозазу, которая узнает указанные 5'- и 3'-ITR.(ii) at least one isolated functional TEP RNA and at least one transgene, which is optionally part of a recombinant nucleic acid molecule, which is optionally transfected in a second, subsequent transfection, possibly together with an isolated nucleic acid or mRNA expressing a transposase that recognizes the indicated 5'- and 3'-ITRs.

Рекомбинантную клетку млекопитающего можно трансфицировать более чем одной молекулой нуклеиновой кислоты, включая по меньшей мере две, по меньшей мере три или по меньшей мере четыре из указанных рекомбинантных молекул нуклеиновых кислот, кодирующих один, два или три из следующих белков: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ и hCANX.A recombinant mammalian cell can be transfected with more than one nucleic acid molecule, including at least two, at least three, or at least four of the recombinant nucleic acid molecules encoding one, two, or three of the following proteins: hSRP14, hSec61α1, hSec61β, hSec61γ, hSRP54, hSRP9, hSRPRα, hSRPβ and hCANX.

Ее также можно трансфицировать hSRP14 с последовательностью SEQ ID NO: 13, hSec61α1 с последовательностью SEQ ID NO: 15, hSec61β с последовательностью SEQ ID NO: 17, hSec61γ с последовательностью SEQ ID NO: 19, hSRP54 с последовательностью SEQ ID NO: 21, hSRP9 с последовательностью SEQ ID NO: 23, hSRPRα с последовательностью SEQ ID NO: 25, hSRPβ с последовательностью SEQ ID NO: 27, и hCANX с последовательностью SEQ ID NO: 29, и/или последовательностями аминокислот, идентичными более чем на 80%, 90%, 95% или 98% указанным последовательностям.It can also be transfected with hSRP14 with SEQ ID NO: 13, hSec61α1 with SEQ ID NO: 15, hSec61β with SEQ ID NO: 17, hSec61γ with SEQ ID NO: 19, hSRP54 with SEQ ID NO: 21, hSRP9 with the sequence SEQ ID NO: 23, hSRPRα with the sequence SEQ ID NO: 25, hSRPβ with the sequence SEQ ID NO: 27, and hCANX with the sequence SEQ ID NO: 29, and/or amino acid sequences more than 80% identical, 90 %, 95% or 98% of the specified sequences.

Любые из рекомбинантных молекул нуклеиновых кислот могут представлять собой часть вектора, при этом можно осуществить котрансфекцию указанными векторами.Any of the recombinant nucleic acid molecules can be part of a vector, and co-transfection with said vectors can be carried out.

Котрансфекция векторами, кодирующими несколько белков ТЕР, предпочтительно котрансфекция рекомбинантными молекулами нуклеиновых кислот, кодирующими белки SRP14, SRP9 и SRP54, может повышать встраивание и/или экспрессию трансгена в указанной клетке по сравнению с клеткой, не подвергнутой такой котрансфекции. Котрансфекция векторами, содержащими последовательности нуклеиновых кислот, которые по меньшей мере на 80%, 90%, 95%, 98% или 100% идентичны последовательностям SEQ ID NO: 12, SEQ ID NO: 22, SEQ ID NO: 20, также входит в объем настоящего изобретения.Cotransfection with vectors encoding multiple TEP proteins, preferably cotransfection with recombinant nucleic acid molecules encoding the SRP14, SRP9 and SRP54 proteins, can increase the insertion and/or expression of the transgene in the cell compared to a cell not so cotransfected. Cotransfection with vectors containing nucleic acid sequences that are at least 80%, 90%, 95%, 98% or 100% identical to the sequences of SEQ ID NO: 12, SEQ ID NO: 22, SEQ ID NO: 20 is also included in scope of the present invention.

Можно получить множество указанных клеток млекопитающих, которые стабильно экспрессируют указанный белок ТЕР или функциональную РНК ТЕР, чтобы получить рекомбинантные клетки млекопитающих, и при этом указанное количество рекомбинантных клеток млекопитающих может не зависеть от наличия указанного элемента MAR. Указанные клетки млекопитающих можно трансфицировать два и возможно три раза.A plurality of said mammalian cells that stably express said TEP protein or functional TEP RNA may be obtained to produce recombinant mammalian cells, and wherein said number of recombinant mammalian cells may be independent of the presence of said MAR element. These mammalian cells can be transfected two and possibly three times.

Предпочтительно, по меньшей мере 30%, 40% или 45% указанных клеток млекопитающих могут стать рекомбинантными клетками млекопитающих и экспрессировать указанный трансген.Preferably, at least 30%, 40% or 45% of said mammalian cells may become recombinant mammalian cells and express said transgene.

Клетку млекопитающего можно трансфицировать указанной по меньшей мере одной изолированной функциональной РНК ТЕР и вектором, содержащим указанный по меньшей мере один трансген и необязательно 3'-ITR и 5'-ITR, фланкирующие указанный по меньшей мере один трансген, возможно вместе с изолированной нуклеиновой кислотой или мРНК, экспрессирующей транспозазу, которая узнает указанные 5'- и 3'-ITR.A mammalian cell can be transfected with said at least one isolated functional TEP RNA and a vector containing said at least one transgene and optionally 3'-ITR and 5'-ITR flanking said at least one transgene, optionally together with an isolated nucleic acid or An mRNA expressing a transposase that recognizes the indicated 5' and 3' ITRs.

Трансген может представлять собой терапевтический белок, такой как иммуноглобулин, гормон, цитокин или фактор роста.The transgene may be a therapeutic protein such as an immunoglobulin, hormone, cytokine or growth factor.

Рекомбинантная молекула нуклеиновой кислоты может необязательно содержать маркер отбора, и при этом указанный по меньшей мере один трансген экспрессируетсяThe recombinant nucleic acid molecule may optionally contain a selection marker, and wherein said at least one transgene is expressed

(а) без отбора по указанному маркеру, или(a) without selection for the specified marker, or

(b) с отбором по указанному маркеру, например, путем добавления селекционного агента в культуральную среду, и(b) with selection for the specified marker, for example, by adding a selection agent to the culture medium, and

(c) в отсутствие транспозазы, или(c) in the absence of a transposase, or

(d) в присутствии транспозазы.(d) in the presence of transposase.

Функциональная РНК ТЕР может кодироваться рекомбинантными последовательностями нуклеиновых кислот, кодирующими кшРНК или микроРНК, или может включать/состоять из миРНК, которая препятствует экспрессии по меньшей мере одного гена гомологичной рекомбинации, такого как, но не ограничиваясь перечисленными: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, циклин D1, Ercc1, MDC1, Bard1, лигаза 1, Mre11 и/или 53BP1.Functional TEP RNA may be encoded by recombinant nucleic acid sequences encoding shRNA or microRNA, or may include/consist of a miRNA that interferes with the expression of at least one homologous recombination gene, such as, but not limited to: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, cyclin D1, Ercc1, MDC1, Bard1, ligase 1, Mre11 and/or 53BP1.

Функциональная РНК ТЕР также может препятствовать экспрессии генов, последовательность которых по меньшей мере на 80%, 90%, 95%, 98% или 100% идентична Rad51 с последовательностью SEQ ID NO: 93, Rad51B с последовательностью SEQ ID NO: 94, Rad51C с последовательностью SEQ ID NO: 95, Rad51D с последовательностью SEQ ID NO: 96, Xrcc2 с последовательностью SEQ ID NO: 99, Xrcc3 с последовательностью SEQ ID NO: 100, Rad52 с последовательностью SEQ ID NO: 97, Rad54 с последовательностью SEQ ID NO: 98, Brca1 с последовательностью SEQ ID NO: 101, Brca2 с последовательностью SEQ ID NO: 102, циклину D1 с последовательностью SEQ ID NO: 103, Ercc1 с последовательностью SEQ ID NO: 104, MDC1 с последовательностью SEQ ID NO: 105, Bard1 с последовательностью SEQ ID NO: 106, лигазе 1 с последовательностью SEQ ID NO: 107, Mre11 с последовательностью SEQ ID NO: 108 и/или 53BP1 с последовательностью SEQ ID NO: 109.Functional TEP RNA can also interfere with the expression of genes that have at least 80%, 90%, 95%, 98%, or 100% sequence identity with Rad51 SEQ ID NO: 93, Rad51B with SEQ ID NO: 94, Rad51C with with the sequence SEQ ID NO: 95, Rad51D with the sequence SEQ ID NO: 96, Xrcc2 with the sequence SEQ ID NO: 99, Xrcc3 with the sequence SEQ ID NO: 100, Rad52 with the sequence SEQ ID NO: 97, Rad54 with the sequence SEQ ID NO: 98, Brca1 with the sequence SEQ ID NO: 101, Brca2 with the sequence SEQ ID NO: 102, cyclin D1 with the sequence SEQ ID NO: 103, Ercc1 with the sequence SEQ ID NO: 104, MDC1 with the sequence SEQ ID NO: 105, Bard1 with sequence SEQ ID NO: 106, ligase 1 with sequence SEQ ID NO: 107, Mre11 with sequence SEQ ID NO: 108 and/or 53BP1 with sequence SEQ ID NO: 109.

Встраивание и/или экспрессию трансгена можно повысить в такой клетке по сравнению с клеткой, не трансфицированной указанными изолированными молекулами нуклеиновых кислот и/или по меньшей мере одной из указанных изолированных функциональных РНК ТЕР.Incorporation and/or expression of the transgene can be increased in such a cell compared to a cell not transfected with said isolated nucleic acid molecules and/or at least one of said isolated functional TEP RNAs.

Настоящее изобретение также направлено на набор, в одном контейнере содержащий по меньшей мере один вектор, содержащий любую из указанных рекомбинантных молекул нуклеиновых кислот согласно пп. 1-13, и во втором необязательном контейнере содержащий вектор, кодирующий подходящую транспозазу, и в дополнительном контейнере содержащий инструкцию по применению указанного вектора или векторов.The present invention is also directed to a kit containing in one container at least one vector containing any of the specified recombinant nucleic acid molecules according to paragraphs. 1-13, and in a second optional container containing a vector encoding a suitable transposase, and in an additional container containing instructions for use of said vector or vectors.

Предложен указанный выше набор, в котором более чем один вектор предусмотрен в одном или более контейнерах и в котором белки ТЕР представляют собой по меньшей мере два из следующих белков: шаперон, SRP14, SRP9, SRP54, SR или транслокон.The above set is provided wherein more than one vector is provided in one or more containers and wherein the TEP proteins are at least two of the following proteins: chaperone, SRP14, SRP9, SRP54, SR or translocon.

Предложен указанный выше набор, в котором функциональная(ые) РНК ТЕР внутри указанного вектора(ов) включает(ют)/состоит(ят) из последовательностей нуклеиновых кислот, кодирующих микроРНК, миРНК или кшРНК, которые препятствуют экспрессии по меньшей мере одного гена гомологичной рекомбинации, такого как, но не ограничиваясь перечисленными: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, циклин D1, Ercc1, MDC1, Bard1, лигаза 1, Mre11 и/или 53BP1, и предпочтительно в дополнительном контейнере указанный набор содержит одну или более миРНК, которые препятствуют экспрессии по меньшей мере одного другого гена гомологичной рекомбинации, такого как, но не ограничиваясь перечисленными: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, циклин D1, Ercc, MDC1, Bard1, лигаза 1, Mre11 и/или 53BP1.The above set is proposed, in which the functional TEP RNA(s) within the specified vector(s) includes/consists of nucleic acid sequences encoding microRNAs, miRNAs or shRNAs that interfere with the expression of at least one homologous recombination gene such as, but not limited to: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, cyclin D1, Ercc1, MDC1, Bard1, ligase 1, Mre11 and/or 53BP1, and preferably in in an additional container, said kit contains one or more siRNAs that interfere with the expression of at least one other homologous recombination gene, such as, but not limited to: Rad51, Rad51B, Rad51C, Rad51D, Xrcc2, Xrcc3, Rad52, Rad54, Brca1, Brca2, cyclin D1, Ercc, MDC1, Bard1, ligase 1, Mre11 and/or 53BP1.

Ген гомологичной рекомбинации может соответствовать нуклеиновым кислотам, последовательность которых по меньшей мере на 80%, 90%, 95%, 98% или 100% идентична Rad51 с последовательностью SEQ ID NO: 93, Rad51B с последовательностью SEQ ID NO: 94, Rad51C с последовательностью SEQ ID NO: 95, Rad51D с последовательностью SEQ ID NO: 96, Xrcc2 с последовательностью SEQ ID NO: 99, Xrcc3 с последовательностью SEQ ID NO: 100, Rad52 с последовательностью SEQ ID NO: 97, Rad54 с последовательностью SEQ ID NO: 98, Brca1 с последовательностью SEQ ID NO: 101, Brca2 с последовательностью SEQ ID NO: 102, циклину D1 с последовательностью SEQ ID NO: 103, Ercc1 с последовательностью SEQ ID NO: 104, MDC1 с последовательностью SEQ ID NO: 105, Bard1 с последовательностью SEQ ID NO: 106, лигазе 1 с последовательностью SEQ ID NO: 107, Mre11 с последовательностью SEQ ID NO: 108 и/или 53BP1 с последовательностью SEQ ID NO: 109.The homologous recombination gene may correspond to nucleic acids that are at least 80%, 90%, 95%, 98%, or 100% sequence identical to Rad51 with the sequence SEQ ID NO: 93, Rad51B with the sequence SEQ ID NO: 94, Rad51C with the sequence SEQ ID NO: 95, Rad51D with SEQ ID NO: 96, Xrcc2 with SEQ ID NO: 99, Xrcc3 with SEQ ID NO: 100, Rad52 with SEQ ID NO: 97, Rad54 with SEQ ID NO: 98 , Brca1 with the sequence SEQ ID NO: 101, Brca2 with the sequence SEQ ID NO: 102, cyclin D1 with the sequence SEQ ID NO: 103, Ercc1 with the sequence SEQ ID NO: 104, MDC1 with the sequence SEQ ID NO: 105, Bard1 with the sequence SEQ ID NO: 106, ligase 1 with the sequence SEQ ID NO: 107, Mre11 with the sequence SEQ ID NO: 108 and/or 53BP1 with the sequence SEQ ID NO: 109.

Настоящее изобретение также направлено на применение рекомбинантных нуклеиновых кислот, описанных в данной заявке, и/или рекомбинантных клеток млекопитающих, описанных в данной заявке, предпочтительно для повышения встраивания и/или экспрессии трансгена.The present invention is also directed to the use of recombinant nucleic acids described in this application and/or recombinant mammalian cells described in this application, preferably to enhance the integration and/or expression of a transgene.

Настоящее изобретение также направлено на вектор экспрессии, содержащий:The present invention is also directed to an expression vector comprising:

(a) трансген, который фланкирован в 3'-5' направлении промотором и в 5'-3' направлении сигналом полиаденилирования,(a) a transgene that is flanked in the 3'-5' direction by a promoter and in the 5'-3' direction by a polyadenylation signal,

(b) единичный элемент MAR в 5'-3' направлении от сигнала полиаденилирования, или(b) a single MAR element in the 5'-3' direction of the polyadenylation signal, or

(c) первый элемент MAR в 3'-5' направлении от интересующего трансгена и второй элемент MAR в 5'-3' направлении от места встраивания указанного трансгена.(c) a first MAR element in the 3'-5' direction from the transgene of interest and a second MAR element in the 5'-3' direction from the insertion site of the specified transgene.

Единичный или первый и второй элементы MAR можно выбрать из элементов MAR 1_68, 1_6, 1_6R2, 1_68R, 1_68R2, X_29R3 или X_29 или элементов, последовательности которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентичны последовательностям SEQ ID NO: 1, 2, 3, 6, 7, 8, 9 или 10.The single or first and second MAR elements can be selected from MAR elements 1_68, 1_6, 1_6R2, 1_68R, 1_68R2, X_29R3 or X_29 or elements whose sequences are at least 80%, 90%, 95%, 98%, 99% or 100 % identical to SEQ ID NO: 1, 2, 3, 6, 7, 8, 9 or 10.

Единичный или первый и второй элемент(ы) MAR можно выбрать из перестроенных элементов MAR 1_6R2, 1_68R, 1_68R2 или X_29R3 или элементов, последовательности которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентичны последовательностям SEQ ID NO: 6, 7, 8, или 10, при этом необязательно указанный элемент(ы) MAR повышает экспрессию интересующего трансгена на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70% по сравнению с их неперестроенными аналогами.The single or first and second MAR element(s) may be selected from rearranged MAR elements 1_6R2, 1_68R, 1_68R2 or X_29R3 or elements whose sequences are at least 80%, 90%, 95%, 98%, 99% or 100% identical sequences of SEQ ID NO: 6, 7, 8, or 10, wherein optionally said MAR element(s) increases expression of the transgene of interest by at least 10%, at least 20%, at least 30%, at least 40 %, at least 50%, at least 60%, or at least 70% compared to their non-rebuilt counterparts.

Промотор может представлять собой промотор EF1-альфа и сигнал полиаденилирования представляет собой поли(А) сигнал BGH.The promoter may be the EF1-alpha promoter and the polyadenylation signal is the BGH poly(A) signal.

Указанный вектор может содержать промотор(ы) и/или энхансер(ы) или продукты их слияния, такие как GAPDH, CGAPD, CSV40p, CMVp, СНО Ef1-альфа, Actb СНО или HspaS СНО.Said vector may contain promoter(s) and/or enhancer(s) or fusion products thereof, such as GAPDH, CGAPD, CSV40p, CMVp, Ef1alpha CHO, Actb CHO or HspaS CHO.

Промоторы могут представлять собой промоторы GAPDH с последовательностью SEQ ID NO: 111, CGAPDH с последовательностью SEQ ID NO: 11, SV40p с последовательностью SEQ ID NO: 114, CMVp с последовательностью SEQ ID NO: 113, EF1-альфа СНО с последовательностью SEQ ID NO:112, Actb СНО с последовательностью SEQ ID NO: 115 и/или HspaS СНО с последовательностью SEQ ID NO: 116 и последовательности нуклеиновых кислот, идентичные более чем на 80%, 90%, 95% или 98% указанным последовательностям.The promoters may be GAPDH having SEQ ID NO: 111, CGAPDH having SEQ ID NO: 11, SV40p having SEQ ID NO: 114, CMVp having SEQ ID NO: 113, EF1-alpha CHO having SEQ ID NO: :112, Actb CHO with the sequence SEQ ID NO: 115 and/or HspaS CHO with the sequence SEQ ID NO: 116 and nucleic acid sequences that are more than 80%, 90%, 95% or 98% identical to these sequences.

Промотор может представлять собой промотор GAPDH и включать энхансер CMV.The promoter may be a GAPDH promoter and include a CMV enhancer.

Первый и/или второй MAR, энхансер, промотор, интересующий трансген и сигнал полиаденилирования могут быть расположены между 5'- и 3'-ITR.The first and/or second MAR, enhancer, promoter, transgene of interest, and polyadenylation signal may be located between the 5' and 3' ITR.

В некотором варианте реализации указанный вектор экспрессии может содержать:In some embodiment, said expression vector may comprise:

(a) единичный элемент MAR в 5'-3' направлении от сигнала полиаденилирования, при этом указанный единичный элемент MAR предпочтительно представляет собой элемент MAR 1-68 или MARX-29 и/или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1 или 3, в частности, перестроенный MAR на основе MAR 1-68 или MAR Х-29, в частности, элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательностям SEQ ID NO: 6, 7 или 10 (элементы MAR 1_68R, 1_68R2 или X_29R3) или SEQ ID NO: 9, и предпочтительно представляет собой элемент MAR Х-29, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3, или(a) a MAR unit element in the 5'-3' direction from the polyadenylation signal, wherein said MAR unit element is preferably a MAR 1-68 or MARX-29 element and/or an element which is at least 80% sequenced, 90 %, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 1 or 3, in particular, a rearranged MAR based on MAR 1-68 or MAR X-29, in particular, an element whose sequence is at least is 80%, 90%, 95%, 98%, 99% or 100% identical to SEQ ID NO: 6, 7 or 10 (MAR elements 1_68R, 1_68R2 or X_29R3) or SEQ ID NO: 9, and is preferably an element MAR X-29, and/or its sequence is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 3, or

(b) первый элемент MAR в 3'-5' направлении от интересующего трансгена и второй элемент MAR в 5'-3' направлении от указанного интересующего трансгена, при этом указанный первый элемент MAR предпочтительно включает элемент 1_6, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 2, в частности, идентична перестроенным элементам MAR на основе MAR 1-6, в частности, элементам, последовательности которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентичны последовательности SEQ ID NO: 8 (MAR 1_6R2), и второй элемент MAR, который предпочтительно включает элемент MAR 1-68, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1.(b) a first MAR element in the 3'-5' direction from the transgene of interest and a second MAR element in the 5'-3' direction from said transgene of interest, wherein said first MAR element preferably includes element 1_6, and/or sequence thereof at least at least 80%, 90%, 95%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 2, in particular, identical to rearranged MAR elements based on MARs 1-6, in particular, elements whose sequence is at least at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 8 (MAR 1_6R2), and a second MAR element, which preferably includes MAR element 1-68, and/or sequence thereof is at least 80%, 90%, 95%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 1.

Вектор экспрессии может содержать единичный элемент MAR, и указанный единичный элемент MAR может быть расположен в 5'-3' направлении от сайта полиаденилирования и представляет собой MAR 1-68 или MAR Х-29, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1 или 3, в частности, идентична перестроенным элементам MAR на основе MAR 1-68 или MAR Х-29, в частности, элементам, последовательность которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательностям SEQ ID NO: 6, 7 или 10 (элементы MAR 1_68R, 1_68R2 или X_29R3) или 9, и может предпочтительно представлять собой полученный из MAR Х-29 элемент, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична SEQ ID NO: 3.The expression vector may contain a single MAR element, and the single MAR element may be located in the 5'-3' direction from the polyadenylation site and is MAR 1-68 or MAR X-29, and/or at least 80% of the sequence thereof , 90%, 95%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 1 or 3, particularly identical to rearranged MAR elements based on MAR 1-68 or MAR X-29, particularly to elements, sequence which is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequences of SEQ ID NO: 6, 7 or 10 (MAR elements 1_68R, 1_68R2 or X_29R3) or 9, and may preferably be a MAR X-29 derived element and/or its sequence is at least 80%, 90%, 95%, 98%, 99% or 100% identical to SEQ ID NO: 3.

Указанный первый элемент MAR может находиться в 3'-5' направлении от интересующего трансгена и второй элемент MAR может находиться в 5'-3' направлении от указанного интересующего трансгена, при этом указанный первый элемент MAR может включать элемент MAR 1_6, и/или его последовательность по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO 2, и указанный второй элемент MAR может включать элемент MAR 1_68, и/или его последовательность может быть по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична SEQ ID NO: 1.The first MAR element may be in the 3'-5' direction from the transgene of interest and the second MAR element may be in the 5'-3' direction from the said transgene of interest, wherein the first MAR element may include the MAR 1_6 element, and/or its sequence is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO 2, and said second MAR element may include MAR element 1_68, and/or its sequence may be at least 80%, 90%, 95%, 98%, 99% or 100% identical to SEQ ID NO: 1.

Настоящее изобретение также направлено на способ экспрессии трансгена, включающий:The present invention is also directed to a method for expressing a transgene, comprising:

обеспечение рекомбинантной клетки млекопитающего, содержащей один из упомянутых выше векторов, содержащих указанный трансген и экспрессирующих указанный трансген, при этом указанный элемент(ы) MAR может повышать экспрессию указанного трансгена предпочтительно на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%. Указанный вектор может содержать единичный элемент MAR Х_29 и/или нуклеиновую кислоту, последовательность которой по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3, и при этом через более чем 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 недель культивирования указанный элемент MAR может повышать экспрессию интересующего трансгена на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%.providing a recombinant mammalian cell containing one of the above vectors containing said transgene and expressing said transgene, wherein said MAR element(s) can increase expression of said transgene preferably by at least 10%, at least 20%, at least 30%, at least 40%, at least 50%, at least 60% or at least 70%. Said vector may contain a single MAR X_29 element and/or a nucleic acid the sequence of which is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 3, and more than than 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 or 14 weeks of culture, said MAR element can increase expression of the transgene of interest by at least 10%, at least 20%, at least 30% , at least 40%, at least 50%, at least 60% or at least 70%.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS

Фиг. 1. Конструирование вектора, несущего транспозон.Fig. 1. Construction of a vector carrying a transposon.

Для того, чтобы проверить, может ли влиять добавление элемента MAR к транспозону РВ (PiggyBac) на эффективность транспозиции и экспрессию трансгена, и чтобы оценить, оказывало ли расположение MAR в конструкции какое-либо влияние на данные эффекты, разработали серию донорных конструкций транспозонов, содержащих ген зеленого флуоресцентного белка (GFP) и ген устойчивости к пуромицину (Puro), в которые встроили MAR 1_68 или контрольную нейтральную спейсерную последовательность ДНК в различные положения в указанной плазмиде. Исходную плазмиду, несущую транспозон, Puro-GFP без вставки использовали в качестве контроля транспозиции, чтобы отличить вклад увеличенного размера транспозона от влияния добавления MAR или спейсерной последовательности.To test whether the addition of a MAR element to the PB transposon (PiggyBac) could influence transposition efficiency and transgene expression, and to evaluate whether the location of the MAR in the construct had any influence on these effects, a series of donor transposon constructs containing a green fluorescent protein (GFP) gene and a puromycin resistance gene (Puro) into which MAR 1_68 or a control neutral DNA spacer sequence was inserted at various positions in the plasmid. The original transposon-carrying plasmid, Puro-GFP, without insertion, was used as a transposition control to distinguish the contribution of increased transposon size from the effect of the addition of a MAR or spacer sequence.

Фиг. 2. Векторы, несущие транспозоны: эффективность транспозиции.Fig. 2. Vectors carrying transposons: efficiency of transposition.

Эффективность транспозиции различных конструкций, несущих транспозоны, измеряли путем оценки (А) процента клеток, экспрессирующих GFP, после трансфекции и трех недель культивирования без селекции антибиотиком и (В) путем подсчета устойчивых к пуромицину колоний.The transposition efficiency of the various transposon-carrying constructs was measured by assessing (A) the percentage of cells expressing GFP after transfection and three weeks of culture without antibiotic selection and (B) by counting puromycin-resistant colonies.

Фиг. 3. Векторы, несущие транспозоны: уровень экспрессии.Fig. 3. Vectors carrying transposons: level of expression.

Анализ уровня экспрессии, обеспеченного различными векторами, несущими транспозоны, трансфицированными совместно (+РВ) или без (-РВ) плазмиды, экспрессирующей транспозазу, путем измерения уровней флуоресценции GFP в клетках СНО после 3 недель культивирования без селекции (А) или при селекции (В) по устойчивости к пуромицину после трансфекции, с учетом флуоресценции только GFP-положительных клеток.Analysis of the level of expression provided by various transposon-carrying vectors transfected with (+PB) or without (-PB) a transposase expression plasmid by measuring GFP fluorescence levels in CHO cells after 3 weeks of culture without selection (A) or with selection (B ) by puromycin resistance after transfection, taking into account the fluorescence of only GFP-positive cells.

Фиг. 4. Влияние MAR и транспозазы на встраивание трансгена в геном.Fig. 4. Influence of MAR and transposase on transgene integration into the genome.

Количество встроенных копий GFP-трансгена определяли, применяя количественную ПЦР, и значения нормировали по отношению к клеточному гену В2М, применяя геномную ДНК, выделенную из не подвергнутых селекции клеток СНО (А), или устойчивых к пуромицину клеток (В), полученных как описано в подписях к фигурам 1-3. Значения представляют средние значения ± стандартная ошибка среднего (n=3). *Р<0,05.The number of inserted copies of the GFP transgene was determined using quantitative PCR, and values were normalized to the cellular B2M gene using genomic DNA isolated from unselected CHO cells (A) or puromycin-resistant cells (B) obtained as described in captions for figures 1-3. Values represent means ± SEM (n=3). *P<0.05.

Фиг. 5. Экспрессия трансгена относительно трансгена.Fig. 5. Expression of the transgene relative to the transgene.

Оценка внутреннего экспрессионного потенциала векторов независимо от их способности встраиваться в геном, без селекции (А) и при селекции (В) пуромицином.Assessment of the internal expression potential of vectors, regardless of their ability to integrate into the genome, without selection (A) and with selection (B) with puromycin.

Фиг. 6. Влияние экспрессии секреторных белков с векторов на основе транспозонов и плазмидных векторов на экспрессию рекомбинантного белка (трансгена). Векторы на основе транспозонов или обычные плазмидные векторы сконструировали для экспрессии секреторных белков SRP9, SRP14, SRP54, альфа и бета субъединиц (SR) рецептора SRP или транслокона. Векторы на основе транспозонов котрансфицировали с вектором экспрессии транспозазы PiggyBac (правая панель), тогда как не основанные на транспозонах плазмидные векторы трансфицировали отдельно (левая панель) в клон клетки, экспрессирующей антитело инфликсимаб, как описано в данном тексте. После трех недель культивирования при селекции (левая панель) или без селекции (правая панель) анализировали уровни секретируемого антитела инфликсимаба в культуральных супернатантах. Можно увидеть, что удельная продуктивность, которая представляет собой относительную экспрессию в клетке, содержащей последовательность, кодирующую белок экспрессии/процессинга трансгена (ТЕР), или функциональную РНК ТЕР, повышалась при применении вектора, несущего транспозон, от 0,25-1,5 до 1-2,5, соответственно, по сравнению с исходной клеткой без ТЕР.Fig. 6. The influence of the expression of secretory proteins from vectors based on transposons and plasmid vectors on the expression of a recombinant protein (transgene). Transposon-based vectors or conventional plasmid vectors have been constructed to express the secretory proteins SRP9, SRP14, SRP54, the alpha and beta subunits (SR) of the SRP receptor, or the translocon. Transposon-based vectors were cotransfected with the PiggyBac transposase expression vector (right panel), whereas non-transposon-based plasmid vectors were transfected alone (left panel) into a cell clone expressing the infliximab antibody as described in this text. After three weeks of culture with selection (left panel) or without selection (right panel), levels of secreted infliximab antibody in the culture supernatants were analyzed. It can be seen that the specific productivity, which is the relative expression in a cell containing the transgene expression/processing protein (TEP) coding sequence or functional TEP RNA, increased with the use of the transposon-carrying vector from 0.25-1.5 to 1-2.5, respectively, compared to the original cell without TEP.

Фиг. 7. Экспрессия рекомбинантного белка в суспензиях подвергнутых электро по рации клеток СНО-М.Fig. 7. Expression of recombinant protein in suspensions of CHO-M cells exposed to electromagnetic radiation.

(A) Клетки СНО-М, которые подвергали электропорации один или два раза несущим MAR Х-29 вектором, экспрессирующим GFP и транспозон, в присутствии (+РВ) или отсутствие (-РВ) транспозазы piggyBac. Показан процент стабильно экспрессирующих GFP клеток после 3 недель культивирования, осуществленного в отсутствие селекции.(A) CHO-M cells that were electroporated once or twice with a MAR X-29-carrying vector expressing GFP and a transposon in the presence (+PB) or absence (-PB) of piggyBac transposase. The percentage of cells stably expressing GFP after 3 weeks of culture in the absence of selection is shown.

(B) Сренее значение флуоресценции GFP в GFP-положительных клетках.(B) Average GFP fluorescence value in GFP-positive cells.

(C) кДНК, кодирующие легкие и тяжелые цепи антитела бевацизумаба (Beva), адалимумаба (Adal) и ритуксимаба (Ritu), встраивали вместо GFP в плазмиды, несущие транспозон, содержащие MAR Х29. Клетки СНО-М подвергали электропорации три раза с интервалами по 12 дней конструкциями, несущими транспозоны, содержащими легкую и тяжелую цепь, вместе с вектором экспрессии, несущим транспозазу piggyBac. Показаны уровни иммуноглобулина, секретируемого в культуральные супернатанты совокупностью поликлональных клеток, которых растили без селекции (незакрашенные столбики). В качестве альтернативы, не подвергнутые селекции поликлональные популяции клеток подвергали сортировке путем пэннинга (просеивания) клеток, на поверхностях которых были выставлены иммуноглобулины, применяя магнитные микрогранулы. Показаны уровни иммуноглобулинов, секретируемых не подвергнутыми сортировке популяциями (закрашенные столбики).(C) cDNAs encoding the antibody light and heavy chains of bevacizumab (Beva), adalimumab (Adal), and rituximab (Ritu) were inserted in place of GFP into transposon-carrying plasmids containing MAR X29. CHO-M cells were electroporated three times at 12-day intervals with light and heavy chain transposon-carrying constructs along with an expression vector carrying the piggyBac transposase. Shown are the levels of immunoglobulin secreted into culture supernatants by a population of polyclonal cells grown without selection (open bars). Alternatively, unselected polyclonal cell populations were sorted by panning cells exposed to immunoglobulins using magnetic beads. Levels of immunoglobulins secreted by unsorted populations are shown (filled bars).

(D) Популяции трансфицированных клеток подвергали сортировке для обнаружения экспрессирующих иммуноглобулины колоний, применяя устройство, собирающее колонии, и по два клона, экспрессирующих каждый из трех указанных иммуноглобулинов, растили в культурах с подпиткой в биореакторах в виде центрифужных пробирок. Показаны уровни секретируемых иммуноглобулинов, и их определяли также, как и для панели (С).(D) Transfected cell populations were screened for immunoglobulin-expressing colonies using a colony picker, and two clones expressing each of the three immunoglobulins were grown in fed-batch cultures in centrifuge tube bioreactors. Levels of secreted immunoglobulins are shown and were determined as for panel (C).

Фиг.8. Гетерологичная экспрессия SRP14 улучшает секрецию трастузумаба и восстанавливает секрецию инфликсимаба.Fig.8. Heterologous expression of SRP14 improves trastuzumab secretion and restores infliximab secretion.

Клоны HP и LP СНО-К1, экспрессирующие иммуноглобулины трастузумаб (А) или инфликсимаб (В) на наиболее высоких из полученных уровней, повторно стабильно трансфицировали вектором экспрессии SRP14, и выделяли моноклональные популяции. Оценивали рост и продуктивность клеток в условиях периодической культуры для полученных субклонов, обозначенных от А до Е. Концентрацию клеток (клетки/мл) и титр IgG (мкг/мл) наносили на график для каждого дня отбора образцов на протяжении 7 дней культивирования. (С) Распределение удельной продуктивности субклонов трастузумаба (HP) и инфликсимаба (LP) после трансфекции вектором экспрессии SRP14 (дорожки S) по сравнению с таковой для исходных клонов HP и LP (-). (D) Определяли относительные уровни мРНК SRP14 для 5 отдельных субклонов А-Е SRP14-LP и исходного контрольного клона LP, и наносили их на график в зависимости от удельной продуктивности IgG для 4 полученных культур. Средние значения и стандартные отклонения уровней мРНК и удельной продуктивности выражали в виде кратности превышения соответствующих значений для контрольного клона LP.HP and LP CHO-K1 clones expressing the immunoglobulins trastuzumab (A) or infliximab (B) at the highest levels obtained were stably retransfected with the SRP14 expression vector, and monoclonal populations were isolated. Cell growth and productivity under batch culture conditions were assessed for the resulting subclones, designated A through E. Cell concentration (cells/mL) and IgG titer (μg/mL) were plotted for each sampling day over the 7 days of culture. (C) Distribution of specific productivity of trastuzumab (HP) and infliximab (LP) subclones after transfection with the SRP14 expression vector (lanes S) compared with that of the original HP and LP (−) clones. (D) Relative SRP14 mRNA levels for 5 individual SRP14-LP subclones A-E and the original control clone LP were determined and plotted against specific IgG productivity for the 4 resulting cultures. Mean values and standard deviations of mRNA levels and specific productivity were expressed as folds higher than the corresponding values for the control clone LP.

Фиг. 9. Гетерологичная экспрессия SRP14 опосредует высокий выход с трудом экспрессируемого иммуноглобулина в процессе получения.Fig. 9. Heterologous expression of SRP14 mediates high yield of difficult to express immunoglobulin during production.

Трансфицированные вектором, несущим SRP14, субклон HP В, экспрессирующий трастузумаб (А), и субклон LP Е, экспрессирующий инфликсимаб (В), проанализированные на фиг. 8, культивировали в вентилируемых встряхиваемых колбах объемом 125 мл в культурах с подпиткой с рабочим объемом 25 мл и определяли концентрацию жизнеспособных клеток и титр IgG в течение 11-дневного периода.Transfected with the vector carrying SRP14, the HP B subclone expressing trastuzumab (A) and the LP E subclone expressing infliximab (B) analyzed in FIG. 8 were cultured in 125 mL vented shake flasks in fed-batch cultures with a working volume of 25 mL, and the viable cell concentration and IgG titer were determined over an 11-day period.

Фиг. 10. Экспрессия SRP14 нарушает агрегацию легких цепей в клонах клеток СНО.Fig. 10. Expression of SRP14 disrupts light chain aggregation in CHO cell lineages.

(А) Собранные путем центрифугирования супернатанты и осадки пермеабилизованных Triton Х100 (Тx100) клеток анализировали с помощью ЭФ в ПААГ/ДСН, как изображено на панелях с обозначением растворимых в Тх-100 и нерастворимых в Тх-100 агрегатов, соответственно, для субклона Е SRP14-LP, полученного из LP, и субклона В SRP14-HP, полученного из HP (дорожки S), или для субклонов СНО, экспрессирующих контрольный белок GFP (дорожки G). Стрелками показаны недостаточно процессированная свободная легкая цепь (LC) и агрегировавшая (агр.) LC. (В) Осуществляли анализ с вытеснением для различных промежуточных вариантов агрегации LC, НС и IgG, полученных в клоне Е SRP14-LP и LP-контрольном клоне Е, результаты которого показаны на данной фигуре.(A) Collected supernatants and pellets of Triton X100 (Tx100) permeabilized cells by centrifugation were analyzed by SDS-PAGE as depicted in panels indicating Tx-100-soluble and Tx-100-insoluble aggregates, respectively, for subclone E of SRP14 -LP, derived from LP, and subclone B of SRP14-HP, derived from HP (lanes S), or for CHO subclones expressing the control GFP protein (lanes G). Arrows indicate underprocessed free light chain (LC) and aggregated (aggregated) LC. (B) A displacement assay was performed on the various LC, HC, and IgG aggregation intermediates obtained in the SRP14-LP clone E and the LP control clone E, the results of which are shown in this figure.

Фиг. 11. Влияние совместной экспрессии субъединиц SRP, SR и транслокона на секрецию иммуноглобулина.Fig. 11. Effect of co-expression of SRP, SR and translocon subunits on immunoglobulin secretion.

(А) Клон LP Е, экспрессирующий инфликсимаб, повторно трансфицировали различными комбинациями векторов экспрессии на основе транспозонов, несущих SRP, SR и транслокон. Удельную продуктивность полученных популяций клеток затем оценивали при периодическом культивировании и представили в виде % от значений в пикограммах на клетку в день (pcd) для LP-контрольных клеток. На диаграммах размаха представлены средняя, верхняя и нижняя квартили нормированных удельных продуктивностей, определенных в день 3 для независимых серий культивирования. (В) Субклон клетки Е, экспрессирующий SRP14 и продуцирующий инфликсимаб, повторно трансфицировали различными комбинациями векторов экспрессии на основе транспозонов, несущих SR и транслокон. Удельная продуктивность популяций клеток представлена аналогично панели А.(A) LP E clone expressing infliximab was retransfected with different combinations of transposon-based expression vectors carrying SRP, SR, and translocon. The specific productivity of the resulting cell populations was then assessed during batch culture and reported as % of picograms per cell per day (pcd) values for LP control cells. The range diagrams show the average, upper and lower quartiles of normalized specific productivity determined on day 3 for independent cultivation series. (B) A subclone of an E cell expressing SRP14 and producing infliximab was retransfected with different combinations of transposon-based expression vectors carrying the SR and the translocon. The specific productivity of cell populations is presented similarly to panel A.

Фиг. 12. Модель восстановления секреции инфликсимаба экспрессирующими SRP14 клонамиFig. 12. Model for restoration of infliximab secretion by SRP14-expressing clones

Модель фолдинга и секреции IgG клонами с низкой продуцирующей способностью до (А) и после (В) сверхэкспрессии субъединиц SRP/транслокона. Полученные результаты свидетельствуют о том, что вновь синтезированная LC, продуцируемая клонами с низкой продуцирующей способностью, недостаточно процесс и руется и имеет неправильный фолдинг. Недостаточный процессинг сигнального пептида LC инфликсимаба может приводить к насыщению аппарата котрансляционной транслокации ЭР (панель А, номер 1). Ее агрегация в ЭР внутри не способных к сборке IgG агрегировавших форм LC (панель А, номер 2) вызывает ЭР-стресс и вызывает образование подобной аутофагосоме структуры (панель А, номер 3). Сверхэкспрессия SRP14 и других компонентов белков SRP/транслокона полностью восстанавливала процессинг и секрецию инфликсимаба IgG (панель В). Активность SRP14, останавливающая элонгацию, возможно задерживает перемещение LC в ЭР в процессе трансляции ее мРНК (панель В, номер 1). Это, в свою очередь, будет способствовать правильному процессингу LC и ее правильному взаимодействию с осуществляющими фолдинг шаперонами в ЭР (панель В, номер 2). Поддержание вновь синтезированной LC в состоянии, позволяющем сборку IgG, таким образом, восстанавливает высокий выход секреции полностью собранных антител (панель В, номер 3).Model of folding and secretion of IgG by low-producing clones before (A) and after (B) overexpression of SRP/translocon subunits. The results obtained indicate that newly synthesized LC, produced by clones with low production capacity, is insufficiently processed and has incorrect folding. Insufficient processing of the infliximab LC signal peptide may lead to saturation of the ER cotranslational translocation machinery (panel A, number 1). Its aggregation in the ER within IgG-incapable aggregated forms of LC (panel A, number 2) causes ER stress and causes the formation of an autophagosome-like structure (panel A, number 3). Overexpression of SRP14 and other SRP/translocon protein components completely restored infliximab IgG processing and secretion (panel B). The elongation arresting activity of SRP14 probably delays the movement of LC into the ER during translation of its mRNA (panel B, number 1). This, in turn, will promote proper processing of LC and its proper interaction with folding chaperones in the ER (panel B, number 2). Maintaining the newly synthesized LC in a state that allows IgG assembly thus restores the high secretion yield of fully assembled antibodies (panel B, number 3).

Фиг. 13. Влияние подавления ГР и НГСК молекулами миРНК на экспрессию.Fig. 13. Effect of suppression of GR and NGSC by siRNA molecules on expression.

Кратность различий в проценте GFP-положительных клеток (по сравнению с клетками, трансфицированными контрольной плазмидой GFP, представленными на данной фигуре как 1,0), представляющем частоты событий рекомбинации в необработанных клетках (ложных), клетках, обработанных миРНК отрицательного контроля (миОтр), миРНК против факторов НГСК (миРНК против Ku70, Ku80 и каталитической субъединицы ДНК-зависимой протеинкиназы (миКu70+80+ДНК-ПКкс)) и миРНК против ГР (MnRad51). На дорожках GFP показан положительный контроль экспрессирующих GFP клеток. На дорожках, обозначенных «нерасщепленные ГР» и «нерасщепленные НГСК», показаны клетки отрицательного контроля, т.е. клетки, трансфицированные кольцевыми репортерными плазмидами ГР и НГСК. На дорожках, обозначенных «ГР I-Scel» и «НГСК I-Scel», представлены клетки, трансфицированные расщепленными Seel репортерными плазмидами, которые восстанавливают экспрессию GFP после репарации расщепления ДНК путем гомологичной рекомбинации или негомологичного соединения концов, соответственно. На данной фигуре показана эффективность ингибирования ГР или НГСК молекулами миРНК, о чем свидетельствует процент GFP-положительных клеток, который нормировали на процент dsRed-положительных клеток и выразили в виде кратности изменения относительно процента контрольных экспрессирующих GFP клеток, который приравняли к 1. Среднее значение для 3 экспериментов, усы показывают стандартную ошибку среднего. Статистическую значимость определяли с помощью непарного критерия Стьюдента; уровень значимости р<0,05 (*) и р<0,01 (**).Fold differences in the percentage of GFP-positive cells (compared to cells transfected with the control GFP plasmid, represented in this figure as 1.0), representing the frequencies of recombination events in untreated cells (mock), cells treated with negative control siRNA (miOtr), siRNA against NGSC factors (siRNA against Ku70, Ku80 and the catalytic subunit of DNA-dependent protein kinase (miKu70+80+DNA-PKx)) and siRNA against GR (MnRad51). The GFP lanes show the positive control of GFP-expressing cells. The lanes labeled “uncleaved GR” and “uncleaved NGSC” show negative control cells, i.e. cells transfected with circular reporter plasmids GR and NGSC. Lanes labeled “GR I-Scel” and “NGSC I-Scel” represent cells transfected with Seel-cleaved reporter plasmids that restore GFP expression after DNA cleavage repair by homologous recombination or nonhomologous end joining, respectively. This figure shows the efficiency of inhibition of GR or NGSC by siRNA molecules, as evidenced by the percentage of GFP-positive cells, which was normalized to the percentage of dsRed-positive cells and expressed as the fold change relative to the percentage of control GFP-expressing cells, which was set to 1. Mean value for 3 experiments, whiskers show the standard error of the mean. Statistical significance was determined using an unpaired Student's t test; significance level p<0.05 (*) and p<0.01 (**).

Фиг. 14. Влияние элементов MAR на подавление НГСК молекулами миРНК.Fig. 14. Influence of MAR elements on the suppression of NGSC by miRNA molecules.

Показана кратность повышения экспрессии и встраивания GFP в клетки СНО, обработанные молекулами миРНК, направленными против факторов НГСК, и повторно трансфицированные плазмидами GFP или MAR-GFP. Средняя флуоресценция GFP, число копий и флуоресценция на копию GFP показаны в виде кратности превышения результата, полученного для необработанных клеток (обозначенных как «ложные»), трансфицированных плазмидой GFP. А) Результаты проточной цитометрии, В) анализ числа копий GFP в геноме с помощью количественной ПЦР, С) средняя флуоресценция каждого встроенного гена GFP (рассчитанная для каждого эксперимента как отношение экспрессии к числу копий). Среднее значение для 3 или более экспериментов; статистическую значимость определяли с помощью непарного критерия Стьюдента. Звездочками указаны значимые различия между обработанным миРНК образцом и соответствующим необработанным контролем; уровни значимости: р<0,05 (*), р<0,01 (**); усы показывают стандартную ошибку среднего.The fold increase in GFP expression and incorporation in CHO cells treated with siRNA molecules directed against NGSC factors and re-transfected with GFP or MAR-GFP plasmids is shown. Average GFP fluorescence, copy number, and fluorescence per copy of GFP are shown as the fold excess of the result obtained for untreated cells (labeled “mock”) transfected with the GFP plasmid. A) Flow cytometry results, B) genomic GFP copy number analysis by qPCR, C) average fluorescence of each integrated GFP gene (calculated for each experiment as the ratio of expression to copy number). Average of 3 or more experiments; statistical significance was determined using an unpaired Student's t test. Asterisks indicate significant differences between the siRNA-treated sample and the corresponding untreated control; significance levels: p<0.05 (*), p<0.01 (**); whiskers indicate standard error of the mean.

Фиг. 15. Влияние элементов MAR на подавление ГР молекулами миРНК.Fig. 15. Influence of MAR elements on the suppression of GR by miRNA molecules.

Показана кратность повышения экспрессии и встраивания GFP в клетки СНО, обработанные молекулами миРНК, направленными против факторов ГР, и повторно трансфицированные плазмидами GFP или MAR-GFP. Средняя флуоресценция GFP, число копий и флуоресценция на копию GFP показаны в виде кратности превышения результата, полученного для необработанных клеток (обозначенных как «ложные»), трансфицированных плазмидой GFP. А) Результаты проточной цитометрии, В) анализ числа копий GFP в геноме с помощью количественной ПЦР, С) средняя флуоресценция каждого встроенного гена GFP (рассчитанная для каждого эксперимента как отношение экспрессии к числу копий). Среднее значение для 3 или более экспериментов; статистическую значимость определяли с помощью непарного критерия Стьюдента. Звездочками указаны значимые различия между обработанным миРНК образцом и соответствующим необработанным контролем; уровни значимости: р<0,05 (*), р<0,01 (**); усы показывают стандартную ошибку среднего.The fold increase in GFP expression and incorporation in CHO cells treated with siRNA molecules directed against GR factors and re-transfected with GFP or MAR-GFP plasmids is shown. Average GFP fluorescence, copy number, and fluorescence per copy of GFP are shown as the fold excess of the result obtained for untreated cells (labeled “mock”) transfected with the GFP plasmid. A) Flow cytometry results, B) genomic GFP copy number analysis by qPCR, C) average fluorescence of each integrated GFP gene (calculated for each experiment as the ratio of expression to copy number). Average of 3 or more experiments; statistical significance was determined using an unpaired Student's t test. Asterisks indicate significant differences between the siRNA-treated sample and the corresponding untreated control; significance levels: p<0.05 (*), p<0.01 (**); whiskers indicate standard error of the mean.

Фиг. 16. Влияние элементов MAR на подавление ОМСК молекулами миРНК.Fig. 16. Influence of MAR elements on the suppression of OSCs by siRNA molecules.

Показана экспрессия и встраивание GFP в клетки СНО, обработанные молекулами миРНК, направленными против факторов ОМСК (и некоторых факторов ГР), и повторно трансфицированные плазмидами GFP (А) или MAR-GFP (В). Средняя флуоресценция GFP, число копий и флуоресценция на копию GFP показаны в виде кратности превышения результата, полученного для необработанных клеток (обозначенных как «ложные»), трансфицированных плазмидой GFP. На фигурах показаны результаты проточной цитометрии. Показано среднее значение для количества экспериментов, указанных внизу под графиком. Клетки, трансфицированные миMDC1, экспрессировали GFP даже без MAR на уровне, в 11,8 раз превышающем таковой для клеток, не трансфицированных миMDC. Особенно хороших результатов также можно было добиться для некоторых плазмид, которые не содержали MAR, а именно, для миВаrd1 и миLigl.The expression and integration of GFP in CHO cells treated with siRNA molecules directed against OMC factors (and some GR factors) and re-transfected with GFP (A) or MAR-GFP (B) plasmids is shown. Average GFP fluorescence, copy number, and fluorescence per copy of GFP are shown as the fold excess of the result obtained for untreated cells (labeled “mock”) transfected with the GFP plasmid. The figures show the results of flow cytometry. Shown is the average for the number of experiments listed below the graph. Cells transfected with miMDC1 expressed GFP even without MAR at a level 11.8 times higher than that of cells not transfected with miMDC. Particularly good results could also be achieved for some plasmids that did not contain MAR, namely miBard1 and miLigl.

Фиг. 17. Влияние опосредованного миРНК подавления белка ГР.Fig. 17. Effect of siRNA-mediated suppression of GR protein.

На фигуре показано, что можно добиться более высокой экспрессии GFP и иммуноглобулина клетками СНО-М, стабильно экспрессирующими кшРНК, направленную против Rad51. Клетки СНО-М трансфицировали вектором экспрессии, полученным на основе транспозона PiggyBac, экспрессирующим кшРНК, направленную против Rad51, и полученную поликлональную популяцию клеток, а также клоны клеток, полученные из нее, повторно трансфицировали плазмидой, экспрессирующей GFP, наряду с исходными клетками СНО-М. Флуоресценцию GFP исходных СНО-М, популяции клеток, экспрессирующих Rad51-кшРНК, и полученных клонов оценивали через 10 дней после отбора на основании стабильной экспрессии гена GFP и гена устойчивости к пуромицину. Профили флуоресценции двух наиболее флуоресцирующих клонов показаны рядом с таковыми для объединенной популяции клеток и исходных клеток (А), а также процент клеток в секторах М1, М2 и М3 через 10 дней после отбора на основании устойчивости к пуромицину (В), который изображен на панели А в виде горизонтальных полос, отмеченных как 1, 2 и 3. Количественное соотношение клеток М3 с высоким уровнем экспрессии отслеживали в течение дополнительных 68 дней культивирования без селекции, чтобы показать, что можно получить более стабильную экспрессию на более высоком уровне в клонах клеток, экспрессирующих кшРНК, по сравнению с исходными клетками СНО-М (С). В качестве альтернативы, экспрессионными плазмидами, кодирующими легкие и тяжелые цепи антитела инфликсимаба, трансфицировали типичные клоны, и оценивали удельную продуктивность секретируемого иммуноглобулина после селекции в течение дополнительных трех недель культивирования без антибиотика.The figure shows that higher expression of GFP and immunoglobulin can be achieved by CHO-M cells stably expressing shRNA directed against Rad51. CHO-M cells were transfected with a PiggyBac transposon-derived expression vector expressing shRNA directed against Rad51, and the resulting polyclonal cell population, and the cell clones derived from it, were re-transfected with a plasmid expressing GFP along with the original CHO-M cells . GFP fluorescence of the original CHO-M, the population of cells expressing Rad51-shRNA, and the resulting clones was assessed 10 days after selection based on the stable expression of the GFP gene and the puromycin resistance gene. The fluorescence profiles of the two most fluorescent clones are shown next to those for the combined population of cells and parent cells (A), as well as the percentage of cells in the M1, M2 and M3 sectors 10 days after selection based on puromycin resistance (B), which is depicted in the panel A as horizontal bars labeled 1, 2, and 3. The proportion of high-expressing M3 cells was monitored for an additional 68 days of culture without selection to show that it was possible to obtain more stable, higher-level expression in clones of cells expressing shRNA compared to parental CHO-M cells (C). Alternatively, expression plasmids encoding the light and heavy chains of the infliximab antibody were transfected into representative clones, and the specific productivity of secreted immunoglobulin was assessed after selection for an additional three weeks of antibiotic-free culture.

Фиг. 18. Влияние различных рекомбинантных элементов MAR человека, расположенных в 3'-5' направлении, на процентиль клеток с высоким и очень высоким уровнем продукции (% М3/М2), которое оценивали с помощью анализа методом сортировки клеток с возбуждением флуоресценции (FACS) по флуоресценции GFP для двух конструкций MAR.Fig. 18. The effect of various recombinant human MAR elements located in the 3'-5' direction on the percentile of cells with high and very high production (% M3/M2), assessed using fluorescence-excited cell sorting (FACS) analysis. GFP fluorescence for two MAR constructs.

(А) Указанные элементы MAR представляли собой перестроенные производные MAR Х-29 (X_29R2 (SEQ ID NO: 9), X_29R3 (SEQ ID NO: 10)), MAR 1-42 (1_42R2Bis, 1_42R3), MAR 1-6 (1_6R2 (SEQ ID NO: 8), 1_6R3) или MAR 1-68 (1_68R2 (SEQ ID NO: 7)), о чем свидетельствуют названия указанных конструкций. (В) Типичные профили FACS, полученные для лучших расположенных в 3'-5' направлении элементов MAR (MAR 1_68R (SEQ ID NO: 6)).(A) The indicated MAR elements were rearranged derivatives of MAR X-29 (X_29R2 (SEQ ID NO: 9), X_29R3 (SEQ ID NO: 10)), MAR 1-42 (1_42R2Bis, 1_42R3), MAR 1-6 (1_6R2 (SEQ ID NO: 8), 1_6R3) or MAR 1-68 (1_68R2 (SEQ ID NO: 7)), as evidenced by the names of these structures. (B) Representative FACS profiles obtained for the best 3'-5' MAR elements (MAR 1_68R (SEQ ID NO: 6)).

Фиг. 19. Стабильность экспрессии для двух векторов MAR.Fig. 19. Stability of expression for two MAR vectors.

Поликлональные популяции, сконструированные из векторов, содержащих производные MAR 1_68R2, 1_6R2 и X_29R3, исследовали в течение 5 недель культивирования без селекции, и еженедельно оценивали флуоресценцию GFP на протяжении данного периода. Оценивали процентиль субпопуляции М3: элемент MAR 1_6R2, расположенный в 3'-5' направлении, и неперестроенный MAR 1-68, расположенный в 5'-3' направлении, представляли собой лучшую исследованную комбинацию для вектора с двумя элементами MAR. Также показаны субпопуляции М1 и М2.Polyclonal populations constructed from vectors containing MAR derivatives 1_68R2, 1_6R2 and X_29R3 were examined for 5 weeks of culture without selection, and GFP fluorescence was assessed weekly during this period. The percentile of the M3 subpopulation was assessed: MAR element 1_6R2, located in the 3'-5' direction, and unrearranged MAR 1-68, located in the 5'-3' direction, represented the best combination tested for a vector with two MAR elements. Subpopulations M1 and M2 are also shown.

Фиг. 20. Векторы экспрессии, содержащие единичный генетический элемент.Fig. 20. Expression vectors containing a single genetic element.

Исследовали MAR 1_68 и Х_29 и использовали их в комбинации с репликатором LmnB2. Элементы MAR расположили в 5'-3' направлении от кассеты экспрессии трансгена, и оценивали в анализе трансфекции трансгеном на протяжении двух месяцев. Поликлональную популяцию стабильно трансфицированных клеток подвергали отбору по устойчивости к антибиотику в течение двух недель и исследовали флуоресценцию GFP с помощью анализа методом сортировки клеток с возбуждением флуоресценции (FACS) в течение семи недель. Соотношение клеток М3 с высоким уровнем продукции показано на графике (А), тогда как на графике (В) показаны типичные профили FACS.MAR 1_68 and X_29 were studied and used in combination with the LmnB2 replicator. MAR elements were positioned in the 5'-3' direction of the transgene expression cassette and assessed in a transgene transfection assay over two months. A polyclonal population of stably transfected cells was subjected to antibiotic resistance selection for two weeks and examined for GFP fluorescence by fluorescence-excited cell sorting (FACS) analysis for seven weeks. The proportion of high-producing M3 cells is shown in graph (A), while graph (B) shows typical FACS profiles.

Фиг. 21. Векторы экспрессии, содержащие единичный генетический элемент Х-29.Fig. 21. Expression vectors containing a single genetic element X-29.

Анализ стабильности вектора Х_29: показали, что вектор экспрессии, содержащий единичный Х_29 в 5'-3' направлении от кассеты экспрессии, оказался стабильным и позволял получить очень высокую процентиль субпопуляций М2 и М3 даже через 14 недель культивирования (27 пассажей).Analysis of the stability of the X_29 vector: showed that the expression vector containing a single X_29 in the 5'-3' direction from the expression cassette was stable and made it possible to obtain a very high percentile of the M2 and M3 subpopulations even after 14 weeks of cultivation (27 passages).

Фиг. 22. Сравнительный анализ стабильно трансфицированных популяций СНО после 24 недель селекции антибиотиком.Fig. 22. Comparative analysis of stably transfected CHO populations after 24 weeks of antibiotic selection.

Вектор с единичным MAR Х_29, расположенным в 5'-3' направлении от кассеты экспрессии (Puro_CGAPD_GFP_гастрин_X29), повышает появление клеток, экспрессирующих высокий уровень GFP, а также стабильность экспрессии с течением времени по сравнению с вектором с двумя элементами MAR: с 1_6R2 в качестве MAR, расположенного в 3'-5' направлении, и 1_68 в качестве MAR, расположенного в 5'-3' направлении (Puro_1_6R2_CGAPD_GFP_гастрин_1_68).A vector with a single MAR X_29 located 5'-3' of the expression cassette (Puro_CGAPD_GFP_gastrin_X29) increases the appearance of cells expressing high levels of GFP, as well as the stability of expression over time, compared to a vector with two MAR elements: with 1_6R2 as MAR located in the 3'-5' direction, and 1_68 as a MAR located in the 5'-3' direction (Puro_1_6R2_CGAPD_GFP_gastrin_1_68).

ПОДРОБНОЕ ОПИСАНИЕ РАЗЛИЧНЫХ И ПРЕДПОЧТИТЕЛЬНЫХ ВАРИАНТОВ РЕАЛИЗАЦИИ НАСТОЯЩЕГО ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF VARIOUS AND PREFERRED EMBODIMENTS FOR IMPLEMENTING THE PRESENT INVENTION

Термин трансген, используемый в контексте настоящего изобретения, представляет собой изолированную последовательность дезоксирибонуклеотидов (ДНК), кодирующую данный зрелый белок (также называемую в данном тексте ДНК, кодирующей белок), предшественника белка или функциональную РНК, которая не кодирует белок (некодирующую РНК). Трансген выделяют и встраивают в клетку для получения продукта трансгена. Некоторые предпочтительные трансгены согласно настоящему изобретению представляют собой трансгены, кодирующие иммуноглобулины (Ig), Fc-слитые белки и другие белки, в частности, белки с терапевтической активностью ("биотерапевтические средства"). Например, некоторые иммуноглобулины, такие как инфликсимаб (ремикейд) или другие секретируемые белки, такие как фактор коагуляции VIII, достаточно трудно экспрессировать вследствие клеточных затруднений, преимущественно неохарактеризованных. С помощью рекомбинантных молекул нуклеиновых кислот, векторов и способов согласно настоящему изобретению данные затруднения можно обнаружить и/или раскрыть. Это, как правило, позволяет повысить количество терапевтических белков, которые можно получить, и/или их качество, например, их процессинг и гомогенность посттрансляционных модификаций, таких как гликозилирование.The term transgene, as used herein, is an isolated deoxyribonucleotide (DNA) sequence encoding a given mature protein (also referred to herein as protein-coding DNA), a protein precursor, or functional RNA that does not encode a protein (non-coding RNA). The transgene is isolated and inserted into a cell to produce the transgene product. Some preferred transgenes of the present invention are transgenes encoding immunoglobulins (Ig), Fc fusion proteins and other proteins, in particular proteins with therapeutic activity ("biotherapeutic agents"). For example, some immunoglobulins, such as infliximab (Remicade) or other secreted proteins, such as coagulation factor VIII, are quite difficult to express due to cellular difficulties, mostly uncharacterized. With the help of recombinant nucleic acid molecules, vectors and methods according to the present invention, these difficulties can be detected and/or solved. This typically improves the quantity of therapeutic proteins that can be produced and/or their quality, such as their processing and homogeneity of post-translational modifications such as glycosylation.

В данном тексте термин трансген не должен, в контексте ДНК, кодирующей белок, включать нетранскрибируемые, фланкирующие участки, такие как сигналы инициации транскрипции РНК, сайты полиаденилирования, промоторы или энхансеры. Другие предпочтительные трансгены включают последовательности ДНК, кодирующие функциональные РНК. Таким образом, термин трансген в контексте настоящего изобретения относится к последовательности ДНК, которую вводят в клетку, такую как эукариотическая клетка-хозяин, путем трансфекции (которая включает, в контексте настоящего изобретения, также трансдукцию, т.е., внедрение посредством вирусных векторов), и которая кодирует интересующий продукт, также называемый в данном тексте "продуктом экспрессии трансгена", например, "гетерологичными белками". Указанный трансген может быть функционально присоединен к последовательности, которая кодирует сигнальный пептид, который, в свою очередь, опосредует и/или способствует перемещению и/или секреции через эндоплазматический ретикулум и/или цитоплазматическую мембрану и удаляется до или в процессе секреции.As used herein, the term transgene shall not, in the context of protein-coding DNA, include nontranscribed flanking regions such as RNA transcription initiation signals, polyadenylation sites, promoters, or enhancers. Other preferred transgenes include DNA sequences encoding functional RNAs. Thus, the term transgene in the context of the present invention refers to a DNA sequence that is introduced into a cell, such as a eukaryotic host cell, by transfection (which also includes, in the context of the present invention, transduction, i.e., introduction through viral vectors) , and which encodes the product of interest, also referred to herein as a “transgene expression product,” eg, “heterologous proteins.” The transgene may be operably linked to a sequence that encodes a signal peptide, which in turn mediates and/or promotes movement and/or secretion across the endoplasmic reticulum and/or cytoplasmic membrane and is removed before or during secretion.

Малые интерферирующие РНК (миРНК) представляют собой двунитевые молекулы РНК, как правило, длиной 20-25 пар оснований, которые играют роль в РНК-интерференции (РНКи) путем интерференции с экспрессией определенных генов с комплементарной последовательностью нуклеотидов. миРНК можно непосредственно ввести в клетки или можно экспрессировать в клетке посредством вектора. Изолированная миРНК ТЕР, упоминаемая в данном тексте, представляет собой такую миРНК длиной 20-25 пар оснований, которую обычно вводят непосредственно в клетку, т.е., без экспрессии посредством нуклеиновой кислоты, которую внедрили в клетку.Small interfering RNAs (siRNAs) are double-stranded RNA molecules, typically 20-25 base pairs in length, that play a role in RNA interference (RNAi) by interfering with the expression of certain genes with complementary nucleotide sequences. siRNA can be directly introduced into cells or can be expressed in a cell via a vector. The isolated TEP siRNA referred to herein is a 20-25 base pair siRNA that is typically introduced directly into a cell, i.e., without expression by a nucleic acid that has been introduced into the cell.

Малая/короткая шпилечная РНК (кшРНК) представляет собой последовательность РНК, которая образует плотный шпилечный изгиб, который можно применять для замалчивания экспрессии целевого гена посредством РНКи. Экспрессию кшРНК в клетках обычно осуществляют путем доставки плазмид или вирусных векторов, таких как ретровирусные векторы. Для того, чтобы получить молекулы кшРНК, последовательность миРНК обычно модифицируют, чтобы ввести короткую петлю между двумя нитями миРНК. Нуклеиновую кислоту, кодирующую кшРНК, затем доставляют посредством вектора в клетку, и она транскрибируется в виде короткой шпилечной РНК (кшРНК), которую, возможно, дайсер обычным способом процессирует в функциональную миРНК.Small/short hairpin RNA (shRNA) is an RNA sequence that forms a tight hairpin bend that can be used to silence the expression of a target gene through RNAi. Expression of shRNAs in cells is usually accomplished by delivery of plasmids or viral vectors such as retroviral vectors. To produce shRNA molecules, the siRNA sequence is usually modified to introduce a short loop between two siRNA strands. The nucleic acid encoding the shRNA is then delivered via a vector into the cell, and it is transcribed as a short hairpin RNA (shRNA), which is possibly processed by the Dicer in the usual manner into functional siRNA.

Ми/кшРНК способна зависимым от последовательности способом снижать экспрессию целевого гена. КшРНК может гибридизоваться с участком транскрипта мРНК, кодирующего продукт целевого гена, тем самым ингибируя экспрессию целевого гена посредством РНК-интерференции. Бифункциональные кшРНК имеют больше одной мишени, например, кодирующую область, а также некоторые нетранслируемые области мРНК. Встраивание в геном клетки способствует длительному или конститутивному замалчиванию гена, которое может распространяться на дочерние клетки.Mi/shRNA is capable of reducing the expression of a target gene in a sequence-dependent manner. The shRNA can hybridize to a region of the mRNA transcript encoding the target gene product, thereby inhibiting the expression of the target gene through RNA interference. Bifunctional shRNAs have more than one target, such as the coding region as well as some untranslated regions of the mRNA. Incorporation into the cell genome promotes long-term or constitutive silencing of the gene, which can spread to daughter cells.

МикроРНК (миРНК) представляет собой малую молекулу РНК, например, длиной от 20 до 24 нуклеотидов, в частности, 22 нуклеотида, которая участвует в транскрипционной и посттранскрипционной регуляции экспрессии генов посредством спаривания с комплементарными последовательностями внутри мРНК. Замалчивание гена может происходить либо путем ингибирования транскрипции трансгена, либо путем деградации мРНК, либо путем предотвращения трансляции мРНК. МикроРНК можно экспрессировать путем доставки плазмид или вирусных векторов, таких как ретровирусные векторы. В качестве альтернативы, можно синтезировать молекулы РНК, ингибирующие или имитирующие микроРНК, и непосредственно трансфицировать ими клетки.A microRNA (miRNA) is a small RNA molecule, e.g., 20 to 24 nucleotides in length, particularly 22 nucleotides, that is involved in the transcriptional and posttranscriptional regulation of gene expression by pairing with complementary sequences within the mRNA. Gene silencing can occur either by inhibiting the transcription of the transgene, by degrading the mRNA, or by preventing the translation of the mRNA. MicroRNAs can be expressed by delivery of plasmids or viral vectors such as retroviral vectors. Alternatively, RNA molecules that inhibit or mimic miRNAs can be synthesized and directly transfected into cells.

"Последовательность, кодирующая белок экспрессии/процессинга трансгена (ТЕР) или функциональную РНК ТЕР" позволяет экспрессировать или экспрессировать на повышенном уровне данный белок ТЕР после его переноса в клетку, тогда как последовательность, кодирующая некодирующие функциональные молекулы РНК, ингибирует экспрессию клеточных белков, соответственно. Белки ТЕР могут быть идентичны или аналогичны клеточным белкам, или они могут представлять собой белки из отличной клетки или вида. Клеточные белки, экспрессия которых, например, ингибируется функциональными молекулами РНК, представляют собой конститутивные белки клетки, в которую ввели функциональные молекулы РНК. Белок ТЕР также может дополнять экспрессию другого клеточного белка и, в результате, предпочтительно, повышает экспрессию трансгена. Указанные белки могут участвовать в рекомбинации; в процессах трансляции мРНК; в перемещении в ЭР, секреции, процессинге или фолдинге полипептидов, в транспорте ЭР-Гольджи-плазматическая мембрана, в гликозилировании и/или другой посттрансляционной модификации. Функциональные молекулы РНК включают, например, миРНК, кшРНК, микроРНК, сплайсированную в форме лассо РНК, малую временную смысловую РНК (мвРНК), антисмысловую РНК (аРНК), РНК рибозима и другие РНК, в частности, такие, которые могут подавлять экспрессию целевого гена. В особо предпочтительном варианте реализации данные белки вовлечены в "путь секреции белка" или в "пути рекомбинации", но также включают некоторые белки процессинга белка или метаболические белки, описанные ниже.A “transgene expression/processing protein (TEP) or functional TEP RNA coding sequence” allows the TEP protein to be expressed or overexpressed after its transfer into a cell, whereas a sequence coding for non-coding functional RNA molecules inhibits the expression of cellular proteins, respectively. TEP proteins may be identical or similar to cellular proteins, or they may be proteins from a different cell or species. Cellular proteins whose expression is, for example, inhibited by functional RNA molecules are constitutive proteins of the cell into which the functional RNA molecules have been introduced. The TEP protein can also complement the expression of another cellular protein and, as a result, preferentially enhances the expression of the transgene. These proteins may be involved in recombination; in the processes of mRNA translation; in ER trafficking, secretion, processing or folding of polypeptides, ER-Golgi-plasma membrane transport, glycosylation and/or other post-translational modification. Functional RNA molecules include, for example, siRNA, shRNA, microRNA, lasso-spliced RNA, small sense RNA (svRNA), antisense RNA (aRNA), ribozyme RNA, and other RNAs, particularly those that can repress the expression of a target gene. . In a particularly preferred embodiment, these proteins are involved in the "protein secretion pathway" or "recombination pathway", but also include some protein processing proteins or metabolic proteins described below.

Функциональные РНК ТЕР можно не только экспрессировать с последовательности нуклеиновой кислоты, описанной выше, но их можно непосредственно ввести в клетку. Это, в частности, справедливо для изолированных миРНК ТЕР.Functional TEP RNAs can not only be expressed from the nucleic acid sequence described above, but they can be directly introduced into a cell. This is particularly true for isolated TEP siRNAs.

Термин "изолированная молекула нуклеиновой кислоты" в контексте настоящего изобретения эквивалентен термину "рекомбинантная молекула нуклеиновой кислоты", т.е. молекула нуклеиновой кислоты, которая не существует в данной форме в природе, но которую сконструировали из частей, которые существуют в природе.The term "isolated nucleic acid molecule" in the context of the present invention is equivalent to the term "recombinant nucleic acid molecule", i.e. a nucleic acid molecule that does not exist in a given form in nature, but which has been constructed from parts that exist in nature.

Последовательность нуклеиновой кислоты, такая как ДНК или РНК, комплементарна другой ДНК или РНК, если нуклеотиды, например, из двух нитей однонитевых ДНК или двух нитей однонитевых РНК, могут образовывать стабильные водородные связи, например, водородную связь между гуанином (G) и цитозином (С). В клетке комплементарное спаривание оснований позволяет, например, клеткам копировать информацию от одного поколения к другому. При РНК-интерференции (РНКи) комплементарное спаривание оснований позволяет замалчивание или полный нокаут некоторых целевых генов. По существу, последовательность миРНК, кшРНК или микроРНК специфично снижает или нарушает экспрессию целевого гена путем выравнивания одинарной нити РНК (например, антисмысловой нити в миРНК) с РНК, в частности, мРНК клетки-хозяина. Степень комплементарности между двумя нитями нуклеиновой кислоты может изменяться от полной комплементарности (каждый нуклеотид напротив противоположного) до частичной комплементарности (50%, 60%, 70%, 80%, 90% или 95%). Степень комплементарности определяет стабильность комплекса и, таким образом, то, насколько успешно ген можно, например, нокаутировать. Таким образом, полная или по меньшей мере 95% комплементарность является предпочтительной.A nucleic acid sequence, such as DNA or RNA, is complementary to another DNA or RNA if the nucleotides, such as two strands of single-stranded DNA or two strands of single-stranded RNA, can form stable hydrogen bonds, such as the hydrogen bond between guanine (G) and cytosine ( WITH). In a cell, complementary base pairing allows cells, for example, to copy information from one generation to the next. In RNA interference (RNAi), complementary base pairing allows the silencing or complete knockout of some target genes. Essentially, a siRNA, shRNA, or microRNA sequence specifically reduces or disrupts the expression of a target gene by aligning a single strand of RNA (eg, an antisense strand in a siRNA) with RNA, particularly host cell mRNA. The degree of complementarity between two strands of nucleic acid can vary from complete complementarity (each nucleotide opposite its opposite) to partial complementarity (50%, 60%, 70%, 80%, 90% or 95%). The degree of complementarity determines the stability of the complex and thus how successfully a gene can, for example, be knocked out. Thus, complete or at least 95% complementarity is preferred.

Активность молекул миРНК при РНКи в значительной мере зависит от их способности связываться с индуцируемым РНК комплексом сайленсинга (RISC). За связыванием дуплекса миРНК с RISC следует разворачивание и расщепление смысловой нити эндонуклеазами. Оставшийся комплекс антисмысловая нить-RISC затем может связываться с целевыми мРНК для инициации замалчивания транскрипции.The RNAi activity of siRNA molecules largely depends on their ability to bind to the RNA-inducible silencing complex (RISC). Binding of the siRNA duplex to RISC is followed by unfolding and cleavage of the sense strand by endonucleases. The remaining antisense strand-RISC complex can then bind to target mRNAs to initiate transcriptional silencing.

В контексте настоящего изобретения трансгены, определение которых приведено выше, экспрессируют, как правило, белки, которые желательно получить в больших количествах, например, для применения в фармацевтике, тогда как последовательности, кодирующие белки ТЕР/функциональные РНК ТЕР, или сами функциональные молекулы РНК, разработаны таким образом, чтобы помогать экспрессии таких трансгенов либо непосредственно, либо опосредованно. "Типичный перечень белков ТЕР, экспрессированных с применением векторов, несущих транспозоны", приведен в таблице А. Для специалиста в данной области должно быть очевидно, что огромное количество таких белков было описано в данной области, и в таблице А представлены как идентификационные номера последовательностей NCBI для соответствующих белков, так и последовательности нуклеиновых кислот, кодирующие их. В последней колонке приведены идентификаторы последовательностей для некоторых из данных последовательностей. Для специалиста в данной области должно быть очевидно, что варианты белков, а также последовательности, идентичные им более чем на 80%, 90%, 95% или 98%, входят в объем настоящего изобретения.In the context of the present invention, transgenes, as defined above, typically express proteins that are desirable to be produced in large quantities, for example, for pharmaceutical use, while the sequences encoding TEP proteins/functional TEP RNAs, or the functional RNA molecules themselves, designed to aid the expression of such transgenes either directly or indirectly. A "typical list of TEP proteins expressed using transposon-carrying vectors" is given in Table A. It will be apparent to one skilled in the art that a large number of such proteins have been described in the art and are presented in Table A as NCBI sequence identification numbers for the corresponding proteins, and the nucleic acid sequences encoding them. The last column lists the sequence identifiers for some of these sequences. It will be apparent to one skilled in the art that protein variants, as well as sequences that are more than 80%, 90%, 95% or 98% identical, are within the scope of the present invention.

"Типичный перечень кшРНК, экспрессируемых с применением, например, определенных векторов, несущих транспозоны piggybac", приведен в таблице В. Для специалиста в данной области должно быть очевидно, что такие кшРНК можно легко сконструировать после того, как выбран целевой ген. Например, любой из известных генов пути рекомбинации представляет собой готовый целевой ген. Тем не менее, другие гены, такие как гены, кодирующие белки, представленные в таблице А, могут представлять собой готовые мишени для миРНК, полученных из таких кшРНК. Таблица С представляет собой перечень примеров миРНК (смысловая нить) и примеров кшРНК, полученных из соответствующих миРНК. Антисмысловую нить миРНК в конечном счете применяют, чтобы блокировать и/или вызвать деградацию клеточной мРНК. Это, как правило, приводит к снижению уровней белка, кодируемого указанной мРНК.A "typical list of shRNAs expressed using, for example, certain vectors carrying piggybac transposons" is shown in Table B. It will be apparent to one skilled in the art that such shRNAs can be easily constructed once the target gene is selected. For example, any of the known recombination pathway genes is a ready-made target gene. However, other genes, such as the protein-coding genes shown in Table A, may represent ready targets for siRNAs derived from such shRNAs. Table C is a list of examples of miRNAs (sense strand) and examples of shRNAs derived from the corresponding miRNAs. The antisense strand of siRNA is ultimately used to block and/or cause degradation of cellular mRNA. This typically results in a decrease in the levels of the protein encoded by said mRNA.

Идентичность означает степень родства между двумя последовательностями нуклеотидов, которую определяют по идентичности пар между двумя нитями таких последовательностей, например, целой и полной последовательности. Идентичность можно легко рассчитать. Несмотря на то, что существует множество способов измерения идентичности между двумя последовательностями нуклеотидов, термин "идентичность" хорошо известен квалифицированным специалистам (Computational Molecular Biology, Lesk, A.M., ред., Oxford University Press, Нью-Йорк, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., ред., Academic Press, Нью-Йорк, 1993; Computer Analysis of Sequence Data, часть I, Griffin, A. M., и Griffin, H. G., ред., Human Press, Нью-Джерси, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; и Sequence Analysis Primer, Gribskov, M. и Devereux, J., ред., M Stockton Press, Нью-Йорк, 1991). Способы, широко используемые для определения идентичности между двумя последовательностями, включают, но не ограничены способами, описанными в Guide to Huge Computers, Martin J. Bishop, ред., Academic Press, Сан-Диего, 1994, и Carillo, H., и Lipman, D., SIAM J Applied Math. 48: 1073 (1988). Разработаны предпочтительные способы определения идентичности, чтобы получить наибольшие совпадения между двумя исследуемыми последовательностями. Такие способы закодированы в компьютерных программах. Предпочтительные способы на основе компьютерных программ для определения идентичности между двумя последовательностями включают, но не ограничены пакетом программ GCG (Genetics Computer Group, Мэдисон, Висконсин) (Devereux, J., и др., Nucleic Acids Research 12(1). 387 (1984)), BLASTP, BLASTN, FASTA (Altschul и др. (1990); Altschul и др. (1997)). Хорошо известный алгоритм Smith Waterman также можно применять для определения идентичности.Identity refers to the degree of relatedness between two nucleotide sequences, which is determined by the identity of pairs between two strands of such sequences, for example, a whole sequence and a complete sequence. Identity can be easily calculated. Although there are many ways to measure identity between two nucleotide sequences, the term "identity" is well known to those skilled in the art (Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D. W., eds., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A. M., and Griffin, H. G., eds., Human Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; and Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991). Methods commonly used to determine identity between two sequences include, but are not limited to, those described in Guide to Huge Computers, Martin J. Bishop, ed., Academic Press, San Diego, 1994, and Carillo, H., and Lipman , D., SIAM J Applied Math. 48: 1073 (1988). Preferred methods for determining identity have been developed to obtain the highest matches between two sequences of interest. Such methods are encoded in computer programs. Preferred computer program-based methods for determining identity between two sequences include, but are not limited to, the GCG (Genetics Computer Group, Madison, Wis.) software package (Devereux, J., et al., Nucleic Acids Research 12(1). 387 (1984 )), BLASTP, BLASTN, FASTA (Altschul et al. (1990); Altschul et al. (1997)). The well-known Smith Waterman algorithm can also be used to determine identity.

В качестве примера, нуклеиновая кислота, включающая последовательность нуклеотидов, "идентичную" по меньшей мере, например, на 95% эталонной последовательности нуклеотидов, означает, что последовательность нуклеотидов нуклеиновой кислоты идентична эталонной последовательности за исключением того, что указанная последовательность нуклеотидов может содержать до пяти точечных мутаций на каждые 100 нуклеотидов эталонной последовательности нуклеотидов. Другими словами, чтобы получить последовательность нуклеотидов, по меньшей мере на 95% идентичную эталонной последовательности нуклеотидов, до 5% нуклеотидов в указанной эталонной последовательности можно удалить или заменить на другой нуклеотид, или множество нуклеотидов, составляющее до 5% от всех нуклеотидов в эталонной последовательности, можно вставить в эталонную последовательность. Данные мутации эталонной последовательности могут встречаться в 5'- или 3'-концевых положениях эталонной последовательности нуклеотидов или в любом месте между этими концевыми положениями, либо разбросанные отдельно среди нуклеотидов в эталонной последовательности, либо расположенные в одной или более непрерывных группах внутри эталонной последовательности. Идентичности последовательностей более чем на приблизительно 60%, приблизительно 70%, приблизительно 75%, приблизительно 85% или приблизительно 90% для любой последовательности, описанной в данной заявке (например, путем указания SEQ ID и/или номера доступа), также входят в объем настоящего изобретения.As an example, a nucleic acid comprising a nucleotide sequence that is at least 95% identical to, for example, a reference nucleotide sequence means that the nucleic acid nucleotide sequence is identical to the reference sequence except that said nucleotide sequence may contain up to five point mutations for every 100 nucleotides of the reference nucleotide sequence. In other words, to obtain a nucleotide sequence that is at least 95% identical to a reference nucleotide sequence, up to 5% of the nucleotides in the reference sequence may be deleted or replaced by another nucleotide, or a plurality of nucleotides constituting up to 5% of all nucleotides in the reference sequence, can be inserted into the reference sequence. These reference sequence mutations may occur at the 5' or 3' terminal positions of the reference nucleotide sequence or anywhere between these terminal positions, either scattered individually among the nucleotides in the reference sequence or located in one or more contiguous groups within the reference sequence. Sequence identities of greater than about 60%, about 70%, about 75%, about 85%, or about 90% to any sequence described herein (e.g., by SEQ ID and/or accession number) are also included in the scope of the present invention.

Последовательность нуклеиновой кислоты, по существу идентичная другой последовательности нуклеиновой кислоты, относится к последовательности, содержащей точечные мутации, делеции или вставки в последовательности, которые не оказывают или оказывают несущественное влияние на соответствующий описанный способ и часто представлены одной, двумя, тремя или четырьмя мутациями на 100 п.о.A nucleic acid sequence substantially identical to another nucleic acid sequence refers to a sequence containing point mutations, deletions or insertions in the sequence that have no or negligible effect on the respective method described and are often represented by one, two, three or four mutations per 100 By.

Настоящее изобретение относится к вариантам как полинукпеотида, так и полипептида. "Вариант" относится к полинуклеотиду или полипептиду, отличающемуся от описанного полинукпеотида или полипептида, но сохранившему его существенные свойства. Как правило, варианты в целом очень сходны и на многих участках идентичны полинуклеотиду или полипептиду согласно настоящему изобретению. Указанные варианты могут включать изменения в кодирующих областях, некодирующих областях или в обоих указанных типах областей. Особенно предпочтительны полинуклеотидные варианты, включающие изменения, которые вызывают молчащие замены, вставки или делеции, но не изменяют свойства или активности кодированного полипептида. Нуклеотидные варианты, полученные путем молчащих замен, вследствие вырожденности генетического кода, являются предпочтительными. Более того, варианты, в которых 5-10, 1-5 или 1-2 аминокислоты, описанные в данной заявке, заменены, удалены или вставлены в любой комбинации, также предпочтительны. В объем настоящего изобретения также входят аллельные варианты указанных полинуклеотидов. Аллельный вариант обозначает любую из двух или более альтернативных форм гена, занимающих один и тот же хромосомный локус. Аллельная вариация в природе возникает в результате мутации и может приводить к полиморфизму внутри популяции. Мутации в гене могут быть молчащими (без изменений в кодируемом полипептиде) или могут кодировать полипептиды, последовательности аминокислот которых изменены. Аллельный вариант полипептида представляет собой полипептид, кодируемый аллельным вариантом гена. Варианты любых из молекул нуклеиновых кислот, описанных в данной заявке, входят в объем настоящего изобретения.The present invention relates to both polynucleotide and polypeptide variants. "Variant" refers to a polynucleotide or polypeptide that differs from the described polynucleotide or polypeptide but retains its essential properties. Typically, the variants are generally very similar and in many areas identical to the polynucleotide or polypeptide of the present invention. These variations may include changes in coding regions, non-coding regions, or both. Particularly preferred are polynucleotide variants comprising changes that cause silent substitutions, insertions or deletions but do not alter the properties or activity of the encoded polypeptide. Nucleotide variants obtained by silent substitutions, due to the degeneracy of the genetic code, are preferred. Moreover, variants in which 5-10, 1-5 or 1-2 amino acids described herein are replaced, deleted or inserted in any combination are also preferred. The present invention also includes allelic variants of these polynucleotides. An allelic variant refers to any of two or more alternative forms of a gene occupying the same chromosomal locus. Allelic variation in nature occurs as a result of mutation and can lead to polymorphism within a population. Mutations in a gene may be silent (without changes in the encoded polypeptide) or may encode polypeptides whose amino acid sequences are changed. An allelic variant polypeptide is a polypeptide encoded by an allelic variant of a gene. Variants of any of the nucleic acid molecules described in this application are included in the scope of the present invention.

Последовательность промотора или сам промотор представляет собой последовательность нуклеиновой кислоты, которая узнается клеткой-хозяином для экспрессии определенной последовательности нуклеиновой кислоты. Последовательность промотора включает последовательности, контролирующие транскрипцию, которые регулируют экспрессию указанного полинукпеотида. Промотор может представлять собой любую последовательность нуклеиновой кислоты, которая проявляет транскрипционную активность в выбранной клетке хозяина, включая мутантные, укороченные и гибридные промоторы, и его можно получить из генов, кодирующих внеклеточные или внутриклеточные полипептиды, либо гомологичные, либо гетерологичные для клетки хозяина. Промоторы согласно настоящему изобретению включают индуцируемые и неиндуцируемые промоторы. Последовательность нуклеиновой кислоты находится под контролем промотора, когда промотор выполняет свою функцию на указанной нуклеиновой кислоте.A promoter sequence, or the promoter itself, is a nucleic acid sequence that is recognized by a host cell to express a specific nucleic acid sequence. The promoter sequence includes transcription control sequences that regulate the expression of the specified polynucleotide. A promoter can be any nucleic acid sequence that exhibits transcriptional activity in a selected host cell, including mutant, truncated, and hybrid promoters, and can be derived from genes encoding extracellular or intracellular polypeptides, either homologous or heterologous to the host cell. The promoters of the present invention include inducible and non-inducible promoters. A nucleic acid sequence is under the control of a promoter when the promoter performs its function on said nucleic acid.

CGAPDH (также называемый в данном тексте C_GAPDH) представляет собой слитые энхансер и промотор, которые включают промотор GAPDH человека и энхансер немедленно-раннего гена CMV человека. В одном варианте реализации для его получения промотор GAPDH человека и его 5'-нетранслируемую область (НТО) амплифицировали путем ПЦР из геномной ДНК клеток НЕК293 человека. Полученный продукт помещали в 5'-3' направлении от энхансера немедленно-раннего гена CMV человека. См. пример последовательности в SEQ ID NO: 11. Последовательности, которые на по меньшей мере 80%, 90%, 95%, 98%, 99% или 100% идентичны последовательности SEQ ID NO: 11, также входят в объем настоящего изобретения. Другой желательный промотор(ы) и/или энхансер(ы) или продукты их слияния представляют собой, но не ограничены перечисленными: энхансер немедленно-раннего гена CMV человека, промотор GAPDH человека, промотор EFI-альфа человека, промотор CMV, промотор SV40, промотор Actb СНО или промотор HspaS СНО. Данные элементы хорошо известны в данной области, и примеры последовательностей перечислены в SEQ ID NO: 110-116. Для специалиста в данной области должно быть очевидно, что их варианты также входят в объем настоящего изобретения, также, как и элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична любой из последовательностей SEQ ID NO: 110-116.CGAPDH (also referred to herein as C_GAPDH) is an enhancer-promoter fusion that includes the human GAPDH promoter and the human CMV immediate-early gene enhancer. In one embodiment, to obtain it, the human GAPDH promoter and its 5' untranslated region (UTR) were amplified by PCR from genomic DNA of human HEK293 cells. The resulting product was placed in the 5'-3' direction of the human CMV immediate-early gene enhancer. See the example sequence in SEQ ID NO: 11. Sequences that are at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence of SEQ ID NO: 11 are also within the scope of the present invention. Other desirable promoter(s) and/or enhancer(s) or fusion products thereof include, but are not limited to: human CMV immediate early gene enhancer, human GAPDH promoter, human EFI-alpha promoter, CMV promoter, SV40 promoter, Actb CHO or HspaS CHO promoter. These elements are well known in the art, and example sequences are listed in SEQ ID NOs: 110-116. It will be apparent to one skilled in the art that variants thereof are also within the scope of the present invention, as is an element which is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical to any from SEQ ID NO: 110-116.

"Транспозон" представляет собой мобильный генетический элемент, который эффективно перемещается между векторами и хромосомами с помощью механизма "вырезать и вставить" или "копировать и вставить". В процессе транспозиции транспозаза (например, транспозаза РВ в системе транспозона PiggyBac) узнает транспозон-специфичные последовательности инвертированных концевых повторов (ITR), расположенные на обоих концах транспозона (существуют 5'- и а 3'-ITR в любой системе транспозона), перемещает содержимое из исходных сайтов и встраивает их в хромосомные сайты, такие как хромосомные сайты ТТАА. Мощная активность системы транспозона PiggyBac позволяет легко перемещать интересующие гены, расположенные между двумя ITR, в целевые геномы. Система транспозона PiggyBac описана, например, в 2010/0154070, которая полностью включена в данную заявку посредством ссылки.A "transposon" is a mobile genetic element that moves efficiently between vectors and chromosomes using a "cut and paste" or "copy and paste" mechanism. During the process of transposition, a transposase (for example, transposase PB in the PiggyBac transposon system) recognizes transposon-specific inverted terminal repeat (ITR) sequences located at both ends of the transposon (there are 5' and 3' ITRs in any transposon system), moves the contents from source sites and inserts them into chromosomal sites, such as the TTAA chromosomal sites. The powerful activity of the PiggyBac transposon system allows genes of interest located between two ITRs to be easily moved into target genomes. The PiggyBac transposon system is described, for example, in 2010/0154070, which is incorporated herein by reference in its entirety.

Элементы MAR (конструкции MAR, последовательности MAR, S/MAR или просто MAR) принадлежат к более широкой группе эпигенетических регуляторных элементов, которые также включают граничные или инсуляторные элементы, такие как cHS4, регуляторные области локусов (LCR), стабилизирующие и антирепрессорные (STAR) элементы, универсальные элементы, открывающие хроматин (UCOE), или модификаторы гистонов, такие как гистоновая дезацетилаза (HDAC).MAR elements (MAR constructs, MAR sequences, S/MAR, or simply MAR) belong to a broader group of epigenetic regulatory elements that also include boundary or insulator elements such as cHS4, loci regulatory regions (LCR), stabilizing and antirepressor (STAR) regions. elements, universal chromatin opening elements (UCOE), or histone modifiers such as histone deacetylase (HDAC).

Элементы MAR могут быть определены на основании идентифицированного MAR, на котором они первично основаны: конструкция MAR S4, соответственно, представляет собой элементы MAR, большинство нуклеотидов которых (50% и более, предпочтительно 60%, 70% или 80%) основаны на MAR S4. Некоторые простые мотивы последовательности, такие как мотивы с высоким содержанием А и Т, часто обнаруживают внутри элементов MAR. Другие широко распространенные мотивы представляют собой мотивы А-бокс, Т-бокс, мотивы раскручивания спирали ДНК, сайты связывания SATB1 (Н-бокс, А/Т/С25) и консенсусные сайты топоизомеразы II для позвоночных или дрозофилы.MAR elements can be defined based on the identified MAR on which they are primarily based: a MAR S4 construct is accordingly MAR elements whose majority of nucleotides (50% or more, preferably 60%, 70% or 80%) are based on MAR S4 . Some simple sequence motifs, such as A- and T-rich motifs, are often found within MAR elements. Other common motifs are A-box, T-box, DNA unwinding motifs, SATB1 binding sites (H-box, A/T/C25) and vertebrate or Drosophila topoisomerase II consensus sites.

MAR, как правило, описывают как последовательности в ДНК эукариотических хромосом, к которым присоединяется ядерный матрикс. Свойства MAR лишь отчасти определяются их первичной структурой. Например, известно, что типичная первичная структура, обнаруженная в элементах MAR, таких как АТ-богатые области, приводит к образованию третичных структур, а именно, некоторых изгибов, которые определяют функцию MAR. Таким образом, MAR часто определяют не только по их первичной структуре, но также по их вторичной, третичной структуре, например, степени их изогнутости и/или физическим свойствам, таким как температура плавления.MARs are generally described as sequences in the DNA of eukaryotic chromosomes to which the nuclear matrix is attached. The properties of MARs are only partly determined by their primary structure. For example, it is known that the typical primary structure found in MAR elements, such as AT-rich regions, leads to the formation of tertiary structures, namely some of the bends, which determine MAR function. Thus, MARs are often defined not only by their primary structure, but also by their secondary, tertiary structure, such as their degree of curvature and/or physical properties such as melting point.

Обогащенная АТ/ТА-динуклеотидами область изгиба ДНК (здесь и далее называемая "АТ-богатой областью"), обнаруживаемая в большинстве элементов MAR, представляет собой область изгиба ДНК, содержащую большое количество А и Т, в частности, в виде динуклеотидов AT и ТА. В предпочтительном варианте реализации она содержит по меньшей мере 10% динуклеотида ТА, и/или по меньшей мере 12% динуклеотида AT на участке из 100 непрерывных пар оснований, предпочтительно, по меньшей мере 33% динуклеотида ТА, и/или по меньшей мере 33% динуклеотида AT на участке из 100 непрерывных пар оснований (или на соответствующем более коротком участке при меньшей длине АТ-богатой области), и при этом имеет изогнутую вторичную структуру. Тем не менее, "АТ-богатые области" могут быть настолько короткими, как приблизительно 30 нуклеотидов или менее, но предпочтительно их длина составляет приблизительно 50 нуклеотидов, приблизительно 75 нуклеотидов, приблизительно 100 нуклеотидов, приблизительно 150, приблизительно 200, приблизительно 250, приблизительно 300, приблизительно 350 или приблизительно 400 нуклеотидов или более.The AT/TA dinucleotide-rich DNA bend region (hereinafter referred to as the “AT-rich region”), found in most MAR elements, is a DNA bend region containing large amounts of A and T, particularly in the form of AT and TA dinucleotides . In a preferred embodiment, it contains at least 10% TA dinucleotide and/or at least 12% AT dinucleotide over a region of 100 contiguous base pairs, preferably at least 33% TA dinucleotide and/or at least 33% AT dinucleotide over a region of 100 contiguous base pairs (or a corresponding shorter region if the AT-rich region is shorter), and has a curved secondary structure. However, the "AT-rich regions" can be as short as about 30 nucleotides or less, but preferably their length is about 50 nucleotides, about 75 nucleotides, about 100 nucleotides, about 150, about 200, about 250, about 300 , about 350 or about 400 nucleotides or more.

Некоторые сайты связывания также часто имеют относительно высокое содержание А и Т, такие как сайты связывания SATB1 (Н-бокс, А/Т/С25) и консенсусные сайты топоизомеразы II для позвоночных (RNYNNCNNGYNGKTNYNY) или дрозофилы (GTNWAYATTNATNNR). Тем не менее, область сайта связывания (модуль), в частности, область TFBS, которая содержит кластер сайтов связывания, можно легко отличить от областей, обогащенных динуклеотидами AT и ТА ("АТ-богатых областей"), от элементов MAR, богатых содержанием А и Т, путем сравнения паттерна кривизны указанных областей. Например, средняя степень кривизны MAR 1_68 человека может превышать приблизительно 3,8 или приблизительно 4,0, тогда как средняя степень кривизны участка TFBS может быть ниже приблизительно 3,5 или приблизительно 3,3. Области идентифицированного MAR также можно подтвердить с помощью альтернативных способов, таких как, но не ограничиваясь определением относительных температур плавления, описанных в других местах в данной заявке. Тем не менее, такие значения видоспецифичны и, следовательно, могут изменяться от вида к виду и могут, например, быть ниже. Таким образом, градусы кривизны соответствующих областей, богатых динуклеотидами AT и ТА, могут быть ниже, например, от приблизительно 3,2 до приблизительно 3,4, или от приблизительно 3,4 до приблизительно 3,6, или от приблизительно 3,6 до приблизительно 3,8, и градусы кривизны областей TFBS могут быть пропорционально ниже, например, ниже приблизительно 2,7, ниже приблизительно 2,9, ниже приблизительно 3,1, ниже приблизительно 3,3. Квалифицированный специалист выберет, соответственно, меньшие размеры окна в программе SMAR Scan II.Some binding sites also often have relatively high A and T content, such as SATB1 binding sites (H-box, A/T/C25) and topoisomerase II consensus sites for vertebrates (RNYNNCNNGYNGKTNYNY) or Drosophila (GTNWAYATTNATNNR). However, the binding site region (module), in particular the TFBS region, which contains a cluster of binding sites, can be easily distinguished from regions enriched in AT and TA dinucleotides ("AT-rich regions"), from MAR elements rich in A content and T, by comparing the curvature pattern of the specified areas. For example, the average degree of curvature of a human MAR 1_68 may be greater than about 3.8 or about 4.0, whereas the average degree of curvature of a TFBS region may be less than about 3.5 or about 3.3. The areas of identified MAR can also be confirmed using alternative methods, such as, but not limited to, determination of relative melting temperatures described elsewhere in this application. However, such values are species specific and therefore may vary from species to species and may, for example, be lower. Thus, the degrees of curvature of the corresponding AT and TA dinucleotide-rich regions may be lower, for example, from about 3.2 to about 3.4, or from about 3.4 to about 3.6, or from about 3.6 to about 3.8, and the degrees of curvature of the TFBS regions may be proportionally lower, for example, lower than about 2.7, lower than about 2.9, lower than about 3.1, lower than about 3.3. A qualified technician will select correspondingly smaller window sizes in the SMAR Scan II program.

Элемент MAR, конструкция MAR, последовательность MAR, S/MAR или просто MAR согласно настоящему изобретению представляет собой последовательность нуклеотидов, одно или более (например, два, три или четыре) свойств которой, таких как описанные выше, аналогичны таковым у встречающихся в природе "SAR" или "MAR". Предпочтительно у такого элемента MAR, конструкции MAR, последовательности MAR, S/MAR или просто MAR по меньшей мере одно свойство способствует экспрессии белка любого гена, находящегося под влиянием указанного MAR. Элемент MAR, как правило, также обладает свойством изолированной и/или очищенной нуклеиновой кислоты, предпочтительно проявляющей активность MAR, в частности, проявляющей активность модуляции транскрипции, предпочтительно активность усиления транскрипции, но также проявляющей, например, активность стабилизации экспрессии и/или другие активности.A MAR element, MAR construct, MAR sequence, S/MAR, or simply MAR according to the present invention is a sequence of nucleotides having one or more (e.g., two, three, or four) properties, such as those described above, similar to those found in nature." SAR" or "MAR". Preferably, such a MAR element, MAR construct, MAR sequence, S/MAR, or simply MAR has at least one property that promotes protein expression of any gene affected by said MAR. The MAR element typically also has the property of an isolated and/or purified nucleic acid, preferably exhibiting MAR activity, in particular exhibiting transcription modulation activity, preferably transcription enhancement activity, but also exhibiting, for example, expression stabilizing activity and/or other activities.

Термины элемент MAR, конструкция MAR, последовательность MAR, S/MAR или просто MAR также включают, в некоторых вариантах реализации, улучшенные конструкции MAR, которые обладают свойствами, которые обеспечивают улучшение по сравнению со встречающимся в природе и/или идентифицированным MAR, на котором может быть основана конструкция MAR согласно настоящему изобретению. Такие свойства включают, но не ограничены перечисленными: уменьшенную длину по сравнению с полноразмерным встречающимся в природе и/или обнаруженным MAR, повышенную экспрессию гена/транскрипции, повышенную стабильность экспрессии, тканеспецифичность, способность к индуцированию или комбинацию перечисленных свойств. Соответственно, элемент MAR, который подвергли улучшению, например, содержит менее чем приблизительно 90%, предпочтительно менее чем приблизительно 80%, еще более предпочтительно менее чем приблизительно 70%, менее чем приблизительно 60%, или менее чем приблизительно 50% от количества нуклеотидов идентифицированной последовательности MAR. Элемент MAR может повышать экспрессию гена и/или транскрипцию трансгена после трансформации подходящей клетки указанной конструкцией.The terms MAR element, MAR construct, MAR sequence, S/MAR, or simply MAR also include, in some embodiments, improved MAR constructs that have properties that provide an improvement over a naturally occurring and/or identified MAR that may be based on the MAR design according to the present invention. Such properties include, but are not limited to: reduced length compared to full-length naturally occurring and/or discovered MAR, increased gene/transcription expression, increased expression stability, tissue specificity, inducibility, or a combination of these properties. Accordingly, the MAR element that has been improved, for example, contains less than about 90%, preferably less than about 80%, even more preferably less than about 70%, less than about 60%, or less than about 50% of the number of nucleotides identified MAR sequences. The MAR element can increase gene expression and/or transcription of the transgene after transformation of a suitable cell with the specified construct.

Элемент MAR предпочтительно встраивают в 3'-5' направлении от промоторной области, с которой функционально связан или может быть функционально связан интересующий ген. Тем не менее, в некоторых вариантах реализации предпочтительно, чтобы элемент MAR был расположен как в 3'-5' направлении, так и в 5'-3' направлении, или только в 5'-3' направлении от интересующего гена/последовательности нуклеиновой кислоты. Другие разнообразные цис- и/или транс-расположения MAR также входят в объем настоящего изобретения.The MAR element is preferably inserted in the 3'-5' direction of the promoter region to which the gene of interest is or can be operably linked. However, in some embodiments, it is preferred that the MAR element be located in both the 3'-5' direction and the 5'-3' direction, or only in the 5'-3' direction, of the gene/nucleic acid sequence of interest . Various other cis and/or trans MAR arrangements are also within the scope of the present invention.

Термин «синтетический», когда его применяют в контексте элемента MAR, относится к MAR, разработка которого включала больше изменений, чем простая перестановка, дупликация и/или делеция последовательностей/областей или части областей идентифицированных MAR или MAR, основанных на них. В частности, синтетические MAR/элементы MAR как правило включают одну или более, предпочтительно одну область идентифицированного MAR, которая, тем не менее, в некотором варианте реализации могла быть синтезирована или модифицирована, а также специально разработанные, хорошо охарактеризованные элементы, такие как единичный TFBS или серия TFBS, которые, в предпочтительном варианте реализации, получают синтетическим путем. Данные разработанные элементы во многих вариантах реализации относительно коротки, в частности, их длина, как правило, составляет не больше чем приблизительно 300 п.о., предпочтительно не больше чем приблизительно 100, приблизительно 50, приблизительно 40, приблизительно 30, приблизительно 20 или приблизительно 10 п.о. Данные элементы в некоторых вариантах реализации могут быть мультимеризованы. Такие синтетические элементы MAR также входят в объем настоящего изобретения, и должно быть очевидно, что, как правило, в настоящем описании следует понимать, что все, что указано как применимое к "элементу MAR", в равной степени применимо к синтетическому элементу MAR.The term “synthetic,” when used in the context of a MAR element, refers to a MAR whose development involved more changes than simple rearrangement, duplication and/or deletion of sequences/regions or portions of regions of identified MARs or MARs based thereon. In particular, synthetic MARs/MAR elements typically include one or more, preferably one, region of an identified MAR that may, in some embodiment, however, have been synthesized or modified, as well as specially designed, well-characterized elements, such as a single TFBS or a series of TFBS, which, in a preferred embodiment, are obtained synthetically. These designed elements are, in many embodiments, relatively short, particularly being typically no more than about 300 bp in length, preferably no more than about 100, about 50, about 40, about 30, about 20, or about 10 p.o. These elements, in some embodiments, may be multimerized. Such synthetic MAR elements are also included within the scope of the present invention, and it should be apparent that, in general, throughout the present specification, it is to be understood that whatever is stated to apply to a “MAR element” is equally applicable to a synthetic MAR element.

Функциональные фрагменты последовательностей нуклеотидов обнаруженных элементов MAR также включены при условии, что они сохраняют функции элемента MAR, описанные выше.Functional nucleotide sequence fragments of discovered MAR elements are also included provided that they retain the functions of the MAR element described above.

Некоторые предпочтительные идентифицированные элементы MAR включают, но не ограничены перечисленными: MAR 1_68, MAR Х_29, MAR 1_6, MAR S4, MAR S46, включая все их перестановки, описанные в WO 2005040377 и публикации патента США 20070178469, которые особенно включены в настоящую заявку посредством ссылки для описания последовательностей данных и других элементов MAR. MAR лизоцима цыпленка также представляет собой предпочтительный вариант реализации (см., патент США номер 7129062, который также особенно включен в данную заявку для описания элементов MAR).Some preferred identified MAR elements include, but are not limited to: MAR 1_68, MAR X_29, MAR 1_6, MAR S4, MAR S46, including all permutations thereof described in WO 2005040377 and US Patent Publication 20070178469, which are specifically incorporated herein by reference to describe data sequences and other MAR elements. Chicken lysozyme MAR is also a preferred embodiment (see US Pat. No. 7,129,062, which is also specifically incorporated herein to describe MAR elements).

Если указано, что вектор содержит единичный MAR, это означает, что внутри указанного вектора присутствует один MAR и нет других MAR либо такого же, либо отличного типа или структуры.If a vector is specified to contain a single MAR, this means that within the specified vector there is a single MAR and no other MARs of either the same or a different type or structure.

В некоторых вариантах реализации настоящего изобретения присутствует несколько MAR, которые могут иметь одинаковый или отличный тип или структуру, все из которых могут быть расположены в 5'-3' направлении от интересующего гена. Это называется кластером единичных MAR.In some embodiments of the present invention, multiple MARs are present, which may be of the same or different type or structure, all of which may be located in the 5'-3' direction of the gene of interest. This is called a single MAR cluster.

Если указано, что что-либо, например, количество клеток, стабильно экспрессирующих полипептид, "не зависит" от присутствия, например, последовательности, то указанная последовательность не оказывает влияния (например, на количество клеток, стабильно экспрессирующих полипептид) до любой статистически значимой степени.If something, such as the number of cells stably expressing a polypeptide, is stated to be “independent” of the presence of, for example, a sequence, then said sequence does not have an effect (for example, the number of cells stably expressing the polypeptide) to any statistically significant extent .

Трансген или последовательность, кодирующая белок экспрессии/процессинга трансгена или функциональную РНК согласно настоящему изобретению, часто является частью вектора.A transgene or sequence encoding a transgene expression/processing protein or functional RNA according to the present invention is often part of a vector.

Вектор согласно настоящему изобретению представляет собой молекулу нуклеиновой кислоты, способную переносить другую нуклеиновую кислоту, такую как трансген, которую нужно экспрессировать с помощью данного вектора, с которым она была связана, как правило, в который она была встроена. Например, плазмида представляет собой тип вектора, ретровирус или лентивирус представляет собой другой тип вектора. В предпочтительном варианте реализации настоящего изобретения вектор линеаризуют перед трансфекцией. Вектор экспрессии содержит регуляторные элементы или находится под контролем таких регуляторных элементов, которые разработаны таким образом, чтобы способствовать транскрипции и/или экспрессии последовательности нуклеиновой кислоты, которую несет указанный вектор экспрессии. Регуляторные элементы включают энхансеры и/или промоторы, но также различные другие элементы, описанные в данной заявке (см. также раздел "Разработка вектора").A vector of the present invention is a nucleic acid molecule capable of carrying another nucleic acid, such as a transgene, to be expressed by a given vector to which it has been linked, typically into which it has been inserted. For example, a plasmid is a type of vector, a retrovirus or lentivirus is another type of vector. In a preferred embodiment of the present invention, the vector is linearized before transfection. An expression vector contains or is under the control of regulatory elements that are designed to facilitate the transcription and/or expression of the nucleic acid sequence carried by the expression vector. Regulatory elements include enhancers and/or promoters, but also various other elements described in this application (see also section "Vector Development").

Последовательность вектора представляет собой последовательность ДНК или РНК указанного вектора, за исключением любых "других" нуклеиновых кислот, таких как трансгены, а также генетических элементов, таких как элементы MAR.The vector sequence is the DNA or RNA sequence of said vector, excluding any "other" nucleic acids such as transgenes, as well as genetic elements such as MAR elements.

Эукариотическую клетку, включая клетку млекопитающего, такую как рекомбинантная клетка млекопитающего/эукариотическая клетка-хозяин, согласно настоящему изобретению можно поддерживать в условиях культуры клеток. Лишь некоторые из примеров данного типа клеток представляют собой эукариотические клетки-хозяева, не относящиеся к приматам, такие как клетки яичника китайского хомячка (СНО) и клетки почки детеныша хомячка (BHK, АТСС CCL 10). Эукариотические клетки-хозяева примата включают, например, клетки карциномы шейки матки человека (HELA, АТСС CCL 2) и линию клеток почки обезьяны CV1, трансформированную SV40 (COS-7, АТСС CRL-1587). Рекомбинантная эукариотическая клетка-хозяин или рекомбинантная клетка млекопитающего означает клетку, которую модифицировали, например, путем трансфекции, например, трансгенной последовательностью, и/или путем мутации. Эукариотические клетки-хозяева или рекомбинантные клетки млекопитающих способны осуществлять посттранскрипционные модификации белков, экспрессируемых указанными клетками. В некоторых вариантах реализации настоящего изобретения клеточный аналог в эукариотической (например, не относящейся к примату) клетке-хозяине полностью функционален, т.е., не был, например, инактивирован путем мутации. Предпочтительно, чтобы трансгенная последовательность (например, примата) экспрессировалась дополнительно к ее клеточному аналогу (например, не относящемуся к примату).A eukaryotic cell, including a mammalian cell, such as a recombinant mammalian cell/eukaryotic host cell, according to the present invention can be maintained under cell culture conditions. Some examples of this cell type are non-primate eukaryotic host cells, such as Chinese hamster ovary (CHO) cells and baby hamster kidney (BHK, ATCC CCL 10) cells. Primate eukaryotic host cells include, for example, human cervical carcinoma cells (HELA, ATCC CCL 2) and the SV40-transformed monkey kidney cell line CV1 (COS-7, ATCC CRL-1587). Recombinant eukaryotic host cell or recombinant mammalian cell means a cell that has been modified, for example, by transfection, for example, with a transgenic sequence, and/or by mutation. Eukaryotic host cells or recombinant mammalian cells are capable of carrying out post-transcriptional modifications of proteins expressed by these cells. In some embodiments of the present invention, the cellular counterpart in the eukaryotic (eg, non-primate) host cell is fully functional, i.e., has not, for example, been inactivated by mutation. Preferably, the transgenic sequence (eg, primate) is expressed in addition to its cellular counterpart (eg, non-primate).

Трансфекция согласно настоящему изобретению представляет собой внедрение нуклеиновой кислоты в реципиентную эукариотическую клетку, например, не ограничиваясь перечисленными, путем электропорации, липофекции, как правило с помощью невирусного вектора (опосредованная вектором трансфекция) или с помощью химических способов, включая применение поликатионных липидов. Трансфекция, не опосредованная вектором, включает, например, непосредственное внедрение изолированных миРНК ТЕР в клетку. Во временно трансфицированной клетке, например, миРНК сохраняется лишь временно. В контексте настоящего изобретения можно осуществить первую трансфекцию по меньшей мере одной молекулой нуклеиновой кислоты с последовательностью, кодирующей белок экспрессии/процессинга трансгена (ТЕР) или функциональную РНК ТЕР, или, в качестве альтернативы, непосредственно функциональной РНК ТЕР (например, миРНК), и вторую последующую трансфекцию нуклеиновой кислотой, кодирующей трансген. Как первую, так и вторую трансфекцию можно повторить. Например, миРНК, внедренная в процессе первой трансфекции, действует, в частности, ингибирует, рекомбинационный белок (белок, который участвует в событиях рекомбинации в трансфицированной клетке). После этого в процессе второй последующей трансфекции вводят трансген.Transfection according to the present invention is the introduction of a nucleic acid into a recipient eukaryotic cell, for example, but not limited to, by electroporation, lipofection, typically using a non-viral vector (vector-mediated transfection) or by chemical methods, including the use of polycationic lipids. Non-vector-mediated transfection involves, for example, direct introduction of isolated TEP siRNAs into the cell. In a transiently transfected cell, for example, siRNA is retained only temporarily. In the context of the present invention, it is possible to carry out a first transfection with at least one nucleic acid molecule with a sequence encoding a transgene expression/processing protein (TEP) or a functional TEP RNA, or, alternatively, a functional TEP RNA itself (for example, siRNA), and a second subsequent transfection with a nucleic acid encoding the transgene. Both the first and second transfections can be repeated. For example, siRNA introduced during the first transfection acts, specifically inhibits, a recombination protein (a protein that is involved in recombination events in the transfected cell). The transgene is then introduced in a second subsequent transfection.

Транскрипция означает синтез РНК по матрице ДНК. "Транскрипционно активный" относится, например, к трансгену, который транскрибируется. Трансляция представляет собой процесс, с помощью которого по РНК синтезируется белок.Transcription means the synthesis of RNA from a DNA template. "Transcriptionally active" refers, for example, to a transgene that is transcribed. Translation is the process by which proteins are synthesized from RNA.

Улучшение секреции измеряют по сравнению со значением, полученным для контрольной клетки, которая не содержит соответствующую трансгенную последовательность. Любое статистически значимое улучшение по сравнению со значением для контроля называют стимуляцией.The improvement in secretion is measured in comparison with the value obtained for a control cell that does not contain the corresponding transgene sequence. Any statistically significant improvement over the control value is called stimulation.

Маркер отбора представляет собой нуклеиновую кислоту, которая содержит ген, продукт которого придает устойчивость к селекционному агенту - антибиотику (например, хлорамфениколу, ампициллину, гентамицину, стрептомицину, тетрациклину, канамицину, неомицину, пуромицину) или способность расти на селективных средах (например, с DHFR (дигидрофолатредуктазой)).A selection marker is a nucleic acid that contains a gene whose product confers resistance to an antibiotic selection agent (e.g., chloramphenicol, ampicillin, gentamicin, streptomycin, tetracycline, kanamycin, neomycin, puromycin) or the ability to grow on selective media (e.g., DHFR (dihydrofolate reductase)).

Класс белков, известных как шапероны, определяют как белки, которые связываются и стабилизируют в противном случае нестабильный конформационный изомер другого белка и, путем контролируемого связывания и высвобождения, способствуют его правильной судьбе in vivo, будь то фолдинг, сборка олигомера, транспорт в конкретный клеточный компартмент или утилизация путем деградации. BiP (также известный как GRP78, белок, связывающий тяжелую цепь Ig, и Kar2p в дрожжах) представляет собой распространенный шаперон массой приблизительно 70 кДа из семейства hsp 70, находящийся в эндоплазматическом ретикулуме (ER), который, среди прочих функций, способствует транспорту в секреторной системе и способствует фолдингу белков. Протеиндисульфидизомераза (PDI) представляет собой белок-шаперон, находящийся в ЭР, который участвует в катализе образования дисульфидной связи при посттрансляционном процессинге белков.The class of proteins known as chaperones are defined as proteins that bind to and stabilize an otherwise unstable conformational isomer of another protein and, through controlled binding and release, promote its correct fate in vivo, whether folding, oligomer assembly, or transport to a specific cellular compartment. or disposal by degradation. BiP (also known as GRP78, Ig heavy chain binding protein, and Kar2p in yeast) is a common approximately 70 kDa chaperone of the hsp 70 family located in the endoplasmic reticulum (ER) that, among other functions, promotes secretory transport. system and promotes protein folding. Protein disulfide isomerase (PDI) is an ER-located chaperone protein that is involved in catalyzing disulfide bond formation during post-translational processing of proteins.

КЛЕТОЧНАЯ МЕТАБОЛИЧЕСКАЯ ИНЖЕНЕРИЯCELLULAR METABOLIC ENGINEERING

В клеточной метаболической инженерии, например, модифицируют процессы, свойственные экспрессирующей клетке. Например, некоторые белки секреторного пути, например, экспрессируют сверх меры. В качестве альтернативы, изменяют события рекомбинации путем влияния на пути рекомбинации.In cellular metabolic engineering, for example, processes inherent in the expressing cell are modified. For example, some secretory pathway proteins are overexpressed, for example. Alternatively, recombination events are altered by influencing recombination pathways.

ПУТЬ СЕКРЕЦИИ БЕЛКАPROTEIN SECRETION PATHWAY

Секреция белков представляет собой процесс, общий для организмов из всех трех царств. Для такого сложного пути секреции в первую очередь требуется перемещение белка из цитозоля через цитоплазматическую мембрану клетки. Для достижения белком конечного назначения необходимо несколько этапов и различных факторов. В клетках млекопитающих такой путь секреции включает два основных макромолекулярных ансамбля: сигналузнающую частицу (SRP) и секреторный комплекс (Sec-комплекс или транслокон). SRP состоит из шести белков с массами 9, 14, 19, 54, 68 и 72 кДа и 7S РНК, а транслокон представляет собой тороидальную частицу, состоящую из Sec61αβγ, Sec62 и Sec63. Номера доступа (в скобках), представленные для человеческого варианта некоторых из данных белков, описаны далее: hSRP14 (номер доступа Х73459.1); hSRP9 (NM_001130440); hSRP54 (NM_003136); hSRPRα (NM_003139); hSRPRβ (NM_021203); hSEC61α1 (NM_013336); hSEC61 β (L25085.1); hSEC61 γ (AK311845,1).Protein secretion is a process common to organisms from all three kingdoms. This complex secretion pathway first requires the movement of protein from the cytosol through the cytoplasmic membrane of the cell. Several steps and various factors are required for a protein to reach its final destination. In mammalian cells, this secretion pathway includes two main macromolecular assemblies: the signal recognition particle (SRP) and the secretory complex (Sec complex or translocon). SRP consists of six proteins with masses of 9, 14, 19, 54, 68 and 72 kDa and 7S RNA, and the translocon is a toroidal particle consisting of Sec61αβγ, Sec62 and Sec63. The accession numbers (in parentheses) provided for the human variant of some of these proteins are described below: hSRP14 (accession number X73459.1); hSRP9 (NM_001130440); hSRP54 (NM_003136); hSRPRα (NM_003139); hSRPRβ (NM_021203); hSEC61α1 (NM_013336); hSEC61 β (L25085.1); hSEC61 γ (AK311845.1).

Первый этап секреции белка зависит от сигнальных пептидов, которые содержат определенную пептидную последовательность на аминоконце полипептида, которая опосредует перемещение образующегося белка через мембрану и в просвет эндоплазматического ретикулума (ЭР). На данном этапе сигнальный пептид, который выходит из лидирующей транслирующей рибосомы, взаимодействует с субъединицей частицы SRP, которая узнает сигнальный пептид, а именно, с SRP54. Связывание SRP с сигнальным пептидом блокирует дальнейшую элонгацию образующегося полипептида, что приводит к остановке трансляции. Белки SRP-9 и -14 необходимы для остановки элонгации (Walter и Blobel 1981). На втором этапе комплекс рибосома-образующийся полипептид-SRP стыкуется с мембраной ЭР посредством взаимодействия SRP54 с рецептором SRP (SR) (Gilmore, Blobel и др. 1982; Pool, Stumm и др. 2002). SR представляет собой гетеродимерный комплекс, содержащий два белка, SRα и SRβ, которые проявляют ГТФазную активность (Gilmore, Walter и др. 1982). Взаимодействие SR с SRP54 зависит от связывания ГТФ (Connolly, Rapiejko и др. 1991). SR координирует высвобождение SRP из комплекса рибосома-образующийся полипептид и ассоциацию сайта выхода из рибосомы с комплексом Sec61 (транслоконом). Растущий образующийся полипептид проникает в ЭР через канал транслокона, и трансляция возобновляется с обычной скоростью. Рибосома остается связанной на цитоплазматической стороне транслокона до тех пор, пока трансляция не завершится. Дополнительно к рибосомам, транслоконы тесно связаны с рибофорином на цитоплазматической стороне и с шаперонами, такими как кальретикулин и кальнексин, и протеиндисульфидизомеразами (PDI) и олигосахарид-трансферазой на стороне просвета ЭР. После внедрения растущего образующегося полипептида в просвет ЭР сигнальный пептид отщепляется от пре-белка ферментом, называемым сигнальной пептидазой, что приводит к высвобождению зрелого белка в ЭР. После посттрансляционной модификации, правильному фолдингу и мультимеризации белки покидают ЭР и мигрируют в аппарат Гольджи, а затем в секреторные везикулы. Слияние секреторных везикул с плазматической мембраной приводит к высвобождению содержимого везикулы во внеклеточное пространство.The first step of protein secretion depends on signal peptides, which contain a specific peptide sequence at the amino terminus of the polypeptide that mediates the movement of the nascent protein across the membrane and into the lumen of the endoplasmic reticulum (ER). At this stage, the signal peptide that exits the leading translation ribosome interacts with a subunit of the SRP particle that recognizes the signal peptide, namely SRP54. Binding of SRP to the signal peptide blocks further elongation of the resulting polypeptide, resulting in translation arrest. SRP-9 and -14 proteins are required for elongation arrest (Walter and Blobel 1981). In the second step, the ribosome-nascent polypeptide-SRP complex docks with the ER membrane through the interaction of SRP54 with the SRP receptor (SR) (Gilmore, Blobel et al. 1982; Pool, Stumm et al. 2002). SR is a heterodimeric complex containing two proteins, SRα and SRβ, which exhibit GTPase activity (Gilmore, Walter et al. 1982). The interaction of SR with SRP54 is dependent on GTP binding (Connolly, Rapiejko et al. 1991). SR coordinates the release of SRP from the ribosome-nascent polypeptide complex and the association of the ribosome exit site with the Sec61 complex (translocon). The growing nascent polypeptide enters the ER through the translocon channel, and translation resumes at normal rates. The ribosome remains bound on the cytoplasmic side of the translocon until translation is complete. In addition to ribosomes, translocons are closely associated with ribophorin on the cytoplasmic side and with chaperones such as calreticulin and calnexin, and protein disulfide isomerases (PDI) and oligosaccharide transferase on the lumenal side of the ER. After insertion of the growing nascent polypeptide into the lumen of the ER, the signal peptide is cleaved from the pre-protein by an enzyme called signal peptidase, resulting in the release of the mature protein into the ER. After post-translational modification, proper folding and multimerization, proteins leave the ER and migrate to the Golgi apparatus and then to secretory vesicles. Fusion of secretory vesicles with the plasma membrane results in the release of the vesicle contents into the extracellular space.

Удивительно, что секретируемые белки в ходе эволюции обрели определенные сигнальные последовательности, которые хорошо подходят для их перемещения через мембрану клетки. Различные последовательности, обнаруженные как отдельные сигнальные пептиды, могут взаимодействовать уникальными путями с секреторным аппаратом. Сигнальные последовательности преимущественно гидрофобны по своей природе, и это свойство может способствовать получению из образующегося пептида секреторного белка. Дополнительно к гидрофобному участку аминокислот последовательности большинства сигналов секреции млекопитающих обладают множеством общих свойств. Различные сигнальные пептиды отличаются по эффективности, с которой они направляют секрецию гетерологичных белков, но были обнаружены несколько сигнальных пептидов секреции (т.е. сигнальных последовательностей из интерлейкина, иммуноглобулина, рецептора гистосовместимости и т.д.), которые можно применять, чтобы направлять секрецию гетерологичных рекомбинантных белков. Несмотря на сходства, данные последовательности не оптимальны для стимуляции эффективной секреции некоторых белков, которые трудно поддаются экспрессии, вследствие того, что нативный сигнальный пептид не может правильно функционировать вне нативного контекста, или из-за различий, связанных с клеткой-хозяином или процессом секреции. Выбор подходящей сигнальной последовательности для эффективной секреции гетерологичного белка может дополнительно осложняться взаимодействием последовательностей внутри отщепленного сигнального пептида с другими участками зрелого белка (Johansson, Nilsson и др. 1993).Surprisingly, secreted proteins have evolved to acquire specific signal sequences that are well suited for their movement across the cell membrane. Various sequences found as distinct signal peptides may interact in unique ways with the secretory apparatus. Signal sequences are predominantly hydrophobic in nature, and this property may facilitate the production of a secretory protein from the resulting peptide. In addition to the hydrophobic amino acid region, the sequences of most mammalian secretion signals share many properties. Different signal peptides differ in the efficiency with which they direct the secretion of heterologous proteins, but several secretion signal peptides (i.e., signal sequences from interleukin, immunoglobulin, histocompatibility receptor, etc.) have been discovered that can be used to direct secretion heterologous recombinant proteins. Despite the similarities, these sequences are not optimal for promoting efficient secretion of some proteins that are difficult to express, due to the fact that the native signal peptide cannot function properly outside the native context, or due to differences associated with the host cell or secretion process. The selection of an appropriate signal sequence for efficient secretion of a heterologous protein can be further complicated by interactions of sequences within the cleaved signal peptide with other regions of the mature protein (Johansson, Nilsson et al. 1993).

ПУТИ РЕКОМБИНАЦИИRECOMBINATION PATHWAYS

Пути рекомбинации, также известные как пути рекомбинации ДНК, представляют собой клеточные пути, которые приводят к репарации повреждения ДНК, например, к соединению концов молекулы ДНК после двухнитевых разрывов хромосомы и к обмену или слиянию последовательностей ДНК между хромосомными и нехромосомными молекулами ДНК, как, например, при кроссинговере хромосом при мейозе или перестройке генов иммуноглобулинов в лимфоцитарных клетках. Существует три основных пути рекомбинации: путь гомологичной рекомбинации (ГР), путь негомологичного соединения концов (НГСК), путь опосредованного микрогомологией соединения концов (ОМСК) и альтернативного соединения концов (Альт-СК).Recombination pathways, also known as DNA recombination pathways, are cellular pathways that lead to the repair of DNA damage, such as joining the ends of a DNA molecule after chromosomal double-strand breaks, and the exchange or fusion of DNA sequences between chromosomal and nonchromosomal DNA molecules, such as , when chromosomes cross over during meiosis or rearrangement of immunoglobulin genes in lymphocytic cells. There are three main recombination pathways: the homologous recombination (HR) pathway, the non-homologous end-joining (NHJ) pathway, the microhomology-mediated end joining (OMJC) and alternative end joining (Alt-end joining) pathways.

МЕХАНИЗМЫ ГОМОЛОГИЧНОЙ РЕКОМБИНАЦИИ (ГР), НЕГОМОЛОГИЧНОГО СОЕДИНЕНИЯ КОНЦОВ (НГСК) И ОПОСРЕДОВАННОГО МИКРОГОМОЛОГИЕЙ СОЕДИНЕНИЯ КОНЦОВ (ОМСК)MECHANISMS OF HOMOLOGY RECOMBINATION (HR), NON-HOMOLOGY END JOINING (HJJ), AND MICROHOMOLOGY-MEDIATED END JOINING (OMJC)

Трансгены используют аппарат рекомбинации для встраивания в двухнитевой разрыв в геноме хозяина,Transgenes use the recombination machinery to insert into a double-strand break in the host genome,

Двухнитевые разрывы (ДНР) представляют собой биологически наиболее разрушительный тип геномного повреждения, потенциально приводящий к гибели клетки или большому разнообразию генетических перестроек. Точная репарация необходима для успешного поддержания и передачи генетической информации.Double-strand breaks (DSBs) are the most biologically destructive type of genomic damage, potentially leading to cell death or a wide variety of genetic rearrangements. Accurate repair is essential for the successful maintenance and transmission of genetic information.

Существует два основных механизма репарации ДНР: негомологичное соединение концов (НГСК) и гомологичная рекомбинация (ГР). Третий механизм, называемый опосредованным микрогомологией соединением концов (ОМСК), часто начинает действовать, когда два основных механизма репарации ДНР претерпевают неудачу. Гомологичная рекомбинация представляет собой процесс генетического обмена между последовательностями ДНК, которые гомологичны друг другу, и действует преимущественно в течение фаз S/G2 клеточного цикла, тогда как НГСК просто соединяет два разорванных конца ДНК, обычно при отсутствии гомологии последовательностей, и действует на всех фазах клеточного цикла, но имеет особое значение во время G0 - G1 и ранней S фазы митотических клеток (Wong и Capecchi, 1985; Delacote и Lopez, 2008). У позвоночных ГР, НГСК и ОМСК различным образом участвуют в репарации ДНР, в зависимости от природы ДНР и фазы клеточного цикла (Takata и др., 1998).There are two main mechanisms of DNR repair: non-homologous end joining (HJJ) and homologous recombination (HR). A third mechanism, called microhomology-mediated end joining (MJK), often comes into play when the two main DNR repair mechanisms fail. Homologous recombination is the process of genetic exchange between DNA sequences that are homologous to each other, and acts primarily during the S/G2 phases of the cell cycle, whereas HSCT simply joins two broken ends of DNA, usually in the absence of sequence homology, and acts during all phases of the cell cycle. cycle, but is of particular importance during G0 - G1 and early S phase of mitotic cells (Wong and Capecchi, 1985; Delacote and Lopez, 2008). In vertebrates, GRs, NGSCs, and OMSCs are involved in DNR repair in different ways, depending on the nature of the DNR and the phase of the cell cycle (Takata et al., 1998).

НГСК: основные механизмыNGSC: basic mechanisms

По существу, молекулярный механизм процесса НГСК кажется простым: 1) набор ферментов захватывает разорванную молекулу ДНК, 2) образуется молекулярный мостик, который сближает два конца ДНК, и 3) разорванные молекулы заново лигируются. Аппарат НГСК в клетках млекопитающих включает два белковых комплекса для осуществления таких реакций: гетеродимер Ku80/Ku70, связанный с ДНК-ПКкс (каталитической субъединицей ДНК-зависимой протеинкиназы), и ДНК-лигаза IV с ее кофактором XRCC4 (комплементирующий ген 4 репарации рентгеновских повреждений у китайского хомячка) и множеством белковых факторов, таких как Artemis (Артемида) и XLF (XRCC4-подобный фактор; или Cernunnos (Цернун)) (Delacote и др., 2002). НГСК часто считают допускающая ошибки репарацией ДНР, так как она просто соединяет два разорванных конца ДНК, обычно при отсутствии гомологии последовательностей, и порождает небольшие вставки и делеции (Moore и Haber, 1996; Wilson и др., 1999). НГСК обеспечивает механизм репарации ДНР на всем протяжении клеточного цикла, но особое значение имеет в течение G0 - G1 и ранней S-фазы митотических клеток (Takata и др., 1998; Delacote и Lopez, 2008). Репарацию ДНР посредством НГСК наблюдают в организмах начиная с бактерий и заканчивая млекопитающими, что указывает на ее консервативный характер в процессе эволюции.Essentially, the molecular mechanism of the NGSC process appears simple: 1) a set of enzymes capture the broken DNA molecule, 2) a molecular bridge is formed that brings the two ends of the DNA closer together, and 3) the broken molecules are religated. The NGSC apparatus in mammalian cells includes two protein complexes for carrying out such reactions: the Ku80/Ku70 heterodimer associated with DNA-PKx (the catalytic subunit of DNA-dependent protein kinase), and DNA ligase IV with its cofactor XRCC4 (complementing X-ray damage repair gene 4 in Chinese hamster) and a variety of protein factors such as Artemis and XLF (XRCC4-like factor; or Cernunnos) (Delacote et al., 2002). NGSC is often considered an error-prone DNR repair because it simply joins two broken ends of DNA, usually in the absence of sequence homology, and generates small insertions and deletions (Moore and Haber, 1996; Wilson et al., 1999). NGSC provides a mechanism for DNR repair throughout the cell cycle, but is of particular importance during G0 - G1 and early S phase of mitotic cells (Takata et al., 1998; Delacote and Lopez, 2008). DNR repair through NGSC is observed in organisms ranging from bacteria to mammals, which indicates its conservative nature in the process of evolution.

После образования ДНР ключевым этапом в пути репарации НГСК является физическое сближение разорванных концов ДНК. НГСК запускается при взаимодействии гетеродимерного белкового комплекса Ku70/80 с обоими концами разорванной молекулы ДНК, чтобы захватить, сблизить концы и создать каркас для сборки других ключевых факторов НГСК. Связанный с ДНК гетеродимерный комплекс Ku привлекает в место ДНР ДНК-ПКкс, белок массой 460 кДа, принадлежащий к семейству PIKK (фосфоинозитид-3-киназа-подобному семейству протеинкиназ) (Gottlieb и Jackson, 1993), и активирует его серин/треонинкиназную функцию (Yaneva и др., 1997). Две молекулы ДНК-ПКкс с двух концов ДНР взаимодействуют, таким образом образуя молекулярный мостик между обоими разорванными концами ДНК и ингибируя их деградацию (DeFazio и др., 2002). Затем концы ДНК можно непосредственно лигировать, хотя большинство концов, возникших в результате ДНР, должны быть надлежащим образом процессированы перед лигированием (Nikjoo и др., 1998). В зависимости от природы разрыва может потребоваться действие различных комбинаций ферментов процессинга для получения совместимых выступов путем заполнения брешей, удаления поврежденной ДНК или вторичных структур, окружающих разрыв. Данный этап в процессе НГСК считают ответственным за случайную потерю нуклеотидов, связанную с репарацией НГСК. Один ключевой фермент процессинга концов при НГСК млекопитающих представляет собой Artemis, член суперсемейства ферментов металло-β-лактамаз, ген которого оказался мутированным у большинства пациентов с радиочувствительным тяжелым комбинированным иммунодефицитом (SCID) (Moshous и др., 2001). Artemis обладает как 5'→3' экзонуклеазной активностью, так и ДНК-ПКкс-зависимой эндонуклеазной активностью по отношению к ДНК, содержащей дн-он переходы (переходы от двух нитей к одной), и шпилькам ДНК (Ма и др., 2002). Его активность также регулируется протеинкиназой ATM. Таким образом, похоже, что Artemis, вероятно, участвует во множестве реакций на повреждение ДНК. Тем не менее, похоже, что Artemis участвует в репарации лишь подгруппы повреждений ДНК, так как не наблюдали значительного дефекта репарации ДНР в клетках, лишенных Artemis (Wang и др., 2005, Darroudi и др., 2007).After DNR formation, a key step in the NGSC repair pathway is the physical bringing together of broken DNA ends. NGSC is triggered by the interaction of the Ku70/80 heterodimeric protein complex with both ends of a broken DNA molecule to capture, bring together the ends, and create a scaffold for the assembly of other key NGSC factors. The DNA-bound heterodimeric Ku complex recruits DNA-PKx, a 460 kDa protein belonging to the PIKK family (Gottlieb and Jackson, 1993), to the DNR site and activates its serine/threonine kinase function ( Yaneva et al., 1997). Two DNA-PKx molecules from the two ends of the DNR interact, thus forming a molecular bridge between both broken DNA ends and inhibiting their degradation (DeFazio et al., 2002). The DNA ends can then be directly ligated, although most ends resulting from DNR must be properly processed before ligation (Nikjoo et al., 1998). Depending on the nature of the break, different combinations of processing enzymes may be required to produce compatible overhangs by filling the gaps, removing damaged DNA, or removing secondary structures surrounding the break. This step in the NGSC process is thought to be responsible for the random loss of nucleotides associated with NGSC repair. One key end-processing enzyme in mammalian NHSC is Artemis, a member of the metallo-β-lactamase superfamily of enzymes, the gene of which is found to be mutated in the majority of patients with radiosensitive severe combined immunodeficiency (SCID) (Moshous et al., 2001). Artemis has both 5'→3' exonuclease activity and DNA-PKx-dependent endonuclease activity towards DNA containing d-on junctions (two-strand to single-strand transitions) and DNA hairpins (Ma et al., 2002). . Its activity is also regulated by the protein kinase ATM. Thus, it appears that Artemis is likely involved in multiple DNA damage responses. However, it appears that Artemis is involved in the repair of only a subset of DNA damage, as no significant defect in DNR repair was observed in cells lacking Artemis (Wang et al., 2005, Darroudi et al., 2007).

Бреши в ДНК должны быть заполнены, чтобы репарация стала возможной. Добавление нуклеотидов в ДНР могут осуществлять только полимеразы μ и λ (Lee и др., 2004; Сарр и др., 2007). Посредством взаимодействия с XRCC4 полинукпеотидкиназа (PNK) также привлекается к концам ДНК, чтобы позволить полимеризацию, а также лигирование ДНК (Koch и др., 2004). Наконец, НГСК завершается путем лигирования концов ДНК, этапа, осуществляемого комплексом, содержащим XRCC4, ДНК-лигазу IV и XLF (Grawunder и др., 1997). Другие лигазы могут частично заменять ДНК-лигазу IV, так как НГСК может происходить в отсутствие XRCC4 и лигазы IV (Yan и др., 2008). Более того, исследования показали, что XRCC4 и лигаза IV не играют роли вне НГСК, тогда как, напротив, KU принимает участие в других процессах, таких как транскрипция, апоптоз и реакции на микроокружение (Monferran и др., 2004; Müller и др., 2005; Downs и Jackson, 2004).Gaps in DNA must be filled for repair to be possible. The addition of nucleotides to DNRs can only be accomplished by polymerases μ and λ (Lee et al., 2004; Sarr et al., 2007). Through interaction with XRCC4, polynucleotide kinase (PNK) is also recruited to DNA ends to allow polymerization as well as DNA ligation (Koch et al., 2004). Finally, NGSC is completed by DNA end ligation, a step carried out by a complex containing XRCC4, DNA ligase IV and XLF (Grawunder et al., 1997). Other ligases may partially replace DNA ligase IV, since NGSC can occur in the absence of XRCC4 and ligase IV (Yan et al., 2008). Moreover, studies have shown that XRCC4 and ligase IV do not play a role outside of NGSC, whereas, on the contrary, KU is involved in other processes such as transcription, apoptosis and responses to the microenvironment (Monferran et al., 2004; Müller et al. , 2005; Downs and Jackson, 2004).

НГСК можно ослабить или прекратить различными способами, многие из которых непосредственно затрагивают упомянутые выше белки (например, гетеродимер Ku80/Ku70, ДНК-ПКкс, но, в особенности, ДНК-лигазу IV, XRCC4, Artemis и XLF (XRCC4-подобный фактор; или Cernunnos), PIKK (фосфоинозитид-3-киназа-подобное семейство протеинкиназ).NGSC can be attenuated or terminated in a variety of ways, many of which directly affect the proteins mentioned above (eg, Ku80/Ku70 heterodimer, DNA-PKx, but especially DNA ligase IV, XRCC4, Artemis, and XLF (XRCC4-like factor; or Cernunnos), PIKK (phosphoinositide 3-kinase-like protein kinase family).

ГР: основные механизмыGR: basic mechanisms

Гомологичная рекомбинация (ГР) представляет собой очень точный механизм репарации. Гомологичная хроматида служит в качестве матрицы для репарации разорванной нити. ГР происходит в фазах S и G2 клеточного цикла, когда сестринские хроматиды становятся доступными. Классическая ГР главным образом характеризуется тремя этапами: 1) удаление 5'-нуклеотидов с разорванных концов, 2) внедрение нити и обмен с гомологичным дуплексом ДНК и 3) расхождение промежуточных продуктов (интермедиатов) рекомбинации. Репарация ДНР может завершаться различными путями, в зависимости от способности осуществлять внедрение нити, которые включают путь зависимого от синтеза ДНК отжига нитей (ЗСОН), классическую репарацию двухнитевого разрыва (РДНР) (Szostak и др., 1983), вызванную разрывом репликацию (ВРР) и, в качестве альтернативы, путь однонитевого отжига (ОНО). Все механизмы ГР взаимосвязаны и включают много общих ферментативных этапов.Homologous recombination (HR) is a very precise repair mechanism. The homologous chromatid serves as a template for the repair of the broken strand. GR occurs in the S and G2 phases of the cell cycle when sister chromatids become accessible. Classical GR is mainly characterized by three stages: 1) removal of 5' nucleotides from broken ends, 2) strand insertion and exchange with a homologous DNA duplex, and 3) divergence of recombination intermediates. DNR repair can be completed in a variety of ways, depending on the ability to carry out strand insertion, which include the DNA synthesis-dependent strand annealing (DSA) pathway, classical double-strand break repair (CDBR) (Szostak et al., 1983), break-induced replication (BRR) and, alternatively, the single-strand annealing (SEA) pathway. All GR mechanisms are interconnected and involve many common enzymatic steps.

Первый этап из всех реакций ГР соответствует удалению 5'-конца разорванной нити ДНК нуклеазами с помощью комплекса MRN (MRE11, RAD50, NBN (ранее NBS1, синдром разрывов Неймеген 1)) и CtIP (CtBP-взаимодействующий белок) (Sun и др., 1991; White и Haber, 1990). Полученная в результате этого совокупность последовательностей с 3'-одноцепочечными ДНР может искать гомологичную последовательность. Внедрение гомологичного дуплекса осуществляют с помощью нуклеофиламента, состоящего из 3'-онДНК, покрытой белком рекомбиназой RAD51 (Benson и др., 1994). Для сборки RAD51-филамента требуется привлечение ре пли кати в но го белка A (RPA), гетеротримерного онДНК-связывающего белка, вовлеченного в метаболические процессы ДНК, связанные с онДНК, у эукариотов (Wold, 1997, Song и Sung, 2000). Затем RAD51 взаимодействует с RAD52, который обладает кольцеобразной структурой (Shen и др., 1996), чтобы вытеснить молекулы RPA и способствовать загрузке RAD51 (Song и sung, 2000). Rad52 важен для процессов рекомбинации у дрожжей (Symington, 2002). Тем не менее, у позвоночных, похоже, скорее BRCA2 (белок чувствительности к раку молочной железы 2 типа), чем RAD52 играет важную роль во внедрении и обмене нитей (Davies и Pellegrini, 2007; Esashi и др., 2007). Взаимодействие RAD51/RAD52 стабилизируется путем связывания с RAD54. RAD54 также играет роль в созревании интермедиатов рекомбинации после образования D-петли (Bugreev и др., 2007). С другой стороны, BRCA1 (рак молочной железы 1) взаимодействует с BARD1 (ассоциированный с BRCA1 RING-домен 1) и ВАСН1 (гомолог 1 ВТВ и CNC), чтобы осуществить лигазную и геликазную активность репарации ДНР, соответственно (Greenberg и др., 2006). BRCA1 также взаимодействует с CtIP CDK-зависимым образом и подвергается убиквитинированию в ответ на повреждение ДНК (Limbo и др., 2007). Следовательно, BRCA1, CtIP и комплекс MRN играют роль в активации ГР-опосредованной репарации ДНК в S и G2 фазах клеточного цикла.The first step of all GR reactions corresponds to the removal of the 5' end of the broken DNA strand by nucleases using the MRN complex (MRE11, RAD50, NBN (formerly NBS1, Nijmegen break syndrome 1)) and CtIP (CtBP-interacting protein) (Sun et al., 1991; White and Haber, 1990). The resulting set of sequences with 3' single-stranded DNRs can search for a homologous sequence. Insertion of the homologous duplex is accomplished using a nucleofilament consisting of 3'-ssDNA coated with the protein recombinase RAD51 (Benson et al., 1994). Assembly of the RAD51 filament requires the recruitment of replica protein A (RPA), a heterotrimeric ssDNA-binding protein involved in ssDNA-related DNA metabolic processes in eukaryotes (Wold, 1997, Song and Sung, 2000). RAD51 then interacts with RAD52, which has a ring-like structure (Shen et al., 1996), to displace RPA molecules and promote RAD51 loading (Song and Sung, 2000). Rad52 is important for recombination processes in yeast (Symington, 2002). However, in vertebrates, BRCA2 (breast cancer susceptibility protein type 2) rather than RAD52 appears to play an important role in strand insertion and turnover (Davies and Pellegrini, 2007; Esashi et al., 2007). The RAD51/RAD52 interaction is stabilized by binding to RAD54. RAD54 also plays a role in the maturation of recombination intermediates after D-loop formation (Bugreev et al., 2007). On the other hand, BRCA1 (breast cancer 1) interacts with BARD1 (BRCA1-associated RING domain 1) and BACH1 (BTB and CNC homolog 1) to mediate ligase and helicase DNR repair activities, respectively (Greenberg et al., 2006 ). BRCA1 also interacts with CtIP in a CDK-dependent manner and is ubiquitinated in response to DNA damage (Limbo et al., 2007). Therefore, BRCA1, CtIP and the MRN complex play a role in the activation of GR-mediated DNA repair in the S and G2 phases of the cell cycle.

Внедрение нуклеофиламента приводит к образованию гетеродуплекса, называемого петлей замещения (D-петлей), и включает замещение одной нити дуплекса внедряющейся нитью и ее спаривание с другой нитью дуплекса. Затем несколько путей ГР могут завершить репарацию, используя гомологичную последовательность в качестве матрицы для замещения последовательности, окружающей ДНР. В зависимости от используемого механизма взаимные обмены (кроссинговеры) между гомологичной матрицей и разорванной молекулой ДНК могут быть или не быть связаны с репарацией ГР. Кроссинговеры могут приводить к значительным генетическим последствиям, таким как геномные перестройки или утрата гетерозиготности.Nucleofilament insertion results in the formation of a heteroduplex called a displacement loop (D-loop) and involves the replacement of one strand of the duplex by the invading strand and its pairing with another strand of the duplex. Multiple GR pathways can then complete repair by using the homologous sequence as a template to replace the sequence surrounding the DNR. Depending on the mechanism used, crossovers between the homologous template and the broken DNA molecule may or may not be associated with GR repair. Crossing overs can lead to significant genetic consequences, such as genomic rearrangements or loss of heterozygosity.

В гомологичной рекомбинации также участвуют пять паралогов Rad51: Xrcc2, Xrcc3, Rad51B, Rad51C, Rad51D (Suwaki и др., 2011). Паралоги Rad51 образуют два типа комплексов: один, названный BCDX2, содержит Rad51B, Rad51C, Rad51D и Xrcc2; другой содержит Rad51C и Xrcc3 (СХ3) (Masson и др., 2001). Предположили, что первый комплекс участвует в образовании и/или стабилизации комплекса Rad51-ДНК (Masson и др., 2001). Похоже, что роль второго комплекса состоит в миграции ветви и расщеплении структуры Холлидея (Liu и др., 2007).Five Rad51 paralogs are also involved in homologous recombination: Xrcc2, Xrcc3, Rad51B, Rad51C, Rad51D (Suwaki et al., 2011). Rad51 paralogs form two types of complexes: one, called BCDX2, contains Rad51B, Rad51C, Rad51D, and Xrcc2; the other contains Rad51C and Xrcc3 (CX3) (Masson et al., 2001). The first complex has been proposed to be involved in the formation and/or stabilization of the Rad51-DNA complex (Masson et al., 2001). The role of the second complex appears to be branch migration and splitting of the Holliday structure (Liu et al., 2007).

Ранее сообщалось, что увеличение ГР по сравнению с НГСК (см. публикацию патента США 20120231449, которая полностью включена в данную заявку посредством ссылки) можно применять, чтобы усилить и/или способствовать экспрессии трансгена.It has previously been reported that increasing GR compared to NGSC (see US Patent Publication 20120231449, which is incorporated herein by reference in its entirety) can be used to enhance and/or promote transgene expression.

Настоящее изобретение направлено на уменьшение или выключение ГР. ГР можно уменьшить или выключить различными способами, многие из которых непосредственно затрагивают упомянутые выше белки (например, белки комплекса MRN (MRE11, RAD50, NBN (ранее NBS1, синдром разрывов Неймеген 1)) и CtIP (CtBP-взаимодействующий белок), RAD51, белок репликации A (RPA), Rad52, BRCA2 (белок чувствительности к раку молочной железы 2 типа), RAD54, BRCA1 (рак молочной железы 1), взаимодействующий с BARD1 (ассоциированный с BRCA1 RING-домен 1), ВАСН1 (гомолог 1 ВТВ и CNC)). Настоящее изобретение сосредоточено на получении молекул РНК, таких как миРНК, для достижения данной цели.The present invention is directed to reducing or switching off GR. GR can be reduced or switched off in a variety of ways, many of which directly affect the proteins mentioned above (eg, MRN complex proteins (MRE11, RAD50, NBN (formerly NBS1, Nijmegen gap syndrome 1)) and CtIP (CtBP-interacting protein), RAD51 protein replication A (RPA), Rad52, BRCA2 (breast cancer susceptibility protein type 2), RAD54, BRCA1 (breast cancer 1), interacting with BARD1 (BRCA1 associated RING domain 1), BACH1 (BTB and CNC homolog 1 )). The present invention focuses on the production of RNA molecules, such as siRNA, to achieve this goal.

Опосредованное микрогомологией соединение концов (ОМСК)Microhomology-mediated end joining (OMJK)

Когда другие пути рекомбинации не справляются или не активны, ДНР могут подвергаться репарации с помощью другого допускающего ошибки механизма репарации, называемого опосредованным микрогомологией соединением концов (ОМСК). Данный путь все еще требуется полностью охарактеризовать, и иногда его также называют альтернативным соединением концов (альт-СК), хотя не ясно, действительно ли в основе данных двух процессов лежит один и тот же механизм. Наиболее отличительное свойство данного пути, которое отличается от НГСК, состоит в использовании микрогомологии по 5-25 п.о. в процессе выравнивания разорванных нитей ДНК (McVey и Lee, 2008).When other recombination pathways fail or are inactive, DNRs can undergo repair by another error-prone repair mechanism called microhomology-mediated end joining (OMJK). This pathway remains to be fully characterized and is sometimes referred to as alternative end joining (alt-end joining), although it is unclear whether the two processes actually underlie the same mechanism. The most distinctive property of this pathway, which differs from NGSC, is the use of microhomology of 5-25 bp. during the process of straightening broken DNA strands (McVey and Lee, 2008).

ОМСК может происходить на любой стадии клеточного цикла и не зависит от основных факторов НГСК и ГР, т.е. генов Ku70, лигазы IV и Rad52 (Boboila и др., 2010; Yu и McVey, 2010; Lee и Lee, 2007; Ma и др., 2003). Вместо того, чтобы использовать для инициации ОМСК собственный набор белков, наиболее важные применяемые для инициации белки являются компонентами комплекса MRN (MRX в дрожжах), содержащего Mre11, Rad50 и Nbs1 (Xrs2 в дрожжах), также участвующего в первых этапах ГР (Ма и др., 2003). Помимо комплекса MRN многие другие факторы были предложены в качестве участников в ОМСК, например, СТВР-взаимодействующий белок (CtIP; Yun и Hiom, 2009), поли(АДФ-рибоза)-полимераза 1 (PARP1), комплекс лигаза III/Xrcc1, лигаза I (Audebert и др., 2004), ДНК-полимераза θ (Yu и McVey, 2010) и комплекс ERCC1/XPF (Ma и др., 2003). Тем не менее, еще многие другие белки принимают участие в данном процессе.OCSC can occur at any stage of the cell cycle and does not depend on the main factors of NCSC and GR, i.e. Ku70, ligase IV and Rad52 genes (Boboila et al., 2010; Yu and McVey, 2010; Lee and Lee, 2007; Ma et al., 2003). Instead of using its own set of proteins for OSC initiation, the most important proteins used for initiation are components of the MRN complex (MRX in yeast), containing Mre11, Rad50 and Nbs1 (Xrs2 in yeast), also involved in the first stages of GR (Ma et al. ., 2003). Besides the MRN complex, many other factors have been proposed as participants in OMCs, such as CTP-interacting protein (CtIP; Yun and Hiom, 2009), poly(ADP-ribose) polymerase 1 (PARP1), ligase III/Xrcc1 complex, ligase I (Audebert et al., 2004), DNA polymerase θ (Yu and McVey, 2010) and the ERCC1/XPF complex (Ma et al., 2003). However, many other proteins are involved in this process.

Предположили, что в отсутствие других белков, связывающися с концом ДНК (таких как Ku или Rad51), ДНР узнаются PARP1, который затем инициирует их репарацию посредством ОМСК (McVey и Lee, 2008). Процесс репарации, аналогично ГР, начинается с удаления нуклеотидов с 5'- к 3'-концу, которое открывает короткие участки гомологии на каждой стороне от разрыва. Данный этап процессинга осуществляется комплексом MRN и регулируется CtIP (Mladenov и IIiakis, 2011). Комплементарные участки (присутствующие во фрагментах 3'-онДНК) спариваются и некомплементарные фрагменты (флэпы) удаляются (Yu и McVey, 2010), вероятно, комплексом ERCC1/XPF. Бреши (если такие есть) затем заполняются полимеразой (например, ДНК-полимеразой θ или δ (Yu и McVey, 2010; Lee и Lee, 2007)) и разрывы соединяются лигазой I или комплексом лигаза III/Xrcc1.It has been proposed that in the absence of other DNA end-binding proteins (such as Ku or Rad51), DNRs are recognized by PARP1, which then initiates their repair by OMCs (McVey and Lee, 2008). The repair process, similar to GR, begins with the removal of nucleotides from the 5' to 3' end, which exposes short regions of homology on each side of the break. This processing step is carried out by the MRN complex and is regulated by CtIP (Mladenov and IIakis, 2011). Complementary regions (present in 3′ ssDNA fragments) are paired and non-complementary fragments (flaps) are removed (Yu and McVey, 2010), probably by the ERCC1/XPF complex. The gaps (if any) are then filled by a polymerase (e.g. DNA polymerase θ or δ (Yu and McVey, 2010; Lee and Lee, 2007)) and the breaks are bridged by ligase I or the ligase III/Xrcc1 complex.

В отсутствие участков непосредственной микрогомологии на концах ДНК, что наиболее часто встречается, более удаленный фрагмент подвергнутой репарации молекулы можно скопировать, применяя точную ДНК-полимеразу (например, полимеразу 6). Данный дуплицированный участок затем участвует в выравнивании концов ДНК, что приводит к образованию вставки в месте соединения. Данный более сложный вариант опосредованной микрогомологией репарации назвали синтез-зависимой ОМСК (СЗ-ОМСК) (Yu и McVey, 2010).In the absence of areas of direct microhomology at the ends of DNA, which is most common, a more distant fragment of the repaired molecule can be copied using a precise DNA polymerase (for example, polymerase 6). This duplicated region then participates in the alignment of DNA ends, resulting in the formation of an insertion at the junction. This more complex version of microhomology-mediated repair has been called synthesis-dependent OMS (SD-OMS) (Yu and McVey, 2010).

Хотя ОМСК считали альтернативным путем рекомбинационной репарации, было показано, что он очень эффективен в процессе рекомбинации переключения классов IgH в В-лимфоцитах (Boboila и др., 2010), позволяя предложить, что он может играть большую роль, чем просто быть запасным механизмом. Также возможно, что некоторые ДНР, например, несовместимые выступы или тупые концы (которые плохо поддаются репарации посредством НГСК и/или ГР), могут более эффективно репарироваться посредством ОМСК (Zhang и Paull, 2005).Although OMC has been considered an alternative pathway for recombinational repair, it has been shown to be very efficient in the process of IgH class switch recombination in B cells (Boboila et al., 2010), suggesting that it may play a greater role than simply being a backup mechanism. It is also possible that some DNRs, such as incompatible protrusions or blunt ends (which are difficult to repair by NGSCs and/or GR), may be more efficiently repaired by OMSCs (Zhang and Paull, 2005).

В ТАБЛИЦЕ D перечислены некоторые из ключевых генов в каждом из трех путей, которые, следовательно, также являются ключевыми мишенями для влияния на каждый из трех путей (см. также публикацию патента США 20120231449, которая полностью включена в данную заявку посредством ссылки). В указанную таблицу также включены белки, участвующие в репарации ДНК, такие как MDC1 и MHS2. MDC1 необходим для активации в ответ на повреждение ДНК контрольной точки в S-фазе и контрольной точки фазы G2/M клеточного цикла. Тем не менее, MDC1 также функционирует в опосредованной Rad51 гомологичной рекомбинации путем удерживания Rad51 в хроматине.TABLE D lists some of the key genes in each of the three pathways, which are therefore also key targets for influence on each of the three pathways (see also US Patent Publication 20120231449, which is incorporated herein by reference in its entirety). This table also includes proteins involved in DNA repair, such as MDC1 and MHS2. MDC1 is required for activation in response to DNA damage of the S phase checkpoint and G2/M phase checkpoint of the cell cycle. However, MDC1 also functions in Rad51-mediated homologous recombination by retaining Rad51 in chromatin.

"Нокдаун" в контексте настоящего изобретения означает, что экспрессия целевого гена снижается, например, на 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% или более. Полное подавление означает, что больше нет детектируемой экспрессии целевого гена. В таблице D также показаны результаты, полученные для некоторых мишеней для нокдауна. Для специалиста в данной области должно быть очевидно, что существуют вариации в последовательностях нуклеиновых кислот указанных мишеней, следовательно, варианты генов, в частности, варианты, последовательности которых идентичны на 80%, 90% или 95% последовательностям мишеней, входят в объем настоящего изобретения."Knockdown" in the context of the present invention means that the expression of the target gene is reduced, for example, by 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% or more. Complete suppression means that there is no longer detectable expression of the target gene. Table D also shows the results obtained for some knockdown targets. It will be apparent to one skilled in the art that variations exist in the nucleic acid sequences of these targets and therefore gene variants, particularly variants that are 80%, 90% or 95% sequence identical to the target sequences, are within the scope of the present invention.

ПРОЦЕССИНГ БЕЛКА И МЕТАБОЛИЧЕСКИЕ БЕЛКИPROTEIN PROCESSING AND METABOLIC PROTEINS

Данная категория белков, которые можно применять для клеточной метаболической инженерии, не принадлежит ни к пути секреции белка, ни к пути рекомбинации, но иным образом влияет на процессы, свойственные экспрессирующей клетке.This category of proteins that can be used for cellular metabolic engineering does not belong to either the protein secretion or recombination pathway, but otherwise influences the processes inherent in the expressing cell.

Белки процессинга белка или метаболические белки часто представляют собой ферменты, такие как шапероны (см. выше определения шаперонов), протеин-изомеразы, добавляющие сахар ферменты (например, сиалил- или гликозилтра нефе разы) или фосфатазы, или белки, контролирующие уровень энергии клетки или функции митохондрий.Protein processing proteins or metabolic proteins are often enzymes such as chaperones (see definitions of chaperones above), protein isomerases, sugar adding enzymes (eg sialyl or glycosylate enzymes) or phosphatases, or proteins that control cellular energy levels or mitochondrial functions.

В ТАБЛИЦЕ А приведен перечень белков, которые экспрессировали (экспр.) и/или экспрессию которых "подавляли" (нокдаун, НД), под подзаголовком "Процессинг белка и метаболические белки".TABLE A provides a list of proteins that were expressed (exp.) and/or whose expression was “suppressed” (knockdown, ND), under the subtitle “Protein Processing and Metabolic Proteins.”

РАЗРАБОТКА ВЕКТОРАVECTOR DEVELOPMENT

Среди невирусных векторов транспозоны особенно привлекательны благодаря их способности встраивать единичные копии последовательностей ДНК с высокой частотой в многочисленные локусы внутри генома хозяина. Сообщалось, что, в отличие от вирусных векторов, некоторые транспозоны преимущественно не встраиваются близко к клеточным генам, и они, таким образом, с меньшей вероятностью приводят к повреждающим мутациям. Более того, транспозоны легко получить и легко с ними обращаться, включая, как правило, донорную плазмиду, несущую транспозон, которая содержит перемещаемую ДНК, фланкированную последовательностями инвертированных повторов, и экспрессирующую транспозазу вспомогательную плазмиду или мРНК. Разработали несколько систем транспозонов для перемещения ДНК в различных линиях клеток, не препятствуя эндогенным копиям транспозона. Например, транспозон PiggyBac (РВ), изначально выделенный из металловидки серой, эффективно переносит целевую ДНК в различные клетки млекопитающих.Among nonviral vectors, transposons are particularly attractive due to their ability to insert single copies of DNA sequences at high frequency into multiple loci within the host genome. It has been reported that, unlike viral vectors, some transposons do not preferentially insert close to cellular genes, and they are thus less likely to lead to damaging mutations. Moreover, transposons are easy to obtain and handle, typically comprising a transposon-carrying donor plasmid that contains transposable DNA flanked by inverted repeat sequences and a transposase-expressing helper plasmid or mRNA. Several transposon systems have been developed to move DNA in different cell lines without interfering with endogenous copies of the transposon. For example, the PiggyBac (PB) transposon, originally isolated from metallic sulfur, efficiently transfers target DNA into various mammalian cells.

Эпигенетические регуляторные элементы можно применять, чтобы защитить перемещаемую ДНК от нежелательных эпигенетических эффектов, когда ее помещают рядом с трансгеном в плазмидные векторы. Например, предложили элементы, называемые участками прикрепления к матриксу (MAR), чтобы повысить встраивание в геном и транскрипцию перемещаемой ДНК, при этом предотвращая замалчивание гетерохроматина, примером которых является эффективный MAR 1-68 человека. Они также могут действовать как инсуляторы и, тем самым, предотвращать активацию соседних клеточных генов. Элементы MAR, таким образом, применяют, чтобы опосредовать высокий уровень продолжительной экспрессии в контексте плазмидных или вирусных векторов.Epigenetic regulatory elements can be used to protect translocated DNA from unwanted epigenetic effects when placed adjacent to a transgene in plasmid vectors. For example, elements called matrix attachment regions (MARs) have been proposed to enhance genomic incorporation and transcription of translocated DNA while preventing heterochromatin silencing, exemplified by the efficient human MAR 1-68. They can also act as insulators and thereby prevent the activation of neighboring cellular genes. MAR elements are thus used to mediate high levels of long-lasting expression in the context of plasmid or viral vectors.

В данной заявке показано, что при правильной разработке вектора благоприятные свойства эпигенетических регуляторов, в частности, элементов MAR, можно комбинировать с таковыми у векторов на основе транспозонов.This application demonstrates that, with proper vector design, the beneficial properties of epigenetic regulators, in particular MAR elements, can be combined with those of transposon-based vectors.

Транспозоны и векторы на основе транспозонов согласно настоящему изобретению можно применять в клеточной метаболической инженерии, например, для экспрессии секреторных белков из различных секреторных путей, описанных в данной заявке. Они также особенно полезны, когда требуется несколько раундов внедрения перемещаемой ДНК. Это подтвердили, когда тестировали множество белков секреторного пути клетки, когда трансфекция множеством векторов и/или множество следующих друг за другом циклов трансфекции могут исчерпать доступный антибиотик или помешать другим способам селекции. Возможность быстро экспрессировать терапевтические белки без необходимости селекции антибиотиком также представляет особый интерес, например, когда нужно экспрессировать множество кандидатных терапевтических белков с целью скрининга, поскольку можно получить значительные количества белков из не подвергнутых селекции популяций клеток через 2-3 недели после трансфекции. В частности, содержащие MAR векторы, несущие транспозоны, таким образом, представляют собой перспективное дополнение к доступному на сегодняшний день арсеналу векторов экспрессии.Transposons and transposon-based vectors according to the present invention can be used in cellular metabolic engineering, for example, for the expression of secretory proteins from various secretory pathways described in this application. They are also particularly useful when multiple rounds of insertion of translocated DNA are required. This was confirmed when multiple proteins in the cell's secretory pathway were tested, where transfection with multiple vectors and/or multiple successive rounds of transfection could exhaust the available antibiotic or interfere with other selection methods. The ability to rapidly express therapeutic proteins without the need for antibiotic selection is also of particular interest, for example when multiple candidate therapeutic proteins need to be expressed for screening purposes, since significant quantities of proteins can be recovered from unselected cell populations 2-3 weeks after transfection. In particular, MAR-containing transposon-carrying vectors thus represent a promising addition to the currently available arsenal of expression vectors.

Выбранные экспериментальные подходы позволили (в противоположность подходам, в которых полагаются на анализы на основе антибиотиков) провести различие между эффектами, основанными на (1) числе копий перемещаемой ДНК, и эффектами, основанными на (2) уровни экспрессии перемещаемой ДНК.The experimental approaches chosen allowed (as opposed to approaches that rely on antibiotic-based assays) to distinguish between effects based on (1) copy number of translocated DNA and effects based on (2) expression levels of translocated DNA.

MAR 1-68 был особенно эффективен, когда он был расположен посередине между ITR транспозона PiggyBac, так как он не снижал эффективность транспозиции. MAR Х-29 также хорошо работал на краях транспозона, не снижая эффективность транспозиции или экспрессии.MAR 1-68 was particularly effective when it was located midway between the ITRs of the PiggyBac transposon, as it did not reduce transposition efficiency. MAR X-29 also worked well at transposon edges without reducing transposition or expression efficiency.

Примечательно, что степень MAR-опосредованной активации перемещенных генов была меньше, по сравнению с таковой для самопроизвольного встраивания плазмиды. Более того, уровень экспрессии, нормированный, например, на копии трансгена, был выше при применении транспозонов, чем полученный в результате самопроизвольного встраивания плазмид в отсутствие транспозазы. Данный эффект наблюдали независимо от размера конструкций, присутствия MAR или силы промотора. Этого будут ожидать, так как транспозиция часто может происходить в геномных локусах, относительно позволяющих экспрессию, например, благодаря тому, что структуры хроматина могут быть более доступны как для транспозазы, так и для факторов транскрипции. В этом отношении, предшествующие исследования позволили предположить, что транспозоны преимущественно могут встраиваться внутрь интронов генов, в промоторы или в геномные локусы с более низкой способностью к замалчиванию, хотя данное утверждение остается темой для обсуждения. В качестве альтернативы, совместное встраивание множества копий плазмиды в один и тот же геномный локус, которое происходит в результате событий самопроизвольного встраивания, может приводить к образованию гетерохроматина и к замалчиванию повторяемых последовательностей, которому будет препятствовать MAR, тогда как встраивание единственной копии транспозона может в меньшей степени способствовать такому опосредованному хроматином замалчиванию. Кроме того, встраивание транспозонов в множество независимых геномных локусов повышает вероятность того, что по меньшей мере одна копия встроилась в благоприятное геномное окружение и экспрессируется, тогда как обнаружили, что встраивание плазмиды происходит преимущественно только в один геномный локус.Notably, the extent of MAR-mediated activation of translocated genes was less than that for spontaneous plasmid insertion. Moreover, the level of expression normalized, for example, to the transgene copy, was higher using transposons than that obtained by spontaneous insertion of plasmids in the absence of transposase. This effect was observed regardless of the size of the constructs, the presence of MAR, or promoter strength. This would be expected since transposition can often occur at genomic loci that are relatively permissive of expression, for example because chromatin structures may be more accessible to both transposase and transcription factors. In this regard, previous studies have suggested that transposons may preferentially insert within gene introns, promoters, or genomic loci with lower silencing capacity, although this remains a topic of debate. Alternatively, the co-incorporation of multiple copies of a plasmid into the same genomic locus, which occurs as a result of spontaneous insertion events, may result in the formation of heterochromatin and silencing of repeated sequences, which would be prevented by MAR, whereas the insertion of a single copy of a transposon may be less likely to occur. extent to contribute to such chromatin-mediated silencing. In addition, the insertion of transposons into multiple independent genomic loci increases the likelihood that at least one copy has inserted into a favorable genomic environment and is expressed, whereas plasmid insertion has been found to occur predominantly at only one genomic locus.

Наиболее высокие уровни экспрессии перемещаемой ДНК, например, трансген/TER, получили для содержащего MAR транспозона, когда он был связан с сильным промотором. Неожиданно было обнаружено, что высокие уровни экспрессии можно получить при перемещении незначительного числа копий ДНК, например, не более чем 20, 15, 10 или 5. Если, тем не менее, удается добиться высокой продуктивности, меньшее количество встроенных, например, перемещаемых копий ДНК является преимуществом, так как благодаря этому снижается вероятность возникновения точечных мутаций в одном или в подгруппе указанных трансгенов, возникающих в результате спонтанных событий мутагенеза. Кроме того, опосредованные транспозазой события встраивания менее мутагенны, чем механизмы репарации и рекомбинации ДНК, вовлеченные в самопроизвольное встраивание плазмиды, которые могут приводить к встраиванию неполных или перестроенных копий трансгена.The highest levels of expression of translocated DNA, such as transgene/TER, were obtained for the MAR-containing transposon when it was associated with a strong promoter. Surprisingly, it has been discovered that high levels of expression can be obtained by moving a small number of DNA copies, for example, no more than 20, 15, 10 or 5. If, however, high productivity can be achieved, a smaller number of inserted, for example, transferred DNA copies is an advantage because it reduces the likelihood of point mutations occurring in one or a subset of these transgenes resulting from spontaneous mutagenesis events. In addition, transposase-mediated insertion events are less mutagenic than the DNA repair and recombination mechanisms involved in spontaneous plasmid insertion, which can result in the insertion of incomplete or rearranged copies of the transgene.

Высокая эффективность встраивания в геном с помощью транспозона piggyBac (РВ) также полезна, когда количество целевых клеток ограничено, например, для невирусного переноса терапевтических генов в первичные стволовые клетки для получения клональных популяций, например, для основанных на клеточной системе методов лечения или регенеративной медицины. В данном контексте, физиологические уровни экспрессии с нескольких перемещенных копий ДНК и частое возникновение событий транспозиции, таким образом, избавляющие от необходимости селекции антибиотиком, являются преимуществом, поскольку использование генов устойчивости к антибиотикам и/или ненадежной, например, экспрессии трансгена может вызывать сомнения относительно безопасности.The high genomic insertion efficiency of the piggyBac (PB) transposon is also useful when the number of target cells is limited, for example, for non-viral transfer of therapeutic genes into primary stem cells to generate clonal populations, for example, for cell-based therapies or regenerative medicine. In this context, physiological levels of expression from multiple transposed DNA copies and the frequent occurrence of transposition events, thus obviating the need for antibiotic selection, are an advantage since the use of antibiotic resistance genes and/or unreliable, for example, transgene expression may raise safety concerns .

Влияние включения MAR на эффективность транспозицииEffect of MAR inclusion on transposition efficiency

Так как устойчивость к антибиотику не обязательно отражает эффективную экспрессию трансгена, в качестве индикатора использовали зеленый флуоресцентный белок (GFP), экспрессируемый с производного сильного клеточного промотора GAPDH. Для того, чтобы проверить, может ли добавление элемента MAR в транспозон РВ влиять на эффективность транспозиции и экспрессию трансгена, и чтобы оценить, оказывает ли расположение MAR в конструкции какое-либо влияние на данные эффекты, разработали серию донорных конструкций, несущих транспозоны, содержащих GFP и ген устойчивости к пуромицину (Puro), в которые встроили MAR 1-68 или контрольную нейтральную спейсерную последовательность ДНК в различные положения в указанной плазмиде (фигура 1). Исходную несущую транспозон плазмиду Puro-GFP без вставки использовали в качестве контроля транспозиции, чтобы отличить вклад увеличенного размера транспозона от влияния добавления MAR или спейсерной последовательности.Since antibiotic resistance does not necessarily reflect efficient transgene expression, green fluorescent protein (GFP) expressed from a derivative of the strong cellular GAPDH promoter was used as an indicator. To test whether the addition of a MAR element to the PB transposon could affect transposition efficiency and transgene expression, and to evaluate whether the location of the MAR in the construct had any influence on these effects, a series of donor constructs carrying transposons containing GFP were developed and the puromycin resistance gene (Puro), into which MAR 1-68 or a control neutral spacer DNA sequence was inserted at various positions in the plasmid (Figure 1). The original transposon-carrying Puro-GFP plasmid without the insert was used as a transposition control to distinguish the contribution of increased transposon size from the effect of the addition of a MAR or spacer sequence.

В присутствии транспозазы наблюдали наиболее высокий уровень экспрессии GFP в не подвергнутых отбору клетках, когда MAR был расположен посередине, но не тогда, когда MAR помещали в 5'-3' направлении от последовательности, кодирующей GFP, и не тогда, когда его вставляли вне перемещенной последовательности, как и ожидалось (фигура 3А). При селекции пуромицином MAR-опосредованная активация уменьшалась, как с транспозазой, так и без нее, тогда как средние значения экспрессии GFP были повышены на один порядок величины (фигура 3В). Полученные результаты подтвердили, что отбор пуромицином позволял получить лишь небольшое число клеток, в которых уровни экспрессии наиболее высоки, что предполагали выше по подсчету событий транспозиции. Дополнительно показано, что векторы на основе транспозонов, содержащие MAR, расположенный по центру, позволяли получить уровни экспрессии, аналогичные таковым для такой же плазмиды, трансфицированной без транспозаз.In the presence of transposase, the highest level of GFP expression was observed in unselected cells when the MAR was positioned in the middle, but not when the MAR was placed 5'-3' of the GFP coding sequence, and not when it was inserted outside the transposase. sequences as expected (Figure 3A). Upon puromycin selection, MAR-mediated activation was reduced, both with and without transposase, whereas mean GFP expression values were increased by one order of magnitude (Figure 3B). The results confirmed that puromycin selection produced only a small number of cells in which expression levels were highest, as suggested by the above counts of transposition events. Additionally, it was shown that transposon-based vectors containing a centrally located MAR produced expression levels similar to those of the same plasmid transfected without transposases.

Влияние включения MAR на число копий встроенного транспозонаEffect of MAR inclusion on the copy number of an integrated transposon

Более высокие уровни флуоресценции GFP могут возникать в результате повышенной транскрипции трансгенов и/или встраивания большего числа копий трансгена. Это оценивали путем определения количества встроенных в геном копий трансгена, внедренных с помощью различных типов векторов. Общую геномную ДНК выделяли из объединенных популяций клеток, либо после цитофлуори метрической сортировки флуоресцирующих клеток из не подвергнутых селекции популяций, либо после отбора по устойчивости к пуромицину. Число копий трансгена определяли с помощью анализа методом количественной полимеразной цепной реакции (qPCR) последовательности, кодирующей GFP, по сравнению с клеточным геном β2-микроглобулина (В2М). В отсутствие отбора антибиотиком среднее количество встроенных трансгенов, либо транспозазой, либо клеточными ферментами рекомбинации, было сходным, около 1-6 копий на геном, и на него значительно не влияли MAR или контрольная последовательность (фиг. 4А). Тем не менее, наименьшее число копий получали, когда MAR вставляли на границе транспозона, что поддерживает наше более раннее заключение, что он уменьшает транспозицию в данном положении. После селекции пуромицином клеток с высоким уровнем экспрессии количество перемещенных трансгенов оказалось в аналогичном диапазоне 2-7 копий (фиг. 4В). Тем не менее, количество копий трансгенов, встроенных в отсутствие транспозазы, как правило, было значительно выше и находилось в диапазоне от 6 до 14 копий. Это можно легко объяснить тем фактом, что самопроизвольное встраивание обычно приводит к встраиванию конкатемеров нескольких копий плазмиды в один геномный локус (результаты не представлены), и что большее число копий трансгенов должно приводить к более высоким уровням экспрессии, если клетки, подвергнутые влиянию замалчивания, были удалены путем отбора антибиотиком. Наряду с предшествующим заключением, что отбор антибиотиком позволяет получить преимущественно клетки с высоким уровнем экспрессии, это также свидетельствует о том, что самопроизвольное встраивание плазмиды приводит к большей вариабельности числа копий трансгена, чем при применении векторов на основе транспозонов.Higher levels of GFP fluorescence may result from increased transcription of transgenes and/or insertion of more copies of the transgene. This was assessed by determining the number of transgene copies introduced into the genome using different types of vectors. Total genomic DNA was isolated from pooled cell populations, either after cytofluorimetric sorting of fluorescent cells from unselected populations or after selection for puromycin resistance. Transgene copy number was determined by quantitative polymerase chain reaction (qPCR) analysis of the GFP coding sequence compared with the cellular β2-microglobulin (B2M) gene. In the absence of antibiotic selection, the average number of transgenes inserted, either by transposase or cellular recombination enzymes, was similar, about 1–6 copies per genome, and was not significantly affected by MAR or control sequence (Fig. 4A). However, the lowest copy number was obtained when the MAR was inserted at the transposon boundary, supporting our earlier conclusion that it reduces transposition at this position. After puromycin selection of cells with high levels of expression, the number of transgenes transferred was in a similar range of 2-7 copies (Fig. 4B). However, the copy number of transgenes inserted in the absence of transposase was generally significantly higher, ranging from 6 to 14 copies. This can be easily explained by the fact that spontaneous insertion usually results in the insertion of concatemers of multiple copies of the plasmid into a single genomic locus (results not shown), and that higher copy numbers of transgenes should lead to higher expression levels if cells affected by silencing were removed by antibiotic selection. Together with the previous finding that antibiotic selection produces predominantly high-expressing cells, this also suggests that spontaneous plasmid insertion results in greater transgene copy number variability than with transposon-based vectors.

Уровень экспрессии GFP затем нормировали на число копий гена, чтобы оценить внутренний экспрессионный потенциал указанных векторов независимо от их способности встраиваться в геном. В целом, получали более низкий уровень экспрессии на копию трансгена для не подвергнутых селекции клеток или для подвергнутых селекции антибиотиком клеток, трансфицированных без транспозазы или с MAR в центральном положении, что указывает на то, что на экспрессию трансгена влияет как включение эпигенетического регуляторного элемента, так и способ встраивания трансгена (фиг. 5). Уровень экспрессии на копию гена, как правило, повышался при применении транспозазы, когда проводили оценку различных векторов и комбинаций элементов, и данный эффект наблюдали как при отборе антибиотиком, так и без него. Наиболее высокие уровни экспрессии на копию трансгена получали после отбора антибиотиком клеток, в которые был внедрен вектор, несущий транспозон, содержащий элемент MAR в центральном положении, в присутствии транспозазы. Включение MAR непосредственно в 5'-3' направлении от последовательности, кодирующей GFP, значительно не повышало экспрессию трансгена, что было отмечено ранее для абсолютных уровней экспрессии.The level of GFP expression was then normalized to the gene copy number to assess the intrinsic expression potential of these vectors, regardless of their ability to integrate into the genome. In general, lower levels of expression per transgene copy were obtained for unselected cells or for antibiotic-selected cells transfected without transposase or with MAR at the central position, indicating that transgene expression is affected by both the inclusion of an epigenetic regulatory element and and a method for inserting the transgene (Fig. 5). Expression levels per gene copy were generally increased by transposase when different vectors and element combinations were evaluated, and this effect was observed with and without antibiotic selection. The highest levels of expression per transgene copy were obtained after antibiotic selection of cells into which a vector carrying a transposon containing a MAR element in the central position was introduced, in the presence of a transposase. Incorporation of a MAR immediately 5'-3' of the GFP coding sequence did not significantly increase transgene expression, as previously noted for absolute expression levels.

Наконец, оценивали, может ли благоприятное влияние MAR 1-68 на экспрессию быть ограничено использованием сильного промотора GAPDH человека, применяемого в данном случае, или оно также будет иметь место с другими промоторами. Таким образом, мы заменили промотор GAPDH человека, запускающий экспрессию GFP, на более слабый ранний промотор вируса обезьян 40 (SV40). Применение более слабого промотора позволяло получить сравнимое количество GFP-положительных клеток и встроенных трансгенов, указывая на то, что экспрессия трансгена не изменяет эффективность транспозиции (не представленные результаты, фиг. 2А и фиг. 4В). Тем не менее, абсолютные уровни экспрессии были ниже при применении промотора SV40 (не представленные результаты по сранению с фиг. 3В). Кроме того, уровень экспрессии, нормированный на число копий транспозона, снижался в 4,6 раз при применении промотора SV40 в отсутствие MAR и в 3,1 раза в присутствии MAR 1-68 (результаты не представлены). Это свидетельствует о том, что MAR мог частично, но не полностью, предотвращать снижение экспрессии, возникшее в результате применения более слабого промотора, даже в присутствии транспозазы. В целом, можно показать, что нескольких встроенных копий достаточно для получения высокого уровня экспрессии трансгена с помощью транспозонов, и что наиболее высокий уровень экспрессии на трансген получали, когда, в данном контексте, MAR-68 помещали в 3'-5' направлении от сильного промотора.Finally, it was assessed whether the beneficial effect of MAR 1-68 on expression could be limited to the use of the strong human GAPDH promoter used here, or would also occur with other promoters. Thus, we replaced the human GAPDH promoter, which drives GFP expression, with the weaker simian virus 40 (SV40) early promoter. Use of a weaker promoter produced comparable numbers of GFP-positive cells and inserted transgenes, indicating that transgene expression did not alter transposition efficiency (results not shown, Fig. 2A and Fig. 4B). However, absolute expression levels were lower when using the SV40 promoter (results not shown compared with Fig. 3B). In addition, the expression level normalized to transposon copy number was reduced by 4.6-fold when using the SV40 promoter in the absence of MAR and by 3.1-fold in the presence of MAR 1-68 (results not shown). This suggests that MAR could partially, but not completely, prevent the reduction in expression resulting from the use of a weaker promoter, even in the presence of the transposase. Overall, it can be shown that a few inserted copies are sufficient to produce high levels of transgene expression by transposons, and that the highest level of expression per transgene was obtained when, in this context, MAR-68 was placed in the 3'-5' direction of the strong promoter

Клетки СНО-М подвергали электропорации один или два раза одним вектором на основе транспозонов, содержащим трансген MAR Х_29. Эффективность транспозиции была наиболее высокой после электропорации (стабильная экспрессия наблюдалась в 30% - 45% клеток). Тем не менее, уровни экспрессии трансгена были аналогичны таковым при химической трансфекции, при которой наблюдали меньшее количество положительных клеток и, следовательно, более низкую эффективность транспозиции. На фиг. 7 показаны результаты для легких и тяжелых цепей терапевтических иммуноглобулинов, встроенных в 3'-5' направлении от MAR Х_29, и были получены титры в диапазоне от 1 до 8 мкг/мл. Указанные уровни дополнительно повышались до 23-55 мкг/мл после сортировки экспрессирующих клеток (фиг. 7С).CHO-M cells were electroporated once or twice with a single transposon-based vector containing the MAR X_29 transgene. Transposition efficiency was highest after electroporation (stable expression was observed in 30% - 45% of cells). However, transgene expression levels were similar to those observed with chemical transfection, in which fewer positive cells and therefore lower transposition efficiency were observed. In fig. 7 shows results for the light and heavy chains of therapeutic immunoglobulins inserted in the 3'-5' direction of MAR X_29, and titers ranging from 1 to 8 μg/ml were obtained. These levels increased further to 23-55 μg/ml after sorting the expressing cells (Fig. 7C).

Экспрессию трансгенов также можно существенно повысить, часто независимо от применения транспозонов, путем разработки определенного вектора, в частности, с применением определенного элемента(ов) MAR в определенных положениях относительно трансгена и, предпочтительно, комбинации данного элемента(ов) MAR с промоторами, энхансерами или продуктами их слияния.The expression of transgenes can also be significantly increased, often independently of the use of transposons, by designing a specific vector, in particular using specific MAR element(s) at specific positions relative to the transgene and, preferably, a combination of these MAR element(s) with promoters, enhancers or products of their fusion.

Соответствующий вектор может содержать элементы MAR, которые фланкируют кассету экспрессии трансгена. Например, указанный вектор может содержать, например, элементы MAR (один или более), расположенные в 3'-5' направлении, и элементы MAR (один или более), расположенные в 5'-3' направлении, например, один MAR, расположенный в 3'-5' направлении от кассеты экспрессии трансгена, и один MAR, расположенный в 5'-3' направлении от нее (фиг. 18А, фиг. 18В, фиг. 19). Указанный вектор может содержать встроенный ген устойчивости к пуромицину под контролем промотора SV40. Трансген может находиться под контролем промотора GAPDH человека, слитого с энхансером немедленно-ранних генов цитомегаловируса (CMV) человека (в частности, слитый промотор CGAPD, обсуждаемый выше).A suitable vector may contain MAR elements that flank the transgene expression cassette. For example, said vector may contain, for example, one or more MAR elements located in the 3'-5' direction, and one or more MAR elements located in the 5'-3' direction, for example, one MAR located in the 3'-5' direction from the transgene expression cassette, and one MAR located in the 5'-3' direction from it (Fig. 18A, Fig. 18B, Fig. 19). Said vector may contain an integrated puromycin resistance gene under the control of the SV40 promoter. The transgene may be under the control of a human GAPDH promoter fused to a human cytomegalovirus (CMV) immediate-early gene enhancer (specifically the CGAPD promoter fusion discussed above).

Наиболее высокий процентиль клеток с высоким и очень высоким уровнем продукции (% М3/М2), который оценивали по флуоресценции GFP с помощью анализа FACS и наименьшей вариабельности, можно было получить при применении 1_6R2, 1_68R2 и X_29R3 в качестве MAR, расположенных в 3'-5' направлении (свыше 80%, 80% и свыше 80%). Таким образом, процентили клеток с высоким и очень высоким уровнем продукции (% М3/М2), составляющие более чем 70%, более чем 75% или более чем 80%, входят в объем настоящего изобретения. Для специалиста в данной области должно быть очевидно, что допустимы некоторые отклонения от определенной последовательности данных элементов MAR. Соответственно, векторы, содержащие последовательности нуклеиновых кислот, более чем на 80%, 85%, 90%, 95% идентичные последовательностям SEQ ID NO: 6, 7, 8, 9 и 10, входят в объем настоящего изобретения (фиг. 18А, фиг. 18В).The highest percentile of cells with high and very high production (% M3/M2), as assessed by GFP fluorescence using FACS analysis and the lowest variability, could be obtained using 1_6R2, 1_68R2 and X_29R3 as MARs located in the 3'- 5' direction (over 80%, 80% and over 80%). Thus, percentiles of cells with high and very high production levels (% M3/M2) of greater than 70%, greater than 75%, or greater than 80% are within the scope of the present invention. It will be apparent to one skilled in the art that some deviations from the defined sequence of these MAR elements are acceptable. Accordingly, vectors containing nucleic acid sequences more than 80%, 85%, 90%, 95% identical to the sequences of SEQ ID NO: 6, 7, 8, 9 and 10 are within the scope of the present invention (Fig. 18A, Fig. .18V).

Затухание экспрессии в биореакторе и/или в отсутствие селекционного давления часто ограничивает получение интересующего белка. Векторы, содержащие производные 1_68R2, 1_6R2 и X_29R3 MAR в качестве MAR, расположенных в 3'-5' направлении, исследовали на протяжении периода культивирования 5 недель в отсутствие селекции, и флуоресценцию GFP оценивали еженедельно в течение данного периода. При рассмотрении процентиля субпопуляции М3 обнаружили, что элемент 1_6R2 в качестве MAR, расположенного в 3'-5' направлении, и неперестроенный MAR 1-68 в качестве MAR, расположенного в 5'-3' направлении, оказались наилучшей из исследованных комбинаций в векторах с по меньшей мере одним элементом MAR, расположенным в 3'-5' направлении, и одним элементом MAR, расположенным в 5'-3' направлении (значительно выше 80% после более 2, 3, 4 недель) (см. фиг. 19).Attenuation of expression in a bioreactor and/or in the absence of selection pressure often limits production of the protein of interest. Vectors containing derivatives of 1_68R2, 1_6R2 and X_29R3 MAR as MARs located in the 3'-5' direction were examined over a culture period of 5 weeks in the absence of selection, and GFP fluorescence was assessed weekly during this period. When considering the percentile of the M3 subpopulation, element 1_6R2 as a MAR located in the 3'-5' direction and unrearranged MAR 1-68 as a MAR located in the 5'-3' direction were found to be the best combination tested in vectors with at least one MAR element located in the 3'-5' direction and one MAR element located in the 5'-3' direction (well above 80% after more than 2, 3, 4 weeks) (see Fig. 19) .

Разработанный аналогичным образом вектор также может содержать, например, только элементы MAR (один или более), расположенные в 5'-3' направлении, например, один MAR, расположенный в 5'-3' направлении от кассеты экспрессии трансгенов (фиг. 20А, 20В, 21 и 22), и не содержать MAR, расположенного в 3'-5' направлении. Указанный вектор также, в данном случае, может содержать встроенный ген устойчивости к пуромицину под контролем промотора SV40. Трансген может находиться под контролем промотора GAPDH человека, слитого с энхансером немедленно-ранних генов цитомегаловируса (CMV) человека. См., например, SEQ ID NO: 11 и другие последовательности, идентичные более чем на 80%, 85%, 90% или 95% указанной последовательности. В такой комбинации с единичным MAR, где в качестве MAR выступал Х_29, добились превосходных результатов. Процентиль клеток с высоким уровнем экспрессии GFP (определенная, как описано выше), а также стабильность экспрессии с течением времени (определенная, как описано выше) были лучше, чем, например, таковые для векторов с высоким уровнем экспрессии, в которых элементы MAR фланкировали кассету экспрессии трансгена, а именно, для вектора, содержащего MAR 1_6R2, расположенный в 3'-5' направлении, и неперестроенный MAR 1-68, расположенный в 5'-3' направлении (см. фиг. 22). Данное открытие противопоставляется общепринятым предположениям, что элементы MAR наиболее эффективны, когда они фланкируют трансген (см. патент США 5731178). Стабильность экспрессии означает, что интересующая ДНК, например, трансген, экспрессируется популяцией клеток даже после некоторого периода времени, например, после более чем 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 недель, на уровне, сравнимом (не более чем на 20%, 10 или 5% меньшем) и, особенно, даже более высоком, чем в течение двух недель от начала экспрессии. Часто стабильная экспрессия связана с высокой процентилью (например, более чем 80%) субпопуляций клеток с высоким уровнем экспрессии.A similarly designed vector may also contain, for example, only one or more MAR elements located in the 5'-3' direction, for example, one MAR located in the 5'-3' direction of the transgene expression cassette (Fig. 20A, 20B, 21 and 22), and do not contain MAR located in the 3'-5' direction. Said vector may also, in this case, contain an integrated puromycin resistance gene under the control of the SV40 promoter. The transgene may be under the control of the human GAPDH promoter fused to the human cytomegalovirus (CMV) immediate-early gene enhancer. See, for example, SEQ ID NO: 11 and other sequences that are more than 80%, 85%, 90% or 95% identical to the specified sequence. In this combination with a single MAR, where X_29 acted as the MAR, excellent results were achieved. The percentile of cells with high levels of GFP expression (determined as described above) as well as the stability of expression over time (determined as described above) were better than, for example, those for high expression vectors in which MAR elements flanked the cassette expression of the transgene, namely, for a vector containing MAR 1_6R2 located in the 3'-5' direction, and unrearranged MAR 1-68 located in the 5'-3' direction (see Fig. 22). This finding contrasts with the generally accepted assumption that MAR elements are most effective when they flank a transgene (see US Pat. No. 5,731,178). Stability of expression means that the DNA of interest, such as a transgene, is expressed by a population of cells even after a period of time, for example, after more than 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 or 14 weeks, at a level comparable (no more than 20%, 10 or 5% less) and, especially, even higher than within two weeks from the start of expression. Often, stable expression is associated with a high percentile (eg, greater than 80%) of cell subpopulations with high levels of expression.

КЛЕТОЧНАЯ МЕТАБОЛИЧЕСКАЯ ИНЖЕНЕРИЯ: СЕКРЕТОРНЫЕ БЕЛКИCELLULAR METABOLIC ENGINEERING: SECRETORY PROTEINS

Секреция гетерологичных белков, таких как IgG, снижается при неправильном процессинге полипептида и низкой продукции IgG в культивируемых клетках, таких как клетки СНО.Secretion of heterologous proteins such as IgG is reduced by improper polypeptide processing and low IgG production in cultured cells such as CHO cells.

Наблюдали, что вызывалась экспрессия индуцированных стрессом шаперонов, таких как BiP, и что шаперон правильно локализовался в ЭР и был способен взаимодействовать с цепями предшественника IgG. Впрочем, IgG, содержащие определенные вариабельные последовательности, такие, которые обнаруживаются в инфликсимабе, тем не менее, неправильно процессировались и собирались, что приводило к низкой секреции. Следовательно, активация реакции несвернутых белков (UPR) в данных клетках оставалась неэффективной для восстановления существенного уровня иммуноглобулина.It was observed that the expression of stress-induced chaperones such as BiP was induced and that the chaperone was correctly localized to the ER and was able to interact with IgG precursor chains. However, IgG containing certain variable sequences, such as those found in infliximab, were however not processed and collected correctly, resulting in low secretion. Consequently, activation of the unfolded protein response (UPR) in these cells remained ineffective to restore significant levels of immunoglobulin.

Было показано, что SRP14 вовлечен в молекулярный этап секреторного пути, который является лимитирующим в клетках СНО, экспрессирующих сверх меры экзогенный белок. Примечательно, что данный лимитирующий этап также наблюдается для легко экспрессируемого трастузумаба, что легко приводит к получению клонов с высоким уровнем экспрессии. Данное заключение следовало за открытием, что экспрессия SRP14 человека легко восстанавливала экспрессию LP клонов, но она также повышала секрецию легко экспрессируемого IgG. Обнаружили, что экспрессия SRP14 повышает процессинг и доступность предшественников LC и НС и позволяет получить сравнимые уровни секреции обоих типов IgG. В целом, продемонстрировали, что SRP14 может быть, как правило, лимитирующим, когда секретируемые белки, такие как IgG, чрезмерно экспрессируются в клетках СНО.SRP14 has been shown to be involved in a molecular step of the secretory pathway that is rate-limiting in CHO cells overexpressing exogenous protein. Notably, this rate-limiting step is also observed for the easily expressed trastuzumab, which easily leads to the production of clones with high levels of expression. This conclusion followed the discovery that expression of human SRP14 readily restored expression of LP clones, but it also increased secretion of readily expressed IgG. Expression of SRP14 was found to enhance the processing and availability of LC and HC precursors and produce comparable levels of secretion of both types of IgG. Overall, it has been demonstrated that SRP14 may be generally limiting when secreted proteins such as IgG are overexpressed in CHO cells.

Сильный эффект, полученный при экспрессии SRP14 в клетках СНО, наблюдаемый в данном исследовании, был неожиданным и позволил предположить, что SRP14 вызывает длительную задержку элонгации LC в клонах, с трудом продуцирующих IgG (фиг. 12В, пункт 1).The strong effect of SRP14 expression in CHO cells observed in this study was unexpected and suggested that SRP14 causes a prolonged delay in LC elongation in clones that have difficulty producing IgG (Fig. 12B, point 1).

Предшествующее исследование показало, что сигнальный пептид, который выходит из транслирующей рибосомы, первый взаимодействует с субъединицей SRP54 частицы SRP, тогда как ассоциация с SRP9 и SRP14 может блокировать дальнейшую элонгацию образующегося полипептида, что приводит к остановке трансляции (Walter и Blobel 1981). На втором этапе комплекс рибосома-образующийся полипептид-SRP стыкуется с мембраной ЭР посредством взаимодействия с рецептором SR (Gilmore и др., 1982; Walter и др., 1982). SR затем может координировать высвобождение SRP из комплекса рибосома-образующийся полипептид и ассоциацию сайта выхода из рибосомы с каналом транслокона, через который растущий образующийся полипептид проникает в ЭР (Lakkaraju и др., 2008). Затем сопряженное с трансляцией перемещение может возобновиться, что приводит к удалению сигнального пептида и к синтезу правильно процессированных и секретируемых полипептидов.Previous research has shown that the signal peptide that exits the translating ribosome first interacts with the SRP54 subunit of the SRP particle, whereas association with SRP9 and SRP14 can block further elongation of the nascent polypeptide, resulting in translation arrest (Walter and Blobel 1981). In the second step, the ribosome-nascent polypeptide-SRP complex docks with the ER membrane through interaction with the SR receptor (Gilmore et al., 1982; Walter et al., 1982). The SR can then coordinate the release of SRP from the ribosome-nascent polypeptide complex and the association of the ribosome exit site with the translocon channel through which the nascent nascent polypeptide enters the ER (Lakkaraju et al., 2008). Translation-coupled movement can then resume, resulting in removal of the signal peptide and the synthesis of properly processed and secreted polypeptides.

Для правильного процессинга с трудом поддающихся экспрессии IgG может потребоваться необычно длинная трансляционная пауза, если кинетика стыковки с ЭР может быть медленнее для конкретных комбинаций последовательностей вариабельного домена IgG и сигнального пептида, вследствие неблагоприятных структур образующегося пептида. Таким образом, считали, что, в свою очередь, модуляция кинетики остановки трансляции путем экспрессии экзогенного компонента SRP14 человека улучшает правильную стыковку с ЭР и перемещение пре-LC в ЭР и, таким образом, восстанавливает эффективный процессинг сигнального пептида (фиг. 12В, пункт 2). Соответственно, снижение уровней SRP14 в клетках человека приводит к отсутствию задержки элонгации трансляции в полисомах, что может привести к чрезмерному увеличению длины образующихся полипептидов сверх критического значения, после которого SRP больше не сможет правильно нацелить секретируемый белок на ЭР.Proper processing of difficult-to-express IgGs may require an unusually long translational pause if ER docking kinetics may be slower for particular combinations of IgG variable domain and signal peptide sequences due to unfavorable structures of the resulting peptide. Thus, it was believed that, in turn, modulation of translational arrest kinetics by expression of exogenous human SRP14 component improves proper ER docking and relocation of pre-LC to the ER and thus restores efficient signal peptide processing (Fig. 12B, point 2 ). Accordingly, reduction of SRP14 levels in human cells results in a lack of delay in translation elongation in polysomes, which may result in the length of nascent polypeptides being excessively increased beyond a critical value, after which SRP can no longer correctly target the secreted protein to the ER.

Таким образом, аффинность SRP14 и возможно также SRP54 в клетках СНО к сигнальным последовательностям гетерологичного белка инфликсимаба человека будет снижена, что приведет к неправильной стыковке с ЭР и/или к элонгации образующегося пептида до того, как произойдет правильная стыковка. Это будет исправлено путем сверхэкспрессии SRP14 человека, увеличения периода времени, в течение которого остановленный комплекс рибосома-SRP может искать правильно организованный сайт стыковки на ЭР, несмотря на 'молекулярный затор' из сверхэкспрессированных белков IgG, происходящий на входе в ЭР.Thus, the affinity of SRP14 and possibly also SRP54 in CHO cells for the signal sequences of the heterologous human infliximab protein will be reduced, leading to incorrect docking with the ER and/or elongation of the resulting peptide before proper docking occurs. This will be corrected by overexpressing human SRP14, increasing the period of time during which the stalled ribosome-SRP complex can search for a properly organized docking site on the ER, despite the 'molecular congestion' of overexpressed IgG proteins occurring at the entrance to the ER.

Соответственно, сверхэкспрессия SR и транслокона, которые могут повышать вместительность ЭР в отношении транслокации, также приводила к улучшению секреции, даже в отсутствие сверхэкспрессии SRP14 человека. Наконец, продемонстрировали, что метаболическая инженерия секреторного пути посредством коэкспрессии комбинаций SRP человека, транслокона и субъединиц SR, приводит к дополнительному улучшению способности клетки секретировать белок, позволяя получить даже более высокие уровни секреции. В целом, пришли к заключению, что белки SRP, их рецепторы и транслокон могут быть, как правило, лимитирующими, когда секретируемые белки, такие как иммуноглобулины человека, чрезмерно экспрессируются в клетках СНО.Accordingly, overexpression of SR and translocon, which can increase the capacity of the ER for translocation, also resulted in improved secretion, even in the absence of overexpression of human SRP14. Finally, it was demonstrated that metabolic engineering of the secretory pathway, through coexpression of combinations of human SRP, translocon, and SR subunits, results in further improvements in the cell's ability to secrete the protein, allowing even higher levels of secretion to be obtained. Overall, it is concluded that SRP proteins, their receptors and the translocon may be generally limiting when secreted proteins, such as human immunoglobulins, are overexpressed in CHO cells.

Немногое известно об относительном содержании SRP и компонентов мембраны ЭР по сравнению с секретируемыми белками и рибосомами в различных типах клеток, но в клетках, экспрессирующих большие количества рекомбинантного белка, потенциально могут возникать нарушения транслокации. Например, SR и/или транслокон могут стать лимитирующими, когда секретируемые белки экспрессируется на аномально высоких уровнях, или SRP14 может встречаться в клетках СНО на субстехиометрических уровнях по сравнению с другими субъединицами SRP. Соответственно, SRP9 и SRP14 присутствуют в 20-кратном избытке по сравнению с другими белками SRP в клетках приматов, но не в клетках мышей, и сверхэкспрессия SRP14 человека в нормальных клетках человека не повышает эффективность секреции щелочной фосфатазы. Более того, SRP14 человека крупнее, чем SRP14 грызуна, так как он содержит аланин-богатый хвост на С-конце, который не обнаружен в SRP14 грызуна. Таким образом, включение более крупного SRP14 человека в SRP СНО может приводить к образованию функциональной химеры SRP с более высокой активностью, с доминирующе-положительным эффектом.Little is known about the relative abundance of SRP and ER membrane components compared to secreted proteins and ribosomes in different cell types, but translocation defects can potentially occur in cells expressing large amounts of recombinant protein. For example, the SR and/or translocon may become limiting when secreted proteins are expressed at abnormally high levels, or SRP14 may occur in CHO cells at substoichiometric levels compared to other SRP subunits. Accordingly, SRP9 and SRP14 are present in 20-fold excess over other SRP proteins in primate cells but not in mouse cells, and overexpression of human SRP14 in normal human cells does not increase the efficiency of alkaline phosphatase secretion. Moreover, human SRP14 is larger than rodent SRP14 because it contains an alanine-rich tail at the C terminus, which is not found in rodent SRP14. Thus, incorporation of the larger human SRP14 into CHO SRP may result in the formation of a functional SRP chimera with higher activity, with a dominant-positive effect.

Открытие того, что экспрессия цитозольных компонентов SRP, таких как SRP14, приводит к эффективному процессингу и секреции сверхэкспрессированных белков в клетках СНО, указывает на затруднение, которое можно использовать для увеличения выхода рекомбинантного белка. Данное затруднение ограничивает экспрессию различных и неродственных IgG и, возможно, также множества других моноклональных антител и производных, которые составляют несомненно наиболее распространенный класс рекомбинантных терапевтических белков.The discovery that expression of cytosolic components of SRP, such as SRP14, leads to efficient processing and secretion of overexpressed proteins in CHO cells indicates a bottleneck that can be exploited to increase recombinant protein yield. This difficulty limits the expression of various and unrelated IgGs and possibly also a variety of other monoclonal antibodies and derivatives that constitute by far the most common class of recombinant therapeutic proteins.

Анализ интермедиатов секреции и возможных стрессовых реакций клетки с последующим систематическим поиском вышележащих лимитирующих действующих факторов, которые вызывают такую стрессовую реакцию, а затем, в конечном счете, разработкой метаболизма секреции клеток СНО привел к лучшему пониманию метаболических ограничений в данных клетках и того, как их обходить.The analysis of secretion intermediates and possible cellular stress responses, followed by a systematic search for the upstream limiting acting factors that cause this stress response, and then ultimately the development of the secretion metabolism of CHO cells, led to a better understanding of the metabolic limitations in these cells and how to circumvent them .

Гетерологичная экспрессия SRP14 восстанавливает секрецию и процессинг LCHeterologous expression of SRP14 restores LC secretion and processing

Клоны IgG HP (с высоким уровнем продукции) и LP (с низким уровнем продукции) котрансфицировали с вектором, кодирующим компонент SRP14 SRP, и с плазмидой устойчивости к неомицину. Отдельные клетки из устойчивой к неомицину популяции клеток отделяли с помощью метода серийных разведений, а затем исследовали их рост и секрецию иммуноглобулина в партии чашек для культивирования при взбалтывании. Экспрессирующие SRP14 полученные из клонов LP субклоны секретировали значительно более высокие количества антитела, чем исходные клоны во всей культуре, и позволяли получить титры иммуноглобулина, аналогичные таковым для субклонов HP, экспрессирующих SRP14 (фиг. 8А и 8В, левые панели).IgG clones HP (high production) and LP (low production) were cotransfected with a vector encoding the SRP14 component of the SRP and a neomycin resistance plasmid. Individual cells from the neomycin-resistant cell population were separated using the serial dilution method and then examined for growth and immunoglobulin secretion in a batch of shaken culture dishes. SRP14-expressing LP clone-derived subclones secreted significantly higher amounts of antibody than the parent clones in the entire culture and produced immunoglobulin titers similar to those of the SRP14-expressing HP subclones (Fig. 8A and 8B, left panels).

Экспрессия SRP14 не влияла на жизнеспособность клеток, но, похоже, она замедляла и продлевала рост культуры HP-клеток до аналогичных плотностей клеток (фиг. 8А и 8В, правые панели). Собрали культуральные супернатанты различных субклонов и анализировали в них концентрацию антитела. На фиг. 8С показано, что экспрессия SRP14 повышала секрецию из LP-клеток, что приводило к 7-кратному увеличению удельной продуктивности IgG. Более того, экзогенная экспрессия SRP14 также улучшала секрецию IgG из НР-субклонов, что приводило к 30% увеличению удельной продуктивности. Примечательно, что отдельные субклоны, экспрессирующие SRP14, секретировали трудно- и легкоэкспрессируемые IgG на по существу идентичных средних уровнях, при этом срединные значения удельных продуктивностей превышали 30 пикограмм на клетку в день (pcd). Такие очень высокие уровни секреции IgG поддерживались в течение более чем 6 месяцев культивирования, указывая на то, что это является постоянным свойством клеток, экспрессирующих SRP14.Expression of SRP14 had no effect on cell viability, but it appeared to slow and prolong HP cell culture growth to similar cell densities (Figures 8A and 8B, right panels). Culture supernatants of various subclones were collected and their antibody concentrations were analyzed. In fig. Figure 8C shows that expression of SRP14 increased secretion from LP cells, resulting in a 7-fold increase in specific IgG productivity. Moreover, exogenous expression of SRP14 also improved IgG secretion from HP subclones, resulting in a 30% increase in specific productivity. Notably, individual SRP14-expressing subclones secreted hard- and easily-expressed IgG at essentially identical mean levels, with median specific productivity values exceeding 30 picograms per cell per day (pcd). These very high levels of IgG secretion were maintained over more than 6 months of culture, indicating that this is a permanent property of SRP14-expressing cells.

Для того, чтобы дополнительно исследовать взаимосвязь между экспрессией SRP14 и продуктивностью в отношении IgG, анализировали уровни мРНК SRP14 в 5 отдельных экспрессирующих SRP14 LP-субклонах с помощью сравнительной количественной ПЦР. На фиг. 8D показано, что субклоны сверхэкспрессировали SRP14 на уровнях, находящихся в диапазоне от 50 до почти 200-кратных по сравнению с таковыми для эндогенных мРНК SRP14 в клетках СНО. Это сопровождалось улучшением секреции IgG в 4-6 раз по сравнению с LP контрольным клоном клетки. Примечательно, что наибольшую удельную продуктивность получили у субклона с промежуточным уровнем повышения экспрессии SRP14, приблизительно в 100 раз относительно уровня эндогенной мРНК SRP14 в клетках СНО (SRP14-LP субклон Е, результаты не представлены). Это подразумевает взаимозависимость уровня сверхэкспрессии SRP14 и удельной продуктивности IgG вплоть до порогового уровня SRP14, соответствующего 100-кратному повышению относительно эндогенного уровня экспрессии. Это позволило предположить, что другие компоненты секреторного пути, в свою очередь, могут стать лимитирующими при очень высоких уровнях SRP14, и что для оптимальной экспрессии IgG может быть необходима сбалансированная экспрессия компонентов данного пути.To further investigate the relationship between SRP14 expression and IgG productivity, SRP14 mRNA levels in 5 individual SRP14-expressing LP subclones were analyzed by comparative qPCR. In fig. 8D shows that the subclones overexpressed SRP14 at levels ranging from 50- to nearly 200-fold compared to those of endogenous SRP14 mRNA in CHO cells. This was accompanied by a 4-6-fold improvement in IgG secretion compared to the LP control cell clone. It is noteworthy that the highest specific productivity was obtained in a subclone with an intermediate level of increase in SRP14 expression, approximately 100 times relative to the level of endogenous SRP14 mRNA in CHO cells (SRP14-LP subclone E, results not shown). This implies a relationship between the level of SRP14 overexpression and the specific productivity of IgG up to a threshold level of SRP14 corresponding to a 100-fold increase relative to the endogenous expression level. This suggested that other components of the secretory pathway may in turn become limiting at very high levels of SRP14, and that balanced expression of components of this pathway may be required for optimal IgG expression.

Для того, чтобы проверить, может ли повышенная удельная продуктивность, полученная в процессе оценки клональной линии клеток, применяться в производственном процессе, лучшие экспрессирующие HP и LP субклоны SRP14 исследовали в чашках для культивирования при взбалтывании в условиях периодической культуры с подпиткой (т.е. LP субклон Е и HP субклон В, см. фиг. 8). Экспрессирующий SRP14 LP субклон позволял получить большие количества жизнеспособных клеток и титры иммуноглобулина, сходные с экспрессирующим SRP14 HP субклоном, при этом максимальная концентрация клеток составляла 8×106 клеток/мл и максимальный титр был выше 2 г на литр по окончании производственного цикла (фиг. 9А и В).To test whether the increased specific productivity obtained during clonal cell line evaluation could be applied to the production process, the best HP- and LP-expressing subclones of SRP14 were examined in shaken culture dishes under fed-batch culture conditions (i.e. LP subclone E and HP subclone B, see Fig. 8). The SRP14 LP-expressing subclone produced large numbers of viable cells and immunoglobulin titers similar to the SRP14 HP-expressing subclone, with a maximum cell concentration of 8 x 10 6 cells/ml and a maximum titer above 2 g per liter at the end of the production run (Fig. 9A and B).

Затем исследовали вклад сверхэкспрессии SRP14 в синтез иммуноглобулина для двух данных субклонов. Результаты показали, что экспрессия SRP14 человека в субклоне, полученном из LP, позволяла получить нормально процессированную и зрелую LC, способную к фолдингу и сборке IgG (фиг. 10А, LP, дорожка S по сравнению с дорожкой -). Миграция свободной НС не изменилась, указывая на то, что экспрессия SRP14 действовала, в частности, на неправильно процессированную LC с трудом поддающегося экспрессии белка. Удивительно, что экспрессия SRP14 полностью нарушала накопление агрегировавшей LC в нерастворимой в Triton X фракции (фиг. 9А, нижняя панель). Экспрессия контрольного белка GFP не улучшала растворимость белка, а также не восстанавливала правильный процессинг LC (фиг. 10А, дорожка G для LP клеток). Экспрессия SRP14 не влияла на паттерн миграции НС и LC, полученный для HP субклона, и наблюдали небольшое влияние на количество свободных цепей и полностью собранного IgG по сравнению с контролями (фиг. 10А, дорожка G для HP клеток).The contribution of SRP14 overexpression to immunoglobulin synthesis was then examined for these two subclones. The results showed that expression of human SRP14 in the LP-derived subclone produced a normally processed and mature LC capable of IgG folding and assembly (Fig. 10A, LP, lane S versus lane -). The migration of free LC was unaffected, indicating that SRP14 expression acted in particular on the misprocessed LC of a difficult to express protein. Surprisingly, expression of SRP14 completely impaired the accumulation of aggregated LC in the Triton X-insoluble fraction (Fig. 9A, lower panel). Expression of the control protein GFP did not improve protein solubility, nor did it restore proper LC processing (Fig. 10A, lane G for LP cells). Expression of SRP14 had no effect on the HC and LC migration pattern obtained for the HP subclone, and little effect was observed on the amount of free chains and fully assembled IgG compared to controls (Fig. 10A, lane G for HP cells).

Осуществляли анализы с вытеснением на основе циклогексимида, чтобы исследовать кинетику фолдинга и сборки IgG, а также судьбу агрегатов IgG в экспрессирующем SRP14 субклоне, продуцирующем инфликсимаб. В противоположность исходным LP клеткам, содержащим агрегировавшие LC, неспособные участвовать в сборке IgG, экспрессирующий SRP14 LP субклон более не накапливал нерастворимые в Тх-100 LC (фиг. 9В, нижняя панель). Тем не менее, свободная LC оставалась в небольших количествах по сравнению со свободной НС, что также было отмечено для HP клеток, указывая на то, что она быстро включалась в состав HC-LC димеров и зрелого IgG и что она, возможно, ограничивала сборку IgG (фиг. 9А и 9В). В совокупности данные результаты позволяют предположить, что SRP14 может играть важную роль в процессинге LC в LP клетках, и что дополнительная экспрессия белка SRP может улучшить секрецию с трудом поддающихся экспрессии и легко поддающихся экспрессии IgG до аналогичных уровней.Cycloheximide-based displacement assays were performed to examine the kinetics of IgG folding and assembly, as well as the fate of IgG aggregates in the SRP14-expressing infliximab-producing subclone. In contrast to parental LP cells containing aggregated LCs unable to participate in IgG assembly, the SRP14-expressing LP subclone no longer accumulated Tx-100-insoluble LCs (Fig. 9B, lower panel). However, free LC remained in small amounts compared to free HC, which was also observed in HP cells, indicating that it was rapidly incorporated into HC-LC dimers and mature IgG and that it may have limited IgG assembly (Figs. 9A and 9B). Taken together, these results suggest that SRP14 may play an important role in LC processing in LP cells and that additional expression of SRP protein may improve the secretion of difficult-to-express and easily-expressible IgG to similar levels.

Инженерия перемещения в ЭР улучшает секрецию рекомбинантного IgGER translocation engineering improves recombinant IgG secretion

В связи с тем, что сверхэкспрессия гетерологичного SRP14 повышала секрецию IgG до данного порога, сделали вывод, что другие компоненты секреторного пути, которые взаимодействуют непосредственно или опосредованно с SRP14, могут стать лимитирующими в SRP14-LP субклонах. Следовательно, мы исследовали, может ли сверхэкспрессия других компонентов секреторного пути также улучшать экспрессию IgG, либо отдельно, либо в комбинации с SRP14. Данные компоненты включали белки SRP9 и SRP54 человека, которые входят в состав комплекса SRP вместе с SRP14, субъединицы рецептора SRP (SR) и субъединицы транслокона Sec61α, β и γ.Because overexpression of heterologous SRP14 increased IgG secretion to this threshold, it was concluded that other components of the secretory pathway that interact directly or indirectly with SRP14 may become limiting in the SRP14-LP subclones. Therefore, we examined whether overexpression of other components of the secretory pathway could also improve IgG expression, either alone or in combination with SRP14. These components included the human SRP9 and SRP54 proteins, which form part of the SRP complex along with SRP14, the SRP receptor (SR) subunits, and the Sec61α, β, and γ translocon subunits.

В первой серии экспериментов наилучший LP клон, а именно LP клон Е на фиг. 1, трансфицировали векторами экспрессии, кодирующими белки SRP или белки транслокона, отдельно или в комбинации. Затем оценивали продукцию IgG в полученных поликлональных популяциях LP клеток при периодическом культивировании. Экспрессия компонентов SRP или белков транслокона повышала секрецию иммуноглобулина данными повторно трансфицированными поликлональными популяциями LP клеток (фиг. 11А и не представленные результаты). По сравнению с экспрессией SRP14 отдельно сверхэкспрессия комбинаций белков SRP или транслокона улучшала удельную продуктивность трансфицированных поликлональных популяций LP клеток на дополнительные 20% - 40% (фиг. 11А, сравнение срединных значений). Полученные результаты явно свидетельствуют о том, что определенные комбинации более эффективно восстанавливали секрецию инфликсимаба, чем экспрессия SRP14 отдельно, такие как комбинации, состоящие из экспрессии трех полипептидов SRP и его рецептора (SR), или из совместной экспрессии SR и транслокона (фиг. 11А).In the first series of experiments, the best LP clone, namely LP clone E in FIG. 1 were transfected with expression vectors encoding SRP proteins or translocon proteins, alone or in combination. IgG production was then assessed in the resulting polyclonal populations of LP cells during batch culture. Expression of SRP components or translocon proteins increased immunoglobulin secretion by these retransfected polyclonal LP cell populations (Fig. 11A and results not shown). Compared with expressing SRP14 alone, overexpression of combinations of SRP or translocon proteins improved the specific productivity of transfected polyclonal LP cell populations by an additional 20% to 40% (Fig. 11A, comparison of median values). The results clearly indicate that certain combinations were more effective in restoring infliximab secretion than SRP14 expression alone, such as combinations consisting of expression of three SRP polypeptides and its receptor (SR), or coexpression of SR and translocon (Fig. 11A). .

Также оценивали, можно ли дополнительно оптимизировать экспрессирующий SRP14 LP субклон Е путем экспрессии комбинаций SR и/или транслокона. По сравнению с 30 pcd для SRP14-LP субклона Е, поликлональные популяции клеток, подвергнутые отбору после трансфекции белками SR и транслоконом, позволяли получить удельные продуктивности выше 60 pcd с трудом поддающегося экспрессии иммуноглобулина (фиг. 10В). Пришли к заключению, что векторы, экспрессирующие белки SR и транслокон, также можно применять для получения клонов с повышенными удельными продуктивностями по сравнению с SRP14-LP клоном E, и что можно успешно применять подход, основанный на сериях последовательных циклов трансфекции и селекции.It was also assessed whether the SRP14-expressing LP subclone E could be further optimized by expressing combinations of SR and/or translocon. Compared to 30 pcd for SRP14-LP subclone E, polyclonal cell populations selected after transfection with SR and translocon proteins yielded specific productivity above 60 pcd for the difficult-to-express immunoglobulin (Fig. 10B). It was concluded that vectors expressing the SR and translocon proteins could also be used to produce clones with increased specific productivity compared to SRP14-LP clone E, and that an approach based on a series of sequential rounds of transfection and selection could be used successfully.

КЛЕТОЧНАЯ МЕТАБОЛИЧЕСКАЯ ИНЖЕНЕРИЯ: подавление пути рекомбинации и экспрессии ТЕР и функциональной РНК ТЕРCELLULAR METABOLIC ENGINEERING: suppression of the recombination pathway and expression of TEP and functional TEP RNA

Для того, чтобы повлиять на рекомбинацию, можно подвергнуть замалчиванию важные гены рекомбинации ДНК. Мишенями для нокдауна являются гены, известные из литературы как важные для определенных путей рекомбинационной репарации у млекопитающих (таблица D). Поскольку большинство из данных генов необходимы для выживаемости и развития клетки, постоянное их замалчивание может привести к снижению жизнеспособности клетки. Следовательно, предпочтительно временное замалчивание данных целевых генов с применением РНК-интерференции (РНКи).To influence recombination, important DNA recombination genes can be silenced. The knockdown targets are genes known from the literature to be important for certain recombinational repair pathways in mammals (Table D). Since most of these genes are essential for cell survival and development, persistent silencing of them can lead to decreased cell viability. Therefore, temporary silencing of these target genes using RNA interference (RNAi) is preferable.

В клетках, обработанных смесью миРНК против факторов, вовлеченных в первые этапы НГСК, т.е. Ku 70, Ku 80 и ДНК-ПКкс (один дуплекс миРНК на белок), частота событий НГСК была значительно ниже, чем в необработанных клетках. Взамен, в данных клетках ГР была более эффективной, что приводило к уменьшению отношения НГСК к ГР (от 2,7:1 до 1,3:1). Напротив, в клетках, обработанных миРНК, направленной против незаменимого фактора ГР - Rad51, ГР-зависимое восстановление уровня GFP почти полностью прекращалось, что повышало отношение НГСК : ГР до 5:1. Похоже, что данные результаты свидетельствуют о том, что репортерный анализ ГР и НГСК обладает достаточной чувствительностью, чтобы его можно было применять в экстрахромосомной форме. Они также дополнительно подвергают сомнению надежность используемых ранее мутантных линий клеток СНО (а именно, клеток 51D1, изначально опубликованных как ГР-отрицательные клетки, но, по-видимому, способных осуществлять ГР согласно данному анализу, результаты не представлены).In cells treated with a mixture of siRNAs against factors involved in the first stages of NGSC, i.e. Ku 70, Ku 80, and DNA-PKx (one siRNA duplex per protein), the frequency of NGSC events was significantly lower than in untreated cells. Instead, in these cells, GR was more effective, resulting in a decrease in the ratio of NGSC to GR (from 2.7:1 to 1.3:1). In contrast, in cells treated with siRNA directed against the essential GR factor Rad51, the GR-dependent restoration of GFP levels was almost completely abolished, which increased the NGSC:GR ratio to 5:1. These results appear to indicate that the GR and NGSC reporter assay is sensitive enough to be used in an extrachromosomal form. They also further question the reliability of previously used mutant CHO cell lines (namely, 51D1 cells, originally published as GR-negative cells but apparently capable of GR by this assay; results not shown).

Повышение экспрессии и встраивания GFP в присутствии MAR. В параллельных экспериментах клетки СНО, обработанные различными миРНК, направленными против ГР или против НГСК, трансфицировали плазмидами, содержащими GFP или MAR-GFP. После двух недель отбора антибиотиком анализировали экспрессию и встраивание GFP в данных клетках с помощью FACS и количественной ПЦР, соответственно. При всех исследованных условиях добавление MAR приводило к 4-5-кратному повышению экспрессии GFP по сравнению с клетками, трансфицированными плазмидой без MAR (фиг. 13, фиг. 14А), что согласовалось с предшествующими сообщениями (Grandjean и др., 2011). Это повышение сопровождалось приблизительно 3-кратным увеличением числа копий встроенного GFP в клетках, трансфицированных плазмидой MAR-GFP, по сравнению с клетками, которые получили вектор без MAR (фиг. 13, фиг. 14В). Также наблюдалось 2-кратное увеличение средней флуоресценции GFP на копию гена (фиг. 13, фиг. 14С), возможно, вследствие более благоприятной локализации сайта встраивания (например, на участке, богатом эухроматином). Следовательно, можно предположить, что элементы MAR обладают способностью направлять гены в геномные локусы, позволяющие экспрессию гена. Комбинация миРНК против ГР с MAR (миРНК: RAD51, Rad51C и Brca1) приводила к изменению среднего уровня экспрессии GFP больше, чем в 11 раз, тогда как одна миРНК против ГР (миРНК: Rad51) приводила к изменению меньше, чем в 9 раз. Другие комбинации, такие как комбинация миРНК против ОМСК с MAR, также приводили к улучшенной экспрессии по сравнению с одной миРНК (результаты не представлены). Соответственно, комбинация различных миРНК (2, 3, 4, 5, 6, 8, 9, 10) к мишеням в том же или отличных метаболических путях, в частности, в пути рекомбинации, входит в объем настоящего изобретения.Increased expression and incorporation of GFP in the presence of MAR. In parallel experiments, CHO cells treated with various siRNAs directed against GR or against NGSC were transfected with plasmids containing GFP or MAR-GFP. After two weeks of antibiotic selection, GFP expression and incorporation in these cells was analyzed by FACS and qPCR, respectively. Under all conditions tested, addition of MAR resulted in a 4- to 5-fold increase in GFP expression compared to cells transfected with a plasmid without MAR (Figure 13, Figure 14A), which was consistent with previous reports (Grandjean et al., 2011). This increase was accompanied by an approximately 3-fold increase in the copy number of the integrated GFP in cells transfected with the MAR-GFP plasmid compared with cells that received the vector without MAR (Fig. 13, Fig. 14B). A 2-fold increase in average GFP fluorescence per gene copy was also observed (Fig. 13, Fig. 14C), possibly due to a more favorable localization of the insertion site (eg, in a euchromatin-rich region). Therefore, it can be hypothesized that MAR elements have the ability to target genes to genomic loci that allow gene expression. Combining anti-GR siRNA with MAR (siRNA: RAD51, Rad51C, and Brca1) resulted in a greater than 11-fold change in average GFP expression, whereas anti-GR siRNA alone (siRNA: Rad51) resulted in a less than 9-fold change. Other combinations, such as combining anti-OCSC siRNA with MAR, also resulted in improved expression compared with siRNA alone (results not shown). Accordingly, the combination of different miRNAs (2, 3, 4, 5, 6, 8, 9, 10) to targets in the same or different metabolic pathways, in particular the recombination pathway, is within the scope of the present invention.

Отсутствие влияния подавления гена НГСК на экспрессию и встраивание трансгена.No effect of NGSC gene suppression on transgene expression and integration.

Обработка миРНК против белков НГСК, похоже, значительно не влияла на стабильную экспрессию трансгена. Также не наблюдалось существенного изменения числа копий GFP в геноме по сравнению с необработанными клетками (за исключением клеток, обработанных миРНК против 53ВР1, но только в отсутствие MAR, что, возможно, указывает на эффект, не свойственный рекомбинации посредством пути НГСК).Treatment with siRNA against NGSC proteins did not appear to significantly affect stable transgene expression. There was also no significant change in genomic GFP copy number compared to untreated cells (except for cells treated with siRNA against 53BP1, but only in the absence of MAR, possibly indicating an effect not inherent to recombination through the NGSC pathway).

Повышение экспрессии и встраивания трансгена в отсутствие факторов ГР. В противоположность подавлению факторов НГСК, присутствие миРНК против белков ГР часто приводило к существенному повышению уровней стабильной экспрессии GFP по сравнению с необработанными клетками (за исключением Brca2, для которого наблюдалось существенное снижение уровня, но снова лишь в отсутствие MAR) (фиг. 15А). Как и в случае с замалчиванием генов НГСК, присутствие MAR приводило к повышению уровней стабильной экспрессии и встраивания GFP, а также к повышению уровней экспрессии на копию гена. На этот раз, тем не менее, замалчивание факторов ГР увеличивало данный эффект в 5-7 раз (наиболее ярким было подавление Rad51, приводящее к уровням экспрессии GFP, большим в 7,4 раза) (фиг. 15А), что может свидетельствовать о том, что белки ГР противодействуют положительному влиянию элемента MAR на экспрессию трансгена. В отсутствие MAR повышение экспрессии GFP коррелировало с увеличенным числом копий GFP в геноме (результаты не представлены). Неожиданно, этого не наблюдали в присутствии MAR, что указывает на то, что подавление белка ГР не влияло на опосредованное MAR увеличение числа копий (за исключением миРНК Rad51D). Похоже, это позволяет предположить, что отсутствие функционального пути репарации ГР не увеличивает количество событий рекомбинации, вызванных MAR. Вместо этого, оно стимулирует встраивание MAR и трансгена в более благоприятный локус, позволяя ему более эффективно экспрессироваться. Эта точка зрения также поддерживается повышенной экспрессией отдельных копий GFP в присутствии MAR в клетках, обработанных миРНК против ГР (фиг. 14С). Другая возможность состоит в том, что количество копий плазмиды, встроенных в геном, уже находится на максимальном уровне в контрольных клетках (при количестве плазмидной ДНК, используемом здесь), и его невозможно дополнительно увеличить даже в условиях, более благоприятных для MAR.Increased expression and integration of the transgene in the absence of GR factors. In contrast to the downregulation of NGSC factors, the presence of siRNAs against GR proteins often resulted in a significant increase in levels of stable GFP expression compared to untreated cells (with the exception of Brca2, which showed a significant decrease in levels, but again only in the absence of MAR) (Fig. 15A). As with NGSC gene silencing, the presence of MAR resulted in increased levels of stable GFP expression and incorporation, as well as increased expression levels per gene copy. This time, however, silencing of GR factors increased this effect by 5-7 times (the most striking was the suppression of Rad51, resulting in GFP expression levels 7.4 times greater) (Fig. 15A), which may indicate that that GR proteins counteract the positive effect of the MAR element on transgene expression. In the absence of MAR, increased GFP expression correlated with increased GFP copy number in the genome (results not shown). Surprisingly, this was not observed in the presence of MAR, indicating that GR protein silencing did not affect MAR-mediated copy number expansion (except for Rad51D siRNA). This appears to suggest that the absence of a functional GR repair pathway does not increase the number of recombination events driven by MAR. Instead, it stimulates the insertion of the MAR and transgene into a more favorable locus, allowing it to be expressed more efficiently. This view is also supported by the increased expression of individual copies of GFP in the presence of MAR in cells treated with siRNA against GR (Fig. 14C). Another possibility is that the number of plasmid copies integrated into the genome is already at its maximum level in control cells (at the amount of plasmid DNA used here) and cannot be further increased even under conditions more favorable to MAR.

В совокупности, данные результаты позволяют предположить, что процесс опосредованного MAR встраивания трансгена преимущественно опосредован путем, противоположным гомологичной рекомбинации, хотя, вероятно, не путем НГСК, поскольку подавление его компонентов не влияло на встраивание или экспрессию. Можно предположить, что данный альтернативный путь менее активен в присутствии функционального пути ГР, но становится более важным, если ГР не работает.Taken together, these results suggest that the process of MAR-mediated transgene insertion is predominantly mediated by a pathway opposite to homologous recombination, although probably not by the HSCT pathway, since silencing its components did not affect insertion or expression. One might speculate that this alternative pathway is less active in the presence of a functional GR pathway, but becomes more important if the GR is not functioning.

ЭКСПРЕССИЯ кшРНК ПРОТИВ ГР ДЛЯ ПОВЫШЕНИЯ ЭКСПРЕССИИ ТЕРАПЕВТИЧЕСКИХ БЕЛКОВEXPRESSION OF SHRNA AGAINST GR TO INCREASE THE EXPRESSION OF THERAPEUTIC PROTEINS

Три миРНК, нацеленные на Rad51, превратили в последовательности кшРНК, которые могут образовывать шпилечные структуры, и последовательность, кодирующую кшРНК, встраивали в вектор, несущий транспозон piggyBac, под контролем слитых энхансера GAPDH и промотора CMV, за которыми следовал MAR Х-29, но без гена селекции антибиотиком. Адаптированные для суспензии клетки СНО-М трансфицировали три раза донорной плазмидой, несущей транспозон, и вектором экспрессии транспозазы, после чего произвольно собирали 30 отдельных клонов клеток, применяя устройство ClonePix. Исходные клетки, а также экспрессирующую кшРНК популяцию клеток и клоны, повторно трансфицировали плазмидой, экспрессирующей GFP (а именно, конструкцией Puro-GFP-MAR Х_29), а затем осуществляли селекцию пуромицином политональных популяций экспрессирующих GFP клеток. Сравнение профилей флуоресценции GFP свидетельствовало о том, что получили более высокое соотношение клеток со средним - высоким уровнем флуоресценции (популяция клеток М2) или очень высоким уровнем флуоресценции (популяция клеток М3) из популяции клеток, трансфицированных вектором, несущим кшРНК, по сравнению с исходными клетками СНО-М (фиг. 17А).Three siRNAs targeting Rad51 were converted into shRNA sequences that can form hairpin structures, and the shRNA coding sequence was inserted into a vector carrying the piggyBac transposon under the control of a GAPDH enhancer-CMV promoter fusion followed by MAR X-29, but without antibiotic selection gene. Suspension-adapted CHO-M cells were transfected three times with a donor transposon-carrying plasmid and a transposase expression vector, and 30 individual cell clones were randomly collected using a ClonePix device. The parent cells, as well as the shRNA-expressing cell population and clones, were re-transfected with a GFP-expressing plasmid (namely, the Puro-GFP-MAR X_29 construct), and then puromycin selection was performed on polytonal populations of GFP-expressing cells. Comparison of GFP fluorescence profiles indicated that a higher proportion of cells with medium to high levels of fluorescence (M2 cell population) or very high levels of fluorescence (M3 cell population) were obtained from the shRNA vector-transfected cell population compared to parental cells SNO-M (Fig. 17A).

Несколько клонов, экспрессирующих кшРНК, опосредовали очень высокие уровни GFP, при этом более 80% устойчивых к антибиотику клеток находились в субпопуляции М3 с высоким уровнем флуоресценции через 10 дней после трансфекции, например, клон 16 и клон 26 (фиг. 17А и В). Высокие уровни флуоресценции GFP поддерживались в данных двух клонах после 35 дней дополнительного культивирования без селекции (фиг. 17С). Напротив, клон 17 не экспрессировал очень высокие уровни GFP в день 10, и экспрессия GFP, похоже, была нестабильной (фиг. 17В и С). Промежуточные уровни экспрессии и промежуточную стабильность получили для клона 8 и клона 22. Данные клоны также трансфицировали экспрессионными плазмидами, кодирующими легкую и тяжелую цепь с трудом поддающегося экспрессии терапевтического антитела инфликсимаба. По-прежнему, клоны 16 и 26 продуцировали наиболее высокие уровни антитела, за ними следовали клоны 8 и 22, тогда как клон 17 экспрессировал количества иммуноглобулина, которые были близки к 0,5-1 pcd, полученным для исходных клеток СНО-М (фиг. 17D и не представленные результаты). В клонах клеток, демонстрирующих наиболее значительно сниженные уровни мРНК Rad51, обнаруживали высокие уровни экспрессии как GFP, так и иммуноглобулина инфликсимаба, указывая на то, что повышенная экспрессия трансгена происходила в результате пониженной экспрессии рекомбинационного белка (результаты не представлены).Several shRNA-expressing clones mediated very high levels of GFP, with more than 80% of the antibiotic-resistant cells being in the M3 subpopulation with high levels of fluorescence 10 days after transfection, such as clone 16 and clone 26 (Fig. 17A and B). High levels of GFP fluorescence were maintained in these two clones after 35 days of additional culture without selection (Fig. 17C). In contrast, clone 17 did not express very high levels of GFP at day 10, and GFP expression appeared to be unstable (Fig. 17B and C). Intermediate levels of expression and intermediate stability were obtained for clone 8 and clone 22. These clones were also transfected with expression plasmids encoding the light and heavy chain of the difficult to express therapeutic antibody infliximab. Still, clones 16 and 26 produced the highest levels of antibody, followed by clones 8 and 22, while clone 17 expressed amounts of immunoglobulin that were close to the 0.5-1 pcd obtained for the parental CHO-M cells (Fig. 17D and results not presented). Cell clones exhibiting the most significantly reduced levels of Rad51 mRNA exhibited high levels of expression of both GFP and the infliximab immunoglobulin, indicating that increased transgene expression resulted from decreased expression of the recombination protein (results not shown).

Таким образом, можно добиться более высоких уровней и более стабильной продукции секретируемых терапевтических белков, таких как инфликсимаб, клетками, экспрессирующими кшРНК, нацеленную на Rad51, или клетками, временно трансфицированными миРНК, такими как миРНК, нацеленная на Rad51.Thus, higher levels and more stable production of secreted therapeutic proteins, such as infliximab, can be achieved by cells expressing shRNA targeting Rad51 or by cells transiently transfected with siRNA, such as siRNA targeting Rad51.

МАТЕРИАЛЫ И МЕТОДЫMATERIALS AND METHODS

Плазмиды и векторы ДНКPlasmids and DNA vectors

Вектор экспрессии, несущий транспозазу РВ, pCS2+U5V5PBU3, содержит последовательность, кодирующую транспозазу РВ, окруженную 5'- и 3'-нетранслируемыми концевыми участками (НТО) гена β-глобина Xenopus laevis. Данную плазмиду сконструировали, как описано далее: фрагмент 3'-НТО размером 317 п.о. из pBSSK/SB10 (любезно предоставленный доктором S. Ivies) встраивали в pCS2+U5 (Invitrogen/life Technologies, Пейсли, Великобритания) с получением pCS2+U5U3. Последовательность, кодирующую транспозазу РВ (2067 п.о., номер доступа в GenBank: EF587698), синтезировали в ATG:biosynthetic (Мерцхаузен, Германия) и клонировали в каркас pCS2+U5U3 между двумя НТО. Контрольный вектор РВ соответствует немодифицированной плазмиде pCS2+U5 (фигура 1, левая панель).The expression vector carrying the PB transposase, pCS2+U5V5PBU3, contains the coding sequence for the PB transposase flanked by the 5' and 3' untranslated terminal regions (UTRs) of the Xenopus laevis β-globin gene. This plasmid was constructed as described below: a 3'-UTR fragment of 317 bp. from pBSSK/SB10 (kindly provided by Dr. S. Ivies) was inserted into pCS2+U5 (Invitrogen/life Technologies, Paisley, UK) to generate pCS2+U5U3. The PB transposase coding sequence (2067 bp, GenBank accession number: EF587698) was synthesized at ATG:biosynthetic (Merzhausen, Germany) and cloned into the pCS2+U5U3 scaffold between two UTRs. The control vector PB corresponds to the unmodified plasmid pCS2+U5 (Figure 1, left panel).

Векторы, несущие различные транспозоны, используемые в данном исследовании, получали путем вставки 3'- и 5'-инвертированных концевых повторов (ITR) РВ размером 235 п.о. и 310 п.о., соответственно, синтезированных в ATG:biosynthetic (Мерцхаузен, Германия), в плазмиду pBluescript SK (pBSK ITR3'-ITR5', фигура 1, правая панель). Затем вставляли ген устойчивости к пуромицину (PuroR) под контролем промотора SV40 из плазмиды pRc/RSV (Invitrogen/Life Technologies) между двумя указанными ITR. Элементы MAR 1-68 и MAR Х-29, гены устойчивости к пуромицину и GFP, применяемые в данном исследовании, были такие, как описано ранее. Векторы экспрессии иммуноглобулинов и последовательности, кодирующие SRP9, SRP14, SRP54, SRPR-альфа, SRPR-бета, SEC61A1, SEC61B и SEC61G, были такие, как описано в Le Fourn и др. (Metab, Eng., Epub, 1 февраля 2013 г.)Vectors carrying the various transposons used in this study were generated by inserting 235-bp PB inverted terminal repeats (ITRs) of 3′ and 5′. and 310 bp, respectively, synthesized at ATG:biosynthetic (Merzhausen, Germany), into the plasmid pBluescript SK (pBSK ITR3'-ITR5', Figure 1, right panel). The puromycin resistance gene (PuroR) was then inserted under the control of the SV40 promoter from plasmid pRc/RSV (Invitrogen/Life Technologies) between the two indicated ITRs. The MAR 1-68 and MAR X-29 elements, puromycin resistance genes, and GFP used in this study were as previously described. Immunoglobulin expression vectors and sequences encoding SRP9, SRP14, SRP54, SRPR-alpha, SRPR-beta, SEC61A1, SEC61B and SEC61G were as described in Le Fourn et al. (Metab, Eng., Epub, February 1, 2013 .)

GFP, иммуноглобулин или секреторные белки экспрессировали, применяя эукариотическую кассету экспрессии, состоящую из энхансера CMV человека и промотора GAPDH человека, расположенных в 3'-5' направлении от кодирующей последовательности, за которыми следовал сигнал полиаденилирования SV40, терминатор гастрина человека и энхансер SV40 (см. Le Fourn и др., 2013). Кассеты экспрессии и/или элементы MAR встраивали между последовательностями ITR или в каркас бактериального вектора, как показано на фигуре 1 и в описаниях к фигуре, применяя стандартные способы клонирования.GFP, immunoglobulin, or secretory proteins were expressed using a eukaryotic expression cassette consisting of the human CMV enhancer and the human GAPDH promoter located 3'-5' of the coding sequence, followed by the SV40 polyadenylation signal, the human gastrin terminator and the SV40 enhancer (see Le Fourn et al., 2013). Expression cassettes and/or MAR elements were inserted between ITR sequences or into a bacterial vector backbone as shown in Figure 1 and the figure legend using standard cloning techniques.

Культивирование клеток и анализ трансфекцииCell culture and transfection assay

Линию клеток DG44 СНО культивировали в DMEM: F12 (Gibco), дополненной гипоксантином/тимидином (НТ, Gibco) и 10% фетальной бычьей сывороткой (FBS, Gibco). Трансфекцию осуществляли, применяя PEI (JetPRIME, Polyplus Transfection), следуя инструкциям производителя. Клетки трансфицировали различными количествами плазмидной ДНК, содержащей транспозазу РВ (в диапазоне от 0 до 1500 нг), для экспериментов с титрованием или котрансфицировали оптимальным соотношением 300 нг плазмиды, экспрессирующей транспозазу РВ, и 300 нг донорной плазмиды, несущей транспозон. Через два дня после трансфекции клетки переносили в несколько чашек Петри в зависимости от эксперимента. Для анализа не подвергнутых селекции трансфицированных клеток СНО, клетки пересевали без селекции антибиотиком в течение 3 недель и процент флуоресцентных клеток и интенсивность флуоресценции GFP-положительных клеток определяли с помощью анализа FACS, применяя проточный цитометр CyAn ADP (Beckman Coulter). Для анализа числа копий гена в не подвергнутых селекции клетках стабильные GFP-положительные клетки СНО подвергали сортировке, применяя FACSAriall. Для количественного анализа устойчивых к антибиотику колоний, 50000 трансфицированных клеток высевали в чашки диаметром 100 мм и подвергали селекции 5 мкг/мл пуромицина в течение 2 недель. Затем устойчивые колонии фиксировали и окрашивали 0,7% метиленовым синим в 70% EtOH в течение 10 мин, и подсчитывали колонии диаметром >0,5 мм. Для исследования экспрессии GFP клетки подвергали селекции в течение двух недель перед анализом FACS флуоресценции GFP, описанным выше.The DG44 CHO cell line was cultured in DMEM:F12 (Gibco) supplemented with hypoxanthine/thymidine (HT, Gibco) and 10% fetal bovine serum (FBS, Gibco). Transfection was performed using PEI (JetPRIME, Polyplus Transfection) following the manufacturer's instructions. Cells were transfected with varying amounts of plasmid DNA containing the PB transposase (ranging from 0 to 1500 ng) for titration experiments or cotransfected with an optimal ratio of 300 ng of plasmid expressing the PB transposase and 300 ng of donor plasmid carrying the transposon. Two days after transfection, cells were transferred to several Petri dishes depending on the experiment. For analysis of unselected transfected CHO cells, cells were subcultured without antibiotic selection for 3 weeks and the percentage of fluorescent cells and the fluorescence intensity of GFP-positive cells were determined by FACS analysis using a CyAn ADP flow cytometer (Beckman Coulter). To analyze gene copy number in unselected cells, stable GFP-positive CHO cells were sorted using FACSArial. For quantitative analysis of antibiotic-resistant colonies, 50,000 transfected cells were plated in 100-mm dishes and subjected to selection with 5 μg/ml puromycin for 2 weeks. Resistant colonies were then fixed and stained with 0.7% methylene blue in 70% EtOH for 10 min, and colonies >0.5 mm in diameter were counted. To examine GFP expression, cells were gated for two weeks before FACS analysis of GFP fluorescence described above.

Клетки СНО-М поддерживали в суспензионной культуре в бессывороточной среде SFM4CHO Hyclone (ThermoScientific), дополненной L-глутамином (РАА, Австрия) и добавкой НТ (Gibco, Invitrogen life sciences), при 37°C, 5% CO2 в увлажненном воздухе. Несущие транспозон донорные плазмиды переносили в данные клетки путем электропорации согласно рекомендациям производителя (Neon devices, Invitrogen). Проводили количественный анализ секреции иммуноглобулина периодическими культурами, как описано ранее (см. Le Fourn и др., 2013). Вкратце, популяции клеток, экспрессирующих иммуноглобулины, оценивали при периодическом культивировании в минибиореакционных пробирках объемом 50 мл (ТРР, Швейцария) при 37°С во влажной камере при 5% CO2 в течение 7 дней. Концентрации иммуноглобулина в культуральных супернатантах измеряли с помощью «сэндвич»-иммуноферментного анализа (ИФА).CHO-M cells were maintained in suspension culture in serum-free SFM4CHO Hyclone medium (ThermoScientific) supplemented with L-glutamine (PAA, Austria) and HT supplement (Gibco, Invitrogen life sciences), at 37°C, 5% CO2 in humidified air. Transposon-carrying donor plasmids were transferred into these cells by electroporation according to the manufacturer's recommendations (Neon devices, Invitrogen). Quantitative analysis of immunoglobulin secretion by batch cultures was performed as described previously (see Le Fourn et al., 2013). Briefly, cell populations expressing immunoglobulins were assessed by batch culture in 50 ml minibioreaction tubes (TPP, Switzerland) at 37°C in a humidified chamber with 5% CO2 for 7 days. Immunoglobulin concentrations in culture supernatants were measured using a sandwich enzyme-linked immunosorbent assay (ELISA).

Анализы числа копий генов методом количественной ПЦР (qPCR)Gene copy number assays using quantitative PCR (qPCR)

Общую ДНК выделяли из популяций стабильных клеток СНО после анализов транспозиции, применяя набор DNeasy Tissue (Qiagen, Хильден, Германия), следуя протоколу производителя. Число копий встроенных в геном трансгенов оценивали, применяя 6 нг геномной ДНК, с помощью количественной ПЦР, применяя набор с SYBR Green-Taq полимеразой от Eurogentec Inc и устройство для проведения ПЦР ABI Prism 7700 (Applied Biosystems). Праймеры GFP-прямой: ACATTATGCCGGACAAAGCC и GFP-обратный: TTGTTTGGTAATGATCAGCAAGTTG использовали для определения количества гена GFP, тогда как праймеры В2М-прямой: ACCACTCTGAAGGAGCCCA и В2М-обратный: GGAAGCTCTATCTGTGTCAA использовали для амплификации гена бета-2 микроглобулина. Для ампликона, полученного с помощью праймеров В2М, обнаружили одно совпадение на гаплоидный геном СНО после выравнивания с нашей сборкой генома СНО, применяя программное обеспечение NCBI BLAST. Так как СНО являются почти диплоидными клетками, приблизительно подсчитали, что В2М присутствует в 2 копиях на геном. Соотношения числа копий целевого гена GFP рассчитывали по сравнению с таковым для эталонного гена В2М, как описано ранее.Total DNA was isolated from stable CHO cell populations after transposition assays using the DNeasy Tissue kit (Qiagen, Hilden, Germany) following the manufacturer's protocol. The copy number of genome-integrated transgenes was assessed using 6 ng of genomic DNA by quantitative PCR using a SYBR Green-Taq polymerase kit from Eurogentec Inc and an ABI Prism 7700 PCR device (Applied Biosystems). Primers GFP-forward: ACATTATGCCGGACAAAGCC and GFP-reverse: TTGTTTGGTAATGATCAGCAAGTTG were used to quantify the GFP gene, while primers B2M-forward: ACCACTCTGAAGGAGCCCA and B2M-reverse: GGAAGCTCTATCTGTGTCAA were used to amplify the beta-2 microglobulin gene. For the amplicon generated with the B2M primers, one hit per haploid CHO genome was found after alignment with our CHO genome assembly using NCBI BLAST software. Since CHOs are nearly diploid cells, it is estimated that B2M is present in 2 copies per genome. Copy number ratios of the GFP target gene were calculated relative to those of the B2M reference gene as previously described.

Сортировка и анализ экспрессирующих иммуноглобулин клетокSorting and analysis of immunoglobulin-expressing cells

Для сортировки магнитным способом экспрессирующих IgG клеток, трансфицированные клетки СНО-М высевали при концентрации клеток 3×105 клеток в мл в среде SFM4CHO (Thermo Scientific), дополненной 8 мМ L-глутамином и добавкой 1 × НТ (оба от Gibco), называемой полной средой. После 4 дней в культуре 2×106 клеток промывали, ресуспендировали в ФБР и инкубировали с биотинилированным IgG человека (KPL216-1006) в конечной концентрации 3 мкг/мл вместе с 30 мкл заранее промытых покрытых стрептавидином гранул MyOne Т1 Dynabeads (Invitrogen), на вращающемся колесе в течение 30 минут при комнатной температуре. Смесь клеток и гранул затем помещали на магнит, чтобы отделить помеченные клетки от не помеченных клеток. Гранулы промывали 4 раза фосфатно-солевым буферным раствором (ФБР). После последней промывки ФБР гранулы и клетки ресуспендировали в 500 мкл заранее нагретой полной среды, переносили в 24-луночный планшет и инкубировали при 37°С при 5% CO2. После 24 ч отделенные методом магнитной сортировки поликлональные клетки отделяли от гранул и продолжали инкубацию до тех пор, пока клетки не достигли достаточной плотности для их размножения в 50 мл центрифужных биореакторах ТРР (TECHNO PLASTIC PRODUCTS AG, Швейцария).For magnetic sorting of IgG-expressing cells, transfected CHO-M cells were seeded at a cell concentration of 3 x 10 5 cells per ml in SFM4CHO medium (Thermo Scientific) supplemented with 8 mM L-glutamine and 1 x HT supplement (both from Gibco), called full environment. After 4 days in culture, 2 x 10 6 cells were washed, resuspended in PBS and incubated with biotinylated human IgG (KPL216-1006) at a final concentration of 3 μg/ml along with 30 μl of pre-washed streptavidin-coated MyOne T1 Dynabeads (Invitrogen), on on a rotating wheel for 30 minutes at room temperature. The mixture of cells and beads was then placed on a magnet to separate labeled cells from unlabeled cells. The beads were washed 4 times with phosphate-buffered saline (PBS). After a final wash with PBS, beads and cells were resuspended in 500 μl of prewarmed complete medium, transferred to a 24-well plate, and incubated at 37°C with 5% CO2. After 24 h, the polyclonal cells separated by magnetic sorting were separated from the beads and incubation continued until the cells reached a sufficient density for their proliferation in 50 ml TPP centrifugal bioreactors (TECHNO PLASTIC PRODUCTS AG, Switzerland).

В качестве альтернативы, выделяли два клона из не подвергнутых сортировке и не подвергнутых селекции популяций, экспрессирующих каждый из трех IgG, применяя устройство clonePix. Вкратце, для иммобилизации отдельных клеток применяли полутвердые среды, и колонии, секретирующие большие количества IgG, собирали через десять дней после заливки. Данные линии клеток пересевали каждые 3-4 дня в центрифужные биореакторы при плотности 3×105 клеток/мл в содержащую пептон ростовую среду (SFM4CHO, дополненную 8 мМ глутамином, от Hyclone) и инкубировали во влажной камере при 37°С и 5% СО2 при вращении на 180 об/мин.Alternatively, two clones were isolated from unsorted and unselected populations expressing each of the three IgGs using the clonePix device. Briefly, semisolid media were used to immobilize single cells, and colonies secreting large amounts of IgG were collected ten days after embedding. These cell lines were subcultured every 3-4 days into centrifugal bioreactors at a density of 3×10 5 cells/ml in peptone-containing growth medium (SFM4CHO, supplemented with 8 mM glutamine, from Hyclone) and incubated in a humidified chamber at 37°C and 5% CO2 when rotating at 180 rpm.

При оценке поликлональных популяций клеток титры IgG определяли для клеток, которые высевали при концентрации 1×105 клеток в мл и растили в течение 6 дней в 5 мл полной среды в 50 мл центрифужных биореакторах. В качестве альтернативы, культуры клональных популяций во встряхиваемых колбах инокулировали при плотности 3×105 клеток/мл в среде SFM4CHO, чтобы начать производственный процесс периодического культивирования с подпиткой. Производство периодических культур с подпиткой осуществляли в культуре объемом 25 мл во встряхиваемых колбах объемом 125 мл или в культуре объемом 5 мл в культуральных пробирках ТРР объемом 50 мл во влажных камерах при 37°С и 5% CO2 при взбалтывании при 150 об/мин (встряхиваемые колбы и центрифужные пробирки объемом 125 мл). Производство осуществляли в течение десяти дней с подпиткой 16% от исходного объема культуры концентрированной подпитки с определенным химическим составом (Hyclone, Cell Boost 5, 52 г/л) в дни ноль, три и шесть - восемь. В процессе культивирования не применяли подпитку глутамином и глюкозой. Жизнеспособность и концентрацию жизнеспособных клеток (VCD) в культуре измеряли ежедневно, применяя устройство GUAVA (Millipore). Двойной анализ «сэндвич»-ИФА применяли, чтобы определить концентрации МАТ, секретируемых в культуральные среды.When assessing polyclonal cell populations, IgG titers were determined for cells that were seeded at a concentration of 1×10 5 cells per ml and grown for 6 days in 5 ml of complete medium in 50 ml centrifugal bioreactors. Alternatively, shake flask cultures of clonal populations were inoculated at a density of 3 x 10 5 cells/ml in SFM4CHO medium to begin the fed-batch production process. Fed-batch culture production was carried out in 25 ml culture in 125 ml shake flasks or in 5 ml culture in 50 ml TPP culture tubes in humidified chambers at 37°C and 5% CO2 with shaking at 150 rpm (shaking flasks and centrifuge tubes with a volume of 125 ml). Production was carried out for ten days with feeding 16% of the initial volume of the culture of concentrated feeding with a certain chemical composition (Hyclone, Cell Boost 5, 52 g/l) on days zero, three and six to eight. Glutamine and glucose were not fed during the cultivation process. Viability and viable cell concentration (VCD) in the culture were measured daily using a GUAVA device (Millipore). A dual sandwich ELISA assay was used to determine the concentrations of MAbs secreted into the culture media.

Плазмиды и относительный количественный анализ ПЦРPlasmids and relative quantitation PCR analysis

Клонирующие векторы, применяемые в данном исследовании, представляли собой векторы для экспрессии в млекопитающем SLXplasmid_082 от Selexis. Последовательность люциферазы контрольного вектора pGL3 (Promega) заменяли на эукариотическую кассету экспрессии, состоящую из энхансера CMV человека и промотора GAPDH человека, расположенную в 3'-5' направлении от последовательности, кодирующей EGFP, за которой следовал сигнал полиаденилирования SV40, терминатор гастрина человека и энхансер SV40. Два полученных из MAR генетических элемента человека фланкировали указанную кассету экспрессии, и ген устойчивости к пуромицину экспрессировался под контролем промотора SV40, при этом SLXplasmid_082 отличается по типу элемента MAR, расположенного в 3'-5' направлении от указанной кассеты экспрессии (hMAR 1-68 и hMAR X-29; Girod и др., 2007).The cloning vectors used in this study were mammalian expression vectors SLXplasmid_082 from Selexis. The luciferase sequence of the control vector pGL3 (Promega) was replaced with a eukaryotic expression cassette consisting of the human CMV enhancer and the human GAPDH promoter, located 3′-5′ of the EGFP coding sequence, followed by the SV40 polyadenylation signal, the human gastrin terminator and enhancer SV40. Two human MAR-derived genetic elements flanked the expression cassette, and the puromycin resistance gene was expressed under the control of the SV40 promoter, with SLXplasmid_082 differing in the type of MAR element located 3'-5' from the expression cassette (hMAR 1-68 and hMAR X-29; Girod et al., 2007).

кДНК тяжелых и легких цепей трастузумаба и инфликсимаба клонировали в вектор экспрессии, чтобы заменить EGFP. Вектор, несущий кассеты экспрессии обеих тяжелой и легкой цепей каждого IgG, получали путем объединения кассет экспрессии тяжелой и легкой цепей на одном плазмидном векторе. Последовательности сигнальных пептидов из всех тяжелых и легких цепей, а также константные области легких цепей идентичны. Константные области тяжелых цепей отличаются в нескольких положениях аминокислот (варианты DEL по сравнению с ЕЕМ).Trastuzumab and infliximab heavy and light chain cDNAs were cloned into an expression vector to replace EGFP. A vector carrying both the heavy and light chain expression cassettes of each IgG was prepared by combining the heavy and light chain expression cassettes on a single plasmid vector. The sequences of signal peptides from all heavy and light chains, as well as the constant regions of the light chains, are identical. Heavy chain constant regions differ at several amino acid positions (DEL versus EEM variants).

Праймеры для амплификации методом ПЦР и номера доступа в GenBank кДНК SRP9, SRP14, SRP54, SRPR-альфа, SRPR-бета, SEC61A1 и SEC61B перечислены в других местах в данном тексте. Продукты ПЦР, кодирующие секреторные белки, клонировали в вектор, чтобы заменить последовательность EGFP. Когда несколько секреторных белков экспрессировали совместно, инвертированные концевые последовательности транспозона piggyBac встраивали в векторы, чтобы заключить в них кассету экспрессии, и полученные в результате этого векторы котрансфицировали с вектором экспрессии, несущим транспозазу piggyBac, чтобы улучшить встраивание трансгена и избавиться от необходимости отбора антибиотиком.PCR amplification primers and GenBank accession numbers for the SRP9, SRP14, SRP54, SRPR-alpha, SRPR-beta, SEC61A1, and SEC61B cDNAs are listed elsewhere in this text. PCR products encoding secretory proteins were cloned into a vector to replace the EGFP sequence. When multiple secretory proteins were expressed together, the inverted tail sequences of the piggyBac transposon were inserted into vectors to enclose the expression cassette, and the resulting vectors were cotransfected with an expression vector carrying the piggyBac transposase to improve transgene integration and eliminate the need for antibiotic selection.

Обычный вектор экспрессии, несущий транспозазу РВ, который представлял собой pCS2+U5V5PBU3, содержащий последовательность, кодирующую транспозазу РВ, окруженную 5'- и 3'-нетранслируемыми концевыми областями (НТО) гена β-глобина Xenopus laevis, применяли в смежных экспериментах. Данную плазмиду конструировали, как описано далее: фрагмент 3'-НТО размером 317 п.о. из pBSSK/SB10 встраивали в pCS2+U5 (Invitrogen/Life Technologies, Пейсли, Великобритания) с получением pCS2+U5U3. Последовательность, кодирующую транспозазу РВ (2067 п.о., номер доступа в GenBank: EF587698), синтезировали в ATG:biosynthetic (Мерцхаузен, Германия) и клонировали в каркас pCS2+U5U3 между двумя НТО. Контрольный вектор РВ соответствовал немодифицированной плазмиде pCS2+U5.A conventional expression vector carrying the PB transposase, which was pCS2+U5V5PBU3 containing the PB transposase coding sequence flanked by the 5' and 3' untranslated terminal regions (UTRs) of the Xenopus laevis β-globin gene, was used in related experiments. This plasmid was constructed as described below: a 3'-UTR fragment of 317 bp. from pBSSK/SB10 was inserted into pCS2+U5 (Invitrogen/Life Technologies, Paisley, UK) to generate pCS2+U5U3. The PB transposase coding sequence (2067 bp, GenBank accession number: EF587698) was synthesized at ATG:biosynthetic (Merzhausen, Germany) and cloned into the pCS2+U5U3 scaffold between two UTRs. The control vector PB corresponded to the unmodified plasmid pCS2+U5.

Векторы, несущие различные транспозоны, получали путем вставки 3'- и 5'-инвертированных концевых повторов РВ (ITR) размером 235 п.о. и 310 п.о., соответственно, синтезированных в ATG:biosynthetic (Мерцхаузен, Германия), в плазмиду pBluescript SK (pBSK ITR3'-ITR5'). Ген фосфотрансферазы неомицина (NeoR) под контролем промотора SV40 из плазмиды pRc/RSV (Invitrogen/Life Technologies) затем вставляли между двумя указанными ITR. Элементы MAR 1-68 и MAR Х-29, гены устойчивости к пуромицину и GFP, применяемые в данном исследовании, были такие, как описано ранее (Girod и др. 2007; Grandjean и др. 2011; Hart и Laemmli 1998). Векторы экспрессии иммуноглобулинов и последовательности, кодирующие SRP9, SRP14, SRP54, SRPR-альфа, SRPR-бета, SEC61A1 и SEC61B, описаны в данной заявке. Секреторные белки экспрессировали, применяя эукариотическую кассету экспрессии, состоящую из энхансера CMV человека и промотора GAPDH человека, расположенных в 3'-5' направлении от кодирующей последовательности, за которыми следовал сигнал полиаденилирования SV40, терминатор гастрина человека и энхансер SV40. Кассеты экспрессии и/или элементы MAR встраивали между последовательностями ITR или в каркас бактериального вектора, применяя стандартные способы клонирования.Vectors carrying different transposons were generated by inserting 235-bp 3'- and 5'-inverted terminal repeats (ITRs) of PB. and 310 bp, respectively, synthesized at ATG:biosynthetic (Merzhausen, Germany), into the plasmid pBluescript SK (pBSK ITR3'-ITR5'). The neomycin phosphotransferase (NeoR) gene under the control of the SV40 promoter from plasmid pRc/RSV (Invitrogen/Life Technologies) was then inserted between the two indicated ITRs. The MAR 1-68 and MAR X-29 elements, puromycin resistance genes, and GFP used in this study were as described previously (Girod et al. 2007; Grandjean et al. 2011; Hart and Laemmli 1998). Immunoglobulin expression vectors and coding sequences for SRP9, SRP14, SRP54, SRPR-alpha, SRPR-beta, SEC61A1 and SEC61B are described herein. The secretory proteins were expressed using a eukaryotic expression cassette consisting of the human CMV enhancer and the human GAPDH promoter located 3'-5' of the coding sequence, followed by the SV40 polyadenylation signal, the human gastrin terminator and the SV40 enhancer. Expression cassettes and/or MAR elements were inserted between ITR sequences or into the backbone of a bacterial vector using standard cloning techniques.

Системы транспозона PiggyBac, включая подходящие 3'- и 5'-ITR, а также транспозазу, например, доступны для приобретения у SYSTEM BIOSCIENCE.PiggyBac transposon systems, including suitable 3' and 5' ITRs as well as transposase, for example, are available for purchase from SYSTEM BIOSCIENCE.

Для относительного анализа методом количественной ПЦР общую РНК выделяли из 1×105 клеток и транскрибировали с помощью обратной транскриптазы в кДНК, применяя набор FastLane Cell cDNA (Qiagen), следуя инструкциям производителя. Осуществляли количественный анализ экспрессии SRP14 и GAPDH с помощью количественной ПЦР, применяя Rotor Gene Q (Qiagen) и LightCycler®480 SYBR Green I Master (Roche), с применением праймеров, перечисленых в приложенной таблице S1. Уровни информационной РНК SRP14 нормировали на таковые для GAPDH, применяя программное обеспечение Rotor-Gene Q Series (Qiagen).For relative qPCR analysis, total RNA was isolated from 1 x 10 5 cells and reverse transcribed into cDNA using the FastLane Cell cDNA kit (Qiagen) following the manufacturer's instructions. SRP14 and GAPDH expression were quantified by qPCR using Rotor Gene Q (Qiagen) and LightCycler®480 SYBR Green I Master (Roche), using the primers listed in the accompanying Table S1. SRP14 messenger RNA levels were normalized to those of GAPDH using Rotor-Gene Q Series software (Qiagen).

Культивирование клеток, стабильная трансфекция и субклонирование линий клеток СНОCell culture, stable transfection and subcloning of CHO cell lines

Суспензионные клетки яичника китайского хомячка (СНО-K1) поддерживали в бессывороточной среде SFM4CHO Hyclone (ThermoScientific), дополненной L-глутамином (РАА, Австрия) и добавкой НТ (Gibco, Invitrogen life sciences), при 37°C, 5% CO2 в увлажненном воздухе. Клетки СНО-K1 трансфицировали векторами экспрессии тяжелых и легких цепей трастузумаба или инфликсимаба, несущими ген устойчивости к пуромицину, путем электропорации согласно рекомендациям производителя (Neon devices, Invitrogen). Через два дня клетки переносили в планшеты Т75 в среду, содержащую 10 мкг/мл пуромицина, и указанные клетки дополнительно культивировали в условиях селекции в течение двух недель. Затем получали стабильные отдельные клоны клеток, экспрессирующих IgG трастузумаб и инфликсимаб, с помощью метода серийных разведений, растили и анализировали эффективность их роста и уровни продукции IgG. Продуцирующие IgG трастузумаб и инфликсимаб клоны клеток, экспрессирующих наиболее высокие уровни IgG, отбирали для дополнительных биохимических экспериментов. Некоторые из данных клонов затем котрансфицировали путем электропорации вектором, экспрессирующим SRP14, и плазмидой, несущей ген устойчивости к неомицину. Клетки затем культивировали в среде, содержащей 300 мкг/мл G418, в течение двух недель, как описано выше. Стабильные клоны выделяли с помощью ограниченного разведения и подтверждали экспрессию SRP14 с помощью анализов методом количественной ПЦР перед выращиванием культуры для биохимического анализа.Suspension Chinese hamster ovary cells (CHO-K1) were maintained in serum-free SFM4CHO Hyclone medium (ThermoScientific) supplemented with L-glutamine (PAA, Austria) and HT supplement (Gibco, Invitrogen life sciences), at 37°C, 5% CO2 in humidified air. CHO-K1 cells were transfected with trastuzumab or infliximab heavy and light chain expression vectors carrying the puromycin resistance gene by electroporation according to the manufacturer's recommendations (Neon devices, Invitrogen). Two days later, the cells were transferred to T75 plates in medium containing 10 μg/ml puromycin, and the cells were further cultured under selection conditions for two weeks. Stable individual clones of cells expressing IgG trastuzumab and infliximab were then obtained using a serial dilution method, grown, and their growth efficiency and IgG production levels were analyzed. Trastuzumab and infliximab IgG-producing cell clones expressing the highest levels of IgG were selected for additional biochemical experiments. Some of these clones were then cotransfected by electroporation with a vector expressing SRP14 and a plasmid carrying the neomycin resistance gene. Cells were then cultured in medium containing 300 μg/ml G418 for two weeks as described above. Stable clones were isolated by limited dilution and SRP14 expression was confirmed by qPCR assays before growing in culture for biochemical analysis.

Периодическое культивирование и периодическое культивирование с подпиткойBatch culture and fed-batch culture

Эффективность роста и продукции для отдельных клонов, экспрессирующих трастузумаб и инфликсимаб, оценивали при периодическом культивировании в минибиореакторе объемом 50 мл (ТРР, Швейцария) при 37°С во влажной камере при 5% CO2 в течение 7 дней. В день 3, день 4 и день 7 культивирования клеток определяли концентрацию и жизнеспособность клеток, применяя систему для проточной цитометрии Guava EasyCyte (Millipore). Титр IgG в культуральных супернатантах измеряли с помощью «сэндвич»-ИФА. Плотность клеток (Cv*мл-1) и значения титра IgG (мкг*мл-1) наносили на график в указанный день отбора образцов в процессе эксперимента. Удельную продуктивность IgG клонов, экспрессирующих трастузумаб и инфликсимаб, определяли как падение концентрации IgG в зависимости от суммарного количества жизнеспособных клеток (IVCD), рассчитанное в день 3 - день 7 (фаза продукции), и выражали в виде пг на клетку в день (pcd).The growth and production efficiency of individual clones expressing trastuzumab and infliximab was assessed by batch cultivation in a 50 ml minibioreactor (TPP, Switzerland) at 37°C in a humidified chamber with 5% CO2 for 7 days. At day 3, day 4, and day 7 of cell culture, cell concentration and viability were determined using a Guava EasyCyte flow cytometry system (Millipore). The IgG titer in culture supernatants was measured using sandwich ELISA. Cell density (Cv*ml-1) and IgG titer values (µg*ml-1) were plotted on the indicated sampling day during the experiment. The specific productivity of IgG clones expressing trastuzumab and infliximab was determined as the drop in IgG concentration depending on the total number of viable cells (IVCD), calculated on day 3 - day 7 (production phase), and expressed as pg per cell per day (pcd). .

Для периодических культур с подпиткой клетки высевали при плотности 0,3×106 клеток/мл во встряхиваемые колбы объемом 125 мл в 25 мл бессывороточной среды SFM4CHO Hyclone. Культуры поддерживали при 37°С и 5% СО2 при встряхивании. Культуры подпитывали ежедневно коммерчески доступной подпиткой Hyclone (ThermoScientific). Плотности клеток и продукцию IgG оценивали ежедневно.For fed-batch cultures, cells were seeded at a density of 0.3 x 10 6 cells/mL in 125 mL shake flasks in 25 mL of serum-free SFM4CHO Hyclone medium. Cultures were maintained at 37°C and 5% CO2 with shaking. Cultures were fed daily with commercially available Hyclone feed (ThermoScientific). Cell densities and IgG production were assessed daily.

Анализ экспрессии и агрегации белковAnalysis of protein expression and aggregation

Растворимые цитоплазматические белки экстрагировали путем пермеабилизации клеток 1% Triton Х-100 в буфере ФБР в присутствии коктейля ингибиторов протеаз (Roche, inc). После инкубации в течение 30 мин на льду клетки центрифугировали 10 мин при 14000 об/мин. Супернатант назвали фракцией "растворимых цитозольных и ЭР белков". Осадок растворяли путем обработки ультразвуком в буфере Лэммли с мочевиной (62,5 мМ Трис, 2% ДСН, 8 М мочевина, 5% глицерин, краситель бромфеноловый синий), что позволяло получить нерастворимую фракцию агрегировавших и везикулярных белков. Растворимую и нерастворимую фракции затем разбавляли буфером Лэммли с добавлением или без 2-меркаптоэтанола и кипятили 8 мин при 95°С. Образцы в восстанавливающем и невосстанавливающем буферах разделяли на 10% или градиентном 4-10% акриламидных гелях с помощью электрофореза в полиакриламидном геле с добавлением додецилсульфата натрия (ЭФ в ПААГ/ДСН), соответственно.Soluble cytoplasmic proteins were extracted by permeabilizing cells with 1% Triton X-100 in PBS buffer in the presence of a protease inhibitor cocktail (Roche, inc). After incubation for 30 min on ice, cells were centrifuged for 10 min at 14,000 rpm. The supernatant was called the “soluble cytosolic and ER proteins” fraction. The precipitate was dissolved by sonication in Laemmli buffer with urea (62.5 mM Tris, 2% SDS, 8 M urea, 5% glycerol, bromophenol blue dye), which made it possible to obtain an insoluble fraction of aggregated and vesicular proteins. The soluble and insoluble fractions were then diluted with Laemmli buffer with or without 2-mercaptoethanol and boiled for 8 min at 95°C. Samples in reducing and non-reducing buffers were separated on 10% or 4-10% gradient acrylamide gels by sodium dodecyl sulfate-polyacrylamide gel electrophoresis (SDS-PAGE), respectively.

Белки затем переносили на нитроцеллюлозную мембрану. После блокирования в 5% молоке, разбавленном в TBS-Tween (20 мМ Трис, 0,5 М NaCl, 0,1% Tween 20), мембраны анализировали для обнаружения различных белков, применяя следующие первичные антитела: антитело осла против IgG (H+L) человека, конъюгированное с пероксидазой хрена (JK immunoresearch, №709 035 149, 1:5000), поликлональные антитела кролика против BiP человека (Cell signalling, BiP, С50 В12, 1:2000), моноклональное антитело мыши против CHOP человека (Cell signalling, CHOP, L63F7, 1:500), поликлональное антитело козы против GAPDH человека. После инкубации в течение ночи при 4°С каждую мембрану обрабатывали конъюгированными с пероксидазой хрена HRP IgG против антител кролика или IgG против антител мыши (Cell signalling, 1:20000). Белки, специфично узнаваемые каждым антителом, детектировали, применяя реагенты для улучшенной хемилюминесценции (ECL) и экспонирование с пленкой для ECL (Amersham Biosciences).The proteins were then transferred to a nitrocellulose membrane. After blocking in 5% milk diluted in TBS-Tween (20 mM Tris, 0.5 M NaCl, 0.1% Tween 20), the membranes were assayed for various proteins using the following primary antibodies: donkey anti-IgG (H+ L) human, conjugated with horseradish peroxidase (JK immunoresearch, No. 709 035 149, 1:5000), rabbit polyclonal antibody against human BiP (Cell signaling, BiP, C50 B12, 1:2000), mouse monoclonal antibody against human CHOP (Cell signaling, CHOP, L63F7, 1:500), goat polyclonal antibody against human GAPDH. After overnight incubation at 4°C, each membrane was treated with horseradish peroxidase-conjugated anti-rabbit IgG or anti-mouse IgG (Cell signaling, 1:20,000). Proteins specifically recognized by each antibody were detected using enhanced chemiluminescence (ECL) reagents and exposure to ECL film (Amersham Biosciences).

Эксперименты с вытеснением белков на основе циклогексимидаCycloheximide-based protein displacement experiments

Эксперименты с вытеснением на основе циклогексимида осуществляли на клонах СНО-K1 с высоким (HP) и низким (LP) уровнем продукции IgG. Равные количества клеток высевали на 6-луночные планшеты в полной культуральной среде, дополненной 100 мкМ циклогексимида (Sigma). В различные моменты времени клетки собирали и лизировали в ФБР, 1% Triton Х-100. Растворимые и нерастворимые в Тх фракции затем разделяли на 4-10% акриламидном геле с помощью ПААГ/ДСН в невосстановительных условиях и подвергали иммуноблоттингу с антителом к IgG человека.Cycloheximide-based displacement experiments were performed on high (HP) and low (LP) IgG production CHO-K1 clones. Equal numbers of cells were seeded into 6-well plates in complete culture medium supplemented with 100 μM cycloheximide (Sigma). At various time points, cells were harvested and lysed in PBS, 1% Triton X-100. Tx-soluble and insoluble fractions were then separated on a 4-10% acrylamide gel using SDS-PAGE under non-reducing conditions and immunoblotted with anti-human IgG antibody.

Анализы дифференциального фракционирования детергентомDifferential detergent fractionation assays

Фракционирование цитозольных и мембранных белков осуществляли путем дифференциального экстрагирования детергентом из осадка клеток. Клетки сначала промывали в 1 мл ФБР, и плазматические мембраны HP и LP клеток пермеабилизовали в буфере КНМ (110 мМ KAc, 20 мМ HEPES, 2 мМ MgCl2, рН 7,2), содержащем 0,01% дигитонин (Sigma), в течение 10 мин в присутствие или без 1% Triton Х-100. Полупермеабилизованные клетки однократно промывали в буфере КНМ и добавляли трипсин до конечной концентрации 50 мкг/мл на 10 мин при комнатной температуре, чтобы расщепить растворимые белки. Расщепление трипсином останавливали путем добавления 1 мМ фенилметилсульфонилфторида (PMSF) и 4 мМ 4-(2-аминоэтил)-бензосульфонилфторида (AEBSF). Клетки собирали путем центрифугирования и растворимые белки экстрагировали в присутствии Triton Х-100 и ингибитора протеаз, как описано а разделе 2.4. Восстанавливающий буфер Лэммли, содержащий 2-меркаптоэтанол, добавляли к осадку и фракциям супернатанта, которые затем подвергали ЭФ в 8% ПААГ/ДСН. Осуществляли иммуноблоттинг, чтобы детектировать белки IgG и BiP.Fractionation of cytosolic and membrane proteins was carried out by differential detergent extraction from cell pellets. Cells were first washed in 1 ml PBS, and plasma membranes of HP and LP cells were permeabilized in KHM buffer (110 mM KAc, 20 mM HEPES, 2 mM MgCl2, pH 7.2) containing 0.01% digitonin (Sigma) for 10 min with or without 1% Triton X-100. Semi-permeabilized cells were washed once in KHM buffer and trypsin was added to a final concentration of 50 μg/ml for 10 min at room temperature to digest soluble proteins. Trypsin digestion was stopped by adding 1 mM phenylmethylsulfonyl fluoride (PMSF) and 4 mM 4-(2-aminoethyl)-benzenesulfonyl fluoride (AEBSF). Cells were collected by centrifugation and soluble proteins were extracted in the presence of Triton X-100 and protease inhibitor as described in section 2.4. Laemmli reducing buffer containing 2-mercaptoethanol was added to the pellet and supernatant fractions, which were then subjected to 8% SDS-PAGE. Immunoblotting was performed to detect IgG and BiP proteins.

Перекрестное сшивание белков и анализ методом вестерн-блоттингаProtein cross-linking and Western blot analysis

Клетки, продуцирующие инфликсимаб на низком уровне (LP), однократно промывали в ФБР и инкубировали с добавлением или без 1 мМ кросслинкера дитиобис(сукцинимидилпропионата) (DSP) (ThermoScientific) в течение 30 мин на льду. Перекрестное сшивание гасили путем инкубации с добавлением 50 мМ Трис-HCl (рН 7,4) в течение 10 мин перед экстрагированием белка в буфере ФБР, содержащем 1% Triton Х-100. После центрифугирования в течение 10 мин при 14000 об/мин в микроцентрифуге нерастворимую в Triton Х-100 фракцию или цельный экстракт белка анализировали с помощью ЭФ в ПААГ/ДСН в восстановительных условиях, подвергали иммуноблоттингу и окрашивали антителами против BiP и LC. Равные количества белков из нерастворимых в Тх фракций анализировали параллельно.Cells producing low levels of infliximab (LP) were washed once in PBS and incubated with or without 1 mM crosslinker dithiobis(succinimidylpropionate) (DSP) (ThermoScientific) for 30 min on ice. Cross-linking was quenched by incubation with 50 mM Tris-HCl (pH 7.4) for 10 min before protein extraction in PBS buffer containing 1% Triton X-100. After centrifugation for 10 min at 14,000 rpm in a microcentrifuge, the Triton X-100-insoluble fraction or whole protein extract was analyzed by EP-PAGE/SDS under reducing conditions, immunoblotted, and stained with antibodies against BiP and LC. Equal amounts of proteins from Tx-insoluble fractions were analyzed in parallel.

Должно быть очевидно, что способы и композиции согласно настоящему изобретению могут быть включены в виде различных вариантов реализации, лишь незначительное количество которых описано в данной заявке. Для специалиста должно быть очевидно, что существуют другие варианты реализации, которые не выходят за рамки сущности настоящего изобретения. Таким образом, описанные варианты реализации являются иллюстративными и не должны истолковываться как ограничительные.It should be obvious that the methods and compositions of the present invention may be included in various embodiments, only a small number of which are described in this application. It will be obvious to one skilled in the art that other embodiments exist that do not depart from the spirit of the present invention. Thus, the described embodiments are illustrative and should not be construed as limiting.

Claims (35)

1. Рекомбинантная молекула нуклеиновой кислоты для увеличения эффективности продукции трансгена, экспрессируемого в клетке млекопитающего, содержащая:1. A recombinant nucleic acid molecule for increasing the efficiency of production of a transgene expressed in a mammalian cell, containing: 5’- и 3’-транспозон-специфичные инвертированные концевые повторы (ITR);5' and 3' transposon-specific inverted terminal repeats (ITRs); по меньшей мере одну последовательность нуклеиновой кислоты, кодирующую белок экспрессии/процессинга трансгена (TEP), расположенную между указанными 5’- и 3’-ITR, и которая находится под контролем промотора; иat least one nucleic acid sequence encoding a transgene expression/processing protein (TEP) located between said 5' and 3' ITRs and which is under the control of a promoter; And по меньшей мере один участок прикрепления к матриксу (MAR), который расположен между 5’- и 3’-ITR; при этом:at least one matrix attachment region (MAR), which is located between the 5' and 3' ITR; wherein: указанный белок экспрессии/процессинга трансгена (TEP) представляет собой hSERCA2, hCALR, hSPCA1, hNRF2, hP4HA1, hP4HB, hCOSMC или hPDI; said transgene expression/processing protein (TEP) is hSERCA2, hCALR, hSPCA1, hNRF2, hP4HA1, hP4HB, hCOSMC or hPDI; указанный участок прикрепления к матриксу (MAR) выбран из SEQ ID NOs: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (MAR лизоцима курицы), или представляет собой сконструированный, в частности, перестроенный аналог, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична любой из последовательностей SEQ ID NO: с 1 по 5. said matrix attachment site (MAR) is selected from SEQ ID NOs: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (chicken lysozyme MAR), or is a designed, specifically rearranged, analogue whose sequence is at least 80%, 90%, 95%, 98%, 99%, or 100% identical to any of the sequences of SEQ ID NO: 1 to 5. 2. Рекомбинантная молекула нуклеиновой кислоты по п. 1, которая дополнительно содержит по меньшей мере один трансген, расположенный между указанными 5’- и 3’-ITR, который находится под контролем промотора трансгена.2. The recombinant nucleic acid molecule according to claim 1, which additionally contains at least one transgene located between the specified 5'- and 3'-ITRs, which is under the control of the transgene promoter. 3. Вектор экспрессии, содержащий рекомбинантную молекулу нуклеиновой кислоты по любому из пп. 1, 2.3. An expression vector containing a recombinant nucleic acid molecule according to any one of paragraphs. 12. 4. Вектор по п. 3, отличающийся тем, что указанный вектор содержит единичный элемент MAR или два или более элементов MAR, при этом указанный элемент(ы) расположен между указанными 5’- и 3’-ITR.4. The vector of claim 3, wherein said vector contains a single MAR element or two or more MAR elements, said element(s) located between said 5' and 3' ITRs. 5. Вектор по п. 3, отличающийся тем, что указанный вектор содержит два элемента MAR, при этом первый элемент MAR расположен в 3’-5’ направлении от TEP, и второй элемент MAR расположен в 5’-3’ направлении от TEP, при этом указанный первый элемент MAR включает элемент MAR 1_6 или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 2, в частности, перестроенные MAR на основе MAR 1-6, более конкретно - элементы, последовательности которых по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентичны SEQ ID NO: 8 (MAR 1_6R2), и второй элемент MAR включает элемент MAR 1-68 или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1. 5. The vector according to claim 3, characterized in that said vector contains two MAR elements, with the first MAR element located in the 3'-5' direction from the TEP, and the second MAR element located in the 5'-3' direction from the TEP, wherein said first MAR element includes a MAR 1_6 element or an element which is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical to the sequence of SEQ ID NO: 2, in particular, rearranged MARs at based on MARs 1-6, more specifically, elements whose sequences are at least 80%, 90%, 95%, 98%, 99% or 100% identical to SEQ ID NO: 8 (MAR 1_6R2), and the second MAR element includes a MAR 1-68 element or an element that is at least 80%, 90%, 95%, 98%, 99%, or 100% sequence identical to SEQ ID NO: 1. 6. Вектор по п. 3, отличающийся тем, что указанный вектор содержит единичный элемент MAR, при этом указанный единичный элемент MAR расположен в 5’-3’ направлении от TEP, и при этом единичный элемент MAR представляет собой MAR 1-68, или элемент MAR X-29, или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 1 или 3, в частности, перестроенный MAR на основе MAR 1-68 или MAR X-29, в частности, элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 6, 7 или 10 (элементы MAR 1_68R, 1_68R2 или X_29R3) или SEQ ID NO: 9, и предпочтительно представляет собой элемент MAR X-29 или элемент, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3. 6. The vector of claim 3, wherein said vector comprises a MAR unit, wherein said MAR unit is located in the 5'-3' direction from the TEP, and wherein the MAR unit is MAR 1-68, or a MAR X-29 element, or an element which is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical to SEQ ID NO: 1 or 3, particularly a rearranged MAR based on MAR 1-68 or MAR X-29, particularly an element which has at least 80%, 90%, 95%, 98%, 99% or 100% sequence identity to SEQ ID NO: 6, 7 or 10 (elements MAR 1_68R, 1_68R2 or X_29R3) or SEQ ID NO: 9, and is preferably a MAR X-29 element or an element that is at least 80%, 90%, 95%, 98%, 99% or 100% sequence identical sequence SEQ ID NO: 3. 7. Способ экспрессии трансгена и белка экспрессии/процессинга трансгена (TEP), включающий:7. A method for expressing a transgene and transgene expression/processing protein (TEP), including: обеспечение рекомбинантной клетки млекопитающего, содержащей трансген, и введение вектора по любому из пп. 3-6 в указанную рекомбинантную клетку млекопитающего с обеспечением экспрессии указанного трансгена и TEP в указанной клетке, причём экспрессия TEP с помощью указанного вектора может повышать экспрессию трансгена в указанной клетке млекопитающего на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%.providing a recombinant mammalian cell containing a transgene, and introducing a vector according to any one of claims. 3-6 into said recombinant mammalian cell to provide expression of said transgene and TEP in said cell, wherein expression of TEP using said vector can increase expression of the transgene in said mammalian cell by at least 10%, at least 20%, at least 30%, at least 40%, at least 50%, at least 60% or at least 70%. 8. Способ по п. 7, отличающийся тем, что указанный вектор содержит единичный элемент MAR X-29 или последовательность нуклеиновой кислоты, которая по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична последовательности SEQ ID NO: 3, и при этом через более чем 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 или 14 недель культивирования TEP, экспрессируемый с указанного вектора, повышает экспрессию представляющего интерес гена на по меньшей мере 10%, по меньшей мере 20%, по меньшей мере 30%, по меньшей мере 40%, по меньшей мере 50%, по меньшей мере 60% или по меньшей мере 70%.8. The method of claim 7, wherein said vector contains a single MAR X-29 element or a nucleic acid sequence that is at least 80%, 90%, 95%, 98%, 99% or 100% identical to the sequence SEQ ID NO: 3, and wherein after more than 4, 5, 6, 7, 8, 9, 10, 11, 12, 13 or 14 weeks of culture, the TEP expressed from said vector increases expression of the gene of interest by at least at least 10%, at least 20%, at least 30%, at least 40%, at least 50%, at least 60% or at least 70%. 9. Рекомбинантная клетка млекопитающего для экспрессии трансгена, содержащая не более чем 20, 15, 10 или 5 рекомбинантных молекул нуклеиновых кислот по п. 1 или 2.9. A recombinant mammalian cell for transgene expression, containing no more than 20, 15, 10 or 5 recombinant nucleic acid molecules according to claim 1 or 2. 10. Рекомбинантная клетка по п. 9, отличающаяся тем, что указанные рекомбинантные молекулы предпочтительно встроены в геном указанной клетки в виде единичных копий.10. A recombinant cell according to claim 9, characterized in that said recombinant molecules are preferably integrated into the genome of said cell in the form of single copies. 11. Рекомбинантная клетка млекопитающего для экспрессии трансгена, содержащая:11. Recombinant mammalian cell for transgene expression, containing: а) рекомбинантную молекулу нуклеиновой кислоты по п. 1, где указанная молекула нуклеиновой кислоты встроена в геном указанной клетки млекопитающего; и a) a recombinant nucleic acid molecule according to claim 1, where said nucleic acid molecule is integrated into the genome of said mammalian cell; And б) рекомбинантную молекулу нуклеиновой кислоты, содержащую:b) a recombinant nucleic acid molecule containing: (i) по меньшей мере один представляющий интерес трансген; и(i) at least one transgene of interest; And (ii) элемент MAR, где указанный элемент MAR выбран из SEQ ID NOs: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (MAR лизоцима курицы), или представляет собой сконструированный, в частности, перестроенный аналог, последовательность которого по меньшей мере на 80%, 90%, 95%, 98%, 99% или 100% идентична любой из последовательностей SEQ ID NO: с 1 по 5.(ii) a MAR element, where the specified MAR element is selected from SEQ ID NOs: 1 (MAR 1-68), 2 (MAR 1_6), 3 (MAR X_S29), 4 (MAR S4), 5 (chicken lysozyme MAR), or is an engineered, specifically rearranged, analogue that is at least 80%, 90%, 95%, 98%, 99%, or 100% sequence identical to any of the sequences of SEQ ID NO: 1 to 5. 12. Способ трансфекции клетки млекопитающего in vitro, включающий:12. A method for transfecting a mammalian cell in vitro, including: трансфекцию указанной клетки млекопитающего по меньшей мере одной, по меньшей мере двумя, по меньшей мере тремя или по меньшей мере четырьмя рекомбинантными молекулами нуклеиновой кислоты по любому из пп. 1 и 2. transfecting said mammalian cell with at least one, at least two, at least three or at least four recombinant nucleic acid molecules according to any one of claims. 1 and 2. 13. Способ по п. 12, отличающийся тем, что трансфекцию по меньшей мере одной указанной рекомбинантной молекулой нуклеиновой кислоты осуществляют в качестве первой трансфекции, и при этом в качестве второй последующей трансфекции осуществляют трансфекцию нуклеиновой кислотой, кодирующей трансген.13. The method according to claim 12, characterized in that transfection with at least one specified recombinant nucleic acid molecule is carried out as a first transfection, and at the same time, as a second subsequent transfection, transfection is carried out with a nucleic acid encoding the transgene. 14. Способ по п. 12 или 13, отличающийся тем, что указанная клетка млекопитающего представляет собой клетку хомячка. 14. The method according to claim 12 or 13, characterized in that said mammalian cell is a hamster cell. 15. Набор для осуществления трансфекции клетки, который в одном контейнере содержит по меньшей мере один вектор, содержащий рекомбинантную молекулу нуклеиновой кислоты по любому из пп. 1 и 2, и в дополнительном контейнере содержит инструкцию по применению указанного вектора или векторов.15. A kit for performing cell transfection, which in one container contains at least one vector containing a recombinant nucleic acid molecule according to any one of paragraphs. 1 and 2, and in an additional container contains instructions for using the specified vector or vectors. 16. Набор по п. 15, отличающийся тем, что указанный набор дополнительно к указанным двум контейнерам содержит в ещё одном дополнительном контейнере вектор, кодирующий подходящую транспозазу.16. The set according to claim 15, characterized in that the said set, in addition to the said two containers, contains in another additional container a vector encoding a suitable transposase. 17. Применение рекомбинантной нуклеиновой кислоты по любому из пп. 1 или 2 и/или рекомбинантной клетки млекопитающего по любому из пп. 9-11 для повышения встраивания трансгена в геном клетки хозяина и/или экспрессии трансгена in vitro. 17. The use of recombinant nucleic acid according to any one of paragraphs. 1 or 2 and/or a recombinant mammalian cell according to any one of paragraphs. 9-11 to increase the integration of the transgene into the genome of the host cell and/or the expression of the transgene in vitro. 18. Рекомбинантная клетка млекопитающего для экспрессии трансгена, которая принадлежит к клеточной линии и содержит:18. A recombinant mammalian cell for transgene expression that belongs to a cell line and contains: А) по меньшей мере одну рекомбинантную молекулу нуклеиновой кислоты, кодирующую белок экспрессии/процессинга трансгена (TEP), где указанный TEP представляет собой hSERCA2, hSPCA1 или hNRF2; и A) at least one recombinant nucleic acid molecule encoding a transgene expression/processing protein (TEP), wherein said TEP is hSERCA2, hSPCA1 or hNRF2; And B) рекомбинантную молекулу нуклеиновой кислоты, содержащую:B) a recombinant nucleic acid molecule containing: (i) по меньшей мере один представляющий интерес трансген; и(i) at least one transgene of interest; And (ii) элемент MAR.(ii) MAR element. 19. Рекомбинантная клетка млекопитающего по п. 18, где указанный по меньшей мере один трансген экспрессирует терапевтический белок, выбранный из иммуноглобулина, гормона, такого как эритропоэтин, или фактора роста, и где, необязательно, в указанной рекомбинантной клетке млекопитающего интеграция и/или экспрессия трансгена повышена по сравнению с клеткой, не содержащей указанную рекомбинантную(ые) молекулу(ы) нуклеиновой кислоты.19. The recombinant mammalian cell of claim 18, wherein said at least one transgene expresses a therapeutic protein selected from an immunoglobulin, a hormone such as erythropoietin, or a growth factor, and wherein, optionally, in said recombinant mammalian cell integration and/or expression transgene is increased compared to a cell not containing the specified recombinant nucleic acid molecule(s). 20. Рекомбинантная клетка млекопитающего по любому из пп. 18, 19, отличающаяся тем, что указанная клетка представляет собой первичную стволовую клетку, клетку хомячка, например клетку СНО, или клетку человека, такую как клетка НЕК293.20. Recombinant mammalian cell according to any one of paragraphs. 18, 19, wherein said cell is a primary stem cell, a hamster cell, such as a CHO cell, or a human cell, such as a HEK293 cell.
RU2019139048A 2013-02-01 2014-02-01 Improved transgene expression and processing RU2808756C1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US61/759,802 2013-02-01
US61/800,244 2013-03-15
US61/806,634 2013-03-29

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2015127667A Division RU2711505C9 (en) 2013-02-01 2014-02-01 Improved expression and processing of transgene

Publications (1)

Publication Number Publication Date
RU2808756C1 true RU2808756C1 (en) 2023-12-04

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0743365A2 (en) * 1995-05-17 1996-11-20 Ajinomoto Co., Inc. Process for efficiently producing transglutaminase through DNA recombination
WO2005010046A1 (en) * 2003-06-27 2005-02-03 Bayer Pharmaceuticals Corporation Use of molecular chaperones for the enhanced production of secreted, recombinant proteins in mammalian cells
RU2394104C2 (en) * 2004-05-20 2010-07-10 Проекто Де Биомедисина Сима, С.Л. Adenovirus/alfavirus hybrid vector for effective administration and expression of therapeutic genes in tumor cells
WO2011033375A2 (en) * 2009-09-18 2011-03-24 Selexis S.A. Products and methods for enhanced transgene expression and processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0743365A2 (en) * 1995-05-17 1996-11-20 Ajinomoto Co., Inc. Process for efficiently producing transglutaminase through DNA recombination
WO2005010046A1 (en) * 2003-06-27 2005-02-03 Bayer Pharmaceuticals Corporation Use of molecular chaperones for the enhanced production of secreted, recombinant proteins in mammalian cells
RU2394104C2 (en) * 2004-05-20 2010-07-10 Проекто Де Биомедисина Сима, С.Л. Adenovirus/alfavirus hybrid vector for effective administration and expression of therapeutic genes in tumor cells
WO2011033375A2 (en) * 2009-09-18 2011-03-24 Selexis S.A. Products and methods for enhanced transgene expression and processing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MATASCI M. et al. "CHO cell lines generated by PiggyBac transposition", BMC PROCEEDINGS, 2011, v. 5, p. P31. *

Similar Documents

Publication Publication Date Title
CA2898878C (en) Enhanced transgene expression and processing
US11884917B2 (en) Conditional CRISPR sgRNA expression
US10760081B2 (en) Compositions and methods for enhancing CRISPR activity by POLQ inhibition
US20120231449A1 (en) Products and methods for enhanced transgene expression and processing
Ley et al. MAR elements and transposons for improved transgene integration and expression
TW202144576A (en) Novel cho integration sites and uses thereof
WO2019060253A1 (en) Non-integrating dna vectors for the genetic modification of cells
US9551009B2 (en) Transcription unit and use thereof in expression vectors
JP2018537986A (en) Improved eukaryotic cells for protein production and methods for their production
EP3201337A1 (en) Methods and compositions for use of non-coding rna in cell culturing and selection
RU2808756C1 (en) Improved transgene expression and processing
EP3901266A1 (en) Super-enhancers for recombinant gene expression in cho cells
HK40007175B (en) Enhanced transgene expression and processing
HK40007175A (en) Enhanced transgene expression and processing
US9512230B2 (en) Transcription units and the use thereof in expression vectors
HK1216323B (en) Enhanced transgene expression and processing