ES2348487T3

ES2348487T3 - Composiciones de parejas aminoacil-trna sintetasa y trna-lisil ortogonales y usos de las mismas.

Info

Publication number: ES2348487T3
Application number: ES08001573T
Authority: ES
Inventors: Christopher J. Anderson; Stephen Santoro; Ning Wu; Peter G. Schultz
Original assignee: Scripps Research Institute
Current assignee: Scripps Research Institute
Priority date: 2003-07-07
Filing date: 2004-07-07
Publication date: 2010-12-07
Anticipated expiration: 2024-07-07

Abstract

Sistema de traducción que comprende: un tRNA ortogonal (O-tRNA) que reconoce un codón selector; y una sintetasa ortogonal (ORS) procedente de una lisil t-RNA sintetasa, la ORS siendo capaz de cargar específicamente homoglutamina en el O-tRNA.

Description

CAMPO DE LA INVENCIÓN

[0001] La invención pertenece al campo de la bioquímica de traducción. La invención se refiere a métodos para producir y a composiciones de ARNt ortogonales, aminoacil-ARNt sintetasas ortogonales y pares de los mismos, que incorporan aminoácidos no naturales, por ejemplo homoglutaminas, en proteínas en respuesta a codones selectores tales como codones selectores de cuatro bases y de terminación. Esto incluye la incorporación de múltiples aminoácidos no naturales diferentes en una única cadena proteica en respuesta a codones selectores de terminación y de cuatro bases. La invención también se refiere a métodos para producir proteínas en células usando dichos pares y composiciones relacionadas.

ANTECEDENTES DE LA INVENCIÓN

[0002] Aunque, con pocas excepciones, los códigos genéticos de todos los organismos conocidos codifican los mismos veinte aminoácidos, todo lo que se requiere para añadir un nuevo aminoácido al repertorio de un organismo es un único par de ARNt/aminoacil-ARNt sintetasa, una fuente del aminoácido y un único codón selector que especifique el aminoácido (Furter (1998) Protein Sci., 7: 419-426). Previamente hemos demostrado que el codón sin sentido ámbar, TAG, junto con pares ortogonales de ARNt/sintetasa de M. jannaschii y E. coli, se puede usar para codificar genéticamente una diversidad de aminoácidos con nuevas propiedades en

E. coli (Wang et al., (2000) J. Am. Chem. Soc, 122: 5010-5011; Wang et al., (2001) Science, 292: 498-500; Wang et al., (2003) Proc. Natl. Acad. Sci. U.

S. A., 100: 56-61; Chin et al., (2002) Proc. Natl. Acad. Sci. U. S. A., 99: 11020-11024) y levadura (Chin y Schultz, (2002) ChemBioChem, 3: 11351137), respectivamente. El número limitado de codones de triplete no codificantes, sin embargo, restringe severamente el número final de aminoácidos codificados por cualquier organismo. [0003] Hay muchos ejemplos de supresores de desplazamiento del marco de lectura +1 de origen natural incluyendo supresores UAGN procedentes de Su7 que codifica glutamina (Magliery et al., (2001) J. Mol. Biol., 307:755769), supresores procedentes de sufJ de codones ACCN que codifican treonina (Anderson et al., (2002) Chem. Biol., 9:237-244) y supresores de CAAA procedentes de ARNtLys y ARNtGln (Anderson y Schultz, (2003) Biochemistry, 42(32): 9598-608). Además, se han usado selecciones genéticas para identificar de forma eficaz ARNt supresores de codones de cuatro y cinco bases de grandes bibliotecas de ARNt mutantes, incluyendo

Ser

un supresor ARNtUCCU de E. coli (Ibba et al., (1999) Proc. Natl. Acad. Sci. U.

S. A., 96: 418-423; Kwok y Wong, (1980) Can. J. Biochem., 58: 213-218). Este fenómeno natural se ha extendido para mutagénesis de aminoácidos no naturales in vitro usando ARNt aminoacilados químicamente. Se ha incorporado una diversidad de aminoácidos, incluyendo pares de fluoróforo/inactivador (Terada et al., (2002) Nat. Struct. Biol., 9: 257-262) en proteínas en respuesta a AGGU y CGGG (Hou et al., (1992) Biochemistry,

31: 4157-4160; Yarus et al., (1986) J. Mol. Biol., 192: 235-255; Miller, (1972) Experiments in molecular genetics, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y). Para expandir adicionalmente el código genético, existe la necesidad de desarrollar componentes mejorados y/o adicionales de la maquinaria biosintética, por ejemplo, ARNt ortogonales, aminoacil-ARNt sintetasas ortogonales y/o codones únicos. Esta invención cumple estas y otras necesidades, como será evidente después de la revisión de la siguiente descripción.

EXPLICACIÓN DE LA INVENCIÓN

[0004] La presente invención proporciona nuevos sistemas de traducción que producen productos proteicos usando tRNA ortogonal y aminoacil tRNA sintetasas ortogonales según se indica en las reivindicaciones. La invención se refiere al sistema de traducción ensamblado, los procedimientos para usar el sistema de traducción y los productos de la traducción producidos por el sistema. Esta tecnología encuentra una serie de usos tal y como se discute en el presente documento, por ejemplo, pero no limitado a, la producción de productos terapéuticos, reactivos diagnósticos y enzimas industriales. [0005] En un aspecto, la presente invención proporciona un sistema de traducción que comprende:

un tRNA ortogonal (O-tRNA) que reconoce un codón selector; y

una sintetasa ortogonal (ORS) derivada de una lisil-tRNA sintetasa, dicha ORS siendo capaz de cargar de manera específica el O-tRNA con homoglutamina. [0006] En algunas realizaciones del sistema de traducción, el lisil O-ARNt, la variante del O-ARNt, la O-RS o tanto el O-ARNt como la O-RS, proceden de Pyrococcus horikoshii (PhKRS). Diversas O-RS que encuentran uso en el sistema de traducción incluyen PhKRS, E444G, PhAD y un mutante I41 y/o S268 de PhAD. En algunas realizaciones, la O-RS de Pyrococcus horikoshii, cuando se expresa en una célula E. coli, muestra una toxicidad que es igual o menor que la toxicidad de un mutante I41 y/o S268 de PhAD. [0007] El lisil O-ARNt o la variante de O-ARNt incluye opcionalmente una secuencia de reconocimiento para un codón de cuatro bases o un codón ámbar. Por ejemplo, el lisil O-ARNt o la variante puede incluir una secuencia de reconocimiento para AGGA. En aspectos relacionados del sistema de traducción, el lisil O-ARNt o la variante usa un bucle anti-codón con la secuencia CU(X)nXXXAA. En algunas realizaciones de este aspecto, la secuencia CU(X)nXXXAA puede ser CUCUAAA o CUUCCUAA. Los ejemplos incluyen el lisil O-ARNt o la variante del mismo que incluye las secuencias observadas en la SEC ID Nº: 24 o la SEC ID Nº: 26. [0008] En algunas realizaciones de la invención, la O-RS, el lisil O-ARNt o las variantes tienen una eficacia de al menos el 50% en la supresión de un codón selector de terminación o de desplazamiento del marco de lectura con respecto a E444G, PhAD o un mutante I41 y/o S268 de PhAD, en combinación con un O-ARNt de la SEC ID Nº: 24 o la SEC ID Nº: 26. En otras realizaciones, el sistema de traducción usa una O-RS adicional y un O-ARNt adicional, donde estos componentes adicionales suprimen un codón selector de desplazamiento del marco de lectura que es diferente de un codón selector de desplazamiento del marco de lectura suprimido por el lisil O-ARNt o la variante de O-ARNt y la O-RS que carga de forma preferente el lisil O-ARNt o la variante de O-ARNt. En otras realizaciones, el sistema de traducción suprime tanto un codón selector de cuatro bases como un codón selector de terminación en un ácido nucleico diana que codifica un polipéptido diana. El codón selector de cuatro bases usa opcionalmente la secuencia AGGA y el codón selector de terminación usa opcionalmente la secuencia TAG o UAG. En algunas realizaciones, el sistema de traducción incluye un ácido nucleico diana que comprende un codón selector de cuatro bases. El sistema de traducción incorpora opcionalmente una proteína codificada por el ácido nucleico diana. Por ejemplo, esta proteína puede incorporar un residuo de homoglutamina. [0009] El sistema de traducción incorpora opcionalmente un ácido nucleico diana que codifica un codón selector de cuatro bases y un codón selector de terminación. En algunos aspectos, el sistema de traducción incorpora una proteína codificada por el ácido nucleico diana, donde la proteína incluye al menos dos aminoácidos no naturales diferentes. [0010] La invención proporciona, por ejemplo, un sistema de traducción que usa un primer ARNt ortogonal (O-ARNt) que reconoce un codón selector de cuatro bases, una primera aminoacil ARNt sintetasa ortogonal (O-RS) que carga de forma preferente el O-ARNt con un primer aminoácido no natural, un segundo O-ARNt que reconoce un codón selector de terminación y una segunda O-RS que carga de forma preferente el segundo O-ARNt con un segundo aminoácido no natural. En una realización, el codón selector de cuatro bases es AGGA y el codón de terminación es UAG. Opcionalmente, el sistema de traducción está en una célula. [0011] En algunas realizaciones del sistema de traducción, el primer o segundo O-ARNt es un lisil ARNt ortogonal (lisil O-ARNt) o una variante modificada. Opcionalmente, el primer O-ARNt es un lisil ARNt ortogonal (lisil O-ARNt) o una variante adecuada y el segundo O-ARNt es un tirosil ARNt ortogonal (tirosil O-ARNt) o una variante adecuada. Opcionalmente, el sistema de traducción incorpora un ácido nucleico que codifica al menos un codón selector de cuatro bases y un codón selector de terminación. En estas realizaciones, el codón selector de cuatro bases puede ser AGGA y el codón selector de terminación puede ser TAG o UAG, y el ácido nucleico que se tiene que traducir es típicamente un ARN expresado. En algunas realizaciones, la proteína codificada por el ácido nucleico incorpora al menos dos aminoácidos no naturales diferentes, por ejemplo, homoglutamina y un segundo aminoácido no natural tal como un aminoácido electrófilo. El sistema de traducción puede incluir cualquiera de una diversidad de aminoácidos no naturales, incluyendo, por ejemplo, homoglutamina. En un ejemplo, la proteína en el sistema de traducción es homóloga a mioglobina pero incluye un aminoácido no natural tal como homoglutamina. [0012] La presente invención proporciona composiciones que incorporan, pero no se limitan a, las secuencias de aminoácidos de PhKRS, E444G, PhAD, un mutante I41 y/o S268 de PhAD o una variante conservativa de estas proteínas. La invención proporciona de forma similar ácidos nucleicos que codifican PhKRS, E444G, PhAD, un mutante I41 y/o S268 de PhAD y/o cualquier variante conservativa de estas secuencias. La invención proporciona ácidos nucleicos que incorporan en parte o consisten completamente en un ARNt que se corresponde a la SEC ID Nº: 24 o la SEC ID Nº: 26, o cualquier variante conservativa de estas secuencias. [0013] En otros aspectos, la invención proporciona composiciones que incorporan, pero no se limitan a, una aminoacil tRNA sintetasa ortogonal (ORS), en la que la O-RS aminoacila preferiblemente un O-tRNA con una homoglutamina. Esta O-RS puede incluir una mutación correspondiente a una mutación I41 y/o S268 de PhAD, o cualquier variante conservativa de esta proteína. En algunas realizaciones, la O-RS aminoacila, preferiblemente, el O-tRNA con una eficacia de al menos el 50% de la eficacia de una mutación I41 y/o S268 PhAD. En algunas realizaciones, la O-RS se deriva de Pyrococcus horikoshii. En algunas realizaciones en las que tanto la O-RS como el O-tRNA están presentes en la composición, el OtRNA reconoce un codón selector de cuatro bases, por ejemplo una secuencia AGGA. [0014] En algunas realizaciones en las que la anterior composición incluye

o está presente dentro de una célula, la O-RS puede estar codificada por uno o más ácidos nucleicos de la célula, que puede ser, por ejemplo, una célula E. coli. La composición puede incorporar un sistema de traducción. En composiciones que incorporan una célula y en las que la O-RS está codificada por uno o más ácidos nucleicos en la célula, la célula puede incluir adicionalmente un ARNt ortogonal (O-ARNt) que reconoce un primer codón selector y una homoglutamina, por ejemplo, donde la O-RS aminoacila de forma preferente el O-ARNt con la homoglutamina. En algunas realizaciones, la célula puede incluir un ácido nucleico diana que codifica un polipéptido de interés, donde el ácido nucleico diana codifica un codón selector que se reconoce por el O-ARNt. [0015] El O-ARNt opcionalmente está codificado completamente o parcialmente por una secuencia polinucleotídica como se expone en la SEC ID Nº: 24 o la SEC ID Nº: 26, o una secuencia polinucleotídica complementaria de la misma, y la O-RS incorpora una secuencia de aminoácidos correspondiente a E444G, PhAD, un mutante I41 y/o S268 de PhAD o cualquier variante conservativa de esa secuencia. Se entenderá que cualquier secuencia de ácido nucleico de este documento se puede representar en una forma de ARN o ADN; por lo tanto, a menos que el contexto indique otra cosa, secuencias tales como la SEC ID Nº: 24 ó 25 incluyen opcionalmente formas de ARN y/o ADN, se muestren de forma explícita o no. En algunas realizaciones, la O-RS y el O-ARNt tienen una eficacia de al menos el 50% en la supresión de un codón selector de terminación o de desplazamiento del marco de lectura con respecto a E444G, PhAD o un mutante I41 y/o S268 de PhAD, en combinación con un O-ARNt de la SEC ID Nº: 24 o la SEC ID Nº: 26. En realizaciones en las que la composición incorpora una célula, la célula puede ser una célula E. coli. Una célula de esta composición puede incluir adicionalmente un par adicional diferente de O-ARNt/O-RS y un aminoácido no natural adicional diferente, donde el O-ARNt reconoce un segundo codón selector y la O-RS aminoacila de forma preferente el O-ARNt con el segundo aminoácido no natural. La célula puede incluir opcionalmente de forma adicional un ácido nucleico diana que codifique el primer y segundo codón selector. Adicionalmente, una célula de esta composición puede incluir una proteína codificada por el ácido nucleico diana, donde la proteína incorpora al menos dos aminoácidos no naturales diferentes. [0016] La invención también proporciona una proteína que incluye al menos una homoglutamina. En algunas realizaciones, la proteína incluye una secuencia de aminoácidos que tiene una identidad de al menos el 75% con una secuencia de una proteína terapéutica de tipo salvaje, una proteína de diagnóstico, una enzima industrial o cualquier parte de estas proteínas. Opcionalmente, la proteína existe junto con un vehículo farmacéuticamente aceptable. [0017] En otro aspecto, la invención proporciona métodos para seleccionar una aminoacil-ARNt sintetasa ortogonal (O-RS) que carga una homoglutamina sobre un ARNt ortogonal (O-ARNt). Estos métodos utilizan una primera etapa de someter a selección una población de células, donde las células incluyen de forma colectiva, 1) el O-ARNt, donde el O-ARNt es ortogonal a miembros de la población de células que comprenden el O-ARNt; 2) una pluralidad de O-RS que tienen uno o más miembros activos de O-RS que cargan el O-ARNt con una homoglutamina en una o más células de la población; 3) un polinucleótido que codifica un marcador de selección, donde el polinucleótido codifica al menos un codón selector que es reconocido por el O-ARNt; y 4) homoglutamina. En esta selección, la célula diana en la población que comprende la O-RS activa se identifica mediante una eficacia de supresión potenciada del marcador de selección en comparación con una eficacia de supresión de una célula control que carece de la pluralidad de RS pero que aloja el O-ARNt. La segunda etapa del método es el procedimiento de selección que selecciona la célula diana que aloja una O-RS activa. La invención proporciona adicionalmente la aminoacil-ARNt sintetasa ortogonal identificada mediante cualquiera de los métodos de selección. [0018] En algunas realizaciones de estos métodos, las células se seleccionan adicionalmente para eliminar células que comprenden una O-RS no diana que carga el O-ARNt con un aminoácido diferente de homoglutamina. En algunas realizaciones, la selección es una selección positiva y el marcador de selección es un marcador de selección positiva. [0019] En diversas realizaciones de estos métodos, la pluralidad de RS puede proceder de cualquiera de una diversidad de fuentes, incluyendo, pero sin limitarse a, RS mutantes, RS procedentes de una o más especies diferentes de la primera especie o tanto RS mutantes como RS procedentes de una especie diferente de la primera especie. [0020] La invención también proporciona métodos para producir una proteína en una célula con una homoglutamina en una posición específica. El método incluye las etapas de dejar crecer, en un medio apropiado, una célula que aloja un ácido nucleico que codifica al menos un codón selector y codifica una proteína; por ejemplo, cuando la célula incluye adicionalmente un ARNt ortogonal (O-ARNt) que reconoce el codón selector y una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila de forma preferente el O-ARNt con homoglutamina; proporcionar la homoglutamina; e incorporar la homoglutamina en la posición especificada en respuesta al codón selector, produciendo por lo tanto la proteína. En una realización de este método, la secuencia de aminoácidos de la O-RS usa completamente, o en parte, la secuencia de aminoácidos de E444G, PhAD, un mutante I41 y/o S268 de PhAD o una variante conservativa de los mismos.

DEFINICIONES

[0021] Antes de describir con detalle la invención, se debe entender que esta invención no está limitada a sistemas biológicos particulares que, por supuesto, pueden variar. También se debe entender que la terminología usada en este documento es con el propósito de describir solamente realizaciones particulares y no pretende ser limitante. Como se usa en esta memoria descriptiva y en las reivindicaciones adjuntas, las formas singulares "un", "una", "el" y "la" incluyen los plurales a menos que el contenido indique claramente lo contrario. De esta manera, por ejemplo, la referencia a "una célula" incluye una combinación de dos o más células; la referencia a "bacteria" incluye mezclas de bacterias y similares. [0022] A menos que se definan en este documento y más adelante en el resumen de la memoria descriptiva, todos los términos técnicos y científicos usados en este documento tienen el mismo significado que se entiende comúnmente por un experto en la materia al que pertenece la invención. [0023] Lisil-ARNt ortogonal: Como se usa en este documento, un lisil-ARNt ortogonal (lisil-O-ARNt) es un ARNt que es ortogonal a un sistema de traducción de interés, en el que el ARNt es: (1) idéntico o sustancialmente similar a un lisil ARNt de origen natural, (2) procedente de un lisil ARNt de origen natural por mutagénesis natural o artificial, (3) procedente de cualquier proceso que tiene en cuenta una secuencia de un lisil ARNt de tipo salvaje o mutante de (1) o (2), (4) homólogo a un lisil ARNt de tipo salvaje o mutante; (5) homólogo a cualquier ARNt ilustrativo que está indicado como sustrato para una lisil ARNt sintetasa en la TABLA 1, o (6) una variante conservativa de cualquier ARNt ilustrativo que está indicado como sustrato para una lisil ARNt sintetasa en la TABLA 1. El lisil ARNt puede existir cargado con un aminoácido o en un estado no cargado. También se debe entender que un "lisil-O-ARNt" está cargado (aminoacilado) opcionalmente por una sintetasa afín con un aminoácido diferente de lisina, por ejemplo, con el aminoácido homoglutamina. De hecho, se entenderá que ventajosamente se use un lisil-O-ARNt de la invención para insertar esencialmente cualquier aminoácido, ya sea natural o artificial, en un polipéptido en crecimiento, durante la traducción, en respuesta a un codón selector. [0024] Lisil aminoácido sintetasa ortogonal: Como se usa en este documento, una lisil aminoácido sintetasa ortogonal (lisil-O-RS) es una enzima que aminoacila de forma preferente el lisil-O-ARNt con un aminoácido en un sistema de traducción de interés. El aminoácido que la lisil-O-RS carga en el lisil-O-ARNt puede ser cualquier aminoácido, ya sea artificial o natural, y no está limitado en este documento. La sintetasa es opcionalmente igual u homóloga a una lisil aminoácido sintetasa de origen natural, o igual u homóloga a una sintetasa denominada una lisil-O-RS en la TABLA 1. Por ejemplo, la lisil-O-RS puede ser una variante conservativa de una lisil-O-RS de la TABLA 1 y/o puede tener una identidad de al menos un 50%, 60%, 70%, 80%, 90%, 95%, 98%, 99% o mayor en la secuencia con una lisil-O-RS de la TABLA 1. [0025] Ortogonal: Como se usa en este documento, "ortogonal" se refiere a una molécula (por ejemplo, un ARNt ortogonal (O-ARNt) y/o una aminoacil ARNt sintetasa ortogonal (O-RS)) que funciona con componentes endógenos de una célula con menor eficacia en comparación con una molécula correspondiente que es endógena a la célula o al sistema de traducción, o que fracasa al funcionar con componentes endógenos de la célula. En el contexto de los ARNt y las aminoacil-ARNt sintetasas, ortogonal se refiere a la incapacidad o menor eficacia, por ejemplo, una eficacia reducida de un 20%, menor de un 10%, menor de un 5% o menor de un 1%, de un ARNt ortogonal para funcionar con una ARNt sintetasa endógena en comparación con la capacidad de un ARNt endógeno para funcionar con la ARNt sintetasa endógena; o de una aminoacil-ARNt sintetasa ortogonal para funcionar con un ARNt endógeno en comparación con la capacidad de una ARNt sintetasa endógena para funcionar con el ARNt endógeno. La molécula ortogonal carece de una molécula complementaria endógena funcionalmente normal en la célula. Por ejemplo, un ARNt ortogonal en una célula se aminoacila mediante cualquier RS endógena de la célula con una eficacia reducida o incluso indetectable en comparación con la aminoacilación de un ARNt endógeno por la RS endógena. En otro ejemplo, una RS ortogonal aminoacila cualquier ARNt endógeno en una célula de interés con una eficacia reducida o incluso indetectable en comparación con la aminoacilación del ARNt endógeno mediante una RS endógena. Se puede introducir una segunda molécula ortogonal en la célula que funciona con la primera molécula ortogonal. Por ejemplo, un par de ARNt/RS ortogonal incluye componentes complementarios introducidos que funcionan juntos en la célula con una eficacia (por ejemplo, un 45 % de eficacia, un 50% de eficacia, un 60% de eficacia, un 70% de eficacia, un 75% de eficacia, un 80% de eficacia, un 90% de eficacia, un 95% de eficacia o un 99% o más de eficacia) en comparación con la de un control, por ejemplo, un par endógeno de ARNt/RS correspondiente o un par ortogonal activo (por ejemplo, un par de tirosil ARNt/RS ortogonal). [0026] Afín: El término "afín" se refiere a componentes que funcionan juntos, por ejemplo, un ARNt ortogonal y una aminoacil-ARNt sintetasa ortogonal que aminoacila de forma preferente el ARNt ortogonal. Los componentes también se pueden denominar "complementarios".

[0027] Aminoacila de forma preferente: La expresión "aminoacila de forma preferente" indica que una O-RS carga un ARNt particular con un aminoácido determinado de forma más eficaz de lo que carga otros ARNt. Por ejemplo, la O-RS puede cargar un O-ARNt afín con una eficacia (por ejemplo, un 70 % de eficacia, un 75 % de eficacia, un 85% de eficacia, un 90% de eficacia, un 95 % de eficacia o un 99% o más de eficacia), en comparación con la O-RS que aminoacila un ARNt no afín (por ejemplo, un ARNt usado como un sustrato para crear el O-ARNt afín, por ejemplo, mediante mutación). [0028] Codón selector: La expresión "codón selector" se refiere a un codón reconocido por un O-ARNt en un proceso de traducción que no se reconoce típicamente por un ARNt endógeno. Los ejemplos típicos incluyen codones de terminación, codones que comprenden 4 o más bases y/o similares. Un bucle anticodón de O-ARNt reconoce un codón selector, por ejemplo, en un ARN expresado, por ejemplo, un ARNm, e inserta su aminoácido en un polipéptido que es traducido por componentes del sistema de traducción. Por ejemplo, en una realización de este documento, el O-ARNt reconoce un codón selector tal como un codón de cuatro bases y añade un aminoácido no natural, tal como una homoglutamina, en un polipéptido que es producido mediante el proceso de traducción. Los codones selectores pueden incluir, por ejemplo, codones sin sentido tales como codones de terminación, por ejemplo, codones ámbar, ocre y ópalo, codones de cuatro o más bases; codones raros; codones procedentes de pares de bases naturales o no naturales y/o similares. [0029] ARNt supresor: Un ARNt supresor es un ARNt que altera la lectura de un ARN mensajero (ARNm) en un sistema de traducción determinado, por ejemplo, proporcionando un mecanismo para incorporar un aminoácido en una cadena polipeptídica en respuesta a un codón selector. Por ejemplo, un ARNt supresor puede leer, por ejemplo, un codón de terminación, un codón de cuatro bases, un codón raro, etc. [0030] Actividad de supresión: Como se usa en este documento, la expresión "actividad de supresión" se refiere, en general, a la capacidad de un ARNt (por ejemplo, un ARNt supresor) a permitir la lectura completa de traducción de un codón (por ejemplo, un codón selector que es un codón ámbar o un codón de 4 o más bases) que de otro modo daría como resultado la terminación de la traducción o la traducción errónea (por ejemplo, desplazamiento del marco de lectura). La actividad de supresión de un ARNt supresor se puede expresar como un porcentaje de la actividad de lectura completa de traducción observada en comparación con un segundo ARNt supresor o en comparación con un sistema de control, por ejemplo, un sistema de control que carece de una O-RS. [0031] La presente invención proporciona diversos medios mediante los cuales se puede cuantificar la actividad de supresión. El porcentaje de supresión de un O-ARNt particular y una ORS contra un codón selector (por ejemplo, un codón ámbar) de interés se refiere al porcentaje de actividad de un marcador de ensayo expresado dado (por ejemplo, LacZ), que incluye un codón selector, en un ácido nucleico que codifica el marcador de ensayo expresado, en un sistema de traducción de interés, donde el sistema de traducción de interés incluye una O-RS y un O-ARNt, en comparación con una construcción de control positivo, donde el control positivo carece del O-ARNt, de la O-RS y del codón selector. De esta manera, por ejemplo, si una construcción de marcador de control positivo activo que carece de un codón selector tiene una actividad observada de X en un sistema de traducción determinado, en unidades pertinentes al ensayo de marcador en cuestión, entonces el porcentaje de supresión de una construcción de ensayo que comprende el codón selector es el porcentaje de X que muestra la construcción de marcador de ensayo en esencialmente las mismas condiciones que el medio natural en las que se expresaba el marcador de control positivo, excepto porque la construcción de marcador de ensayo se expresa en un sistema de traducción que también incluye el O-ARNt y la ORS. Típicamente, el sistema de traducción que expresa el marcador de ensayo también incluye un aminoácido que es reconocido por la O-RS y el O-ARNt. Opcionalmente, la medición del porcentaje de supresión se puede refinar mediante la comparación del marcador de ensayo con una construcción de marcador de control "de fondo" o "negativo" que incluye el mismo codón selector que el marcador de ensayo, pero en un sistema que no incluye el O-ARNt, la O-RS y/o el aminoácido pertinente reconocido por el O-ARNt y/o la O-RS. Este control negativo es útil para normalizar las mediciones del porcentaje de supresión para tener en cuenta efectos de señal de fondo del marcador en el sistema de traducción de interés. [0032] Se puede determinar la eficacia de supresión mediante cualquiera de los varios ensayos conocidos en la técnica. Por ejemplo, se puede usar un ensayo indicador de -galactosidasa, por ejemplo, se introduce un plásmido lacZ derivatizado (donde la construcción tiene un codón selector en la secuencia de ácido nucleico lacZ) en células de un organismo apropiado (por ejemplo, un organismo en el que se pueden usar los componentes ortogonales) junto con un plásmido que comprende un O-ARNt de la invención. También se puede introducir una sintetasa afín (bien como un polipéptido o como un polinucleótido que codifica la sintetasa afín cuando se expresa). Las células se dejan crecer en medio hasta la densidad deseada, por ejemplo, hasta una DO600 de aproximadamente 0,5, y se realizan ensayos de -galactosidasa, por ejemplo, usando el Kit de Ensayo de -Galactosidasa BetaFluor™ (Novagen). Se puede calcular el porcentaje de supresión como el porcentaje de actividad para una muestra con respecto a un control comparable, por ejemplo, el valor observado de la construcción lacZ derivatizada, donde la construcción tiene un codón sentido correspondiente en una posición deseada en vez de un codón selector. [0033] Sistema de traducción: La expresión "sistema de traducción" se refiere a componentes que incorporan un aminoácido en una cadena polipeptídica en crecimiento (proteína). Los componentes de un sistema de traducción pueden incluir, por ejemplo, ribosomas, ARNt, sintetasas, ARNm y similares. El O-ARNt y/o las O-RS de la invención se pueden añadir o formar parte de un sistema de traducción in vitro o in vivo, por ejemplo, en una célula no eucariota, por ejemplo, una bacteria (tal como E. coli), o en una célula eucariota, por ejemplo, una célula de levadura, una célula de mamífero, una célula vegetal, una célula de alga, una célula de hongo, una célula de insecto y/o similares. [0034] Aminoácido no natural: Como se usa en este documento, la expresión "aminoácido no natural" se refiere a cualquier aminoácido, aminoácido modificado y/o análogo de aminoácido, tal como una homoglutamina, que no es uno de los 20 aminoácidos de origen natural comunes o los aminoácidos naturales raros selenocisteína o pirrolisina. [0035] Procedente de: Como se usa en este documento, la expresión "procedente de" se refiere a un componente que se aísla o se prepara usando una molécula u organismo especificado, o información de la molécula o el organismo especificado. [0036] Marcador de selección o identificación positiva: Como se usa en este documento, la expresión "marcador de selección o identificación positiva" se refiere a un marcador que cuando está presente, por ejemplo, expresado, activado o similares, da como resultado la identificación de una célula que comprende un rasgo correspondiente al marcador, por ejemplo, células con el marcador de selección positiva, entre aquellas que no tienen el rasgo. [0037] Marcador de selección o identificación negativa: Como se usa en este documento, la expresión "marcador de selección o identificación negativa" se refiere a un marcador que, cuando está presente, por ejemplo, expresado, activado o similares, permite la identificación de una célula que no comprende una propiedad o un rasgo seleccionado (por ejemplo, en comparación con una célula que posee la propiedad o el rasgo). [0038] Indicador: Como se usa en este documento, el término "indicador" se refiere a un componente que se puede usar para identificar y/o seleccionar componentes diana de un sistema de interés. Por ejemplo, un indicador puede incluir una proteína, por ejemplo, una enzima, que confiere resistencia

o sensibilidad a antibióticos (por ejemplo, -lactamasa, cloranfenicol acetiltransferasa (CAT), y similares), un marcador de identificación fluorescente (por ejemplo, proteína fluorescente verde (por ejemplo, (GFP), YFP, EGFP, RFP, etc.), un marcador luminiscente (por ejemplo, una proteína de luciferasa de luciérnaga), un marcador de identificación basado en afinidad o genes marcadores de selección positiva o negativa tales como lacZ, -gal/lacZ (-galactosidasa), Adh (alcohol deshidrogenasa), his3, ura3, Ieu2, Iys2 o similares. [0039] Eucariota: Como se usa en este documento, el término "eucariota" se refiere a organismos pertenecientes al dominio filogenético Eucarya, tales como animales (por ejemplo, mamíferos, insectos, reptiles, aves, etc.), ciliados, plantas (por ejemplo, monocotiledóneas, dicotiledóneas, algas, etc.), hongos, levaduras, flagelados, microsporidios, protistas, etc. [0040] No eucariota: Como se usa en este documento, la expresión "no eucariota" se refiere a organismos no eucariotas. Por ejemplo, un organismo no eucariota puede pertenecer al dominio filogenético Eubacteria (por ejemplo, Escherichia coli, Thermus thermophilus, Bacillus stearothermophilus, etc.) o los dominios filogenéticos Archaea (por ejemplo, Methanococcus jannaschii (Mj), Methanosarcina mazei (Mm), Methanobacterium thermoautotrophicum (Mt), Methanococcus maripaludis, Methanopyrus kandleri, Halobacterium tales como Haloferax volcanii y Halobacterium especie NRC-1, Archaeoglobus fulgidus (At), Pyrococcus furiosus (Pf), Pyrococcus horikoshii (Ph), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Aeuropyrum pernix (Ap), Thermoplasma acidophilum, Thermoplasma volcanium, etc.).

[0041] Variante conservativa: Tal y como se usa en este documento, la expresión "variante conservativa" en el contexto de un componente de traducción, se refiere a un componente de traducción, por ejemplo, un O-ARNt variante conservativo o una O-RS variante conservativa, que funcionalmente se comporta de forma similar a un componente base al cual es similar la variante conservativa, por ejemplo, un O-ARNt o una O-RS, que tiene variaciones en la secuencia en comparación con un O-ARNt o una ORS de referencia. Por ejemplo, una O-RS aminoacilará un O-ARNt complementario o un O-ARNt variante conservativo con un aminoácido no natural, por ejemplo, una homoglutamina, aunque el O-ARNt y el O-ARNt variante conservativo no tengan la misma secuencia. La variante conservativa puede tener, por ejemplo, una variación, dos variaciones, tres variaciones, cuatro variaciones o cinco o más variaciones en la secuencia, siempre que la variante conservativa sea complementaria al O-ARNt o la ORS correspondiente. [0042] Agente de selección o identificación: Como se usa en ese documento, la expresión "agente de selección o identificación" se refiere a un agente que, cuando está presente, permite la selección/identificación de determinados componentes de una población. Por ejemplo, un agente de selección o identificación puede ser, pero no se limita a, por ejemplo, un nutriente, un antibiótico, una longitud de onda de luz, un anticuerpo, un polinucleótido expresado o similares. El agente de selección se puede variar, por ejemplo, por concentración, intensidad, etc. [0043] En respuesta a: Como se usa en ese documento, la expresión "en respuesta a" se refiere al proceso en el que un ARNt de la invención reconoce un codón selector e incorpora un aminoácido pertinente, por ejemplo, un aminoácido no natural tal como homoglutamina, el cual es llevado por el ARNt, en la cadena polipeptídica en crecimiento. [0044] Codificar: Como se usa en ese documento, la expresión "codificar" se refiere a cualquier proceso por el que la información en una macromolécula polimérica o una cadena de secuencia se usa para dirigir la producción de una segunda molécula o cadena de secuencia que es diferente de la primera molécula o cadena de secuencia. Como se usa en ese documento, el término se usa ampliamente y puede tener una diversidad de aplicaciones. En un aspecto, el termino "codificar" describe el proceso de replicación semi-conservativa de ADN, donde una cadena de una molécula de ADN bicatenario se usa como plantilla para codificar una cadena hermana complementaria sintetizada recientemente por una ADN polimerasa dependiente de ADN. [0045] En otro aspecto, el término "codificar" se refiere a cualquier proceso por el que la información en una molécula se usa para dirigir la producción de una segunda molécula que tiene una naturaleza química diferente de la primera molécula. Por ejemplo, una molécula de ADN puede codificar una molécula de ARN (por ejemplo, mediante el proceso de transcripción incorporando una enzima ARN polimerasa dependiente de ADN). Además, una molécula de ARN puede codificar un polipéptido, como en el proceso de traducción. Cuando se usa para describir el proceso de traducción, el termino "codificar" también se extiende al codón triplete que codifica un aminoácido. En algunos aspectos, una molécula de ARN puede codificar una molécula de ADN, por ejemplo, mediante el proceso de transcripción inversa incorporando una ADN polimerasa dependiente de ARN. En otro aspecto, una molécula de ADN puede codificar un polipéptido, donde se entiende que "codificar" como se usa en ese caso incorpora tanto los procesos de transcripción como los procesos de traducción.

BREVE DESCRIPCIÓN DE LAS FIGURAS

[0046]La Figura 1 proporciona un alineamiento de secuencia de las secuencias de ARNtLys arcaicos. Las secuencias genómicas proceden de Pa, Pyrococcus abyssi; Pf, Pyrococcus furiosus; Ph, Pyrococcus horikoshii; Pya, Pyrobaculum aerophilum; Ta, Thermoplasma acidophilum; Tv, Thermoplasma volcanum; Af, Archaeoglobus fulgidus; Hh, Halobacterium sp. NRC-1; Mj, Methanococcus jannaschii; Mt, Methanobacterium thermoautotrophicum; Mm, Methanosarcina mazei; St, Sulfolobus tokodaii; Ss, Sulfolobus solfataricus; Ap, Aeropyrum pernix se alinearon con el programa de GCG pileup y se presentaron con el programa prettybox. [0047] La Figura 2, Paneles A y B, proporciona histogramas que ilustran aminoacilación interespecie in vitro. (A) Aminoacilación de ARNt de E. coli completo, o (B) ARNt de halobacteria completo por EcKRS (□), PhKRS (■) o sin sintetasa (▲). Los ensayos se realizaron en reacciones de 20 l que contenían Tris-CI 50 mM, pH 7,5, KCI 30 mM, MgCI2 20 mM, glutatión 3 mM, 0,1 mg/ml de BSA, ATP 10 mM, [3H] lisina 1 M (Amersham), sintetasa 750 nM y ARNt completo 0, 2, 10 ó 40 M a 37ºC durante 20 minutos. [0048] La Figura 3 ilustra de forma esquemática un ARNt supresor ámbar procedente de consenso. El consenso para la familia de secuencias de ARNtLys arcaico se representa en una configuración en hoja de trébol. El bucle anticodón se cambió desde el consenso hasta CUCUAAA para generar AKCUA. [0049] La Figura 4 proporciona un histograma que ilustra la actividad in vivo del par ortogonal sintetasa-ARNt. Se determinó la actividad β-galactosidasa por cuadruplicado para células GeneHogs (Invitrogen) transformadas con los plásmidos mostrados o sin plásmidos. El mutante E444G de PhKRS se expresó a partir del plásmido pKQ. Se usó el plásmido pKQ para muestras que no contenían sintetasa. Se expresó AKCUA a partir del plásmido pACGFP, y el plásmido pACGFP se usó para muestras que no contenían ARNt. Los genes indicadores de lacZ procedían del plásmido pLASC-lacZ. Se dejaron crecer las células en medios 2YT con los antibióticos apropiados hasta una DO600 de 0,5 y después se ensayaron con los métodos de Miller (Miller, (1972) Experiments in molecular genetics, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y). [0050] Figura 5. Construcción de ARNt supresores ámbar y de cuatro bases. Se construyó un ARNt supresor ámbar a partir de los alineamientos de secuencia múltiple de muchas secuencias de ARNtLys . Se identificó un ARNt supresor de AGGA Ortogonal por la selección de una biblioteca del tallo aceptor (en inglés “acceptor stem library”). [0051] Figuras 6A y 6B. La Figura 6A muestra la estructura del sitio activo de PhKRS. Los residuos E41 y Y268 realizan contactos específicos con el sustrato de lisina. Los residuos se aleatorizaron de forma simultánea para la construcción de bibliotecas de sitio activo. La Figure 6B muestra las estructuras de diversos aminoácidos. [0052] Las Figuras 7A y 7B proporcionan fosfoimágenes de quimiofluorescencia que ilustran la expresión de mioglobina mediante supresión de AGGA; Figura 7A, el gen de mioglobina con un codón AGGA en la posición G24 se expresó en presencia del ARNt AKUCCU y PhAD, una variante específica de hGln, o JYRS. Se consiguió de forma similar la expresión de mioglobina por supresión ámbar en la posición S4 con PhAD

o JYRS. b, se incorporó hGIn por supresión de AGGA en la posición 24 y se incorporó AzPhe por supresión ámbar en la posición 75 en un único polipéptido. [0053] Figura 8. Análisis MALDI-TOF de fragmentos trípticos que contienen homoglutamina o lisina.

[0054] Figura 9. Análisis de EM por electropulverización de mioglobina de longitud completa que contiene homoglutamina en la posición 24 y O-metiltirosina en la posición 75.

DESCRIPCIÓN DETALLADA

[0055] Para añadir aminoácidos sintéticos adicionales, tal como una homoglutamina, al código genético, in vivo, se necesitan nuevos pares ortogonales de una aminoacil-ARNt sintetasa y un ARNt que puedan funcionar de forma eficaz en la maquinaria de traducción, pero que sean "ortogonales" al sistema de traducción en cuestión, lo cual significa que los pares funcionan de forma independiente de las sintetasas y los ARNt endógenos al sistema de traducción. Las características deseadas del par ortólogo incluyen ARNt que decodifica o reconoce solamente un nuevo codón específico, por ejemplo, un codón selector, que no se decodifica por ningún ARNt endógeno, y aminoacil-ARNt sintetasas que aminoacilan (o cargan) de forma preferente su ARNt afín solamente con un aminoácido no natural especifico, por ejemplo, una homoglutamina. Además, el O-ARNt de forma deseable no se aminoacila por sintetasas endógenas. Por ejemplo, en

E. coli, un par ortogonal incluirá una aminoacil-ARNt sintetasa que sustancialmente no aminoacila ninguno de los ARNt endógenos, por ejemplo, de los cuales hay 40 en E. coli, y un ARNt ortogonal que no se aminoacila por ninguna de las sintetasas endógenas, por ejemplo, de las cuales hay 21 en E. coli. [0056] En este documento se describe la generación de un nuevo par ortogonal de sintetasa/ARNt procedente de secuencias de ARNtLys arcaico que incorporan de forma eficaz y de forma selectiva el aminoácido homoglutamina (hGIn) en mioglobina en respuesta al codón selector de cuatro bases AGGA. La supresión del desplazamiento del marco de lectura con hGIn no afecta de forma significativa a los rendimientos de la proteína o a las velocidades de crecimiento celular y se ha demostrado que es ortogonal de forma mutua con la supresión de TAG por un segundo par de O-ARNt-ORS. Este trabajo demuestra que ni el número de codones de triplete disponibles ni la propia maquinaria de traducción representan una barrera significativa para la expansión adicional del código. [0057] Para codificar aminoácidos no naturales con codones de cuadruplete in vivo, se tiene que generar un ARNt ortogonal (O-ARNt) que reconozca de

forma única este codón y una sintetasa correspondiente que aminoacile de forma única solamente este O-ARNt con un aminoácido no natural de interés. Debido a que el bucle anticodón del ARNt supresor ámbar ortogonal de M. jannaschii generado previamente es un elemento de reconocimiento 5 clave para la sintetasa afín, JYRS, fue difícil extender este bucle para decodificar un codón de cuatro bases. Aunque es posible relajar la especificidad de unión del anticodón de JYRS, probablemente sería difícil construir pares mutuamente ortogonales que distingan supresores ámbar y de cuatro bases usando exclusivamente la secuencia anticodón. Por lo tanto,

10 en este documento se consiguió un sistema que permite la incorporación simultánea de dos o más aminoácidos no naturales diferentes en un polipéptido en respuesta a dos o más codones selectores diferentes usando pares ortogonales con orígenes diferentes. [0058] Esta invención proporciona composiciones y métodos para identificar

15 y producir pares de ARNt-aminoacil-ARNt sintetasa ortogonales adicionales, por ejemplo, pares de O-ARNt/O-RS que se pueden usar para incorporar aminoácidos no naturales, por ejemplo, homoglutamina. Un O-ARNt ilustrativo de la invención es capaz de mediar la incorporación de una homoglutamina en una proteína que está codificada por un polinucleótido,

20 que comprende un codón selector que es reconocido por el O-ARNt, por ejemplo, in vivo. El bucle anticodón del O-ARNt reconoce el codón selector en un ARNm e incorpora su aminoácido, por ejemplo, una homoglutamina, en este sitio en el polipéptido. Una aminoacil-ARNt sintetasa ortogonal de la invención aminoacila (o carga) de forma preferente su O-ARNt solamente

25 con un aminoácido no natural específico.

ARNt ORTOGONAL/AMINOACIL-ARNt SINTETASAS ORTOGONALES Y PARES DE LOS MISMOS

[0059] Los sistemas de traducción que son adecuados para preparar proteínas que incluyen uno o más aminoácidos no naturales se describen en las solicitudes internacionales con números de publicación WO 2002/086075 titulada “METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGANOL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS” y WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”. Además, véase WO 2004/094593, presentada en 16 de abril de 2004. Tales sistemas de traducción comprenden, por lo general, células (que pueden ser células no eucariotas tales como E. coli, o células eucariotas tales como levadura) que incluyen un tRNA ortogonal (O-tRNA), una aminoacil tRNA sintetasa ortogonal y un aminoácido no natural (en la presente invención la homoglutamina es un ejemplo de dicho aminoácido no natural), donde la O-RS aminoacila el O-tRNA con la homoglutamina. Una pareja ortogonal de la invención incluye un O-tRNA, p. ej., un tRNA supresor, un tRNA de marco de lectura o similares, y un O-RS. También se proporcionan en la invención los componentes individuales. [0060] En general, cuando un par ortogonal reconoce un codón selector y carga un aminoácido en respuesta al codón selector, se dice que el par ortogonal "suprime" el codón selector. Es decir, un codón selector que no es reconocido por la maquinaria endógena del sistema de traducción (por ejemplo, de la célula) normalmente no se traduce, lo que puede dar como resultado el bloqueo de la producción de un polipéptido que de otro modo se traduciría a partir del ácido nucleico. Un O-ARNt de la invención reconoce un codón selector e incluye al menos aproximadamente, por ejemplo, un 45%, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia de supresión en la presencia de una sintetasa afín en respuesta a un codón selector en comparación con un O-ARNt que comprende o que es codificado por una secuencia polinucleotídica como la indicada en la lista de secuencias de este documento. La O-RS aminoacila el O-ARNt con un aminoácido no natural de interés, tal como una homoglutamina. La célula usa el par de O-ARNt/O-RS para incorporar el aminoácido no natural en una cadena polipeptídica en crecimiento, por ejemplo, mediante un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende un codón selector que es reconocido por el O-ARNt. En determinados aspectos deseables, la célula puede incluir un par adicional de O-ARNt/O-RS, donde el O-ARNt adicional es cargado por la O-RS adicional con un aminoácido no natural diferente. Por ejemplo, uno de los O-ARNt puede reconocer un codón de cuatro bases y el otro puede reconocer un codón de terminación. De forma alternativa, múltiples codones de terminación diferentes o múltiples codones de cuatro bases diferentes pueden reconocer de forma específica diferentes codones selectores. [0061] En determinadas realizaciones de la invención, una célula tal como una célula E. coli que incluye un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), una homoglutamina y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende el codón selector que es reconocido por el O-ARNt. El sistema de traducción también puede ser un sistema sin células, por ejemplo, cualquiera de una diversidad de sistemas de transcripción/traducción "in vitro" disponibles en el mercado en combinación con un par de O-ARNt/ORS y un aminoácido no natural como se describe en este documento. [0062] En una realización, la eficacia de supresión de la O-RS y el O-ARNt es, por ejemplo, aproximadamente 5 veces, 10 veces, 15 veces, 20 veces o 25 veces o más veces mayor que la eficacia de supresión del O-ARNt que carece de la O-RS. En un aspecto, la eficacia de supresión de la O-RS y el O-ARNt conjuntamente es al menos aproximadamente, por ejemplo, un 35%, un 40%, un 45%, un 50%, un 60%, un 75%, un 80% o un 90% o más de la eficacia de supresión de un par de sintetasa ortogonal como se indica en la lista de secuencias de este documento. [0063] Como se señala, la invención incluye opcionalmente múltiples pares de O-ARNt/O-RS en una célula u otro sistema de traducción, que permite la incorporación de más de un aminoácido no natural, por ejemplo, una homoglutamina, y otro aminoácido no natural. Por ejemplo, la célula puede incluir adicionalmente un par adicional diferente de O-ARNt/O-RS y un segundo aminoácido no natural, donde este O-ARNt adicional reconoce un segundo codón selector y esta O-RS adicional aminoacila de forma preferente el O-ARNt con el segundo aminoácido no natural. Por ejemplo, una célula que incluye un par de O-ARNt/O-RS (donde el O-ARNt reconoce, por ejemplo, un codón selector ámbar) puede comprender adicionalmente un segundo par ortogonal, por ejemplo, leucil, lisil, glutamil, etc. (donde el segundo O-ARNt reconoce un codón selector diferente, por ejemplo, un codón ópalo, de cuatro bases o similares). De forma deseable, los diferentes pares ortogonales proceden de diferentes fuentes, lo cual puede facilitar el reconocimiento de diferentes codones selectores. [0064] El O-ARNt y/o la O-RS pueden ser de origen natural, o pueden obtenerse, por ejemplo, mediante mutación de un ARNt y/o RS de origen natural, por ejemplo, generando bibliotecas de ARNt y/o bibliotecas de RS, a partir de cualquiera de una diversidad de organismos y/o usando cualquiera de una diversidad de estrategias de mutación disponibles. Por ejemplo, una estrategia para producir un par ortogonal de ARNt/aminoacil-ARNt sintetasa implica importar un par heterólogo (a la célula hospedadora) de ARNt/sintetasa de, por ejemplo, una fuente diferente de la célula hospedadora, o fuentes múltiples, en la célula hospedadora. Las propiedades del candidato de sintetasa heteróloga incluyen, por ejemplo, que no carga ningún ARNt de célula hospedadora, y las propiedades del candidato de ARNt heterólogo incluyen, por ejemplo, que no se aminoacila por ninguna sintetasa de célula hospedadora. Además, el ARNt heterólogo es ortogonal a todas las sintetasas de la célula hospedadora. [0065] Una segunda estrategia para generar un par ortogonal implica generar bibliotecas mutantes a partir de las cuales se identifica y/o selecciona un O-ARNt o una O-RS. Estas estrategias también se pueden combinar.

ARNt ortogonal (O-ARNt)

[0066] Un ARNt ortogonal (O-ARNt) de la invención de forma deseable media en la incorporación de un aminoácido no natural, tal como homoglutamina, en una proteína que está codificada por un polinucleótido que comprende un codón selector que se reconoce por el O-ARNt, por ejemplo, in vivo o in vitro. En determinadas realizaciones, un ARNt de la invención incluye al menos aproximadamente, por ejemplo, un 45%, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia de supresión en presencia de una sintetasa afín en respuesta a un codón selector en comparación con un O-ARNt que comprende o está codificado por una secuencia polinucleotídica como se expone en las secuencias de O-ARNt en la lista de secuencias de este documento. [0067] Se puede determinar la eficacia de supresión mediante cualquiera de los varios ensayos conocidos en la técnica. Por ejemplo, se puede usar un ensayo indicador de -galactosidasa, por ejemplo, un plásmido lacZ derivatizado (en el que la construcción tiene un codón selector en la secuencia de ácido nucleico de lacZ) se introduce en células de un organismo apropiado (por ejemplo, un organismo en el que se puedan usar los componentes ortogonales) junto con un plásmido que comprende un O-ARNt de la invención. También se puede introducir una sintetasa afín (bien como polipéptido o como polinucleótido que codifica la sintetasa afín cuando se expresa). Las células se dejan crecer en medio hasta una densidad deseada, por ejemplo, hasta una DO600 de aproximadamente 0,5, y se realizan ensayos de -galactosidasa, por ejemplo, usando el Kit de Ensayo de -Galactosidasa BetaFluor™ (Novagen). Se puede calcular el porcentaje de supresión como el porcentaje de actividad para una muestra relativa a un control comparable, por ejemplo, el valor observado de la construcción de lacZ derivatizada, donde la construcción tiene en una posición deseada un codón sentido correspondiente en lugar de un codón selector. [0068] En la lista de secuencias de este documento se exponen ejemplos de O-ARNt de la invención. Véanse también las tablas, los ejemplos y las figuras de este documento con las secuencias de moléculas de O-ARNt y ORS ejemplares. Véase también la sección titulada "Ácido nucleico y Secuencia Polipeptídica y Variantes" de este documento. En una molécula de ARN, tal como un ARNm de O-RS o una molécula de O-ARNt , la Timina

(T) se sustituye por Uracilo (U) con respecto a una secuencia dada (o viceversa para un ADN codificante) o un complemento del mismo. También pueden estar presentes modificaciones adicionales de las bases. [0069] La invención también incluye variaciones conservativas de O-ARNt correspondientes a O-ARNt particulares en este documento. Por ejemplo, las variaciones conservativas de O-ARNt incluyen las moléculas que funcionan como los O-ARNt particulares, por ejemplo, como en la lista de secuencias de este documento y que conservan la estructura en forma del L del ARNt mediante auto-complementariedad apropiada, pero que no tienen una secuencia idéntica a los mismos, por ejemplo, en la lista de secuencias, las figuras o los ejemplos en este documento (y, de forma deseable, son diferentes de las moléculas de ARNt de tipo salvaje). Véase también la sección de este documento titulada "Ácidos Nucleicos y Polipéptidos, Secuencia y Variantes”. [0070] La composición que comprende un O-ARNt puede incluir adicionalmente una aminoacil-ARNt sintetasa ortogonal (O-RS), donde la ORS aminoacila de forma preferente el O-ARNt con un aminoácido no natural tal como homoglutamina. En determinadas realizaciones, una composición que incluye un O-ARNt puede incluir adicionalmente un sistema de traducción (por ejemplo, in vitro o in vivo). También puede estar presente en la célula un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende un codón selector que es reconocido por el O-ARNt, o una combinación de uno o más de los mismos. Véase también la sección de este documento titulada "Aminoacil-ARNt sintetasas ortogonales". [0071] Los métodos para producir un ARNt ortogonal (O-ARNt) también son una característica de la invención. También es una característica de la invención un O-ARNt producido mediante el método. En determinadas realizaciones de la invención, los O-ARNt se pueden producir generando una biblioteca de mutantes. La biblioteca de ARNt mutantes se puede generar usando diversos métodos de mutagénesis conocidos en la técnica. Por ejemplo, los ARNt mutantes se pueden generar mediante mutaciones con especificidad de sitio, mutaciones puntuales aleatorias, recombinación homóloga, barajado de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. [0072] Se pueden introducir mutaciones adicionales en posición (posiciones) específica(s), por ejemplo, en una(s) posición (posiciones) no conservativa(s), o en una posición conservativa, en una(s) posición (posiciones) aleatoria(s) o una combinación de ambas en un bucle deseado

o región de un ARNt, por ejemplo, un bucle anticodón, el tallo aceptor, el brazo o bucle D, el bucle variable, el brazo o bucle TPC, otras regiones de la molécula de ARNt o una combinación de los mismos. Típicamente, las mutaciones en un ARNt incluyen mutar el bucle anticodón de cada miembro de la biblioteca de ARNt mutantes para permitir el reconocimiento de un codón selector. El método puede incluir adicionalmente añadir una secuencia adicional (CCA) a un extremo del O-ARNt. Típicamente, un O-ARNt posee una mejora de la ortogonalidad para un organismo deseado en comparación con el material de partida, por ejemplo, en la pluralidad de secuencias de ARNt, mientras que conserva su afinidad hacia una RS deseada. [0073] Los métodos incluyen opcionalmente analizar la similitud (y/u homología deducida) de secuencias de ARNt y/o aminoacil-ARNt sintetasas para determinar candidatos potenciales para un O-ARNt, una O-RS y/o pares de los mismos que parecen ser ortogonales para un organismo específico. Se pueden usar programas informáticos conocidos en la técnica y descritos en este documento para el análisis, por ejemplo, se pueden usar programas BLAST y pileup. En un ejemplo, para elegir componentes de traducción ortogonales potenciales para usar en E. coli, un organismo procariota, se elige una sintetasa y/o un ARNt que no muestra similitud de secuencia cercana a organismos procariotas. [0074] Típicamente se obtiene un O-ARNt sometiendo, por ejemplo, a selección negativa a una población de células de una primera especie, donde las células comprenden un miembro de la pluralidad de O-ARNt potenciales. La selección negativa elimina células que comprenden un miembro de la biblioteca de O-ARNt potenciales que se aminoacilan mediante una aminoacil-ARNt sintetasa (RS) que es endógena a la célula. Esto proporciona un conjunto de ARNt que son ortogonales a la célula de la primera especie. [0075] En determinadas realizaciones, en la selección negativa se introduce un(os) codón (codones) selector(es) en un polinucleótido que codifica un marcador de selección negativa, por ejemplo, una enzima que confiere resistencia a antibióticos, por ejemplo, -lactamasa, una enzima que confiere un producto detectable, por ejemplo, -galactosidasa, cloranfenicol acetiltransferasa (CAT), por ejemplo, un producto tóxico, tal como barnasa, en una posición no esencial (por ejemplo, que todavía produce una barnasa funcional, etc.). La identificación/selección se realiza opcionalmente dejando crecer la población de células en presencia de un agente selectivo (por ejemplo, un antibiótico tal como ampicilina). En una realización, la concentración del agente de selección se varía. [0076] Por ejemplo, para medir la actividad de ARNt supresores se usa un sistema de selección que se basa en la supresión in vivo de un codón selector, por ejemplo, mutaciones sin sentido o de desplazamiento del marco de lectura introducidas en un polinucleótido que codifica un marcador de selección negativa, por ejemplo, un gen para -lactamasa (bla). Por ejemplo, se construyen variantes polinucleotídicas, por ejemplo, variantes bla con un codón selector en una determinada posición (por ejemplo, A184). Se transforman las células, por ejemplo, bacterias con estos polinucleótidos. En el caso de un ARNt ortogonal que no puede ser cargado de forma eficaz mediante sintetasas de E. coli endógenas, la resistencia a antibióticos, por ejemplo, resistencia a ampicilina, debe ser aproximadamente igual o menor que la de una bacteria transformada sin plásmido. Si el ARNt no es ortogonal, o si se co-expresa una sintetasa heteróloga capaz de cargar el ARNt en el sistema, se observa un mayor nivel de resistencia a antibióticos, por ejemplo, a ampicilina. Se eligen células, por ejemplo, bacterias que son incapaces de crecer en placas de agar LB con concentraciones de antibiótico aproximadamente iguales a las células transformadas sin plásmidos. [0077] En el caso de un producto tóxico (por ejemplo, ribonucleasa o barnasa), cuando un miembro de la pluralidad de ARNt potenciales es aminoacilado por un hospedador endógeno, por ejemplo, sintetasas de Escherichia coli (es decir, no es ortogonal al hospedador, por ejemplo, sintetasas de Escherichia coli), el codón selector se suprime y el producto polinucleotídico tóxico producido conduce a la muerte celular. Las células que alojan ARNt ortogonales o ARNt no funcionales sobreviven. [0078] En una realización, el conjunto de ARNt que son ortogonales a un organismo deseado se someten después a una selección positiva en la que se coloca un codón selector en un marcador de selección positiva, por ejemplo, codificado por un gen de resistencia a fármacos, tal como un gen de -lactamasa. La selección positiva se realiza en una célula que comprende un polinucleótido que codifica o que comprende un miembro del conjunto de ARNt que son ortogonales a la célula, un polinucleótido que codifica un marcador de selección positiva y un polinucleótido que codifica una RS afín. En determinadas realizaciones, la segunda población de células comprende células que no han sido eliminados por la selección negativa. Los polinucleótidos se expresan en la célula y la célula se deja crecer en presencia de un agente de selección, por ejemplo, ampicilina. Después se seleccionan los ARNt por su capacidad para ser aminoacilado mediante la sintetasa afín co-expresada y para insertar un aminoácido en respuesta a este codón selector. Típicamente, estas células muestran una potenciación en la eficacia de supresión en comparación con células que alojan ARNt no funcional(es) o ARNt que no pueden ser reconocidas de forma eficaz por la sintetasa de interés. Las células que alojan los ARNt no funcionales o ARNt que no son reconocidas de forma eficaz por la sintetasa de interés son sensibles al antibiótico. Por lo tanto, los ARNt que: (i) no son sustratos para sintetasas endógenas del hospedador, por ejemplo, la sintetasa de Escherichia coli; (ii) pueden ser aminoacilados por la sintetasa de interés; y (iii) son funcionales en la traducción, sobreviven a ambas selecciones. [0079] En consecuencia, el mismo marcador puede ser un marcador positivo o negativo, dependiendo del contexto en el que se identifica. Es decir, si se consigue la identificación se realiza a favor del marcador es un marcador positivo, pero si se identifica contra él es un marcador negativo. [0080] La rigurosidad de la selección, por ejemplo, la selección positiva, la selección negativa o tanto la selección positiva como la negativa, en los métodos que se han descrito anteriormente, incluye opcionalmente variar la rigurosidad de la selección. Por ejemplo, debido a que la barnasa es una proteína extremadamente tóxica, la rigurosidad de la selección negativa se puede controlar introduciendo diferentes números de codones selectores en el gen de la barnasa y/o usando un promotor inducible. En otro ejemplo se varía la concentración del agente de selección o identificación (por ejemplo, concentración de ampicilina). En un aspecto de la invención se varía la rigurosidad debido a que la actividad deseada puede ser baja durante las primeras rondas. De esta manera, se aplican criterios de selección menos rigurosos en las primeras rondas y se aplican criterios más rigurosos en rondas de selección posteriores. En determinadas realizaciones, la selección negativa, la selección positiva o tanto la selección negativa como la positiva se pueden repetir múltiples veces. Se pueden usar múltiples marcadores diferentes de selección negativa, marcadores de selección positiva o tanto marcadores de selección negativa como positivas. En determinadas realizaciones, el marcador de selección positiva y negativa puede ser el mismo. [0081] Se pueden usar otros tipos de selección/identificación en la invención para producir componentes de traducción ortogonales, por ejemplo, un O-ARNt, una O-RS, y un par de O-ARNt/O-RS que carga un aminoácido no natural tal como homoglutamina en respuesta a un codón selector. Por ejemplo, el marcador de selección negativa, el marcador de selección positiva o tanto el marcador de selección positiva como negativa pueden incluir un marcador que produce fluorescencia o cataliza una reacción luminiscente en presencia de un reactivo adecuado. En otra realización se detecta un producto del marcador mediante separación de células activadas por fluorescencia (FACS) o por luminiscencia. Opcionalmente, el marcador incluye un marcador de identificación basado en afinidad. Véase también, Francisco, J. A., et al., (1993) Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragment on the external surface. Proc Natl Acad Sci USA. 90:10444-8. [0082] Se pueden encontrar procedimientos adicionales para la producción de tRNA ortogonal recombinante en, p. ej., las solicitudes de patente internacional WO 2002/086075, titulada “”Methods and compositions for the production of orthogonal tRNA-aminoacyl-tRNA synthetase pairs” y WO 2004/094593, titulada “EXPANDING THE EUKARYOTIC GENETIC CODE”. Véase también Foster et al., (2003) Programming peptidomimetic synthetases by translating genetic codes designed de novo PNAS 100(11):6353-6357; y Feng et al., (2003), Expanding tRNA recognition of a tRNA synthetase by a single amino acid change, PNAS, 100(10):5676-5681.

Aminoacil-ARNt sintetasa ortogonal (O-RS)

[0083] Una O-RS de la invención aminoacila de forma preferente un O-ARNt con un aminoácido no natural tal como homoglutamina in vitro o in vivo. Se puede proporcionar una O-RS de la invención al sistema de traducción, por ejemplo, una célula, mediante un polipéptido que incluye una O-RS y/o un polinucleótido que codifica una O-RS o una parte de la misma. Por ejemplo, una O-RS ilustrativa comprende una secuencia de aminoácidos como se expone en la lista de secuencias y los ejemplos de este documento,

o una variación conservativa de la misma. En otro ejemplo una O-RS, o una parte de la misma, está codificada por una secuencia polinucleotídica que codifica una secuencia que comprende aminoácidos en la lista de secuencias o los ejemplos de este documento, o una secuencia polinucleotídica complementaria de la misma. Véanse, por ejemplo, las tablas y los ejemplos en este documento secuencias de moléculas de O-RS ejemplares. Véase también la sección titulada "Ácido Nucleico y Secuencias Polipeptídicas y Variantes". [0084] También son una característica de la invención métodos para identificar una aminoacil-ARNt sintetasa ortogonal (O-RS), por ejemplo una O-RS para usar con un O-ARNt. Por ejemplo, un método incluye someter una población de células de una primera especia a selección, por ejemplo, a selección positiva, donde las células comprenden individualmente: 1) un miembro de una pluralidad de aminoacil-ARNt sintetasas (RS), (por ejemplo, la pluralidad de RS puede incluir RS mutantes, RS procedentes de una especie diferente de la primera especie o tanto RS mutantes como RS procedentes de una especie diferente de la primera especie ); 2) el ARNt ortogonal (O-ARNt) (por ejemplo, de una o más especies); y 3) un polinucleótido que codifica un marcador de selección (por ejemplo, positiva) y comprende al menos un codón selector. Se seleccionan o identifican las células que muestran un aumento en la eficacia de supresión en comparación con células que carecen de o con una cantidad reducida del miembro de la pluralidad de RS. Se puede medir la eficacia de supresión mediante técnicas conocidas en la técnica y como se describe en este documento. Las células que tienen un aumento en la eficacia de supresión comprenden una RS activa que aminoacila el O-ARNt. Se compara un nivel de aminoacilación (in vitro o in vivo) mediante la RS activa de un primer conjunto de ARNt de la primera especie con el nivel de aminoacilación (in vitro o in vivo) por la RS activa de un segundo conjunto de ARNt de la segunda especie. Se puede determinar el nivel de aminoacilación mediante una sustancia detectable (por ejemplo, un aminoácido o un aminoácido no natural marcado, por ejemplo, una homoglutamina marcada). Típicamente se selecciona la RS activa que aminoacila de forma más eficaz el segundo conjunto de ARNt en comparación con el primer conjunto de ARNt, proporcionando por lo tanto una aminoacil-ARNt sintetasa ortogonal eficaz (optimizada) para usar con el O-ARNt. También es una característica de la invención una O-RS identificada por el método. [0085] Para determinar la aminoacilación se puede usar cualquiera de los numerosos ensayos. Estos ensayos se pueden llevar a cabo in vitro o in vivo. Por ejemplo, ensayos de aminoacilación in vitro se describen en, p. ej., Hoben y Soll (1985) Methods Enzymol. 113:55-59. La aminoacilación también puede determinarse usando un reportero junto con los componentes de traducción ortogonales y detectando el reportero en una célula que expresa un polinucleótido que comprende al menos un codón selector que codifica una proteína. Véase también WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”, y WO 2004/094593, presentada el 16 de abril de 2004. [0086] La O-RS identificada se puede manipular adicionalmente para alterar la especificidad de sustrato de la sintetasa, de forma que solamente se carga un aminoácido no natural deseado, por ejemplo, una homoglutamina, pero ninguno de los 20 aminoácidos comunes, en el O-ARNt. Los métodos para generar una aminoacil-ARNt sintetasa ortogonal con una especificidad de sustrato para un aminoácido no natural incluyen mutar la sintetasa, por ejemplo, en el sitio activo en la sintetasa, en el sitio del mecanismo de edición en la sintetasa, en diferentes sitios combinando diferentes dominios de sintetasas o similares, y aplicar un proceso de selección. Se usa una estrategia que se basa en la combinación de una selección positiva seguida de una selección negativa. En la selección positiva, la supresión del codón selector introducido en una o más posiciones no esenciales de un marcador positivo permite que las células sobrevivan bajo presión de selección positiva. En presencia de tanto aminoácidos naturales como de aminoácidos no naturales, los supervivientes codifican de esta manera sintetasas activas que cargan el ARNt supresor ortogonal con un aminoácido natural o no natural. En la selección negativa, la supresión de un codón selector introducido en una o más posiciones no esenciales de un marcador negativo retira las sintetasas con especificidades de aminoácidos naturales. Los supervivientes de la selección negativa y positiva codifican sintetasas que aminoacilan (cargan) el ARNt supresor ortogonal solamente con aminoácidos no naturales. Estas sintetasas se pueden someter, a continuación, a mutagénesis adicional, por ejemplo, barajado de ADN u otros métodos de mutagénesis recursivos. [0087] Se puede generar una biblioteca de O-RS mutantes usando diversas técnicas de mutagénesis conocidas en la técnica. Por ejemplo, se pueden generar las RS mutantes mediante mutaciones con especificidad de sitio, mutaciones puntuales aleatorias, recombinación homóloga, barajado de ADN u otros métodos de mutagénesis recursivos, construcción quimérica o cualquier combinación de los mismos. Por ejemplo, se puede producir una biblioteca de RS mutantes a partir de dos o más "sub-bibliotecas" diferentes, por ejemplo, menores, menos diversas. También se incluyen en la invención bibliotecas quiméricas de RS. Se debe señalar que las bibliotecas de ARNt sintetasas de diversos organismos (por ejemplo, microorganismos tales como eubacterias o arqueobacterias) tales como bibliotecas que comprenden diversidad natural (véase, por ejemplo, la Patente de Estados Unidos Nº 6.238.884 de Short et al; la Patente de Estados Unidos Nº

5.756.316 de Schallenberger et al; la Patente de Estados Unidos Nº

5.783.431 de Petersen et al; la Patente de Estados Unidos Nº 5.824.485 de Thompson et al; la Patente de Estados Unidos Nº 5.958.672 de Short et al), se construyen y exploran opcionalmente por pares ortogonales. [0088] Una vez que las sintetasas se han sometido a la estrategia de selección/identificación positiva y negativa, estas sintetasas se pueden someter después a mutagénesis adicionales. Por ejemplo, se puede aislar un ácido nucleico que codifica la O-RS; se puede generar a partir del ácido nucleico un conjunto de polinucleótidos que codifican O-RS mutadas (por ejemplo, por mutagénesis aleatoria, mutagénesis con especificidad de sitio, recombinación o cualquier combinación de las mismas); y se pueden repetir estas etapas individuales o una combinación de estas etapas hasta que se obtenga una O-RS mutada que aminoacile de forma preferente el O-ARNt con el aminoácido no natural, por ejemplo, una homoglutamina. En un aspecto de la invención, las etapas se realizan múltiples veces, por ejemplo, al menos dos veces. [0089] También se pueden usar niveles adicionales de rigurosidad de selección/identificación en los métodos de la invención para producir O-ARNt, O-RS o pares de los mismos. La rigurosidad de selección o identificación se puede variar en una o en las dos etapas del método para producir una O-RS. Esto podría incluir, por ejemplo, variar la cantidad del agente de selección/identificación que se usa, etc. También se pueden realizar rondas adicionales de selecciones positivas y/o negativas. La selección o identificación también puede comprender uno o más de un cambio en la permeabilidad de aminoácidos, un cambio en la eficacia de traducción, un cambio en la fidelidad de traducción, etc. Típicamente, dichos uno o más cambios se basan en una mutación en uno o más genes en un organismo en el que usa un par de ARNt-ARNt sintetasa ortogonal para producir una proteína. [0090] Se puede encontrar detalles generales adicionales para la producción de O-RS y la alteración de la especificidad de la sintetasa por el sustrato en WO 2002/086075 titulada “Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs” y WO 2004/094593, presentada el 16 de abril de 2004.

ORGANISMOS FUENTE Y HOSPEDADORES

[0091] Los componentes de traducción de la invención se pueden obtener a partir de organismos no eucariotas. Por ejemplo, el O-ARNt ortogonal se puede obtener de un organismo no eucariota (o una combinación de organismos), por ejemplo, una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies de Halobacterium NRC-1, Archaeoglobus

fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium o similares, o una eubacteria, tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus o similares, mientras que la O-RS ortogonal se puede obtener a partir de un organismo (o una combinación de organismos) no eucariotas, por ejemplo, un arqueobacteria, tal como

Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies de Halobacterium NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei, Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus, Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium o similares, o una eubacteria, tal como Escherichia coli, Thermus thermophilus, Bacillus stearothermphilus o similares. En una realización también se pueden usar fuentes eucariotas, por ejemplo, plantas, algas, protistas, hongos, levaduras, animales (por ejemplo, mamíferos, insectos, artrópodos o similares) como fuentes de O-ARNt y ORS. [0092] Los componentes individuales de un par de O-ARNt/O-RS se pueden obtener a partir del mismo organismo o de diferentes organismos. En una realización, el par O-ARNt/O-RS procede del mismo organismo. Como alternativa, el O-ARNt y la O-RS del par O-ARNt/O-RS son de organismos diferentes. En un ejemplo preferido, el par lisil sintetasa/ARNt del organismo arcaico Pyrococcus horikoshii se usa como un par ortogonal, por ejemplo, en un sistema de traducción basado en E. coli. Como se describe en este documento, este par se puede modificar para reconocer un codón selector de cuatro bases y se puede modificar para cargar el O-ARNt con un aminoácido no natural tal como homoglutamina. Este par ortogonal (o formas modificadas del mismo) también se puede combinar con pares ortogonales que se hayan descrito previamente, por ejemplo, aquellos derivados de Methanococcus jannaschii, por ejemplo, que están modificados para reconocer codones selectores de terminación. Esto asegura la producción de proteínas que comprenden dos aminoácidos no naturales diferentes en un sistema de traducción de interés mediante la inclusión un ácido nucleico codificante para tales proteínas que incluya dos o más codones selectores que son reconocidos cada uno por un par de O-ARNt/ORS. [0093] El O-ARNt, la O-RS o el par de O-ARNt/O-RS se puede seleccionar

o identificar in vivo o in vitro y/o usar en una célula, por ejemplo, una célula no eucariota o célula eucariota para producir un polipéptido con una homoglutamina u otro aminoácido no natural de interés. Una célula no eucariota puede ser de cualquiera de una diversidad de fuentes, por ejemplo, una eubacteria, tales como Escherichia coli, Thermus thermophilus, Bacillus stearothermophilus o similares, o una arqueobacteria, tal como Methanococcus jannaschii, Methanobacterium thermoautotrophicum, Halobacterium tal como Haloferax volcanii y especies de Halobacterium NRC-1, Archaeoglobus fulgidus, Pyrococcus furiosus, Pyrococcus horikoshii, Aeuropyrum pernix, Methanococcus maripaludis, Methanopyrus kandleri, Methanosarcina mazei (Mm), Pyrobaculum aerophilum, Pyrococcus abyssi, Sulfolobus solfataricus (Ss), Sulfolobus tokodaii, Thermoplasma acidophilum, Thermoplasma volcanium o similares. Una célula eucariota puede proceder de cualquiera de una diversidad de fuentes, por ejemplo, una planta (por ejemplo, una planta compleja tal como monocotiledóneas o dicotiledóneas), un alga, un protista, un hongo, una levadura (por ejemplo, Saccharomyces cerevisiae), un animal (por ejemplo, un mamífero, un insecto, un artrópodo, etc.) o similares. También son una característica de la invención composiciones de células con componentes de traducción de la invención. [0094] Véase también WO 2004/094593, presentada el 16 de abril de 2004 para el cribado de O-tRNA y/o O-RS en una especie para usar en otra especie.

CODONES SELECTORES

[0095] Los codones selectores de la invención expanden el marco de lectura del codón genético de la maquinaria biosintética de proteínas. Por ejemplo, un codón selector incluye, por ejemplo, un único codón de tres bases, un codón sin sentido tal como un codón de terminación, por ejemplo, un codón ámbar (UAG), o un codón ópalo (UGA), un codón no natural, al menos un codón de cuatro bases (por ejemplo, AGGA), un codón raro o similares. Se pueden introducir varios codones selectores en un gen deseado, por ejemplo, uno o más, dos o más, más de tres, etc.: usando diferentes codones selectores se pueden usar múltiples pares ortogonales de ARNt/sintetasa para permitir la incorporación con especificidad de sitio simultánea de múltiples aminoácidos no naturales diferentes usando estos codones selectores diferentes. [0096] En una realización, los métodos implican el uso de un codón selector que es un codón de terminación para la incorporación de una homoglutamina in vivo en una célula. Por ejemplo, se produce un O-ARNt que reconoce un codón selector de cuatro bases y es aminoacilado por una O-RS con una homoglutamina. Este O-ARNt no es reconocido por las aminoacil-ARNt sintetasas endógenas del sistema de traducción. Se puede usar mutagénesis dirigida convencional para introducir el codón selector en el sitio de interés en un polinucleótido diana que codifica un polipéptido de interés. Véase también, por ejemplo, Sayers, J.R., et al. (1988), "5',3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis." Nucleic Acids Res, 791-802. Cuando la O-RS, el O-ARNt y el ácido nucleico que codifica un polipéptido de interés se combinan, por ejemplo, in vivo, la homoglutamina se incorpora en respuesta al codón selector para dar un polipéptido que contiene la homoglutamina en la posición especificada. [0097] La incorporación de aminoácidos no naturales tales como homoglutamina in vivo se puede realizar sin perturbación significativa de la célula hospedadora. Por ejemplo, en células no eucariotas, tales como Escherichia coli, como la eficacia de supresión de un codón selector de terminación, el codón UAG, depende de la competitividad entre el O-ARNt, por ejemplo, el ARNt supresor ámbar, y el factor de liberación 1 (RF1) (que se une al codón UAG e inicia la liberación del péptido de crecimiento del ribosoma), se puede modular la eficacia de supresión, por ejemplo, aumentando el nivel de expresión de O-ARNt, por ejemplo, el ARNt supresor, o usando una cepa deficiente en RF1. En células eucariotas, debido a que la eficacia de supresión de un codón UAG depende de la competitividad entre el O-ARNt, por ejemplo, el ARNt supresor ámbar, y un factor de liberación eucariota (por ejemplo, eRF) (que se une a un codón de terminación e inicia la liberación del péptido de crecimiento del ribosoma), se puede modular la eficacia de supresión, por ejemplo, aumentando el nivel de expresión de O-ARNt, por ejemplo, el ARNt supresor. Además, también pueden estar presentes compuestos adicionales que modulan la acción del factor de liberación, por ejemplo, reduciendo agentes tales como el ditiotretiol (DTT).

[0098] También se pueden codificar aminoácidos no naturales, por ejemplo, homoglutaminas, con codones raros. Por ejemplo, se ha demostrado que cuando la concentración de arginina se reduce en una reacción de síntesis proteica in vitro, el codón raro de arginina, AGG, es eficaz para la inserción de Ala mediante un ARNt sintético acilado con alanina. Véase, por ejemplo, Ma et al., Biochemistry, 32:7939 (1993). En este caso, el ARNt sintético compite con el ARNtArg de origen natural que existe como una especie minoritaria en Escherichia coli. Además, algunos organismos no usan todos los codones de triplete. Se ha utilizado un codón no asignado AGA en Micrococcus luteus para la inserción de aminoácidos en un extracto de transcripción/traducción in vitro. Véase, por ejemplo, Kowal y Oliver, Nucl. Acid. Res., 25:4685 (1997). Se pueden generar componentes de la invención para usar estos codones raros in vivo. [0099] Los codones selectores también pueden comprender codones extendidos, por ejemplo, codones de cuatro o más bases, tales como codones de cuatro, cinco, seis o más bases. Los ejemplos de codones de cuatro bases incluyen, por ejemplo, AGGA, CUAG, UAGA, CCCU y similares. Los ejemplos de codones de cinco bases incluyen, por ejemplo, AGGAC, CCCCU, CCCUC, CUAGA, CUACU, UAGGC y similares. Los métodos de la invención incluyen usar codones extendidos basados en supresión del desplazamiento del marco de lectura. Los codones de cuatro o más bases pueden insertar, por ejemplo, uno o múltiples aminoácidos no naturales, tales como una homoglutamina, en la misma proteína. En otras realizaciones, los bucles anticodón pueden decodificar, por ejemplo, al menos un codón de cuatro bases, al menos un codón de cinco bases o al menos un codón de seis bases o más. Ya que hay 256 codones de cuatro bases posibles, se pueden codificar múltiples aminoácidos no naturales en la misma célula usando un codón de cuatro o más bases. Véase también Anderson et al., (2002) Exploring the Limits of Codon and Anticodon Size, Chemistry and Biology, 9:237-244; y Magliery, (2001) Expanding the Genetic Code: Selection of Efficient Suppressors of Four-base Codons and Identification of "Shifty" Four-base Codons with a Library Approach in Escherichia coli, J. Mol. Biol. 307: 755-769. [0100] Por ejemplo, se han usado codones de cuatro bases para incorporar aminoácidos no naturales en proteínas usando métodos biosintéticos in vitro. Véase por ejemplo, Ma et al., (1993) Biochemistry, 32:7939; y Hohsaka et al., (1999) J. Am. Chem. Soc, 121:34. Se usaron CGGG y AGGU para incorporar de forma simultánea 2-naftilalanina y un derivado NBD de lisina en estreptavidina in vitro con dos ARNt supresores de desplazamiento del marco de lectura acilados químicamente. Véase, por ejemplo, Hohsaka et al., (1999) J. Am. Chem. Soc, 121:12194. En un estudio in vivo, Moore et al. examinaron la capacidad de los derivados de ARNtLeu con anticodones NCUA para suprimir codones UAGN (N puede ser U, A, G o C), y observaron que el cuadruplete UAGA puede ser decodificado mediante un ARNtLeu con un anticodón UCUA con una eficacia del 13 al 26% con poca decodificación en la fase 0 o -1. Véase Moore et al., (2000) J. Mol. Biol.,

298:195. En una realización se pueden usar en la invención codones extendidos basados en codones raros o codones sin sentido, que pueden reducir la lectura completa sin sentido y la supresión por desplazamiento del marco de lectura en otros sitios no deseados. En los ejemplos en este documento se describe un par ortogonal que reconoce un codón selector AGGA y que inserta una homoglutamina durante la traducción de proteínas. [0101] Para un sistema determinado, un codón selector también puede incluir uno de los codones de tres bases naturales, donde el sistema endógeno no usa (o usa raramente) el codón de bases naturales. Por ejemplo, esto incluye un sistema que carece de un ARNt que reconoce el codón de tres bases naturales y/o un sistema en el que el codón de tres bases es un codón raro. [0102] Los codones selectores incluyen opcionalmente pares de bases no naturales. Estos pares de bases no naturales expanden adicionalmente el alfabeto genético existente. Un par de bases adicional aumenta el número de codones de triplete de 64 a 125. Las propiedades de pares de tercera base incluyen un emparejamiento de bases estable y selectivo, una incorporación enzimática eficaz en ADN con elevada fidelidad mediante una polimerasa y la extensión por cebador continuada eficaz después de la síntesis del par de bases no natural que se genera. Las descripciones de pares de bases no naturales que se pueden adaptar para métodos y composiciones incluyen, por ejemplo, Hirao, et al., (2002) An unnatural base pair for incorporating amino acid analogues into protein, Nature Biotechnology, 20:177-182. Véase también Wu, Y. et al., (2002) J. Am. Chem. Soc. 124:14626-14630. Se enumeran otras publicaciones relacionadas más abajo. [0103] Para el uso in vivo, el nucleósido no natural es permeable a la membrana y se fosforila para formar el trifosfato correspondiente. Además, la información genética aumentada es estable y no es destruida por enzimas celulares. Ciertos esfuerzos previos de Benner y otros aprovecharon patrones de formación de enlaces de hidrógeno que son diferentes de los presentes en pares de Watson-Crick canónicos, de los cuales el ejemplo más notable es el par iso-C:iso-G. Véase, por ejemplo, Switzer et al., (1989)

J. Am. Chem. Soc, 111:8322; y Piccirilli et al., (1990) Nature, 343:33; Kool, (2000) Curr. Opin. Chem. Biol., 4:602. Estas bases en general se aparean de forma errónea hasta cierto grado con bases naturales y no se pueden replicar enzimáticamente. Kool y colaboradores demostraron que las interacciones de empaquetamiento hidrófobas entre bases pueden sustituir a las uniones por enlaces de hidrógeno para dirigir la formación de pares de bases. Véase Kool, (2000) Curr. Opin. Chem. Biol., 4:602; y Guckian y Kool, (1998) Angew. Chem. Int. Ed. Engl., 36, 2825. En un esfuerzo por desarrollar un par de bases no natural que satisfaga todos los requisitos anteriores, Schultz, Romesberg y colaboradores han sintetizado y estudiado sistemáticamente una serie de bases hidrófobas no naturales. Se ha observado que un autopar PICS:PICS es más estable que pares de bases naturales y se puede incorporar de forma eficaz en el ADN por el fragmento Klenow de la ADN polimerasa I de Escherichia coli (KF). Véase, por ejemplo, McMinn et al., (1999) J. Am. Chem. Soc, 121:11586; y Ogawa et al., (2000)

J. Am. Chem. Soc, 122:3274. Se puede sintetizar un autopar 3MN:3MN por KF con suficiente eficacia y selectividad para la función biológica. Véase, por ejemplo, Ogawa et al., (2000) J. Am. Chem. Soc, 122:8803. Sin embargo, ambas bases actúan como un terminador de cadena para la replicación posterior. Se ha desarrollado recientemente una ADN polimerasa mutante que se puede usar para replicar el autopar PICS. Además, se puede replicar un autopar 7AI. Véase, por ejemplo, Tae et al., (2001) J. Am. Chem. Soc., 123:7439. También se ha desarrollado un nuevo par de bases metálico, Dipic:Py, que forma un par estable después unirse a Cu(ll). Véase Meggers et al., (2000) J. Am. Chem. Soc, 122:10714. Debido a que los codones extendidos y los codones no naturales son intrínsecamente ortogonales a codones naturales, los métodos de la invención pueden utilizar ventajosamente esta propiedad para generar ARNt ortogonales para los mismos. [0104] También se puede usar un sistema de derivación de la traducción para incorporar una homoglutamina u otro aminoácido no natural en un polipéptido deseado. En un sistema de derivación de traducción se inserta una gran secuencia en un gen pero no se traduce en una proteína. La secuencia contiene una estructura que sirve como clave para inducir el salto del ribosoma sobre la secuencia y reanudar la traducción más adelante de la inserción.

AMINOÁCIDOS NO NATURALES

[0105] Como se usa en este documento, un aminoácido no natural se refiere a cualquier aminoácido, aminoácido modificado o análogo de aminoácido diferente de selenocisteína y/o pirrolisina y los siguientes veinte alfa-aminoácidos codificados genéticamente: alanina, arginina, asparagina, ácido aspártico, cisteína, glutamina, ácido glutámico, glicina, histidina, isoleucina, leucina, lisina, metionina, fenilalanina, prolina, serina, treonina, triptófano, tirosina, valina. La estructura genérica de un alfa-aminoácido se ilustra en la Fórmula I:

imagen1

[0106] Un aminoácido no natural es típicamente cualquier estructura que tenga la Fórmula I, en la que el grupo R es cualquier sustituyente diferente de los usados en los veinte aminoácidos naturales. Véase, por ejemplo, Biochemistry de L. Stryer, 3ª ed. 1988, Freeman and Company, New York, para las estructuras de los veinte aminoácidos naturales. Obsérvese que los aminoácidos no naturales de la invención pueden ser compuestos de origen natural diferentes de los veinte alfa-aminoácidos anteriores (o, por supuesto, compuestos sintéticos producidos de forma artificial). [0107] Ya que los aminoácidos no naturales de la invención difieren típicamente de los aminoácidos naturales en la cadena lateral, los aminoácidos no naturales forman enlaces amida con otros aminoácidos, por ejemplo, naturales o no naturales, del mismo modo en el que se forman en proteínas de origen natural. Sin embargo, los aminoácidos no naturales tienen grupos de cadena lateral que los distinguen de los aminoácidos naturales. [0108] Es de particular interés en la incorporación de aminoácidos no

naturales en proteínas, tener la capacidad de incorporar una homoglutamina. En otros aminoácidos no naturales, por ejemplo, el grupo R presente en la Fórmula I comprende opcionalmente un alquilo-, arilo-, acilo-, ceto-, azido-, hidroxilo-, hidracina, ciano-, halo-, hidracida, alquenilo, alquinilo, éter, tiol, 5 seleno-, sulfonilo-, borato, boronato, fosfo, fosfono, fosfina, heterociclo, enona, imina, aldehído, éster, tioácido, hidroxilamina, amina y similares, o cualquier combinación de los mismos. Otros aminoácidos de interés incluyen, pero no se limitan a, aminoácidos que comprenden un agente de entrecruzamiento fotoactivable, aminoácidos marcados por espín, 10 aminoácidos fluorescentes, aminoácidos de unión a metal, aminoácidos que contienen metal, aminoácidos radiactivos, aminoácidos con nuevos grupos funcionales, aminoácidos que interaccionan de forma covalente o de forma no covalente con otras moléculas, aminoácidos con grupos fotoprotectores y/o fotoisomerizables, aminoácidos que contienen biotina o análogos de 15 biotina, aminoácidos que contienen ceto, aminoácidos glicosilados, aminoácidos que comprenden polietilenglicol o poliéter, aminoácidos sustituidos con átomos pesados, aminoácidos químicamente escindibles o fotoescindibles, aminoácidos con una cadena lateral alargada en comparación con aminoácidos naturales (por ejemplo, poliéteres o 20 hidrocarburos de cadena larga, por ejemplo, de más de aproximadamente 5, de más de aproximadamente 10 carbonos, etc.), aminoácidos que contienen azúcar unido a carbono, aminoácidos con actividad redox, aminoácidos que contienen aminotioácido y aminoácidos que contienen uno o más residuos tóxicos. En algunas realizaciones, los aminoácidos no naturales tienen un

25 agente de entrecruzamiento fotoactivable. En una realización, los aminoácidos no naturales tienen un residuo de sacárido unido a la cadena lateral del aminoácido y/u otra modificación de carbohidrato. [0109] Además de aminoácidos no naturales que contienen nuevas cadenas laterales, los aminoácidos no naturales también comprenden

30 opcionalmente estructuras de cadena principal modificadas, por ejemplo, como es ilustrado por las estructuras de las Fórmulas II y III:

imagen2

imagen1

en las que Z comprende típicamente OH, NH2, SH, NH-R' o S-R'; X e Y, que pueden ser iguales o diferentes, comprenden típicamente S u O, y R y R', que son opcionalmente iguales o diferentes, se seleccionan típicamente de la misma lista de constituyentes para el grupo R que se ha descrito anteriormente para los aminoácidos no naturales que tienen la Fórmula I, así como hidrógeno. Por ejemplo, los aminoácidos no naturales de la invención comprenden opcionalmente sustituciones en el grupo amino o carboxilo, como se ilustra por las Fórmulas II y III. Los aminoácidos no naturales de este tipo incluyen, pero no se limitan a, -hidroxiácidos,  -tioácidos, aminotiocarboxilatos, por ejemplo, con cadenas laterales correspondientes a los veinte aminoácidos naturales comunes o cadenas laterales no naturales. Además, las sustituciones en el carbono  incluyen opcionalmente aminoácidos L, D, o - disustituidos tales como D-glutamato, D-alanina, Dmetil-O-tirosina, ácido aminobutírico y similares. Otras alternativas estructurales incluyen aminoácidos cíclicos, tales como análogos de prolina así como análogos de prolina con anillo de 3, 4, 6, 7, 8 y 9 miembros,  y  aminoácidos tales como -alanina sustituida y ácido -aminobutírico. Las estructuras de adicionales aminoácidos no naturales de la invención incluyen estructuras de tipo homo-beta, por ejemplo, en las que hay, por ejemplo, un grupo metileno o amino intercalado adyacente al carbono alfa, por ejemplo, isómeros de homo-beta-tirosina, alfa-hidracino-tirosina. Véase, por ejemplo,

imagen1

[0110] Muchos aminoácidos no naturales se basan en aminoácidos naturales, tales como tirosina, glutamina, fenilalanina y similares. Por ejemplo, los análogos de tirosina incluyen tirosinas para-sustituidas, tirosinas orto-sustituidas y tirosinas meta-sustituidas, en las que la tirosina sustituida comprende un grupo acetilo, un grupo benzoílo, un grupo amino, una hidracina, una hidroxiamina, un grupo tiol, un grupo carboxi, un grupo isopropilo, un grupo metilo, un hidrocarburo C6-C20 de cadena lineal o ramificada, un hidrocarburo saturado o insaturado, un grupo O-metilo, un grupo poliéter, un grupo nitro o similares. Además, también se contemplan anillos de arilo sustituidos de forma múltiple. Los análogos de glutamina de la invención incluyen, pero no se limitan a, derivados -hidroxi, derivados sustituidos, derivados cíclicos y derivados de glutamina sustituidos con amida. Los análogos de fenilalanina ilustrativos incluyen, pero no se limitan a, fenilalaninas para-sustituidas, fenilalaninas orto-sustituidas y fenilalaninas meta-sustituidas, en las que el sustituyente comprende un grupo hidroxi, un grupo metoxi, un grupo metilo, un grupo alilo, un aldehído o grupo ceto o similares. Los ejemplos específicos de aminoácidos no naturales incluyen, pero no se limitan a, homoglutamina, una 3,4-dihidroxi-L-fenilalanina, una pacetil-L-fenilalanina, una p-propargiloxifenilalanina, O-metil-L-tirosina, una L3-(2-naftil)alanina, una 3-metilfenilalanina, una O-4-alil-L-tirosina, un 4-propilL-tirosina, una tri-O-acetil-GlcNAc-serina, una L-Dopa, una fenilalanina fluorada, una isopropil-L-fenilalanina, una p-azido-L-fenilalanina, una p-acilL-fenilalanina, una p-benzoil-L-fenilalanina, una L-fosfoserina, una fosfonoserina, una fosfonotirosina, una p-yodo-fenilalanina, una pbromofenilalanina, una p-amino-L-fenilalanina y una isopropil-L-fenilalanina y similares. Se proporcionan las estructuras de una diversidad de aminoácidos no naturales en, por ejemplo, las Figuras 16, 17, 18, 19, 26 y 29 del documento WO 2002/085923 titulado "In vivo incorporation of unnatural amino acids."

Síntesis Química de Aminoácidos No Naturales

[0111] Muchos de los aminoácidos no naturales proporcionados más arriba están disponibles comercialmente, p. ej., de Sigma (USA) o Aldrich (Milwakee, WI, USA). Los que no están disponibles comercialmente se sintetizan opcionalmente según se proporciona en varias publicaciones o usando procedimientos estándar conocidos para los expertos en la materia. Para técnicas de síntesis orgánica, véase, p. ej., Organic Chemistry de Fessendon y Fessendon (1982, segunda edición, Willard Grant Press, Boston Mass); Advanced Organic Chemistry de March (tercera edición, partes A y B, 1990, Plenum Press, Nueva York). Publicaciones adicionales que describen la síntesis de aminoácidos no naturales incluyen, p. ej., WO 2002/085923 titulada “In vivo incorporation of Unnatural Amino Acids”. Matsoukas et al., (1995), J. Med. Chem., 38, 4660-4669; King F. E. & Kidd,

D.A.A.: (1949) A new synthesis of Glutamine and of �-Dipeptides of Glutamic Acid from Phythylated Intermediates, J. Chem. Soc., 3315-3319; Friedman,

O.: M. & Chattenji, R. (1959) Synthesis of Derivatives of Glutamine as Model Substrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81, 3750-3752; Craig,

J.: C. et al (1988) Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline (Chloroquine). J. Org. Chem. 53, 1167-1170; Azoulay, M., Villmont, M. & Frappier, F. (1991) Glutamine analogues as Potential Antimalarials, Eur. J. Med. Chem. 26, 2015; Koskinen, A.M.P. & Rapoport, H. (1989) Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues. J. Org. Chem. 54, 1859-1866; Christie, B. D. & Rapoport, H. (1985) Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to the Total Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization. J. Org. Chem. 1989: 1859-1866; Barton et al., (1987) Synthesis of Novel a-Amino Acids and Derivatives Using Radical Chemistry: Synthesis of L- and D-a-Amino Adipic Acids, L-a-aminopimelic Acid and Appropriate Unsaturated Derivatives. Tetrahedron Lett. 43: 42974308; y Subasinghe et al., (1992) Quisqualic acid analogues: synthesis of beta-heterocyclic 2-aminopropionic acid derivatives and their activity at a novel quisqualate-sensitized site. J. Med. Chem. 35:4602-7. Véase también WO 2004/058946, titulada “Protein Arrays”.

Captación celular de aminoácidos no naturales

[0112] La captación de aminoácidos no naturales por una célula es una cuestión que se considera típicamente cuando se diseñan y seleccionan aminoácidos no naturales, por ejemplo, para la incorporación en una proteína. Por ejemplo, la gran densidad de carga de -aminoácidos sugiere que estos compuestos probablemente no sean permeables a la célula. Los aminoácidos naturales se introducen en la célula a través de una colección de sistemas de transporte basados en proteínas que a menudo muestran grados variables de especificidad de aminoácidos. Se puede realizar una exploración rápida que evalúa qué aminoácidos no naturales, si hay alguno, se captan por las células. Véase, por ejemplo, ensayos de toxicidad en, por ejemplo, la Solicitud Internacional Número PCT/US03/41346, titulada "Protein Arrays," presentada el 22 de diciembre de 2003; y Liu, D. R. & Schultz, P. G. (1999) Progress toward the evolution of an organism with an expanded genetic code. PNAS United States 96:4780-4785. Aunque la captación se analiza de manera sencilla con diversos ensayos, una alternativa para diseñar aminoácidos no naturales que son susceptibles a rutas de captación celulares es proporcionar rutas biosintéticas para crear aminoácidos in vivo.

Biosíntesis de Aminoácidos No Naturales

[0113] Ya existen muchas rutas biosintéticas en las células para la producción de aminoácidos y otros compuestos. Mientras que un método biosintético para un aminoácido no natural concreto puede no existir en la naturaleza, por ejemplo, en una célula, la invención proporciona tales métodos. Por ejemplo, se pueden generar rutas biosintéticas para aminoácidos no naturales en células hospedadoras añadiendo nuevas enzimas o modificando rutas existentes de la célula hospedadora. Las nuevas enzimas adicionales son opcionalmente enzimas de origen natural o enzimas desarrolladas artificialmente. Por ejemplo, la biosíntesis de paminofenilalanina (como se presenta en un ejemplo del documento WO 2002/085923, supra) se basa en la adición de una combinación de enzimas conocidas de otros organismos. Se pueden introducir los genes para estas enzimas en una célula transformando la célula con un plásmido que comprende los genes. Los genes, cuando se expresan en la célula, proporcionan una ruta enzimática para sintetizar el compuesto deseado. En los ejemplos que se presentan más adelante se proporcionan ejemplos de los tipos de enzimas que se pueden añadir. Pueden encontrarse secuencias de enzimas adicionales, por ejemplo, en el Genbank. También se pueden añadir enzimas desarrolladas artificialmente a una célula del mismo modo. De esta manera, la maquinaria celular y los recursos de una célula se manipulan para producir aminoácidos no naturales. [0114] De hecho, se puede usar cualquiera de una diversidad de métodos para producir nuevas enzimas para usar en rutas biosintéticas, o para la evolución de rutas existentes, para la producción de aminoácidos no naturales, in vitro o in vivo. Se pueden aplicar muchos métodos disponibles para desarrollar enzimas y otros componentes de ruta biosintética a la presente invención para producir aminoácidos no naturales (o, de hecho, para desarrollar sintetasas para que tengan nuevas especificidades de sustrato u otras actividades de interés). Por ejemplo, opcionalmente se usa el barajado de ADN para desarrollar nuevas enzimas y/o rutas de tales enzimas para la producción de aminoácidos no naturales (o producción de nuevas sintetasas), in vivo o in vitro. Véase, por ejemplo, Stemmer (1994), Rapid evolution of a protein in vitro by DNA shuffling, Nature 370(4):389-391; y Stemmer, (1994), DNA shuffling by random fragmentation and reassembly: In vitro recombination for molecular evolution, Proc. Natl. Acad. Sci. USA., 91:10747-10751. Una estrategia relacionada baraja familias de genes relacionados (por ejemplo, homólogos) para desarrollar rápidamente enzimas con características deseadas. Un ejemplo de tales métodos de "barajado de genes de familias” se encuentra en Crameri et al. (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution" Nature, 391(6664): 288-291. También se pueden generar nuevas enzimas (componentes de rutas biosintéticas o sintetasas) usando un procedimiento de recombinación de ADN conocido como "truncamiento incremental para la creación de enzimas híbridas" ("ITCHY"), por ejemplo, como se describe en Ostermeier et al. (1999) "A combinatorial approach to hybrid enzymes independent of DNA homology" Nature Biotech 17:1205. Esta estrategia también se puede usar para generar una biblioteca de enzimas u otras variantes de ruta que pueden servir como sustratos para uno o más métodos de recombinación in vitro o in vivo. Véase también, Ostermeier et al.(1999) "Combinatorial Protein Engineering by Incremental Truncation," Proc. Natl. Acad. Sci. USA, 96: 3562-67 y Ostermeier et al. (1999), "Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts," Biological and Medicinal Chemistry, 7: 2139-44. Otra estrategia usa mutagénesis de conjunto exponencial para producir bibliotecas de enzimas u otras variantes de ruta que se seleccionan, por ejemplo, por la capacidad de catalizar una reacción biosintética pertinente para la producción de un aminoácido no natural (o una nueva sintetasa). En esta estrategia se aleatorizan pequeños grupos de residuos en una secuencia de interés en paralelo para identificar, en cada posición alterada, aminoácidos que conducen a proteínas funcionales. Pueden encontrarse ejemplos de tales procedimientos, que se pueden adaptar a la presente invención para producir nuevas enzimas para la producción de aminoácidos no naturales (o nuevas sintetasas), en Delegrave & Youvan (1993) Biotechnology Research 11: 1548-1552. En otra estrategia más, se puede usar mutagénesis aleatoria

: o semi-aleatoria usando oligonucleótidos dopados o degenerados para la producción por ingeniería genética de enzimas y/o componentes de ruta, por ejemplo, usando los métodos de mutagénesis generales de, por ejemplo, Arkin y Youvan (1992) "Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis" Biotechnology 10:297300; o Reidhaar-Olson et al. (1991) "Random mutagenesis of protein sequences using oligonucleotide cassettes" Methods Enzymol. 208:564-86. Otra estrategia más, denominada a menudo mutagénesis "no estocástica", que usa el reensamblaje de polinucleótidos y mutagénesis de saturación de sitio, se puede usar para producir enzimas y/o componentes de ruta que después se pueden explorar con respecto a una capacidad para realizar una

: o más funciones de sintetasa o de ruta biosintética (por ejemplo, para la producción de aminoácidos no naturales in vivo). Véase, por ejemplo, Short "Non-Stochastic Generation of Genetic Vaccines and Enzymes", documento WO 00/46344. [0115] Una alternativa a tales métodos mutacionales implica recombinar genomas enteros de organismos y seleccionar la progenie resultante para funciones de ruta particulares (lo cual se denomina a menudo "barajado de genoma completo"). Esta estrategia se puede aplicar a la presente invención, por ejemplo, mediante recombinación genómica y selección de un organismo (por ejemplo, una célula E. coli u otra célula) con respecto a la capacidad de producir un aminoácido no natural (o intermedio del mismo). Por ejemplo, se pueden aplicar métodos descritos en las siguientes publicaciones para el diseño de rutas para la evolución de rutas existentes y/o nuevas en células para producir aminoácidos no naturales in vivo: Patnaik et al. (2002) "Genome shuffling of lactobacillus for improved acid tolerance" Nature Biotechnology, 20(7): 707-712; y Zhang et al. (2002) "Genome shuffling leads to rapid phenotypic improvement in bacteria" Nature, 7 de febrero, 415(6872): 644-646. [0116] También están disponibles otras técnicas para la producción por ingeniería genética de organismos y rutas metabólicas, por ejemplo, para la producción de compuestos deseados, y también se pueden aplicar a la producción de aminoácidos no naturales. Los ejemplos de publicaciones que describen estrategias de producción por ingeniería genética de rutas incluyen: Nakamura y White (2003) "Metabolic engineering for the microbial production of 1,3 propanediol" Curr. Opin. Biotechnol. 14(5):454-9; Berry et

al. (2002) "Application of Metabolic Engineering to improve both the production and use of Biotech Indigo" J. Industrial Microbiology and Biotechnology 28: 127-133; Banta et al. (2002) "Optimizing an artificial metabolic pathway: Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis" Biochemistry, 41(20), 6226-36; Selivonova et al. (2001) "Rapid Evolution of Novel Traits in Microorganisms" Applied and Environmental Microbiology, 67:3645 y muchas otras. [0117] Sin tener en cuenta el método usado, típicamente el aminoácido no natural producido con una ruta biosintética creada por ingeniería genética de la invención se produce en una concentración suficiente para la biosíntesis eficaz de proteínas, por ejemplo, una cantidad celular natural, pero no hasta tal grado como para afectar de forma significativa a la concentración de otros aminoácidos celulares o hasta agotar los recursos celulares. Las concentraciones típicas producidas de este modo in vivo son de aproximadamente 10 mM a aproximadamente 0,05 mM. Una vez que se produce una célula por ingeniería genética para producir enzimas deseadas para una ruta específica y se genera un aminoácido no natural, se usan opcionalmente selecciones in vivo para optimizar adicionalmente la producción del aminoácido no natural tanto para la síntesis de proteínas ribosómicas como para el crecimiento celular.

Componentes Ortogonales para Incorporar Homoglutamina

[0118] La invención proporciona composiciones y métodos para producir componentes ortogonales para incorporar una homoglutamina en una cadena polipeptídica en crecimiento en respuesta a un codón selector, por ejemplo, codón de terminación, un codón antisentido, un codón de cuatro o más bases, etc., por ejemplo, in vivo. Por ejemplo, la invención proporciona ARNt ortogonales (O-ARNt), aminoacil-ARNt sintetasas ortogonales (O-RS) y pares de los mismos. Estos pares se pueden usar para incorporar homoglutaminas en cadenas polipeptídicas en crecimiento. [0119] Una composición de la invención incluye una aminoacil-ARNt sintetasa ortogonal (O-RS), donde la O-RS aminoacila de forma preferente un O-ARNt con una homoglutamina. En determinadas realizaciones, la O-RS comprende una secuencia de aminoácidos que comprende la SEQ ID Nº: 1

: o una variante conservativa de la misma. En determinadas realizaciones de

la invención, la O-RS amioacila de forma preferente el O-ARNt con una eficacia de al menos un 50% de la eficacia de un polipéptido que comprende una secuencia de aminoácidos de la SEQ ID Nº: 1. [0120] Una composición que incluye una O-RS puede incluir adicionalmente de forma opcional un ARNt ortogonal (O-ARNt), donde el O-ARNt reconoce un codón selector. Típicamente, un O-ARNt de la invención incluye al menos aproximadamente, por ejemplo, un 45%, un 50%, un 60%, un 75%, un 80%

: o un 90% o más de eficacia de supresión en presencia de una sintetasa afín en respuesta a un codón selector en comparación con el O-ARNt que comprende o está codificado por una secuencia polinucleotídica como se indica en la lista de secuencias y los ejemplos de este documento. En una realización, la eficacia de supresión de la O-RS y el O-ARNt conjuntamente es, por ejemplo, 5 veces, 10 veces, 15 veces, 20 veces, 25 veces o más veces mayor que la eficacia de supresión del O-ARNt que carece de la ORS. En un aspecto, la eficacia de supresión de la O-RS y del O-ARNt conjuntamente es al menos un 45% de la eficacia de supresión de un par ortogonal de tirosil-ARNt sintetasa procedente de Methanococcus jannaschii. [0121] Una composición que incluye un O-ARNt puede incluir opcionalmente una célula (por ejemplo, una célula no eucariota, tal como una célula E. coli y similares, o una célula eucariota) y/o un sistema de traducción. [0122] La invención también proporciona una célula (por ejemplo, una célula no eucariota o una célula eucariota) que comprende un sistema de traducción, donde el sistema de traducción incluye un ARNt ortogonal (O-ARNt); una aminoacil-ARNt sintetasa ortogonal (O-RS); y una homoglutamina. Típicamente, la O-RS aminoacila de forma preferente el O-ARNt con una eficacia de al menos un 50% de la eficacia de un polipéptido que comprende una secuencia de aminoácidos de la SEQ ID Nº: 1. El O-ARNt reconoce el primer codón selector y la O-RS aminoacila de forma preferente el O-ARNt con la homoglutamina. En una realización, el O-ARNt comprende o está codificado por una secuencia polinucleotídica como se indica en la SEQ ID Nº: 2 o una secuencia polinucleotídica complementaria de la misma. En una realización, la O-RS comprende una secuencia de aminoácidos como se indica en una cualquiera de la SEQ ID Nº: 1 o una variación conservativa de la misma. [0123] Una célula de la invención puede comprender adicionalmente de forma opcional un par diferente de ARNt/O-RS adicional y un segundo

aminoácido no natural, por ejemplo, donde este O-ARNt reconoce un segundo codón selector y esta O-RS aminoacila de forma preferente el O-ARNt con el segundo aminoácido no natural. Opcionalmente, una célula de la invención incluye un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende un codón selector que es reconocido por el O-ARNt. [0124] En determinadas realizaciones, una célula de la invención incluye una célula E. coli que incluye un ARNt ortogonal (O-ARNt), una aminoacil-ARNt sintetasa ortogonal (O-RS), una homoglutamina y un ácido nucleico que comprende un polinucleótido que codifica un polipéptido de interés, donde el polinucleótido comprende el codón selector que es reconocido por el O-ARNt. En determinadas realizaciones de la invención, la O-RS aminoacila de forma preferente el O-ARNt con una eficacia de al menos un 50% de la eficacia de un polipéptido que comprende una secuencia de aminoácidos de cualquier secuencia de O-RS enumerada en este documento. [0125] En determinadas realizaciones de la invención, un O-ARNt de la invención comprende o está codificado por una secuencia polinucleotídica como se indica en la lista de secuencias o en los ejemplos de este documento o una secuencia polinucleotídica complementaria de la misma. En determinadas realizaciones de la invención, una O-RS comprende una secuencia de aminoácidos como se indica en la lista de secuencias o una variante conservativa de la misma. En una realización, la O-RS o una parte de la misma está codificada por una secuencia polinucleotídica que codifica un aminoácido como se indica en la lista de secuencias o en los ejemplos en este documento o una secuencia polinucleotídica complementaria de la misma. [0126] El O-ARNt y/o la O-RS de la invención se pueden obtener a partir de cualquiera de una diversidad de organismos (por ejemplo, organismos eucariotas y/o no eucariotas). [0127] También son una característica de la invención los polinucleótidos. Un polinucleótido de la invención incluye un polinucleótido artificial (por ejemplo, hecho por el hombre y no de origen natural) que comprende una secuencia de nucleótidos que codifica un polipéptido como se indica en la lista de secuencias en este documento y/o es complementario a esa secuencia polinucleotídica. Un polinucleótido de la invención también puede incluir un ácido nucleico que hibrida con un polinucleótido descrito anteriormente, en condiciones de alta rigurosidad, a lo largo de sustancialmente toda la longitud del ácido nucleico. Un polinucleótido de la invención también incluye un polinucleótido que tiene una identidad de, por ejemplo, al menos un 75%, al menos un 80%, al menos un 90%, al menos un 95%, al menos un 98% o mayor con el de un ARNt de origen natural o un ácido nucleico codificante correspondiente (pero un polinucleótido de la invención es diferente de un ARNt de origen natural o ácido nucleico codificante correspondiente), donde el ARNt reconoce un codón selector, por ejemplo, un codón de cuatro bases. También se incluyen en los polinucleótidos de la invención polinucleótidos artificiales que tienen una identidad de, por ejemplo, al menos un 80%, al menos un 90%, al menos un 95%, al menos un 98% o mayor con cualquiera de los anteriores y/o un polinucleótido que comprende una variación conservativa de cualquiera de los anteriores. [0128] También son una característica de la invención vectores que comprenden un polinucleótido de la invención. Por ejemplo, un vector de la invención puede incluir un plásmido, un cósmido, un fago, un virus, un vector de expresión y/o similares. También es una característica de la invención una célula que comprende un vector de la invención. [0129] También son características de la invención métodos para producir componentes de un par de O-ARNt/O-RS. Los componentes producidos mediante esos métodos también son una característica de la invención. Por ejemplo, los métodos para producir al menos un ARNt que es ortogonal a una célula (O-ARNt) incluyen generar una biblioteca de ARNt mutantes; mutar un bucle anticodón de cada miembro de la biblioteca de ARNt mutantes para permitir el reconocimiento de un codón selector, proporcionando de este modo una biblioteca de O-ARNt potenciales, y someter a selección negativa una primera población de células de una primera especie, donde las células comprenden un miembro de la biblioteca de ARNt potenciales. La selección negativa elimina las células que comprenden un miembro de la biblioteca de O-ARNt potenciales que se aminoacila por una aminoacil-ARNt sintetasa (RS) que es endógena a la célula. Esto proporciona un conjunto de ARNt que son ortogonales a la célula de la primera especie, proporcionando de este modo al menos un O-ARNt. También se proporciona un O-ARNt producido mediante los métodos de la invención. [0130] En determinadas realizaciones, los métodos comprenden adicionalmente someter a selección positiva una segunda población de células de la primera especie, donde las células comprenden un miembro del conjunto de ARNt que son ortogonales a la célula de la primera especie, una aminoacil-ARNt sintetasa afín y un marcador de selección positiva. Usando la selección positiva se seleccionan o se identifican las células que comprenden un miembro del conjunto de ARNt que está aminoacilado por la aminoacil-ARNt sintetasa afín y que muestra una respuesta deseada en la presencia del marcador de selección positiva, proporcionando de esta manera un O-ARNt. En determinadas realizaciones, la segunda población de células comprende células que no se han eliminado por la selección negativa. [0131] También se proporcionan métodos para identificar una aminoacil-ARNt sintetasa ortogonal que carga una homoglutamina en un O-ARNt. Por ejemplo, los métodos incluyen someter a selección una población de células de una primera especie, donde las células comprenden cada una: 1) un miembro de una pluralidad de aminoacil-ARNt sintetasas (RS), (por ejemplo, la pluralidad de RS puede incluir RS mutantes, RS procedentes de una especie diferente de una primera especie o tanto RS mutantes o como RS procedentes de una especie diferente de una primera especie); 2) el ARNt ortogonal (O-ARNt) (por ejemplo, de una o más especies); 3) un polinucleótido que codifica un marcador de selección positiva y que comprende al menos un codón selector. [0132] Se seleccionan o identifican las células (por ejemplo, una célula hospedadora) que muestran una potenciación en la eficacia de supresión en comparación con células que carecen o que tienen una cantidad reducida del miembro de la pluralidad de RS. Estas células seleccionadas/identificadas comprenden una RS activa que aminoacila el O-ARNt. También es una característica de la invención una aminoacil-ARNt sintetasa ortogonal identificada por el método de la invención. [0133] También son una característica de la invención métodos para producir una proteína en una célula (por ejemplo, una célula no eucariota, tal como una célula E. coli o similares, o una célula eucariota) con una homoglutamina en una posición especificada. Por ejemplo, un método incluye dejar crecer, en un medio apropiado, una célula, donde la célula comprende un ácido nucleico que comprende al menos un codón selector y codifica una proteína, proporcionar la homoglutamina e incorporar la homoglutamina en la posición especificada en la proteína durante la traducción del ácido nucleico con dicho al menos un codón selector, produciendo de este modo la proteína. La célula comprende adicionalmente: un ARNt ortogonal (O-ARNt) que funciona en la célula y que reconoce el codón selector; y una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila de forma preferente el O-ARNt con la homoglutamina. Una proteína producida mediante este método también es una característica de la invención. [0134] La invención también proporciona composiciones que incluyen proteínas, donde las proteínas comprenden, por ejemplo, una homoglutamina. En determinadas realizaciones, la proteína comprende una secuencia de aminoácidos que tiene al menos un 75% de identidad con la de una proteína conocida, por ejemplo, una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una parte de la misma. Opcionalmente, la composición comprende un vehículo farmacéuticamente aceptable.

SECUENCIA DE ÁCIDO NUCLEICO Y POLIPEPTÍDICA Y VARIANTES

[0135] Como se ha descrito anteriormente y se describe a continuación, la invención proporciona secuencias polinucleotídicas de ácido nucleico, por ejemplo, O-ARNt y O-RS, y secuencias de aminoácidos de polipéptido, por ejemplo, O-RS y, por ejemplo, composiciones, sistemas y métodos que comprenden dichas secuencias. En este documento se describen ejemplos de dichas secuencias, por ejemplo, O-ARNt y O-RS (véase la lista de secuencias y los ejemplos de este documento). Sin embargo, un experto en la materia entenderá que la invención no está limitada a estas secuencias exactas, por ejemplo, como en los Ejemplos y en la lista. Un experto entenderá que la invención también proporciona, por ejemplo, muchas secuencias relacionadas y no relacionadas con las funciones descritas en este documento, por ejemplo, que codifican un O-ARNt apropiado o una ORS. [0136] La invención proporciona polipéptidos (O-RS) y polinucleótidos, por ejemplo, O-ARNt, polinucleótidos que codifican O-RS o partes de las mismas, oligonucleótidos usados para aislar clones de aminoacil-ARNt sintetasas, etc. Los polinucleótidos de la invención incluyen aquellos que codifican proteínas o polipéptidos de interés de la invención con uno o más codones selectores. Además, los polinucleótidos de la invención incluyen, por ejemplo, un polinucleótido que comprende una secuencia de nucleótidos como se indica en la lista de secuencias; un polinucleótido que es complementario a o que codifica una secuencia polinucleotídica del mismo. Un polinucleótido de la invención también incluye un polinucleótido que codifica una secuencia de aminoácidos que comprende cualquiera de aquellas en la lista de secuencias o los ejemplos de este documento. Un polinucleótido de la invención también incluye un polinucleótido que codifica un polipéptido de la invención. De forma similar, es un polinucleótido de la invención un ácido nucleico artificial que hibrida con un polinucleótido que se ha indicado anteriormente en condiciones de alta rigurosidad a lo largo de sustancialmente toda la longitud del ácido nucleico (y es diferente de un polinucleótido de origen natural). En una realización, una composición incluye un polipéptido de la invención y un excipiente (por ejemplo, tampón, agua, excipiente farmacéuticamente aceptable, etc.). La invención también proporciona un anticuerpo o antisueros específicamente inmunorreactivos con un polipéptido de la invención. Un polinucleótido artificial es un polinucleótido que está hecho por el hombre y que no es de origen natural. [0137] Un polinucleótido de la invención también incluye un polinucleótido artificial que tiene una identidad de, por ejemplo, al menos un 75%, al menos un 80%, al menos un 90%, al menos un 95%, al menos un 98% o mayor que un ARNt de origen natural, (pero es diferente de un ARNt de origen natural) o cualquier ARNt o ácido nucleico codificante del mismo en una lista o ejemplo de este documento. Un polinucleótido también incluye un polinucleótido artificial que tiene una identidad de, por ejemplo, al menos un 75%, al menos un 80%, al menos un 90%, al menos un 95%, al menos un 98% o mayor con un ARNt de origen natural. [0138] En determinadas realizaciones, un vector (por ejemplo un plásmido, un cósmido, un fago, un virus, etc.) comprende un polinucleótido de la invención. En una realización, el vector es un vector de expresión. En otra realización, el vector de expresión incluye un promotor unido de manera operativa a uno o más de los polinucleótidos de la invención. En otra realización, una célula comprende un vector que incluye un polinucleótido de la invención. [0139] Un experto también entenderá que en la invención están incluidas muchas variantes de las secuencias descritas. Por ejemplo, en la invención están incluidas variaciones conservativas de las secuencias descritas que proporcionan una secuencia funcionalmente similar. Se considera que están incluidas en la invención variantes de las secuencias polinucleotídicas de ácido nucleico, en las que las variantes hibridan con al menos una secuencia descrita y reconocen un codón selector. También se incluyen en la invención subsecuencias únicas de las secuencias descritas en este documento como se determina, por ejemplo, mediante técnicas de comparación de secuencias convencionales.

Variaciones conservativas

[0140] Debido a la degeneración del código genético, las "sustituciones silenciosas" (es decir, sustituciones en una secuencia de ácido nucleico que no dan como resultado una alteración en un polipéptido codificado) son una característica implícita de todas las secuencias de ácido nucleico que codifican un aminoácido. De forma similar, en las "sustituciones de aminoácidos conservativas", uno o unos pocos aminoácidos de una secuencia de aminoácidos se han sustituido por aminoácidos diferentes con propiedades muy similares, también se identifican de forma sencilla como muy similares a una construcción descrita. Tales variaciones conservativas de cada secuencia descrita son una característica de la presente invención. [0141] Las "variaciones conservativas" de una secuencia de ácido nucleico particular se refieren a los ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas o, cuando el ácido nucleico no codifica una secuencia de aminoácidos, a secuencias esencialmente idénticas. Un experto reconocerá que las sustituciones, deleciones o adiciones individuales que alteran, añaden o eliminan un solo aminoácido o un pequeño porcentaje de aminoácidos (típicamente menos del 5%, más típicamente menos del 4%, 2% o 1%) en una secuencia codificada son "variaciones modificadas de forma conservativa", resultan las alteraciones en la deleción de un aminoácido, la adición de un aminoácido o la sustitución de un aminoácido por un aminoácido químicamente similar. Por lo tanto, las "variaciones conservativas" de una secuencia polipeptídica enumerada de la presente invención incluyen sustituciones de un pequeño porcentaje, típicamente menos del 5%, más típicamente menos del 2% o del 1%, de los aminoácidos de la secuencia polipeptídica, por un aminoácido del mismo grupo de sustitución conservativa. Finalmente, la adición de secuencias que no alteran la actividad codificada de una molécula de ácido nucleico, tal como la adición de una secuencia no funcional, es una variación conservativa del ácido nucleico básico. [0142] Se conocen bien en la técnica tablas de sustitución conservativa que proporcionan aminoácidos funcionalmente similares, donde un residuo aminoacídico se sustituye por otro residuo aminoacídico que tiene

5 propiedades químicas similares (por ejemplo, cadenas laterales aromáticas o cadenas laterales cargadas positivamente) y, por lo tanto, no cambia sustancialmente las propiedades funcionales de la molécula polipeptídica. A continuación se indican grupos ilustrativos que contienen aminoácidos naturales con propiedades químicas similares, donde la sustitución dentro de

10 un grupo es una "sustitución conservativa".

Cadenas Laterales No Polares y/o Alifáticas: Cadenas Laterales Polares, No Cargadas Cadenas Laterales Aromáticas Cadenas Laterales Cargadas Positivamente Cadenas Laterales Cargadas Negativamente

Glicina Alanina Valina Leucina Isoleucina Prolina: Serina Treonina Cisteína Metionina Asparagina Glutamina Fenilalanina Tirosina Triptófano Lisina Arginina Histidina Aspartato Glutamato

Hibridación de Ácidos Nucleicos

15 [0143] Se puede usar hibridación comparativa para identificar ácidos nucleicos de la invención, tales como aquellos en la lista de secuencias de este documento, incluyendo variaciones conservativas de ácidos nucleicos de la invención, y este método de hibridación comparativo es un método para distinguir ácidos nucleicos de la invención de ácidos nucleicos no

20 relacionados. Además son una característica de la invención los ácidos nucleicos diana que hibridan con un ácido nucleico representado por los de la lista de secuencias en condiciones de rigurosidad alta, ultra-alta y ultraultra-alta. Los ejemplos de tales ácidos nucleicos incluyen aquellos con una

o unas pocas sustituciones de ácido nucleico conservativas o silenciosas en

25 comparación con una secuencia de ácido nucleico dada. [0144] Se dice que un ácido nucleico de ensayo hibrida específicamente con un ácido nucleico sonda cuando hibrida al menos la mitad de bien con la sonda como con la diana complementaria perfectamente coincidente, es decir, con una relación entre señal e interferencias de al menos la mitad de la hibridación de la sonda con la diana en condiciones en las que la sonda perfectamente coincidente se une a la diana complementaria perfectamente coincidente con una relación entre señal e interferencias que es al menos de aproximadamente 5 veces a 10 veces la observada para la hibridación con cualquiera de los ácidos nucleicos diana no coincidentes. [0145] Los ácidos nucleicos "hibridan" cuando se asocian, típicamente en solución. Los ácidos nucleicos hibridan debido a una diversidad de fuerzas fisicoquímicas bien caracterizadas, tales como formación de enlaces de hidrógeno, exclusión de disolvente, adhesión de bases y similares. Se encuentra una guía extensa para la hibridación de ácidos nucleicos en Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes parte I capítulo 2, "Overview of principles of hybridization and the strategy of nucleic acid probe assays," (Elsevier, New York), así como en Ausubel, supra. Hames y Higgins (1995) Gene Probes 1 IRL Press en Oxford University Press, Oxford, Inglaterra, (Hames y Higgins 1) y Hames y Higgins (1995) Gene Probes 2 IRL Press en Oxford University Press, Oxford, Inglaterra (Hames y Higgins 2) proporcionan detalles de la síntesis, marcaje, detección y cuantificación de ADN y ARN, incluyendo oligonucleótidos. [0146] Un ejemplo de condiciones de hibridación rigurosas para la hibridación de ácidos nucleicos complementarios que tienen más de 100 residuos complementarios en un filtro en una transferencia Southern o Northern es formalina al 50% con un 1 mg de heparina a 42ºC, realizándose la hibridación durante la noche. Un ejemplo de condiciones de lavado rigurosas es un lavado con SSC 0,2x a 65ºC durante 15 minutos (véase Sambrook, supra para una descripción de tampón SSC). A menudo, el lavado de alta rigurosidad está precedido por un lavado de baja rigurosidad para retirar la señal de fondo de la sonda. Un ejemplo de lavado de baja rigurosidad es SSC 2x a 40ºC durante 15 minutos. En general, una relación entre señal e interferencias 5 veces mayor (o superior) que la observada para una sonda no relacionada en el ensayo de hibridación particular indica detección de una hibridación específica. [0147] Las "condiciones rigurosas de lavado de hibridación " en el contexto de los experimentos de hibridación de ácidos nucleicos tales como hibridaciones Southern y Northern son dependientes de la secuencia y son diferentes con diferentes parámetros ambientales. Se encuentra una guía extensa sobre la hibridación de ácidos nucleicos en Tijssen (1993), supra y en Hames y Higgins, 1 y 2. Las condiciones de hibridación y lavado rigurosas se pueden determinar de forma sencilla empíricamente para cualquier ácido nucleico de ensayo. Por ejemplo, para determinar condiciones de hibridación y lavado rigurosas, las condiciones de hibridación y lavado se aumentan gradualmente (por ejemplo, aumentando la temperatura, disminuyendo la concentración de sal, aumentando la concentración de detergente y/o aumentando la concentración de disolventes orgánicos tales como formalina en la hibridación o el lavado), hasta que se cumpla un conjunto seleccionado de criterios. Por ejemplo, en condiciones de hibridación y lavado de alta rigurosidad, las condiciones de hibridación y lavado se aumentan gradualmente hasta que una sonda se une a una diana complementaria perfectamente coincidente con una relación entre señal e interferencias que es al menos 5 veces la observada para la hibridación de la sonda con una diana no coincidente. [0148] Se seleccionan condiciones "muy rigurosas" para que sean iguales al punto de fusión térmico (Tm) de una sonda particular. La Tm es la temperatura (con fuerza iónica y pH definidos) a la que el 50% de la secuencia de ensayo hibrida con una sonda perfectamente coincidente. Para los propósitos de la presente invención, generalmente se seleccionan las condiciones de hibridación y lavado "altamente rigurosas" para que sean aproximadamente 5ºC menores que la Tm para la secuencia específica a una fuerza iónica y pH definidos. [0149] Las condiciones de hibridación y lavado "de rigurosidad ultra-alta" son aquellas en las que la rigurosidad de las condiciones de hibridación y lavado se aumentan hasta que la relación entre señal e interferencias para unir la sonda al ácido nucleico diana complementario perfectamente coincidente sea al menos 10 veces mayor que la observada para la hibridación con cualquiera de los ácidos nucleicos diana no coincidentes. Se dice que un ácido nucleico diana que hibrida con una sonda en tales condiciones, con una relación entre señal e interferencias de al menos la mitad de la del ácido nucleico diana complementario perfectamente coincidente, se une a la sonda en condiciones de rigurosidad ultra-alta. [0150] De forma similar, se pueden determinar niveles incluso mayores de rigurosidad aumentando gradualmente las condiciones de hibridación y/o lavado del ensayo de hibridación pertinente. Por ejemplo, aquellos en los que la rigurosidad de las condiciones de hibridación y lavado se aumentan hasta que la relación entre señal e interferencias para la unión de la sonda al ácido nucleico diana complementario perfectamente coincidente sea al menos 10 veces, 20 veces, 50 veces, 100 veces, 500 veces o más veces la observada para la hibridación con cualquiera de los ácidos nucleicos diana no coincidentes. Se dice que un ácido nucleico diana que hibrida con una sonda en tales condiciones, con una relación entre señal e interferencias de al menos la mitad de la del ácido nucleico diana complementario perfectamente coincidente, se une a la sonda en condiciones de rigurosidad ultra-ultra-alta. [0151] Los ácidos nucleicos que no hibridan entre sí en condiciones rigurosas todavía son sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto sucede, por ejemplo, cuando se crea una copia de un ácido nucleico usando la máxima degeneración de codón permitida por el código genético.

Subsecuencias Únicas

[0152] En un aspecto, la invención proporciona un ácido nucleico que comprende una subsecuencia única en un ácido nucleico seleccionado de las secuencias de O-ARNt y O-RS descritas en este documento. La subsecuencia única es única en comparación con un ácido nucleico correspondiente a cualquier secuencia de ácido nucleico de ARNt o RS conocida previamente. Se puede realizar el alineamiento usando, por ejemplo, un ajuste BLAST para parámetros por defecto. Cualquier subsecuencia única es útil, por ejemplo, como una sonda para identificar los ácidos nucleicos de la invención. [0153] De forma similar, la invención incluye un polipéptido que comprende una subsecuencia única en un polipéptido seleccionado de las secuencias de las O-RS descritas en este documento. En este caso, la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquier secuencia de RS conocida previamente. [0154] La invención también proporciona ácidos nucleicos diana que hibridan en condiciones rigurosas con un único oligonucleótido codificante que codifica una subsecuencia única en un polipéptido seleccionado de las secuencias de O-RS donde la subsecuencia única es única en comparación con un polipéptido correspondiente a cualquiera de los polipéptidos de control (por ejemplo, secuencias parentales de las que se obtuvieron las sintetasas de la invención, por ejemplo, mediante mutación). Las secuencias únicas se determinan como se ha señalado anteriormente.

Comparación, identidad y homología de secuencia

[0155] Los términos "idéntico" o porcentaje de "identidad", en el contexto de dos o más ácidos nucleicos o secuencias polipeptídicas, se refieren a dos o más secuencias o subsecuencias que son iguales o que tienen un porcentaje especificado de residuos aminoacídicos o nucleótidos que son iguales cuando se comparan y alinean para la máxima correspondencia, como se mide usando uno de los algoritmos de comparación de secuencia que se describen a continuación (u otros algoritmos disponibles para los expertos en la materia) o mediante inspección visual. [0156] La expresión "sustancialmente idéntico", en el contexto de dos ácidos nucleicos o polipéptidos (por ejemplo, ADN que codifica un O-ARNt o una O-RS o la secuencia de aminoácidos de una O-RS), se refiere a dos o más secuencias o subsecuencias que tienen al menos aproximadamente un 60%, aproximadamente un 80%, aproximadamente un 90-95%, aproximadamente un 98%, aproximadamente un 99% o más de identidad de nucleótidos o residuos aminoacídicos, cuando se comparan y se alinean para la máxima correspondencia, como se mide usando un algoritmo de comparación de secuencias o mediante inspección visual. Tales secuencias "sustancialmente idénticas" típicamente se consideran "homólogas", sin referencia a la ascendencia real. Preferiblemente, la "identidad sustancial" existe a lo largo de una región de las secuencias que tiene una longitud de aproximadamente al menos 50 residuos, más preferiblemente a lo largo de una región de aproximadamente al menos 100 residuos y mucho más preferiblemente las secuencias son sustancialmente idénticas a lo largo de aproximadamente al menos 150 residuos o a lo largo de la longitud completa de las dos secuencias que se tienen que comparar. [0157] Las proteínas y/o secuencias de proteínas son "homólogas" cuando se obtienen, de forma natural o de forma artificial, a partir de una proteína o secuencia de proteína ancestral común. De forma similar, los ácidos nucleicos y/o las secuencias de ácido nucleico son homólogas cuando se obtienen, de forma natural o de forma artificial, a partir de un ácido nucleico

o una secuencia de ácido nucleico ancestral común. Por ejemplo, cualquier ácido nucleico de origen natural se puede modificar mediante cualquier método de mutagénesis disponible para incluir uno o más codones selectores. Cuando se expresa, este ácido nucleico mutado codifica un polipéptido que comprende una o más homoglutaminas, por ejemplo, un aminoácido no natural. El proceso de mutación puede, por supuesto, alterar adicionalmente uno o más codones convencionales, cambiando también de esta manera uno o más aminoácidos convencionales en la proteína mutante resultante. La homología generalmente se deduce a partir de la similitud de secuencia entre dos o más ácidos nucleicos o proteínas (o secuencias de los mismos). El porcentaje preciso de similitud entre secuencias que es útil para establecer la homología varía con el ácido nucleico y la proteína en cuestión, pero de forma rutinaria se usa únicamente un 25% de similitud de secuencia para establecer la homología. También se pueden usar niveles mayores de similitud de secuencia, por ejemplo, un 30%, un 40%, un 50%, un 60%, un 70%, un 80%, un 90%, un 95% o un 99% o más, para establecer la homología. En este documento se describen métodos para determinar porcentajes de similitud de secuencia (por ejemplo, BLASTP y BLASTN usando parámetros por defecto) y están generalmente disponibles. [0158] Para la comparación de secuencias y determinación de homología, típicamente una secuencia actúa como una secuencia de referencia con la que se comparan las secuencias de ensayo. Cuando se usa un algoritmo de comparación de secuencias, se introducen las secuencias de ensayo y de referencia en un ordenador, se diseñan las coordenadas de subsecuencia, si es necesario, y se diseñan parámetros de programa de algoritmo de secuencia. Después, el algoritmo de comparación de secuencia calcula el porcentaje de identidad de secuencia para la o las secuencias de ensayo con respecto a las secuencias de referencia, basándose en los parámetros de programa diseñados. [0159] Se puede realizar un alineamiento óptimo de secuencias para la comparación, por ejemplo, mediante el algoritmo de homología local de Smith & Waterman, Adv. Appl. Math. 2:482 (1981), mediante el algoritmo de alineamiento de homología de Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), mediante el método de búsqueda de similitud de Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), mediante aplicaciones informáticas de estos algoritmos (GAP, BESTFIT, FASTA y TFASTA en el Paquete de Software de Wisconsin Genetics, Genetics Computer Group, 575 Science Dr., Madison, Wl) o mediante inspección visual (véase en general Ausubel et al., infra). [0160] Un ejemplo de un algoritmo que es adecuado para determinar el porcentaje de identidad de secuencia y de similitud de secuencia es el algoritmo BLAST, que se describe en Altschul et al., J. Mol. Biol. 215:403410 (1990). El software para realizar análisis BLAST está disponible públicamente por el National Center for Biotechnology Information (www.ncbi.nlm.nih.gov/). Este algoritmo implica identificar en primer lugar pares de secuencias con alta puntuación (HSP) identificando palabras cortas de longitud W en la secuencia problema, que se ajustan o satisfacen alguna puntuación umbral T valorada positivamente cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. T se denomina el umbral de puntuación de la palabra vecina (Altschul et al., supra). Estos aciertos de palabra vecina iniciales actúan como semillas para iniciar búsquedas para encontrar HSP más largos que los contengan. Después, los aciertos de palabra se extienden en ambas direcciones a lo largo de cada secuencia hasta que se pueda aumentar la puntuación de alineamiento acumulativa. Las puntuaciones acumulativas se calculan usando, para secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos coincidentes; siempre  0) y N (puntuación de penalización para residuos no coincidentes; siempre  0). Para secuencias de aminoácidos se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección se detiene cuando: la puntuación de alineamiento acumulativa cae en la cantidad X desde su máximo valor conseguido; la puntuación acumulativa tiende a cero o a un valor inferior debido a la acumulación de uno o más alineamientos de residuos de puntuación negativa; o se alcanza el extremo de cualquier secuencia. Los parámetros de algoritmo BLAST W, T y X determinan la sensibilidad y velocidad del alineamiento. El programa BLASTN (para secuencias de nucleótidos) usa por defecto una longitud de palabra (W) de 11, una esperanza (E) de 10, un límite de 100, M=5, N=-4 y una comparación de las dos cadenas. Para secuencias de aminoácidos, el programa BLASTP usa por defecto una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff (1989) Proc. Natl. Acad. Sci. USA 89:10915). [0161] Además de calcular el porcentaje de identidad de secuencia, el algoritmo BLAST realiza un análisis estadístico de la similitud entre dos secuencias (véase, por ejemplo, Karlin & Altschul, Proc. Nat'l. Acad. Sci. USA 90:5873-5787 (1993)). Una medición de la similitud proporcionada por el algoritmo BLAST es la menor probabilidad total (P(N)), que proporciona una indicación de la probabilidad con la que ocurriría por casualidad una coincidencia entre dos secuencias de nucleótidos o aminoácidos. Por ejemplo, se considera que un ácido nucleico es similar a una secuencia de referencia si la menor probabilidad total, en una comparación del ácido nucleico de ensayo con el ácido nucleico de referencia, es menor de aproximadamente 0,1, más preferiblemente menor de aproximadamente 0,01 y mucho más preferiblemente menor de aproximadamente 0,001.

Mutagénesis y Otras Técnicas de Biología Molecular

[0162] Los polinucleótidos y polipéptidos de la invención y usados en la invención se pueden manipular usando técnicas de biología molecular. Los textos generales que describen técnicas de biología molecular incluyen Berger y Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology volumen 152 Academic Press, Inc., San Diego, CA (Berger); Sambrook et al., Molecular Cloning - A Laboratory Manual (3a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 2001 ("Sambrook") y Current Protocols in Molecular Biology, F. M. Ausubel et al., eds., Current Protocols, una sociedad conjunta entre Greene Publishing Associates, Inc. y John Wiley & Sons, Inc., (complementado por 2003) ("Ausubel")). Estos textos describen mutagénesis, el uso de vectores, promotores y muchos otros aspectos pertinentes relacionados con, por ejemplo, la generación de genes que incluyen codones selectores para la producción de proteínas que incluyen homoglutaminas, ARNt ortogonales, sintetasas ortogonales y pares de los mismos. [0163] En la invención se usan diversos tipos de mutagénesis, por ejemplo, para mutar moléculas de ARNt, para producir bibliotecas de ARNt, para producir bibliotecas de sintetasas, o para insertar codones selectores que codifican una homoglutamina en una proteína o un polipéptido de interés. Éstos incluyen, pero no se limitan a, mutagénesis puntual aleatoria dirigida, recombinación homóloga, barajado de ADN u otros métodos de mutagénesis recursiva, construcción quimérica, mutagénesis usando plantillas que contienen uracilo, mutagénesis dirigida por oligonucleótido, mutagénesis de ADN modificado por fosforotioato, mutagénesis usando ADN dúplex discontinuo o similares o cualquier combinación de los mismos. Otros métodos adecuados incluyen reparación de emparejamiento erróneo puntual, mutagénesis usando cepas de hospedador deficientes en reparación, selección por restricción y purificación por restricción, mutagénesis por deleción, mutagénesis por síntesis génica total, reparación de rupturas de cadena doble o similares. También se incluye en la presente invención, por ejemplo, la mutagénesis que implica construcciones quiméricas. En una realización, la mutagénesis se puede guiar por una información conocida de la molécula de origen natural o la molécula natural alterada o mutada, por ejemplo, por información de la secuencia, de comparaciones de secuencias, de propiedades físicas, de la estructura cristalina o similares. [0164] Las células hospedadoras se crean mediante ingeniería genética (por ejemplo, se transforman, transducen o transfectan) con los polinucleótidos de la invención o con construcciones que incluyen un polinucleótido de la invención, por ejemplo, un vector de la invención, que puede ser, por ejemplo, un vector de clonación o un vector de expresión. Por ejemplo, las regiones codificantes para los ARNt ortogonales, la ARNt sintetasa ortogonal y la proteína que se tiene que derivatizar están unidas de manera operativa a elementos de control de la expresión génica que son funcionales en la célula hospedadora deseada. Los vectores típicos contienen terminadores de la transcripción y traducción, secuencias de inicio de la transcripción y traducción y promotores útiles en la regulación de la expresión del ácido nucleico diana particular. Los vectores comprenden opcionalmente casetes de expresión genéricos que contienen al menos una secuencia terminadora independiente, secuencias que permiten la replicación del casete en eucariotas o procariotas, o ambas cosas (por ejemplo, vectores lanzadera) y marcadores de selección tanto para sistemas procariotas como para sistemas eucariotas. Los vectores son adecuados para replicación y/o integración en procariotas, eucariotas o preferiblemente en ambos tipos celulares. Véase Giliman & Smith, Gene 8:81 (1979); Roberts, et al., Nature, 328: 731 (1987); Schneider, B., et al., Protein Expr. Purif. 6435:10 (1995); Ausubel, Sambrook, Berger (todos supra). El vector puede estar, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado. Los vectores son introducidos en células y/o microorganismos por métodos convencionales incluyendo electroporación (From et al., Proc. Natl. Acad. Sci. USA 82, 5824 (1985), infección por vectores virales, penetración balística a gran velocidad con partículas pequeñas con el ácido nucleico en el interior de la matriz de pequeñas perlas o partículas o sobre la superficie (Klein et al., Nature 327, 70-73 (1987)) y/o similares. [0165] Se proporciona un catálogo de Bacterias y Bacteriófagos útiles para la clonación, por ejemplo, en la ATCC, por ejemplo, The ATCC Catalogue of Bacteria and Bacteriophage (1996) Gherna et al. (eds) publicado por la ATCC. También se encuentran procedimientos básicos adicionales para la secuenciación, la clonación y otros aspectos de biología molecular y consideraciones teóricas subyacentes en Sambrook (supra), Ausubel (supra, y en Watson et al. (1992) Recombinant DNA Second Edition Scientific American Books, NY. Además, esencialmente cualquier ácido nucleico (y prácticamente cualquier ácido nucleico marcado, bien convencional o no convencional) se puede encargar a petición del cliente o de forma convencional en cualquiera de una diversidad de fuentes comerciales, tales como la Midland Certified Reagent Company (Midland, TX mcrc.com), The Great American Gene Company (Ramona, CA disponible en la World Wide Web en genco.com), ExpressGen Inc. (Chicago, IL disponible en la World Wide Web en expressgen.com), Operon Technologies Inc. (Alameda, CA) y muchas otras. [0166] Las células hospedadoras creadas por ingeniería genética se pueden cultivar en medios nutrientes convencionales modificados de forma apropiada para dichas actividades tales como, por ejemplo, etapas de identificación, activación de promotores o selección de transformantes. Estas células se pueden cultivar opcionalmente en organismos transgénicos. Otras referencias útiles, por ejemplo, para el aislamiento y cultivo de células (por ejemplo, para el aislamiento posterior de ácidos nucleicos) incluyen Freshney (1994) Culture of Animal Cells, a Manual of Basic Technique, tercera edición, Wiley-Liss, New York y las referencias citadas en ese documento; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY; Gamborg y Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Editorial Springer (Berlin Heidelberg New York) y Atlas y Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL.

PROTEÍNAS Y POLIPÉPTIDOS DE INTERÉS

[0167] Las proteínas o los polipéptidos de interés que tienen, por ejemplo, al menos una homoglutamina, son una característica de la invención como lo son los polipéptidos que comprenden dos o más aminoácidos no naturales diferentes. También puede estar presente un excipiente (por ejemplo, un excipiente farmacéuticamente aceptable) con la proteína. Opcionalmente, una proteína de la invención incluirá una modificación postraduccional. [0168] También constituyen una característica de la invención métodos para producir una proteína en una célula con una homoglutamina u otro aminoácido no natural en una posición especificada. Por ejemplo, un método incluye dejar crecer, en un medio apropiado, la célula, donde la célula comprende un ácido nucleico que comprende al menos un codón selector y codifica una proteína; y proporcionar la homoglutamina u otro aminoácido no natural; donde la célula comprende además: un ARNt ortogonal (O-ARNt) que funciona en la célula y reconoce el codón selector; y una aminoacil-ARNt sintetasa ortogonal (O-RS) que aminoacila de forma preferente el O-ARNt con la homoglutamina u otro aminoácido no natural. En determinadas realizaciones, la O-ARNt comprende al menos aproximadamente, por ejemplo, un 45%, un 50%, un 60%, un 75%, un 80% o un 90% o más de eficacia de supresión en presencia de una sintetasa afín en respuesta al codón selector en comparación con el O-ARNt que comprende o está codificado por una secuencia polinucleotídica como se indica en la lista de secuencias y los ejemplos en este documento. También constituye una característica de la invención una proteína producida mediante este método. [0169] La invención también proporciona composiciones que incluyen proteínas, donde las proteínas comprenden una homoglutamina. En determinadas realizaciones, la proteína comprende una secuencia de aminoácidos que tiene una identidad de aproximadamente al menos un 75% con la de una proteína diana, tal como una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una parte de las mismas, por ejemplo, que difiera de la proteína diana por la introducción de uno o más aminoácidos no naturales tales como homoglutamina. [0170] Las composiciones de la invención y las composiciones hechas mediante los procedimientos de la invención están presentes opcionalmente en una célula. Las parejas O-tRNA/O-RS o los componentes individuales de la invención se pueden usar, entonces, en una maquinaria de traducción de un sistema hospedador, lo que resulta en la incorporación de una homoglutamina en una proteína. WO 2004/094593, titulada “Expanding the Eukaryotic Genetic Code”; y WO 2002/085923, titulada “IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS” describen este procedimiento. Por ejemplo, cuando una pareja O-tRNA/O-RS se introduce en un hospedador, p. ej., Escherichia coli, la pareja lleva a la incorporación in vivo de homoglutamina, p. ej., un aminoácido sintético, tal como un derivado de un aminoácido tirosina o fenilalanina que se puede añadir exógenamente al medio de crecimiento, a una proteína, en respuesta a un codón selector. Opcionalmente, las composiciones de la presente invención pueden estar en un sistema de traducción in vitro o en un/unos sistema(s) in vivo. [0171] Una célula de la invención proporciona la capacidad de sintetizar proteínas que comprenden aminoácidos no naturales en grandes cantidades útiles. En un aspecto, la composición incluye opcionalmente, por ejemplo, al menos 10 microgramos, al menos 50 microgramos, al menos 75 microgramos, al menos 100 microgramos, al menos 200 microgramos, al menos 250 microgramos, al menos 500 microgramos, al menos 1 miligramo, al menos 10 miligramos o más de la proteína que comprende una homoglutamina o múltiples aminoácidos no naturales, o una cantidad que se puede conseguir con métodos de producción de proteína in vivo (en este documento se proporcionan detalles de la producción y purificación de proteínas recombinantes). En otro aspecto, la proteína está opcionalmente presente en la composición a una concentración de, por ejemplo, al menos 10 microgramos de proteína por litro, al menos 50 microgramos de proteína por litro, al menos 75 microgramos de proteína por litro, al menos 100 microgramos de proteína por litro, al menos 200 microgramos de proteína por litro, al menos 250 microgramos de proteína por litro, al menos 500 microgramos de proteína por litro, al menos 1 miligramo de proteína por litro

o al menos 10 miligramos de proteína por litro o más, por ejemplo, en un lisado celular, un tampón, un tampón farmacéutico u otra suspensión líquida (por ejemplo, en un volumen de, por ejemplo, cualquiera de aproximadamente 1 nl a aproximadamente 100 l). Una característica de la invención es la producción de grandes cantidades (por ejemplo, superiores a las típicamente posibles con otros métodos, por ejemplo, traducción in vitro) de una proteína que incluye al menos una homoglutamina en una célula. [0172] La incorporación de una homoglutamina u otros aminoácidos no naturales se puede realizar para, por ejemplo, adaptar cambios en la estructura y/o función de la proteína, por ejemplo, para cambiar el tamaño, acidez, nucleofilia, formación de enlaces de hidrógeno, hidrofobia, accesibilidad de sitios diana de proteasa, dirección a residuo (por ejemplo, para una serie de proteínas), etc. Las proteínas que incluyen una homoglutamina pueden tener propiedades catalíticas o físicas mejoradas o incluso completamente nuevas. Por ejemplo, mediante la inclusión de una homoglutamina u otro aminoácido no natural en una proteína se modifican opcionalmente las siguientes propiedades: toxicidad, biodistribución, propiedades estructurales, propiedades espectroscópicas, propiedades químicas y/o fotoquímicas, capacidad catalítica, vida media (por ejemplo, vida media en suero), capacidad de reaccionar con otras moléculas, por ejemplo, de forma covalente o de forma no covalente, y similares. Las composiciones que incluyen proteínas que incluyen al menos una homoglutamina son útiles para, por ejemplo, nuevas enzimas terapéuticas, de diagnóstico, catalíticas, enzimas industriales, proteínas de unión (por ejemplo, anticuerpos) y, por ejemplo, para el estudio de la estructura y función de proteínas. Véase, por ejemplo, Dougherty, (2000) Unnatural Amino Acids as Probes of Protein Structure and Function, Current Opinion in Chemical Biology, 4:645-652. Además se pueden incorporar uno o más aminoácidos no naturales en un polipéptido para proporcionar un marcador molecular, por ejemplo, para fijar el polipéptido a un soporte sólido. Véase, por ejemplo, en "PROTEIN ARRAYS" de Wang y Schultz, presentada el 22 de diciembre de 2003, Número de Expediente de Mandatario 54-000810PC, una discusión extensa de métodos para realizar series usando polipéptidos que comprenden aminoácidos no naturales. [0173] En un aspecto de la invención, una composición incluye al menos una proteína con al menos una, por ejemplo al menos dos, al menos tres, al menos cuatro, al menos cinco, al menos seis, al menos siete, al menos ocho, al menos nueve o al menos diez o más aminoácidos no naturales, por ejemplo, homoglutaminas y/u otros aminoácidos no naturales. Los aminoácidos no naturales pueden ser iguales o diferentes, por ejemplo, puede haber 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más sitios diferentes en la proteína que comprenden 1, 2, 3, 4, 5, 6, 7, 8, 9 ó 10 o más aminoácidos no naturales diferentes. En otro aspecto, una composición incluye una proteína en la que al menos uno, pero no todos los aminoácidos concretos presentes en la proteína se han sustituido con la homoglutamina. Para una proteína dada con más de un aminoácido no natural, los aminoácidos no naturales pueden ser idénticos o diferentes (por ejemplo, la proteína puede incluir dos o más tipos diferentes de aminoácidos no naturales o puede incluir dos de los mismos aminoácidos no naturales). Para una proteína dada con más de dos aminoácidos no naturales, los aminoácidos no naturales pueden ser iguales, diferentes o una combinación de un aminoácido no natural múltiple del mismo tipo con al menos un aminoácido no natural diferente. [0174] Usando las composiciones y los métodos de este documento se puede producir esencialmente cualquier proteína (o parte de la misma) que incluya un aminoácido no natural tal como una homoglutamina, o que codifique múltiples aminoácidos no naturales diferentes (y cualquier ácido nucleico codificante correspondiente, por ejemplo, que incluya uno o más codones selectores). No se ha intentado identificar los cientos o miles de proteínas conocidas que se pueden modificar para incluir uno o mas aminoácidos no naturales, por ejemplo, adaptando cualquier método de mutación disponible para incluir uno o más codones selectores apropiados en un sistema de traducción pertinente. Los depósitos de secuencia comunes para proteínas conocidas incluyen GenBank EMBL, DDBJ y NCBI. Se pueden identificar otros depósitos de forma sencilla buscando en internet. [0175] Típicamente, las proteínas son, p. ej., al menos un 60%, al menos un 70%, al menos un 75%, al menos un 80%, al menos un 90%, al menos un 95%, o al menos un 99% o más idénticas a cualquiera de las proteínas disponibles (p.ej., una proteína terapéutica, una proteína de diagnóstico, una enzima industrial o una porción de la misma, y similares), y comprenden uno

: o más aminoácidos no naturales. Ejemplos de proteínas terapéuticas, de diagnóstico y otras proteínas que se pueden modificar para que comprendan una o más homoglutaminas, se pueden encontrar en, pero sin limitarse a, las de la solicitud internacional número WO 2004/094593, titulada "Expanding the Eukaryotic Genetic Code” y WO 2002/085923, titulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS". Ejemplos de proteínas terapéuticas, diagnósticas y otras proteínas que se puedan modificar para que comprendan una o más homogluatminas incluyen, pero no se limitan a,

p.: ej., alfa-1 antitripsina, angiostatina, factor antihemolítico, anticuerpos (más detalles sobre anticuerpos se encuentran más abajo), apolipoproteína, apoproteína, factor natriurético atrial, polipéptido natriurético atrial, péptidos atriales, quimioquinas C-X-C (p. ej., T39765, NAP-2, ENA-78, Gro-a, Gro-b, Gro-c, IP-10, GCP-2, NAP-4, SDF-1, PF4, MIG), calcitonina, quimioquinas CC (p. ej., proteína-1 quimioatrayente de monocitos, proteína-2 quimioatrayente de monocitos, proteína-3 quimioatrayente de monocitos, proteína-1 alfa inflamatoria de monocitos, proteína-1 beta inflamatoria de monocitos, RANTES, I309, R83915, R91733, HCC1, T58847, D31065,

T64262), ligando CD40, ligando C-kit, colágeno, factor estimulador de colonias (CSF), factor 5a de complemento, inhibidor de complemento, receptor 1 de complemento, citoquinas, (p. ej., péptido 78 activador de neutrófilos epiteliales, GRO/MGSA, GRO, GRO, MIP-1, MIP-1 ,MCP1), factor de crecimiento epidérmico (EGF), eritropoietina("EPO"), toxinas exfoliantes A y B, Factor IX, Factor VII, Factor VIII, Factor X, factor de crecimiento de fibroblastos (FGF), fibrinógeno, fibronectina, G-CSF, GMCSF, glucocerebrosidasa, gonadotropina, factores de crecimiento, proteínas Hedgehog (p. ej., Sonic, Indian, Desert), hemoglobina, factor de crecimiento de hepatocitos (HGF), hirudina, albúmina de suero humano, insulina, factor de crecimiento similar a insulina (IGF), interferones (p. ej., IFN-, IFN-, IFN), interleuquinas (p. ej., IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, JL-7, IL-8, IL-9, IL-10, IL-11, IL-12, etc.), factor de crecimiento de queratinocitos (KGF), lactoferrina, factor inhibidor de leucemia, luciferasa, neurturina, factor inhibidor de neutrófilos (NIF), oncostatina M, proteína osteogénica, hormona paratiroide, PD-ECSF, PDGF, hormonas peptídicas (p. ej., hormona de crecimiento humano), pleiotropina, proteína A, proteína G, exotoxinas pirogénicas A, B y C, relaxina, renina, SCF, receptor I de complemento soluble, I-CAM 1 soluble, receptores solubles de interleuquina (IL-1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12, 13,14, 15), receptor soluble de TNF, somatomedina, somatostatina, somatotropina, estreptoquinasa, superantígenos, es decir, enterotoxinas de Staphylococcus (SEA, SEB, SEC1, SEC2, SEC3, SED, SEE), Superóxido dismutasa (SOD), toxina del síndrome de shock tóxico (TSST-1), timosina alfa 1, activador de plasminógeno de tejido, factor beta de necrosis tumoral (TNF beta), receptor del factor de necrosis tumoral (TNFR), factor-alfa de necrosis tumoral (TNF alpha), factor de crecimiento del endotelio vascular (VEGEF), uroquinasa y muchas otras. [0176] Una clase de proteínas que se puede obtener usando las composiciones y los métodos para la incorporación in vivo de homoglutaminas descritos en este documento incluye moduladores de la transcripción o una parte de los mismos. Ejemplos de moduladores de la transcripción incluyen genes y proteínas moduladoras de la transcripción que modulan el crecimiento, la diferenciación, o la regulación celular o similares. Los moduladores de la transcripción se encuentran en procariotas, virus y eucariotas, incluyendo hongos, vegetales, levaduras, insectos y animales, incluyendo mamíferos, proporcionando una amplia serie de dianas terapéuticas. Se entenderá que los activadores de la expresión y de transcripción regulan la transcripción mediante muchos mecanismos, por ejemplo, uniéndose a receptores, estimulando una cascada de transducción de señales, regulando la expresión de factores de transcripción, uniéndose a promotores y potenciadores, uniéndose a proteínas que se unen a promotores y potenciadores, desenrollando el ADN, por corte y empalme del pre-ARNm, poliadenilando el ADN y degradando el ARN. [0177] Una clase de proteínas de la invención (por ejemplo, proteínas con una o más homoglutaminas) incluye activadores de expresión tales como citoquinas, moléculas inflamatorias, factores de crecimiento, sus receptores y productos oncogénicos, por ejemplo, interleucinas (por ejemplo, IL-1, IL-2, IL-8, etc.), interferones, FGF, IGF-I, IGF-II, FGF, PDGF, TNF, TGF- TGF-, EGF, KGF, SCF/c-Kit, CD40L/CD40, VLA-4/VCAM-1, ICAM-1/LFA-1 e hialurina/CD44; moléculas de transducción de señales y productos oncogénicos correspondientes, por ejemplo, Mos, Ras, Raf y Met; y activadores y supresores de la transcripción, por ejemplo, p53, Tat, Fos, Myc, Jun, Myb, Rel y receptores de hormonas esteroideas tales como los receptores de estrógenos, progesterona, testosterona, aldosterona, el ligando del receptor de LDL y corticosterona. [0178] La invención también proporciona enzimas (por ejemplo, enzimas industriales) o partes de las mismas con al menos una homoglutamina. Los ejemplos de enzimas incluyen, pero no se limitan a, por ejemplo, amidasas, aminoácido racemasas, acilasas, deshalogenasas, dioxigenasas, diarilpropano peroxidasas, epimerasas, epóxido hidrolasas, esterasas, isomerasas, quinasas, glucosa isomerasas, glicosidasas, glicosil transferasas, haloperoxidasas, monooxigenasas (por ejemplo, p450), lipasas, lignina peroxidasas, nitrilo hidratasas, nitrilasas, proteasas, fosfatasas, subtilisinas, transaminasas y nucleasas. [0179] Muchas de estas proteínas están disponibles en el mercado (véase, por ejemplo, el catálogo y la lista de precios de Sigma BioSciences 2003) y las secuencias de proteínas y genes correspondientes y, típicamente, muchas variantes de las mismas son bien conocidas (véase, por ejemplo, Genbank). Cualquiera de ellas se puede modificar mediante la inserción de una o más homoglutaminas u otros aminoácidos no naturales de acuerdo con la invención, por ejemplo, para alterar la proteína con respecto a una o más propiedades terapéuticas, de diagnóstico o enzimáticas de interés. Los ejemplos de propiedades terapéuticamente pertinentes incluyen la vida media sérica, vida media de almacenamiento, estabilidad, inmunogenicidad, actividad terapéutica, detectabilidad (por ejemplo, mediante la inclusión de grupos indicadores (por ejemplo, marcadores o sitios de unión a marcadores) en los aminoácidos no naturales, por ejemplo, homoglutaminas), reducción de DL50 u otros efectos secundarios, capacidad de entrar en el cuerpo a través del tracto gástrico (por ejemplo, disponibilidad oral) o similares. Los ejemplos de las propiedades de diagnóstico incluyen vida media en almacenamiento, estabilidad, actividad de diagnóstico, detectabilidad o similares. Los ejemplos de propiedades enzimáticas pertinentes incluyen vida media en almacenamiento, estabilidad, actividad enzimática, capacidad de producción o similares. [0180] También se puede modificar una diversidad de proteínas diferentes para incluir una o más homoglutaminas u otro aminoácido no natural de la invención. Por ejemplo, la invención puede incluir sustituir uno o más aminoácidos naturales en una o más proteínas de vacuna con una homoglutamina, por ejemplo, en proteínas de hongos infecciosos, por ejemplo, Aspergillus, especie de Candida; bacterias, particularmente E. coli, que sirve como modelo para bacterias patógenas, así como bacterias médicamente importantes tales como Staphylococci (por ejemplo, aureus) o Streptococci (por ejemplo, pneumoniae); protozoos tales como esporozoos (por ejemplo, Plasmodia), rizópodos (por ejemplo, Entamoeba) y flagelados (Trypanosoma, Leishmania, Trichomonas, Giardia, etc.); virus tales como virus de ARN (+) (los ejemplos incluyen Poxvirus, por ejemplo, vaccinia; Picornavirus, por ejemplo, polio; Togavirus, por ejemplo, rubella; Flavivirus, por ejemplo, VCH; y Coronavirus), virus de ARN (-) (por ejemplo, Rhabdovirus, por ejemplo, VSV; Paramixovirus, por ejemplo, RSV; Orthomyxovirus, por ejemplo, influenza; Bunyavirus; y Arenavirus), virus ADNbc (por ejemplo, Reovirus), virus de ARN a ADN, es decir, Retrovirus, por ejemplo, VIH y HTLV, y determinados virus de ADN a ARN tales como el virus de la Hepatitis B. [0181] Las proteínas relacionadas con la agricultura tales como las proteínas de resistencia a insectos (por ejemplo, las proteínas Cry), enzimas de producción de almidón y lípidos, toxinas de plantas e insectos, proteínas de resistencia a toxinas, proteínas de detoxificación de micotoxina, enzimas de crecimiento de plantas (por ejemplo, Ribulosa 1,5-Bisfosfato Carboxilasa/Oxigenasa, "RUBISCO"), lipoxigenasa (LOX) y Fosfoenolpiruvato (PEP) carboxilasa son también dianas apropiadas para la modificación con homoglutamina o con otro aminoácido no natural.

[0182] En determinadas realizaciones, la proteína o el polipéptido de interés (o parte de los mismos) en los métodos y/o las composiciones de la invención están codificados por un ácido nucleico. Típicamente, el ácido nucleico comprende al menos un codón selector, al menos dos codones selectores, al menos tres codones selectores, al menos cuatro codones selectores, al menos cinco codones selectores, al menos seis codones selectores, al menos siete codones selectores, al menos ocho codones selectores, al menos nueve codones selectores, diez o más codones selectores. [0183] Los genes que codifican proteínas o polipéptidos de interés se pueden mutar usando métodos bien conocidos por los expertos en la materia y descritos en este documento en "Mutagénesis y otras Técnicas de Biología Molecular" para incluir, por ejemplo, uno o más codones selectores para la incorporación de una homoglutamina. Por ejemplo, se muta un ácido nucleico para una proteína de interés con el fin de que incluya uno o más codones selectores, asegurando la inserción de la una o más homoglutaminas. La invención incluye cualquiera de dichas variantes, por ejemplo, mutantes, versiones de cualquier proteína, por ejemplo, que incluye al menos una homoglutamina. De forma similar, la invención también incluye ácidos nucleicos correspondientes, es decir, cualquier ácido nucleico con uno o más codones selectores que codifique una o más homoglutaminas. [0184] Para fabricar una proteína que incluye una homoglutamina se pueden usar células y organismos hospedadores que estén adaptados para la incorporación in vivo de la homoglutamina mediante pares ortogonales de ARNt/RS. Las células hospedadoras se crean mediante ingeniería genética (por ejemplo, se transforman, transducen o transfectan) con uno o más vectores que expresan el ARNt ortogonal, la ARNt sintetasa ortogonal y un vector que codifica la proteína que se tiene que derivatizar. Estos componentes pueden estar en el mismo vector o cada uno puede estar en un vector separado, o los dos componentes pueden estar en un vector y el tercer componente en un segundo vector. El vector puede estar, por ejemplo, en forma de un plásmido, una bacteria, un virus, un polinucleótido desnudo o un polinucleótido conjugado.

Definición de Polipéptidos mediante Inmunorreactividad

[0185] Como los polipéptidos de la invención proporcionan una diversidad de nuevas secuencias polipeptídicas (comprendiendo, por ejemplo, homoglutaminas en el caso de proteínas sintetizadas en los sistemas de traducción de este documento o, por ejemplo, en el caso de las nuevas sintetasas, nuevas secuencias de aminoácidos convencionales), los polipéptidos también proporcionan nuevas características estructurales que se pueden reconocer, por ejemplo, en ensayos inmunológicos. La generación de antisueros que se unen específicamente a los polipéptidos de la invención, así como los polipéptidos que se unen por dichos antisueros, constituyen una característica de la invención. El término "anticuerpo", como se usa en este documento, incluye, pero no se limita a, un polipéptido codificado sustancialmente por un gen de inmunoglobulina o genes de inmunoglobulina o fragmentos de los mismos que se unen específicamente y reconocen un analito (antígeno). Los ejemplos incluyen anticuerpos policlonales, monoclonales, quiméricos, de cadena única y similares. Los fragmentos de inmunoglobulinas, incluyendo fragmentos Fab y fragmentos producidos mediante una biblioteca de expresión, incluyendo presentación en fagos, también están incluidos en el término "anticuerpo" como se usa en este documento. Véase, por ejemplo, en Paul, Fundamental Immunology, 4ª Ed. 1999, Raven Press, New York, la estructura y terminología de anticuerpos. [0186] Con el fin de producir los antisueros para uso en un inmunoensayo, se producen uno o más polipéptidos inmunogénicos y se purifican según se describe en el presente documento. Por ejemplo, la proteína recombinante se puede producir en una célula recombinante. Una cepa innata de ratón (usada en este ensayo ya que los resultados son más reproducibles debido a la identidad genética virtual del ratón) se inmuniza con la(s) proteína(s) inmunogénica(s) en combinación con un adyuvante estándar, tal como adyuvante de Freund, y un protocolo de inmunización de ratón estándar (véase, p. ej., Harlow y Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York, para una descripción estándar de generación de anticuerpos, formatos de inmunoensayo y condiciones que se pueden usar para determinar la inmunorreactividad específica. Detalles adicionales sobre proteínas, anticuerpos, antisueros, etc. se pueden encontrar en WO 2004/094593, titulada “Expading the Eukaryotic Genetic Code”; WO 2002/085923, titulada "IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”; WO 2004/035605 titulada "Glycoprotein synthesis” presentada el 16 de enero de 2003.

USO DE O-ARNt Y O-RS Y PARES DE O-ARNt/O-RS

[0187] Las composiciones de la invención y las composiciones obtenidas mediante los métodos de la invención están opcionalmente en una célula. Los pares de O-ARNt/O-RS o componentes individuales de la invención se pueden usar después en la maquinaria de traducción del sistema de un hospedador dando como resultado la incorporación de una homoglutamina en una proteína. La solicitud de patente "In vivo Incorporation of Unnatural Amino Acids", documento WO 2002/085923 de Schultz, et al. describe este proceso. Por ejemplo, cuando se introduce un par de O-ARNt/O-RS en un hospedador, por ejemplo, Escherichia coli, el par conduce a la incorporación in vivo de una homoglutamina que se puede añadir de forma exógena al medio de crecimiento, en una proteína, por ejemplo, mioglobina o una proteína terapéutica, en respuesta a un codón selector, por ejemplo, un codón sin sentido ámbar. Opcionalmente, las composiciones de la invención pueden estar en un sistema de traducción in vitro o en un sistema o sistemas in vivo. Se pueden usar proteínas con la homoglutamina como proteínas terapéuticas y se pueden usar para facilitar estudios de la estructura de la proteína, interacciones con otra proteína, procesos de transferencia de electrones en proteínas y similares.

KITS

[0188] Los kits también son una característica de la invención. Por ejemplo, se proporciona un kit para producir una proteína que comprende al menos una homoglutamina en una célula, donde el kit incluye un recipiente que contiene una secuencia polinucleotídica que codifica un O-ARNt y/o un O-ARNt y/o una secuencia polinucleotídica que codifica una O-RS y/o una ORS. En una realización, el kit incluye adicionalmente una homoglutamina. En otra realización, el kit comprende adicionalmente materiales con instrucciones para traducir la proteína. Cualquier composición, sistema o dispositivo de la invención también se puede asociar a materiales de envasado apropiados (por ejemplo, recipientes, etc.) para la producción en forma de kit.

EJEMPLOS

[0189] Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar, la invención reivindicada. Los expertos en la materia reconocerán una diversidad de parámetros no críticos que se pueden alterar sin apartarse del alcance de la invención reivindicada.

EJEMPLO 1: PRODUCCIÓN DE UN PAR ORTOGONAL DE

SINTETASA/ARNt DERIVADO DE ARNtLYS ARCAICO

[0190] Se construyó un par ortogonal de sintetasa-ARNt a partir de la lisil-ARNt sintetasa de Pyrococcus horikoshii. Usando un ARNt supresor ámbar obtenido del consenso de un alineamiento de secuencia múltiple de secuencias de ARNtlys arcaico, se observó un 32% de supresión ámbar en ensayos de -galactosidasa. Como tal, este par es un sistema altamente eficaz para la incorporación selectiva de aminoácidos no naturales en una proteína en E. coli. [0191] La expansión del código genético de un organismo para que incluya aminoácidos adicionales más allá de los veinte comunes requiere un mínimo de dos genes nuevos: una aminoacil-ARNt sintetasa que active selectivamente el aminoácido no natural y no transfiera el aminoácido a ARNt endógenos; y un ARNt ortogonal afín que acepte el aminoácido no natural y que no haya sido cargado por sintetasas endógenas (Furter, (1998) Protein Sci., 7:419-426). Además, el ARNt suministra el aminoácido en respuesta a un codón no codificante, por ejemplo, un codón sin sentido o de desplazamiento del marco de lectura. Se han identificado variantes de un par de tirosil ARNt-sintetasa de Methanococcus jannaschii y ARNt supresor ámbar afín (Wang et al., (2000) J. Am. Chem. Soc, 122:5010-5011; Wang et al., (2001) Science, 292:498-500) que cumplen estos criterios y se han usado para incorporar de forma eficaz una diversidad de aminoácidos no naturales, incluyendo aminoácidos que contienen ceto (Wang et al., (2003) Proc. Natl. Acad. Sci. U. S. A., 100:56-61) y foto-entrecruzamiento, en proteínas en E. coli con alta fidelidad (Chin et al., (2002) Proc. Natl. Acad. Sci. U. S. A., 99:11020-11024; Chin y Schultz, (2002) ChemBioChem, 3:1135-1137). La ampliación del alcance y número de aminoácidos no naturales que se pueden codificar genéticamente usará probablemente nuevos pares ortogonales de sintetasa-ARNt y nuevos codones para codificarlos (Magliery et al., (2001) J. Mol. Biol., 307: 755-769; Anderson et al., (2002) Chem. Biol., 9:237-244). [0192] Recientemente se ha realizado un nuevo enfoque para construir un par ortogonal obtenido a partir de la leucil-ARNt sintetasa de Methanobacterium thermoautotrophicum y ARNt supresores ámbar, ópalo y de cuatro bases ortogonales afines obtenidos de Halobacterium sp. NRC-1 (Anderson y Schultz, (2003) Biochemistry, 42(32):9598-608). El diseño de estos ARNt supresores a partir de la secuencia consenso de un alineamiento de secuencia múltiple de leucil-ARNt arcaico proporcionó supresores de desplazamiento del marco de lectura y ópalo ortogonales eficaces. Los ARNt supresores ortogonales robustos tenían bucles anticodón CU(X)XXXAA (donde (X)XXX es la secuencia complementaria inversa del codón) y sin bases desapareadas en regiones de tallo. Se describe ahora el uso de esta estrategia de "supresor consenso" en el diseño racional de un par de sintetasa-ARNt ortogonal eficaz obtenido a partir de secuencias de ARNtLys arcaico y la lisil-ARNt sintetasa del Pyrococcus horikoshii arcaico. [0193] Este par de ARNt/sintetasa tiene varias características atractivas para la construcción de un par supresor ortogonal en E. coli. Un ARNt ortogonal para usar en E. coli no debe tener reacción cruzada con aminoacil-ARNt sintetasas de E. coli. Sin tener en cuenta la similitud entre las secuencias de ARNtLys de procariotas y organismos arcaicos, la base discriminadora 73 es A en procariotas y G en organismos arcaicos (Ibba et al., (1999) Proc. Natl. Acad. Sci. U. S. A., 96:418-423), lo cual evita que el ARNtLys arcaico sirva como sustrato para sintetasas de E. coli. De hecho, se observó que los lisados celulares totales de E. coli acilan mal el ARNt del Halobacterium cutirucum arcaico (Kwok y Wong, (1980) Can. J. Biochem., 58:213-218). Para construir ARNt supresores se permiten cambios en la secuencia del anticodón sin afectar de forma adversa a la actividad de aminoacilación. Los estudios de reconocimiento del ARNt por la lisil-ARNt sintetasa del Pyrococcus horikoshii arcaico (PhKRS) (Terada et al., (2002) Nat. Struct. Biol., 9:257-262) mostraron que el anticodón se puede alterar sin afectar al reconocimiento del ARNt. Por lo tanto, es probable que se puedan construir ARNt supresores para codones tales como el codón sin sentido ámbar, UAG, a partir de estos ARNt. Finalmente, la estructura de cristal de la lisil-ARNt sintetasa de tipo I arcaica, PhKRS, está disponible (Terada et al., (2002) Nat. Struct. Biol., 9:257-262) para facilitar cambios en la especificidad de aminoácido de la aminoacil-ARNt sintetasa.

[0194] Para determinar si la PhKRS es ortogonal en E. coli, fue útil demostrar que la sintetasa no carga el ARNt de E. coli con ningún alcance significativo. El gen para la PhKRS se amplificó mediante PCR a partir de ADN genómico, se insertó en el plásmido pBAD-Myc/HisA (Invitrogen) y se sobreexpresó. La proteína PhKRS resultante se purificó hasta homogeneidad. Se realizaron ensayos de aminoacilación en ARNt completo de Halobacterium sp. NRC-1 o E. coli. Las secuencias de los ARNtLys de Halobacterium sp. NRC-1 y Pyrococcus horikoshii son altamente homólogas (Figura 1). Se anticipó, por tanto, que el ARNt de halobacteria se carga fácilmente mediante la PhKRS. De hecho, la PhKRS carga una cantidad 14 veces mayor de ARNt de halobacteria completo que de ARNt de E. coli completo en 20 minutos (Figura 2; [ARNt] 10 M). Aunque la PhKRS es capaz de cargar débilmente el ARNt de E. coli, la velocidad es 28 veces menor que la actividad de la sintetasa de E. coli con respecto a la misma concentración de ARNt de E. coli completo y solamente 7 veces superior a la carga de fondo. Además, la sintetasa arcaica altamente homóloga de M. maripaludis solamente podría complementar débilmente un doble mutante lysS/lysU deficiente en lisil-ARNt sintetasa de E. coli (Ibba et al., (1999) Proc. Natl. Acad. Sci. U. S. A., 96:418-423). Por lo tanto, probablemente, la PhKRS compite poco con sintetasas de E. coli endógenas para cargar ARNt de E. coli in vivo. [0195] Para caracterizar adicionalmente la ortogonalidad de la PhKRS, se intentó insertar el gen de la PhKRS en el vector de expresión constitutivo pKQ. Este plásmido contiene el sitio de unión a ribosomas, sitio de clonación múltiple y el terminador rrnB del plásmido pBAD-Myc/HisA (Invitrogen) bajo el control del promotor de glutamina constitutivo. El plásmido también contiene un origen de replicación ColEI y un marcador de selección de resistencia a kanamicina para el mantenimiento del plásmido. Desafortunadamente, el gen de la PhKRS de tipo salvaje parecía ser tóxico cuando se expresó de forma constitutiva. Sin embargo, se identificó un mutante E444G casual (plásmido pKQ-PhE444G) que mostró toxicidad reducida cuando se expresó en E. coli. No se ha establecido el mecanismo mediante el cual la mutación E444G mitiga la toxicidad aparente en este sistema. Una posibilidad es que la mutación evite la carga errónea interespecie de bajo nivel de ARNt de E. coli observada in vitro. [0196] La siguiente etapa implicó la construcción de un ARNt supresor sin sentido que se podría cargar por PhKRS. Los determinantes de unión a anticodón débiles observados para la PhKRS sugieren que la enzima debería aceptar ARNt con una diversidad de secuencias de anticodón (Terada et al., (2002) Nat. Struct. Biol., 9:257-262). Ya que la supresión ámbar es la forma de supresión mejor caracterizada y más eficaz en E. coli (Anderson et al., (2002) Chem. Biol., 9:237-244), se construyó un ARNt supresor ámbar arcaico ortogonal, AKCUA, a partir de la secuencia consenso (Anderson y Schultz, (2003) Biochemistry, 42(32):9598-608). Se realizó un alineamiento de secuencia múltiple de todas las secuencias de ARNtLys arcaico a partir de secuencias genómicas disponibles usando el programa GCG pileup (Figura 1). Se determinó la secuencia consenso de los ARNt alineados y se generó una representación en hoja de trébol (Figura 3). Después se inspeccionó la secuencia para determinar la presencia de pares de bases no canónicos o desemparejamientos de bases en regiones de tallo, que se había observado que reducen la eficacia supresora (Hou et al., (1992) Biochemistry, 31:4157-4160). No había tales pares erróneos en la secuencia consenso de ARNtLys. Después, el bucle anticodón se cambió a CUCUAAA ya que se ha observado que esta secuencia es óptima para supresión ámbar (Yarus et al., (1986) J. Mol. Biol., 192:235-255). Se construyó la secuencia de ARNt diseñada mediante la extensión solapante de oligonucleótidos sintéticos (Genosys) y se insertó entre los sitios de restricción EcoRI y PstI del plásmido pACGFP (Magliery et al., (2001) J. Mol. Biol., 307:755-769) bajo el control del promotor fuerte constitutivo Ipp. El plásmido resultante, pAC-AKCUA, también contiene el origen de replicación p15A y un marcador selección de resistencia a cloranfenicol. [0197] Para examinar la eficacia de supresión de este par potencial de sintetasa-ARNt ortogonal se co-transformaron células E. coli de GeneHogs (Invitrogen) con pKQ-PhE444G, pAC-AKCUA y un plásmido indicador lacZ, pLASC-lacZ(TAG) (Anderson y Schultz, (2003) Biochemistry, 42(32):9598608). Este plásmido, obtenido a partir de pSC101, contiene un marcador de selección de resistencia a ampicilina y el gen lacZ que codifica la galactosidasa bajo el control del promotor Ipp. Hay un codón ámbar en un sitio permisivo, residuo 25, del gen lacZ, que provoca terminación prematura. En ausencia de un ARNt supresor ámbar, las células que alojan pLASClacZ(TAG) solamente tienen un 0,17% de la actividad -galactosidasa observada para el plásmido pLASC-lacZ(Lys) que contiene un codón con sentido AAA (lisina) en la posición 25 y actividad solamente 2 veces mayor que células que no contienen plásmidos. Si las sintetasas de E. coli endógenas no son capaces de cargar AKCUA se debería observar poca supresión ámbar cuando el ARNt se co-expresa con pLASC-lacZ(TAG). Se observa solamente un 1,7% de supresión (con respecto a la expresión de lacZ(lys)) para células que alojan pAC-AKCUA y pLASC-lacZ(TAG). Si la PhKRS es capaz de cargar el ARNt ortogonal, entonces se debería observar un nivel mayor de supresión ámbar cuando se introduce en el sistema el plásmido pKQ-PhE444G. De hecho, se observa un 32% de supresión. En comparación, el par ortogonal de tirosina sintetasa-ARNt obtenido de M. jannaschii que se ha descrito previamente para E. coli muestra una eficacia de supresión del 18,5% en presencia de la sintetasa afín y un 0,2% de supresión en ausencia de la sintetasa. El par ortogonal ámbar de leucina obtenido de M. thermoautotrophicum produce un 33,2% y un 1,5% de supresión con y sin la sintetasa afín, respectivamente (Anderson y Schultz, (2003) Biochemistry, 42(32):9598-608). [0198] En este ejemplo se ha identificado la lisil-ARNt sintetasa de tipo I y un ARNt supresor ámbar obtenido a partir del alineamiento de secuencia múltiple de secuencias de ARNtLys arcaico como un par ortogonal de sintetasa-ARNt para la incorporación específica de sitio de aminoácidos no naturales en E. coli. La alta eficacia (un 32% de supresión) observada para el par PhKRS/AKCUA demuestra la eficacia de la estrategia de secuencia consenso para la construcción de ARNt supresores ortogonales eficaces.

EJEMPLO 2: SUPRESIÓN DE DESPLAZAMIENTO DEL MARCO DE LECTURA CON UN AMINOÁCIDO NO NATURAL QUE ELIMINA LA TOXICIDAD DE PHKRS

[0199] Se ha desarrollado un par ortogonal de ARNt-sintetasa obtenido a partir de la lisil-ARNt sintetasa de tipo I de Pyrococcus horikoshii para usar en E. coli. La parte de ARNt del sistema funciona muy bien como un supresor ámbar ortogonal. El plásmido de expresión de sintetasa pKQPhE444G fue capaz de cargar este ARNt, pero todavía se observaron efectos de toxicidad. Cuando se expresaron solas, las células que alojaban pKQ-PhE444G crecieron hasta un 56% de la densidad observada para células sin plásmido. Los plásmidos indicadores pAC-AKCUA y pAC-AKCUA también mostraron toxicidad moderada, creciendo hasta un 71% y un 52%. Cuando el pKQ-PhE444G se cotransforma con el plásmido pAC-AKCUA, la densidad celular disminuye hasta el 17%. Además, las células alcanzan una densidad de solamente un 5% cuando se co-expresan con el plásmido indicador de -lactamasa pAC-AKCUA (un derivado del plásmido pACKOA184TAG). Por lo tanto, está claro que hay toxicidad tanto con el ARNt como con la sintetasa en este sistema. Además, parece ser que hay un efecto sinérgico en el que las células cotransformadas con ambos plásmidos disminuyen espectacularmente su viabilidad. Para abordar esta cuestión, se buscó un mutante menos tóxico de PhKRS. [0200] Se pensó que mutaciones puntuales u otras mutaciones en PhKRS podrían reducir la toxicidad de la sintetasa mientras que se conserva la actividad de carga. Por lo tanto, pKQ-PhE444G se transformó en células XL1-red químicamente competentes (Stratagene) y las células se sembraron en placas LB-agar que contenían 25 g/ml de kanamicina. Esta cepa tiene varias mutaciones genómicas que provocan una alta tasa de mutagénesis en plásmidos transformados. Se rasparon aproximadamente 100 colonias de esta placa y se amplificaron en 25 ml de medio líquido LB suplementado con kanamicina. Se pensó que los mutantes no tóxicos de pKQ-PhE444G crecerían más rápidamente que el tipo salvaje y cultivos seriados de las células conducirían a la acumulación de estos mutantes. Después de 2 cultivos en serie con dilución de factor 10000 en cada etapa, las células se sometieron a minipreparaciones y se introdujeron en células Genehog que contenían el plásmido pAC-AKCUA y se sembraron en placas de LB-agar que contenían 25 g/ml cada una de kanamicina y cloranfenicol y diversas concentraciones de ampicilina. Más del 90% de las células transformadas no mostraron toxicidad aparente y fueron capaces de sobrevivir en placas de LB-agar que contenían 1000 g/ml de ampicilina. Se observaron colonias menores incluso con 1500 g/ml de ampicilina indicando supresión ámbar eficaz. Una sintetasa mutante, denominada pKQ-PhKep, se aisló y caracterizó mediante mapeo por restricción y secuenciación del marco de lectura abierto de PhKRS. El gen mutante contiene una inserción de 778 pb detrás del residuo S357, pero por otra parte es la misma secuencia que el plásmido pKQ-PhE444G. Una búsqueda BLAST mostró que esta inserción es homóloga a una secuencia anotada como "insAcp1" del plásmido p1658/97, pero no se ha observado otra mención de esta secuencia en la bibliografía y se desconoce el origen de esta secuencia. Cuando se traduce a partir del codón de inicio de PhKRS, el producto previsto de este gen está truncado 6 aminoácidos cadena abajo de S357. Para ensayar si el truncamiento de PhKRS fue responsable de la eliminación de la toxicidad, se sintetizó el cebador CA510R con la secuencia 5'CAGTGGAATTCAGTAAGTTGGCAGCATCAC-3' para construir de forma explícita el mutante de truncamiento en el plásmido pKQ. Se amplificó el plásmido pKQ-PhKep mediante PCR con CA279 y CA510R, y el producto se subclonó en los sitios NcoI y EcoRI del plásmido pKQ. El plásmido resultante, pKQ-PhAD (también conocido como pKQ-Ph510), se usó cotransformó con el plásmido pAC-AKCUA y se observó que las transformaciones resultantes tienen una CI50 similar a células transformadas con pKQ-PhKep y no tienen toxicidad aparente. [0201] Parece ser que el truncamiento detrás del residuo S357 deleciona el dominio de unión a anticodón de PhKRS, y se quiso examinar cómo afecta esa deleción a las propiedades de reconocimiento de ARNt de la sintetasa. Por lo tanto, se sobre-expresó sintetasa para realizar ensayos de aminoacilación in vitro. El gen se amplificó mediante PCR a partir de pKQ-PhKep con CA279 y CA511 (5'CATTGGAATTCGAGTAAGTTGGCAGCATCAC-3') y se subclonó en los sitios NcoIy EcoRI de pBAD-Myc/HisA en el marco con el marcador C-terminal Myc/His. Se purificó la proteína mediante cromatografía Ni-NTA.

EJEMPLO 3: EXPANSIÓN DEL CÓDIGO GENÉTICO CON CODONES DE CUATRO BASES Y AMINOÁCIDOS NO NATURALES

[0202] Aunque, con pocas excepciones, los códigos genéticos de todos los organismos conocidos codifican los mismos veinte aminoácidos, todo lo que se requiere para añadir un nuevo bloque de construcción es un único par de ARNt/aminoacil-ARNt sintetasa, una fuente del aminoácido y un codón único que especifique el aminoácido (Wang et al., (2001) Expanding the genetic code. Science 292:498-500). Previamente se ha demostrado que el codón sin sentido ámbar, TAG, junto con pares de ARNt/sintetasa ortogonales de

M. jannaschii y E. coli, se puede usar para codificar genéticamente una diversidad de aminoácidos con nuevas propiedades en E. coli (Wang et al., (2003) Addition of the keto functional group to the genetic code of Escherichia coli. Proc. Natl. Acad. Sci. U. S. A. 100:56-61; Santoro et al., (2002) An efficient system for the evolution of aminoacil-ARNt synthetase specificity. Nat. Biotechnol. 20:1044-8; Chin et al., (2002) Addition of a photocrosslinking amino acid to the genetic code of Escherichia coli. Proc. Natl. Acad. Sci. U. S. A. 99:11020-11024; Mehl et al. (2003) Generation of a bacterium with a 21 amino acid genetic code. J. Am. Chem. Soc. 125:935-9), y levadura (Chin et al. (2003) An expanded eukaryotic genetic code. Science 301:964-7), respectivamente. El número limitado de codones triplete no codificantes, sin embargo, restringe en gran medida el número final de aminoácidos codificados por cualquier organismo. En este documento se describe la generación de un nuevo par ortogonal de sintetasa/ARNt procedente de secuencias de ARNtLys arcaico que incorpora de forma eficaz y de forma selectiva el aminoácido homoglutamina (hGIn) en mioglobina en respuesta al codón de cuatro bases AGGA. La supresión del desplazamiento del marco de lectura con hGIn no afecta de forma significativa al rendimiento de la proteína ni a las velocidades de crecimiento celular, y se demostró que es mutuamente ortogonal con la supresión de TAG. Este trabajo sugiere que ni el número de codones de triplete disponibles ni la propia maquinaria de traducción representan una barrera significativa para la expansión adicional del código. [0203] Hay muchos ejemplos de supresores del desplazamiento del marco de lectura +1 de origen natural incluyendo supresores UAGN (N= A, G, C o T) procedentes de Su7 que codifica glutamina (Curran y Yarus (1987) Reading frame selection and transfer RNA anticodon loop stacking. Science 238:1545-50), supresores obtenidos de sufJ de codones ACCN que codifican treonina (Bossi y Roth (1981) Four-base codons ACCA, ACCU and ACCC are recognized by frameshift suppressor sufJ. Cell 25: 489-96), y supresores CAAA obtenidos de ARNtLys y ARNtGln (O'Connor (2002) Insertions in the anticodon loop of ARNt(1)(Gln)(sufG) and ARNt(Lys) promote quadruplet decoding of CAAA. Nucleic Acids Res. 30:1985-1990). Además, se han usado selecciones genéticas para identificar ARNt supresores de codones de cuatro y cinco bases eficaces a partir de grandes bibliotecas de ARNt mutantes, incluyendo un supresor de Ser de E.

ARNtUCCU

coli (Magliery et al., (2001) Expanding the genetic code: selection of efficient suppressors of four-base codons and identification of "shifty" four-base codons with a library approach in Escherichia coli. J. Mol. Biol. 307:755-769; Anderson et al., (2002) Exploring the limits of codon and anticodon size. Chem. Biol. 9:237-244; Hohsaka et al., (1999) lncorporation of two nonnatural amino acids into proteins through extension of the genetic code. Nucleic Acids Symp. Ser. 42:79-80; Hohsaka et al., (2001) Five-base codons for incorporation of nonnatural amino acids into proteins. Nucleic Acids Res. 29:3646-51; Hohsaka y Sisido (2002) Incorporation of non-natural amino acids into proteins. Curr. Opin. Chem. Biol. 6:809-15). [0204] Para codificar aminoácidos no naturales con codones cuadruplete in vivo, se tiene que generar un ARNt que reconozca de forma única este codón y una sintetasa correspondiente que aminoacile de forma única solamente este ARNt con el aminoácido no natural de interés. Ya que el bucle anticodón del ARNt supresor ámbar ortogonal de M. jannaschii generado previamente es un elemento clave de reconocimiento para la sintetasa afín, JYRS, fue difícil manipular genéticamente este ARNt para decodificar un codón de cuatro bases. Aunque es posible relajar la especificidad de unión al anticodón de la JYRS, probablemente sería difícil construir pares mutuamente ortogonales que distinguieran supresores ámbar y de cuatro bases usando exclusivamente la secuencia de anticodón. Por lo tanto, un sistema que permite la incorporación simultánea de dos aminoácidos no naturales en un polipéptido se conseguiría probablemente usando dos pares ortogonales de diferente origen, necesitando el desarrollo de un nuevo par de ARNt-sintetasa ortogonal. [0205] Inicialmente, se centró la atención en el par de lisil sintetasa/ARNt de Pyrococcus horikoshii arcaico (PhKRS) como un candidato de par ortogonal ya que 1) este par probablemente es ortogonal debido a la conservación de A73 en procariotas y G73 en organismos arcaicos (Ibba et al. (1999) Substrate recognition by class I lisil-ARNt synthetases: a molecular basis for gene displacement. Proc. Natl. Acad. Sci. U. S. A. 96:418-423), 2) PhKRS es tolerante a sustituciones en el bucle anticodón de ARNt permitiendo la carga de ARNt supresores (Terada et al. (2002) Functional convergence of two lisil-ARNt synthetases with unrelated topologies. Nat. Struct. Biol. 9:257-262) y 3) la estructura de cristal de PhKRS está disponible (Terada et al. (2002) Functional convergence of two lisil-ARNt synthetases with unrelated topologies. Nat. Struct. Biol. 9:257-262) para facilitar cambios en la especificidad de aminoácido. Desafortunadamente, se ha observado que la PhKRS es tóxica para células E. coli cuando se expresaba de forma constitutiva. Sin embargo, el cultivo en serie en la cepa mutante XL1-red condujo al aislamiento de una variante no tóxica, PhAD, que está truncada 6 aminoácidos cadena abajo del residuo S357 debido a un elemento de inserción de 778 pb indicado como insAcp1. Así, el dominio de unión al bucle anticodón se ha delecionado minimizando adicionalmente cualquier pérdida de actividad que pudiera producirse a partir de la sustitución del bucle anticodón.

[0206] Como se señala con más detalle en el Ejemplo 1, para determinar si este mutante de truncamiento es funcional y ortogonal en E. coli, fue útil demostrar que la sintetasa no puede cargar el ARNt de E. coli con ningún alcance significativo, pero conserva actividad hacia ARNt arcaico afín. Se clonaron y sobre-expresaron genes para PhAD y EcKRS y se purificó la proteína hasta homogeneidad. Se ensayó la aminoacilación del ARNt completo de una arqueobacteria, Halobacterium sp. NRC-1 o E. coli. PhAD carga una cantidad mayor de ARNt de halobacteria completo que de ARNt de E. coli completo en 20 minutos (Figura 2; [ARNt] 10 M). Aunque PhAD es capaz de cargar débilmente el ARNt de E. coli, la velocidad es 28 veces menor que la actividad de la sintetasa de E. coli con respecto a la misma concentración de ARNt de E. coli completo y solamente 7 veces superior a la carga de fondo. Además, PhAD fue incapaz de complementar el crecimiento a 43ºC de la cepa PALSUTR(pMAKIysU) (Chen et al., (1994) Properties of the lisil-ARNt synthetase gene and product from the extreme thermophile Thermus thermophilus. J. Bacteriol. 176:2699-705), un doble mutante lysS/lysU deficiente en lisil-ARNt sintetasa de E. coli. Sin embargo, EcKRS (clonada del locus lysU de la cepa de E. coli HB101) produjo un crecimiento normal. Por lo tanto, PhAD es incapaz de sustituir a la EcKRS y probablemente competiría mal con sintetasas de E. coli endógenas para cargar ARNt de E. coli in vivo. [0207] Para demostrar que PhAD era funcional en E. coli, se usó un ensayo de supresión de -lactamasa con un ARNt supresor ámbar ortogonal para PhAD. Este enfoque también permitió usar los esquemas de selección desarrollados previamente para el par ortogonal de M. jannaschii. Se diseño un ARNtCUA (AKCUA) supresor usando una estrategia de supresor consenso descrita recientemente (Anderson y Schultz, P. G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-ARNt and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598-608). Se realizó un alineamiento de secuencia múltiple de todas las secuencias de ARNtLys arcaico de secuencias genómicas disponibles y se determinó una secuencia consenso. La secuencia del bucle anticodón se cambió a CUCUAAA para producir un ARNt supresor ámbar (Figura 1). Se sintetizó el gen para AKCUA y se insertó en el plásmido pACKO-A184TAG (Anderson y Schultz, P. G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-ARNt and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598608) para examinar la eficacia de supresión ámbar. Este plásmido contiene un gen para -lactamasa (bla) con un codón TAG en el sitio permisivo A184. Sin ARNt, la traducción no produce -lactamasa de longitud completa observable y produce sensibilidad a 5 g/ml de ampicilina. Cuando se expresó con AKCUA no se observó aumento en la resistencia a ampicilina, indicando que el ARNt no se había cargado mediante las sintetasas de E. coli. Cuando se co-expresó con PhAD, el ARNt ortogonal se cargó conduciendo a supresión ámbar eficaz y resistencia a 1000 g/ml de ampicilina. El par ortogonal de PhAD/AKCUA es, por lo tanto, un sistema de supresión ámbar eficaz y ortogonal. [0208] Previamente se demostró que el codón de cuatro bases AGGA se

Ser

puede suprimir de forma eficaz mediante un ARNtUCCU de E. coli. En este caso, la supresión del codón de cuatro bases compite con el codón raro AGG que puede contribuir a la eficacia y ausencia de toxicidad del ARNt supresor. Se diseñó un ARNt supresor de AGGA a partir de AKCUA cambiando el bucle anticodón a CUUCCUAA e insertándolo en el plásmido pACKO-A184AGGA. De forma similar a pACKO-A184TAG, este plásmido contiene un codón AGGA en la posición A184 dando como resultado la traducción interrumpida y resistencia a solamente 5 g/ml de ampicilina. Desafortunadamente, este ARNt ya no es ortogonal a sintetasas de E. coli. Las células que contienen el ARNt diseñado sobreviven a 200 g/ml de ampicilina tanto en ausencia como en presencia de PhAD. [0209] Para identificar variantes ortogonales se construyó una biblioteca en la que los últimos pares de cuatro bases del tallo aceptor, las posiciones 1-4 y 69-72, se aleatorizaron de forma simultánea (Anderson y Schultz, P. G. (2003) Adaptation of an Orthogonal Archaeal Leucyl-ARNt and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42: 9598608). Estos ARNt se co-expresaron con PhAD y las células se sometieron a dos rondas de selección con ampicilina a 200 g/ml dando como resultado un conjunto de ARNt supresores de AGGA activos. Para identificar variantes ortogonales, los plásmidos de ARNt se aislaron y se exploraron 384 clones individuales por sensibilidad a ampicilina en ausencia de PhAD. De éstos, el clon más eficaz y ortogonal es resistente a 700 g/ml de ampicilina en presencia de PhAD, pero sobrevive solamente a 5 g/ml en su ausencia. Este ARNt, AKUCCU, contiene múltiples sustituciones en el tallo aceptor y una mutación casual A37C de importancia desconocida (Figura 5). [0210] Para incorporar homoglutamina en respuesta a AGGA, a continuación fue útil alterar la especificidad de PhAD. Se seleccionó la

homoglutamina como una diana inicial para ensayar la fidelidad de una sintetasa modificada debido a su tamaño similar a lisina y a que tiene tanto propiedades donadoras como aceptadoras de enlaces de hidrógeno. Durante el examen de la estructura de cristal de PhKRS, solamente dos 5 residuos reconocen específicamente el grupo -amino de la lisina, E41 e Y268. Se aleatorizaron de forma simultánea mediante mutagénesis de saturación en la construcción de una pequeña biblioteca de sitio activo obtenida a partir de PhAD. Para identificar sintetasas específicas de hGln se usó un plásmido indicador de GFP, pREP2-AKCUA (Santoro et al., (2002) 10 An efficient system for the evolution of aminoacil-ARNt synthetase specificity. Nat. Biotechnol. 20:1044-8) que codifica el gen para AKCUA, un gen de ARNt polimerasa de T7 con dos codones TAG en las posiciones M1 y Q107, y GFPuv bajo el control de un promotor de T7. Cuando se cotransformaron con pREP2-AKCUA y PhAD, los codones ámbar en T7RNAP se suprimen 15 dando como resultado expresión de GFPuv y fluorescencia verde. En ausencia de la sintetasa, las células son blancas. Así, las células que alojan sintetasas activas se pueden identificar observando fluorescencia. Las células se co-transformaron con pREP2-AKCUA y después la biblioteca se sembró en placas que contenían hGln. Se aislaron colonias verdes 20 individuales y se dejaron crecer con y sin el aminoácido no natural para identificar clones cuya fluorescencia requería hGln. De 15 colonias exploradas, 5 mostraron una mayor fluorescencia en placas que contenían hGln. De éstas, todas excepto una conservaron una sustitución Y268S; la más selectiva de estas sintetasas, hGlnRS, tiene I41 y S268 y se caracterizó

25 adicionalmente. Los 5 mutantes correspondientes a las 5 colonias tenían los siguientes cambios de secuencia en comparación con PhAD:

Clon Y268 E41 (codón)

(codón) Clon 2 Ser(TCT) Val(GTT) Clon 3 Ser(TCG) Thr(ACG) Clon 4 Ser(AGT) Ser(AGT) Clon 5 Ser(TCG) Lle(ATT) Clon 6 Gly(GGT) Pro(CCG)

[0211] Después se expresó la proteína mioglobina con una mutación 30 Gly24AGGA usando el par ortogonal hGlnRS/AKTCCT para determinar si el fenotipo dependiente de hGln observado se producía a partir de la incorporación específica del aminoácido no natural. Después de la expresión del gen de mioglobina mutante en ausencia de hGlnRS no se produjo proteína detectable. Cuando se co-expresó con hGlnRS, se aislaron 1,8 mg/ml de mioglobina. En comparación, se produjeron 3,8 mg/ml de mioglobina después de la expresión del plásmido pBAD-JYAMB que contiene el gen de mioglobina de tipo salvaje. El análisis MALDI-TOF de fragmentos trípticos de la proteína purificada mostró un péptido de masa de 1676,85 Da coherente con la masa prevista de 1676,88 Da. No se observó evidencia de péptidos que contuvieran lisina o glutamina en la posición 24. Además se observó poca toxicidad durante la incorporación de hGIn en respuesta a AGGA. Durante el crecimiento semilogarítmico en las condiciones usadas para la expresión de mioglobina sin inducción con arabinosa, el tiempo de duplicación para células GeneHogs es el doble que el de células que incorporan hGIn. Esta reducción de la velocidad de crecimiento se observó tanto en presencia como en ausencia de hGIn indicando que la ligera toxicidad es el resultado de la expresión de sintetasa y ARNt en vez la supresión de AGGA. Por lo tanto, la reactividad cruzada del supresor AGGA con codones raros AGG no limita la aplicación práctica de la supresión del desplazamiento del marco de lectura. [0212] La expresión de mioglobina por supresión de AGGA para incorporar un residuo de hGIn se muestra en la Figura 7A. Esta figura proporciona una transferencia de Western sondada con un anticuerpo anti-His C-terminal. Se produjo proteína a partir del gen de la mioglobina con un codón AGGA en la posición G24 (Myo24AGGA) solamente en presencia de los tres componentes, ARNt AK514, hGlnRS (una variante específica de hGln de PhKRS) y hGIn (carriles 2-5). La expresión de mioglobina por supresión ámbar en la posición 75 (Myo75TAG) solamente fue posible con JYRS y su ARNt ámbar afín, demostrando la ortogonalidad mutua de los pares lisil y tirosil (carriles 6-9). [0213] También se investigó la posibilidad de usar el par PhAD/AKuccu en combinación con la tirosina sintetasa de M. jannaschii (JYRS) para la supresión simultánea de TAG y AGGA en un único polipéptido. Cuando se co-expresó con JYRS en el plásmido pBK-JYRS, pMyo-AKuccu no produce mioglobina detectable. Por lo tanto, JYRS es incapaz de cargar AKUCCU. Por el contrario, se intentó expresar mioglobina a partir del plásmido pBAD/JYAMB-4TAG cargándolo con PhAD. Este plásmido de expresión contiene el gen de mioglobina con un codón TAG en la posición 4 y un ARNtTyr ortogonal, J17 (Mehl et al. (2003) Generation of a bacterium with a 21 amino acid genetic code. J. Am. Chem. Soc. 125:935-9). La co-expresión con JYRS produce 3,8 mg/ml de mioglobina, pero no se observa proteína con PhAD. Por lo tanto, PhAD es incapaz de cargar J17. Así, estos pares de sintetasa/ARNt son mutuamente ortogonales y se podrían usar en combinación sin reactividad cruzada. [0214] Para la incorporación de dos aminoácidos no naturales en la mioglobina, se combinaron AKUCCU y J17 en un único plásmido expresando una mioglobina mutante con Gly24AGGA y Ala75TAG. Una sintetasa específica de O-Metil-L-tirosina (OMeYRS) (Chin et al., (2002) Addition of a photocrosslinking amino acid to the genetic code of Escherichia coli. Proc. Natl. Acad. Sci. U. S. A. 99:11020-11024) obtenida de JYRS y hGlnRS se combinó en un segundo plásmido. Cuando las células co-transformadas con ambos plásmidos se dejaron crecer en presencia de los dos aminoácidos, se produjeron 1,7 mg/l de mioglobina. No se produjo proteína cuando se excluyó alguno de los dos aminoácidos no naturales o las sintetasas. [0215] El uso simultáneo de dos sistemas de ARNt ortogonales para incorporar dos aminoácidos no naturales diferentes usando el sistema modelo de mioglobina se muestra en la Figura 7B. Esta figura proporciona una transferencia Western ensayada con un anticuerpo anti-His C-terminal. La proteína se expresó a partir de un gen de mioglobina que contenía un codón AGGA en la posición 24 y un codón TAG en la posición 75 (Myo24AGGA/75TAG) en presencia tanto de pares ortogonales lisil como tirosil. Se incorporó hGIn mediante supresión de AGGA en la posición 24, y se incorporó O-metil-tirosina (OMeTyr) mediante supresión ámbar en la posición 75 en un único polipéptido usando hGlnRS y OMeTyrRS. Como se muestra en la figura, un polipéptido solamente se produce cuando están presentes los dos aminoácidos no naturales, y además, solamente cuando están presentes tanto los sistemas ortogonales lisil como tirosil. [0216] Los resultados observados en las transferencias Western de las Figuras 7A y 7B se confirman adicionalmente en análisis proporcionados en las Figuras 8 y 9. La Figura 8 proporciona un análisis de desorción e ionización por láser asistida por matriz-tiempo de vuelo de fragmentos trípticos de la mioglobina de tipo salvaje (MyoWT; conteniendo probablemente lisina en la posición 24) y la mioglobina mutante (24AGGA; conteniendo probablemente hGIn) como se produce en la Figura 7A. Los análisis de estas especies de mioglobina se muestran en los paneles superior e inferior, respectivamente. El análisis mostró fragmentos peptídicos trípticos de la proteína purificada y mostró un péptido de masa 1676,85 Da coherente con la masa prevista de 1676,88 Da. No se observó evidencia de péptidos que contuvieran lisina (masa observada de 950,46 Da de la proteína expresada con PhKRS para el péptido escindido con tripsina y masa calculada de 950,53 ó 1.661,91 Da para el péptido de longitud completa) o glutamina en la posición 24 (masa calculada, 1661,87 Da). [0217] La Figura 9 proporciona un análisis de EM por electropulverización de la proteína doble mutante de longitud completa (producida en la Figura 7B). El análisis de EM mostró una masa 18.546,40 Ds (SD 0,11), coherente con la masa prevista de 18.546,60 (SD 0,81) para la mioglobina que contiene ambos aminoácidos no naturales, en comparación con la masa calculada 18.518,3 Da para mioglobina con las sustituciones G24K y A75Y. [0218] En resumen, se ha demostrado el uso de supresión de desplazamiento del marco de lectura para la incorporación específica de sitio de un aminoácido no natural in vivo. Además se ha demostrado la ortogonalidad mutua de esta lisil-ARNt sintetasa obtenida de P. horikoshii y un par ortogonal obtenido de la tirosil-ARNt sintetasa de M. jannaschii y se ha demostrado que se puede incorporar de forma simultánea dos aminoácidos no naturales en un único polipéptido. Debe ser posible identificar variantes de sintetasa que permitan la incorporación de asas reactivas mutuamente ortogonales o incluso aminoácidos fluoróforos. Con tales materiales es posible incorporar un par fluoróforo en un polipéptido para estudios FRET in vivo. De forma similar, es posible incorporar residuos diferentes de aminoácidos tales como -hidroxiácidos para la producción ribosómica de polímeros no naturales. Se pueden usar codones adicionales tales como CCCU o CUAG, que se suprimen de forma eficaz en E. coli. Como alternativa, se podría resintetizar el genoma de E. coli con degeneración limitada de codones, poniendo a disposición de este modo hasta 43 codones para la recodificación.

MATERIALES Y MÉTODOS

[0219] Clonación y expresión de genes de sintetasa: se preparó ADN genómico de P. horikoshii obtenido de la American Type Culture Collection (ATCC; 700860). PhKRS se amplificó mediante PCR y se clonó en los sitios Ncol y EcoRI del plásmido pBAD/Myc-HisA (Invitrogen) para la sobre-expresión. Para la expresión constitutiva, los genes de sintetasa se clonaron en pGLN y pKQ (Anderson y Schultz (2003) Adaptation of an Orthogonal Archaeal Leucyl-ARNt and Synthetase Pair for Four-base, Amber, and Opal Suppression. Biochemistry 42:9598-608) bajo el control del promotor de la glutamina. Estos plásmidos obtenidos de pBAD/Myc-HisA confieren resistencia a ampicilina y kanamicina, respectivamente. De forma similar, la EcKRS se clonó del locus lysU de la cepa de E. coli HB101. Se sobre-expresó proteína en medio 2YT mediante el protocolo descrito para el kit QIAexpressionist de Qiagen y después se dializó contra Tris-HCI 100 mM, pH 7,5; NaCI 100 mM; y glicerol al 10%. [0220] Ensayos de aminoacilación in vitro: se adquirió ARNt de E. coli completo en Roche y se extrajo el ARNt de halobacteria de cultivos Halobacterium sp. NRC-1 (ATCC; nº 700922) con el Kit de Extracción de ARN/ADN (Qiagen). Se realizaron ensayos en reacciones de 20 l que contenían Tris-HCI 50 mM, pH 7,5, KCI 30 mM, MgCI2 20 mM, glutatión 3mM, 0,1 mg/ml de BSA, ATP 10 mM, [3H] lisina 1 M (Amersham), sintetasa 750 nM y 0, 2, 10 ó 40 M de ARNt completo a 37ºC durante 20 minutos. [0221] Análisis de complementación: se transformaron células PALSUTR(pMAKIysU) con derivados de pGLN para la expresión de PhAD, EcKRS o sin sintetasa y se recuperaron en placas de LB-agar que contenían 50 g/ml de ampicilina a 30ºC. La complementación a 43ºC del defecto de crecimiento deficiente en sintetasa de la cepa PALSUTR se realizó sobre placas de LB-agar o medio líquido sin antibióticos. Se usó el crecimiento en GeneHog como un control positivo para eliminar la posibilidad de efectos tóxicos debidos a la expresión de la sintetasa. Para los medios líquidos se diluyeron cultivos saturados en un factor 10000 en medios nuevos y se controló el crecimiento a 600 nm durante 8 horas. [0222] Construcción de bibliotecas: los genes para ARNt se construyeron mediante la extensión solapante de oligonucleótidos sintéticos (Genosys) y se subclonaron en los sitios EcoRI y PstI de pACKO-A184TAG o pACKOA184AGGA. Estos plásmidos indicadores obtenidos de pACYC184 contienen el origen de replicación p15A, un gen de resistencia a cloranfenicol y un promotor constitutivo fuerte que controla la expresión de los genes de ARNt. La biblioteca obtenida de PhAD se construyó en el plásmido pKQ mediante EIPCR (Stemmer y Morris, S. K. (1992) Enzymatic inverse PCR: a restriction site independent, single-fragment method for highefficiency, site-directed mutagenesis. Biotechniques 13:214-20). Se usaron fosforamiditas premezcladas durante la síntesis de oligonucleótidos para la construcción de la biblioteca. La diversidad de la biblioteca fue 900 veces mayor que la diversidad teórica y se demostró que estaba libre de desviación de secuencia por secuenciación. [0223] Determinación de eficacia de supresión: se determinó la eficacia de supresión sembrando en medio de LB-agar suplementado con 25 g/ml de kanamicina y cloranfenicol y diversas concentraciones de ampicilina entre 5 y 1000 g/ml. Las células se sembraron con densidades inferiores a 100 células por placa. Se describió la eficacia como la concentración más elevada a la que las células sobrevivieron para formar colonias entre una serie de placas para las cuales las siguientes concentraciones mayores y menores estarían dentro del 20% del valor descrito. [0224] Expresión y caracterización de mioglobina que contiene hGIn: para experimentos de incorporación en sitio único se construyó pMyo-AKuccu con un origen de replicación p15A y genes para cloranfenicol acetiltransferasa, AKUCCU, y mioglobina de esperma de ballena. El gen de mioglobina se puso bajo el control del promotor de arabinosa y contiene un codón AGGA en la posición G24. Para la incorporación en dos sitios se construyó otro plásmido introduciendo un codón TAG en la posición A74 del gen de mioglobina en pMyo-AKuccu. El ARNtTyr ortogonal, J17, se añadió bajo el control de un segundo promotor Ipp. Las sintetasas hGlnRS y AzPheRS se expresaron a partir del plásmido pKQ con promotores de glutamina independientes. La células GeneHog que alojan plásmidos de expresión de sintetasa y mioglobina apropiados se dejaron crecer a 37ºC hasta DO600=0,7 en medio GMML suplementado con los 19 aminoácidos excepto lisina, cada uno a una concentración de 0,4 mg/ml, vitaminas y 1 mg/ml de hGIn (Sigma), se indujeron con arabinosa al 0,02% y después se dejaron crecer hasta la saturación. Las células se lisaron mediante sonicación y se purificó mioglobina con el kit QIAexpressionist de Qiagen. Se realizó análisis un MALDI-MS de fragmentos trípticos en la TSRI Proteomics Facility.

EJEMPLO 4: LISIL O-RS Y LISIL O-ARNt ILUSTRATIVOS

[0225] Se encuentran O-ARNt ilustrativos en los ejemplos y/o la Tabla 1. También se encuentran O-RS ilustrativas en los ejemplos y/o en la Tabla 1.

Los polinucleótidos ilustrativos que codifican O-RS o partes de las mismas incluyen los observados en los ejemplos y/o la Tabla 1. [0226] Se pueden encontrar detalles adicionales de la invención y, en particular, detalles experimentales, en Anderson, John Christopher,

5 "Pathway Engineering of the Expanding Genetic Code," Ph. D. Dissertation, The Scripps Research Institute [2003]. [0227] Se entiende que los ejemplos y las realizaciones descritas en este documento tienen solamente fines ilustrativos y que los expertos en la materia sugerirán diversas modificaciones o cambios a la luz de la misma y

10 se tienen que incluir dentro del espíritu y ámbito de esta solicitud y del alcance de las reivindicaciones adjuntas. [0228] Aunque la anterior invención se ha descrito con cierto detalle para facilitar su claridad y comprensión, será evidente para un experto en la materia tras la lectura de esta descripción que se puedan realizar diversos

15 cambios en la forma y los detalles. Por ejemplo, todas las técnicas y los aparatos que se han descrito anteriormente se pueden usar en diversas combinaciones.

TABLA 1

imagen3

SEC: AKbibliotecadetallo

ID:

25

SEC: AKUCCU

ID:

26

SEC: PhAD

ID:27

SEC PhAD pep ID:

SEC: PhEA44G

ID:: también

29: conocido

como PhKRS

imagen1

SEC: PhE444G.pep

ID:: también

30: conocido

como PhKRS

SEC: pACKO-

ID:: A184TAG

31

imagen1

SEC: pACKO-

ID:: A184AGG A

32

imagen1

SEC pACKO-Bla ID:

imagen1

SEC pKQ ID:

imagen1

SEC pKQ-PhKeP ID:

imagen1

LISTADO DE SECUENCIAS

5 [0229]

<110> The Scripps Research Institute

<120> COMPOSICIONES DE PAREJAS t-RNA SINTETASA Y t-RNA LISIL ORTOGONAL Y USOS DE LAS MISMAS

10 <130> SJK/FP6523278

<140> No hay todavía EP

<141> 2004-07-07

<150> EP 06002989.9

<151> 2004-07-07

<150> EP 04777951.7

<151> 2004-07-07

<150> PCT/US 04/022187

<151> 2004-07-07

<150> US 60/485,451

<151> 2004-07-07

<150> US 60/528,815

<151> 2003-12-10

<150> US 60/537,149

<151> 2003-01-15

<160> 37

<170> PatentIn versión 3.2

<210> 1

<211> 78

<212> RNA

<213> Pyrococcus abyssi

<400> 1

imagen1

<210> 2

<211> 78

<212> RNA

<213> Pyrococcus furiosus

<400> 2

imagen1

<210> 3

<211> 78

<212> RNA

<213> Pyrococcus horikoshii

<400> 3

imagen1

<210> 4

<211> 78

<212> RNA

<213> Pyrococcus abyssi

<400> 4

imagen1

10 <210> 5

<211> 78

<212> RNA

<213> Pyrococcus horikoshii

imagen4

<210> 6

<211> 78

<212> RNA

<213> Pyrococcus furiosus

20 <400> 6

imagen1

<210> 7

<211> 78

<212> RNA 25 <213> Pyrobaculum aerophilum

<400> 7

imagen1

<210> 8

<211> 77

<212> RNA

<213> Thermoplasma acidophilum

<400> 8

imagen1

<210> 9

<211> 77

<212> RNA

<213> Thermoplasma volcanium

imagen5

<210> 10

<211> 77

<212> RNA

<213> Archaeoglobus fulgidus

15 <400> 10

imagen1

<210> 11

<211> 77

<212> RNA 20 <213> NRC-1 de Halobacterium sp.

<400> 11

imagen1

<210> 12

<211> 77 25 <212> RNA

<213> Thermoplasma acidophilum

<400> 12

imagen1

<210> 13 30 <211> 77

<212> RNA

<213> Thermoplasma volcanium

<400> 13

imagen1

<210> 14

<211> 77

<212> RNA

<213> Methanococcus jannaschii

imagen6

<210> 15

<211> 77

<212> RNA

<213> Methanobacterium thermoautotrophicum

15 <400> 15

imagen1

<210> 16

<211> 77

<212> RNA 20 <213> Methanosarcina mazeii

<400> 16

imagen1

<210> 17

<211> 77 25 <212> RNA

<213> Sulfolobus tokodaii

<400> 17

imagen1

<210> 18 30 <211> 77

<212> RNA

<213> Sulfolobus tokodaii

<400> 18

imagen1

<210> 19

<211> 77

<212> RNA

<213> Pyrobaculum aerophilum

imagen7

<210> 20

<211> 77

<212> RNA

<213> Archaeoglobus fulgidus

15 <400> 20

imagen1

<210> 21

<211> 76

<212> RNA 20 <213> Sulfolobus solfataricus

<400> 21

imagen1

<210> 22

<211> 79 25 <212> RNA

<213> Aeropyrum pernix

<400> 22

imagen1

<210>: 23 30 <211> 80

<212> RNA

<213> Artificial

<220>

<223> tRNA consenso

<220>

<221> misc_feature

<222> (36)..(36)

<223> n indica no consenso (u o c)

<220>

<221> misc_feature

<222> (43)..(43)

<223> n indica no consenso (hueco o c)

<220>

<221> misc_feature

<222> (44)..(44)

<223> n indica no consenso (hueco o g)

<400> 23

<210> 24

<211> 77

<212> RNA

<213> Artificial

<220>

<223> tRNA consenso derivado de AKCUA

<400> 24

<210> 25

<211> 78

<212> RNA

<213> Artificial

<220>

<223> tRNA consenso procedente de librería

<220>

<221> misc_feature

<222> (1)..(4)

<223> n es a, c, g o u

<220>

<221> misc_feature

<222> (71)..(74)

<223> n es a, c, g o u

<400> 25

<210>: 26 10 <211> 78

imagen1

<212> RNA

<213> Artificial

<220>

<223> tRNA mutante

15 <400> 26

imagen1

<210> 27

<211> 1092

<212>: DNA 20 <213> Artificial

<220>

<223> tRNA sintetasa mutante

<400> 27

<210> 28

<211> 363

<212> PRT

<213> Artificial

<220>

<223> tRNA sintetasa mutante

<210> 29

<211> 1572

<212> DNA

<213> Artificial

<220>

<223> tRNA sintetasa mutante

<400> 29

<210> 30

<211> 523

<212> PRT

<213> Artificial

<220>

<223> tRNA sintetasa mutante

<210> 31

<211> 4813

<212>: DNA 5 <213> Artificial

imagen1

imagen8

imagen1

imagen9

imagen1

<220>

<223> plásmido pACKO-A184TAG

<220>

<221> misc_feature 10 <222> (3749)..(3749)

<223> n es a, c, g, o t

<220>

<221> misc_feature

<222> (3769)..(3769) 15 <223> n es a, c, g, o t

<400> 31

imagen1

<210> 32

<211> 4814

<212> DNA 5 <213> Artificial

<220>

<223> plásmido pACKO-A184AGGA

<220>

<221> misc_feature 10 <222> (3750)..(3750)

<223> n es a, c, g, o t

<220>

<221> misc_feature

<222> (3770)..(3770) 15 <223> n es a, c, g, o t

<400> 32

imagen1

<210> 33

<211> 4338

<212> DNA 5 <213> Artificial

<220>

<223> plámidopACkO-Bla

<220>

<221> misc_feature 10 <222> (3274) .. (3274)

<223> n es a, c, g, o t

<220>

<221> misc_feature

<222> (3294)..(3294) 15 <223> n es a, c, g, o t

<400> 33

imagen1

<210> 34

<211> 2271

<212> DNA

<213> Artificial

<220>

<223> plámido pKQ

<400> 34

imagen1

<210> 35

<211> 4582

<212> DNA

<213> Artificial

<220>

<223> plásmido pKQ-PhKep

<400> 35

imagen1

5: <210> 36 <211> 30 <212> DNA <213> Artificial

<220> <223> cebador oligonucleotídico

<400> 36 cagtggaatt cagtaagttg gcagcatcac: 30

10: <210> 37 <211> 31 <212> DNA <213> Artificial

15: <220> <223> cebador oligonucleotídico

<400> 37 cattggaatt cgagtaagtt ggcagcatca c: 31

LISTADO DE SECUENCIAS

[0230]

<110> The Scripps Research Institute

<120> COMPOSICIONES DE PARES ORTOGONALES DE LISIL-ARNt Y AMINOACIL-ARNt SINTETASA Y USOS DE LOS MISMOS

<130> SJK/FP6355119

<140> EP no conocido todavía

<141> 07-07-2004

<150> EP 04777951.7

<151> 07-07-2004

<150> PCT/US 04/022187

<151> 07-07-2004

<150> US 60/485.451

<151> 07-07-2004

<150> US 60/528.815

<151> 10-12-2003

<150> US 60/537.149

<151> 15-01-2003

<160> 37

<170> PatentIn versión 3.2

<210> 1

<211> 78

<212> ARN

<213> Pyrococcus abyssi

<400> 1

imagen1

5 <210> 2

<211> 78

<212> ARN

<213> Pyrococcus furiosus

10 <400> 2

imagen1

<210> 3

<211>: 78 15 <212> ARN

<213> Pyrococcus horikoshii

<400> 3

<210> 5

<211> 78

<212> ARN

<213> Pyrococcus horikoshii

<400> 5

<210> 6

<211> 78

<212> ARN

<213> Pyrococcus furiosus

<400> 6

<210> 7

<211> 78

<212> ARN

<213> Pyrobaculum aerophilum

<400> 7

<210> 8

<211> 77

<212> ARN

<213> Thermoplasma acidophilum

<400> 8

<210> 9

<211> 77

<212> ARN

<213> Thermoplasma volcanium

<400> 9

<210> 10

<211> 77

<212> ARN

<213> Archaeoglobus fulgidus

<210> 11

<211> 77

<212> ARN

<213> Halobacterium sp. NRC-1

<400> 11

<210> 12

<211> 77

<212> ARN

<213> Thermoplasma acidophilum

<400> 12

<210> 13

<211> 77

<212> ARN

<213> Thermoplasma volcanium

<400> 13

<210> 14

<211> 77

<212> ARN

<213> Methanococcus jannaschii

<400> 14

<210> 15

<211> 77

<212> ARN

<213> Methanobacterium thermoautotrophicum

<400> 15

<210> 16

<211> 77

<212> ARN

<213> Methanosarcina mazeii

<400> 16

<210> 17

<211> 77

<212> ARN

<213> Sulfolobus tokodaii

<400> 17

<210> 18

<211> 77

<212> ARN

<213> Sulfolobus tokodaii

<210> 19

<211> 77

<212> ARN

<213> Pyrobaculum aerophilum

<400> 19

<210> 20

<211> 77

<212> ARN

<213> Archaeoglobus fulgidus

<400> 20

<210> 21

<211> 76

<212> ARN

<213> Sulfolobus solfataricus

<400> 21

<210> 22

<211> 79

<212> ARN

<213> Aeropyrum pernix

<400> 22

<210> 23

<211> 80

<212> ARN

<213> Artificial

<220>

<223> ARNt consenso

<220>

<221> misc_feature

<222> (36)..(36)

<223> n indica no consenso (u o c)

<220>

<221> misc_feature

<222> (43)..(43)

<223> n indica no consenso (gap o c)

<220>

<221> misc_feature

<222> (44)..(44)

<223> n indica no consenso (gap o g)

<400> 23

<210> 24

<211> 77

<212> ARN

<213> Artificial

<220>

<223> ARNt AKCUA procedente de consenso

<400> 24

<210> 25

<211> 78

<212> ARN

<213> Artificial

<220>

<223> biblioteca de ARNt procedente de consenso

<220>

<221> misc_feature

<222> (1)..(4)

<223> n es a, c, g o u

<220>

<221> misc_feature

<222> (71)..(74)

<223> n es a; c, g o u

<400> 25

<210> 26

<211> 78

<212> ARN

<213> Artificial

<220>

<223> ARNt mutante

<400> 26

<210> 27

<211> 1092

<212> ADN

<213> Artificial

<200>

<221> ARNt sintetasa mutante

<400> 27

<210> 28

<211>: 363 5 <212> PRT

imagen1

20

25: <210> 4 <211> 78 <212> ARN <213> Pyrococcus abyssi <400> 4

imagen1

<213> Artificial

<200>

<221> ARNt sintetasa mutante 10

<400> 28

imagen1

<210> 29

<211> 1572

<212> ADN

<213> Artificial

<200>

<221> ARNt sintetasa mutante

<400> 29 <210> 30

imagen1

<211> 523

<212> PRT

<213> Artificial

<200>

<221> ARNt sintetasa mutante

<400> 30

imagen1

<210> 31

<211> 4813

5: <212> ADN

<213> Artificial

<220>

<223> plásmido pACKO-A184TAG

10

<220>

<221> misc_feature

<222> (3749)..(3749)

<223> n es a, c, g o t

15

<220>

<221> misc_feature

<222> (3769)..(3769)

<223> n es a, c, g o t

<400> 31

imagen1

<210> 32

<211> 4814 5 <212> ADN

<213> Artificial

<220>

<223> plásmido pACKO-A184AGGA 10

<220>

<221> misc_feature

<222> (3750)..(3750)

<223> n es a, c, g o t

<220>

<221> misc_feature

<222> (3770)..(3770)

<223> n es a, c, g o t

<400> 32

imagen1

<210> 33

<211> 4338 5 <212> ADN

<213> Artificial

<220>

<223> plásmido pACKO-Bla 10

<220>

<221> misc_feature

<222> (3274)..(3274)

<223> n es a, c, g o t

<220>

<221> misc_feature

<222> (3294)..(3294)

<223> n es a, c, g o t

<400> 33

imagen1

<210> 34

<211> 2271 5 <212> ADN

<213> Artificial

<220>

<223> plásmido pKQ 10

<400> 34

imagen1

<210> 35

<211> 4582 5 <212> ADN

<213> Artificial

<220>

<223> plásmido pKQ-PhKep 10

<400> 35

imagen1

<210> 36

<211> 30 5 <212> ADN

<213> Artificial

<220>

<223> cebador oligonucleotídico 10

imagen10

<210> 37 15 <211> 31

<212> ADN

<213> Artificial

<220> 20 <223> cebador oligonucleotídico

<400> 37

imagen1

REFERENCIAS CITADAS EN LA DESCRIPCIÓN

Esta lista de referencias citadas por el solicitante únicamente es para comodidad del lector. Dicha lista no forma parte del documento de patente Europea. Aunque se ha tenido gran cuidado en la recopilación de las referencias, no se pueden excluir errores u omisiones y la EPO rechaza toda responsabilidad a este respecto.

Documentos de patentes citados en la descripción

imagen1

Bibliografía no relativa a patentes citada en la descripción

imagen1

174

imagen1

175

imagen1

176

imagen1

Claims

Reivindicaciones

1.

Sistema de traducción que comprende:

un tRNA ortogonal (O-tRNA) que reconoce un codón selector; y una sintetasa ortogonal (ORS) procedente de una lisil t-RNA sintetasa, la ORS siendo capaz de cargar específicamente homoglutamina en el O-tRNA.
2.

Sistema de traducción de la reivindicación 1, que comprende homoglutamina y un ácido nucleico de interés que comprende un codón selector, en donde la ORS aminoacila el O-tRNA con la homoglutamina, en donde el O-tRNA reconoce el codón selector y mantiene la incorporación específica de la homoglutamina en un polipéptido codificado por el ácido nucleico de interés.
3.

Sistema de traducción de la reivindicación 1, en donde la ORS es un mutante 141 y/o S268 de la aminoacil tRNA sintetasa de SEC ID NO: 28 (PhAD).
4.

Sistema de traducción de la reivindicación 1, en donde el sistema de traducción comprende una célula procariota y la ORS procede de una célula archae.
5.

Sistema de traducción de la reivindicación 4, en donde el sistema de traducción comprende una célula E. coli y la ORS procede de una ORS de Pyrococcus horikoshii.
6.

Composición que comprende la aminoacil t-RNA sintetasa de SEC ID NO: 28 (PhAD).
7.

Aminoacil t-RNA sintetasa artificial procedente de la aminoacil t-RNA sintetasa de SEC ID NO: 28 (PhAD) capaz de cargar homoglutamina en un tRNA.
8.

Aminoacil t-RNA sintetasa artificial de la reivindicación 7, en donde la sintetasa es una variante homóloga de PhAD, que comprende los residuos variantes en las posiciones correspondientes a Y268 y E41 de PhAD.
9.

Aminoacil t-RNA sintetasa artificial de la reivindicación 7, que comprende una serina o glicina en la posición que corresponde a Y268 de PhAD.
10.

Aminoacil t-RNA sintetasa artificial de la reivindicación 7, que comprende

5 una valina, treonina, serina, isoleucina o prolina en una posición que corresponde a E41 de PhAD.
11. Aminoacil t-RNA sintetasa artificial de la reivindicación 7, que comprende

una serina en una posición que corresponde a Y268 y una isoleucina en la 10 posición que corresponde a E41 de PhAD.
12. Aminoacil t-RNA sintetasa artificial de la reivindicación 7, en donde la sintetasa es capaz de cargar el tRNA de SEC ID NO: 26 con homoglutamina.

15 13. Ácido nucleico que codifica la aminoacil tRNA sintetasa de cualquiera de las reivindicaciones 7 a 12.
14. Vector de ácido nucleico que comprende el ácido nucleico de la

reivindicación 13. 20
15.

tRNA de SEC ID NO: 26.
16.

DNA que codifica el tRNA de la reivindicación 15.