[go: up one dir, main page]

ES2665516T3 - Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas - Google Patents

Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas Download PDF

Info

Publication number
ES2665516T3
ES2665516T3 ES11850126.1T ES11850126T ES2665516T3 ES 2665516 T3 ES2665516 T3 ES 2665516T3 ES 11850126 T ES11850126 T ES 11850126T ES 2665516 T3 ES2665516 T3 ES 2665516T3
Authority
ES
Spain
Prior art keywords
microorganism
hydroxybenzoyl
coa
fatty acid
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES11850126.1T
Other languages
English (en)
Inventor
Robert Christopher Brown
Rekha SESHADRI
Carlos CHAVEZ-TORRES
Weidong Xu
Toby Richardson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ExxonMobil Technology and Engineering Co
Original Assignee
ExxonMobil Research and Engineering Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ExxonMobil Research and Engineering Co filed Critical ExxonMobil Research and Engineering Co
Application granted granted Critical
Publication of ES2665516T3 publication Critical patent/ES2665516T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/020234-Hydroxybenzoyl-CoA thioesterase (3.1.2.23)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • C12P7/6418Fatty acids by hydrolysis of fatty acid esters
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/582Recycling of unreacted starting or intermediate materials

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

Microorganismo para usar en la producción de al menos un ácido graso libre y/o un derivado de ácido graso, que comprende una molécula de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa, la cual tiene al menos un 70% identidad secuencial de aminoácidos con la SEQ ID NO:1 o la SEQ ID NO:2.

Description

Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas
ÁMBITO DE LA PRESENTE INVENCIÓN
La presente invención se refiere a composiciones y métodos para la producción de ácidos grasos libres y derivados de ácidos grasos en microorganismos, incluyendo microorganismos fotosintéticos como cianobacterias y microalgas.
ANTECEDENTES
Biocombustibles
Los biocombustibles constituyen fuentes de energía renovables procedentes de organismos vivos como plantas superiores, hongos o bacterias. Las formas de vida fotosintéticas captan energía lumínica y luego la convierten en la energía libre de compuestos orgánicos basados en el CO2 fijado, utilizando agua como principal dador de electrones. En la actualidad se aplican dos tecnologías principales para generar biocombustibles con el empleo de organismos fototróficos: en primer lugar la producción de biocombustibles de base vegetal mediante la fermentación del azúcar contenido en la planta, para obtener etanol, y en mucha menor medida la producción de biodiésel derivado de algas mediante la extracción de lípidos de la biomasa procedente de cultivos a gran escala (Angermayr y otros, 2009, Curr Opin Biotechnol, 20 (3): 257 - 263).
Lípidos
Los lípidos biológicos son un grupo químicamente diverso de compuestos cuya característica común y definitoria es su insolubilidad en el agua. Las funciones biológicas de los lípidos son igualmente diversas. Las grasas y los aceites son las principales formas de almacenamiento de energía en muchos organismos, y los fosfolípidos y los esteroles constituyen cerca de la mitad de la masa de las membranas biológicas. Otros lípidos, a pesar de estar en cantidades relativamente bajas, juegan papeles decisivos como cofactores enzimáticos, portadores de electrones, pigmentos absorbentes de luz, anclajes hidrófobos, agentes emulsionantes, hormonas y mensajeros intracelulares (Lodish, H., Molecular Cell Biology, 6ª ed., St. Martin's Press (2008)).
Ácidos grasos
Los ácidos grasos son ácidos carboxílicos con cadenas hidrocarbonadas de 4 hasta 36 carbonos. En algunos ácidos grasos esta cadena es totalmente saturada (lo cual significa que no contiene dobles enlaces) y no ramificada; otros llevan uno (monoinsaturados) o más dobles enlaces (poliinsaturados). Algunos contienen anillos de tres carbonos o grupos hidroxilo. Una nomenclatura simplificada de estos compuestos especifica la longitud de cadena y el número de enlaces dobles, separado por dos puntos; el ácido palmítico saturado, de 16 carbonos, se abrevia 16:0, y el ácido oleico, con 18 carbonos y un doble enlace, se abrevia 18:1. Las posiciones de cualquier enlace doble se especifican mediante superíndices después de Δ (delta); un ácido graso de 20 carbonos con un doble enlace entre C-9 y C-10 (siendo C-1 el carbono carboxílico) y otro entre C-12 y C-13 se designa 20:2 (Δ9,12), por ejemplo. Los ácidos grasos más comunes tienen un número par de átomos de carbono en una cadena no ramificada de 12 hasta 24 carbonos. El número par de carbonos es el resultado del modo de síntesis de estos compuestos, que implica la condensación de unidades de acetato (dos carbonos). (Lehninger y otros, Principles of Biochemistry, vol. 1, Macmillan, 2005).
La posición de los dobles enlaces en los ácidos grasos insaturados también es irregular; en la mayoría de los ácidos grasos monoinsaturados el doble enlace está entre C-9 y C-10 (Δ9), y los otros dobles enlaces de los ácidos grasos poliinsaturados son generalmente Δ12 y Δ15. Los dobles enlaces de los ácidos grasos poliinsaturados no están casi nunca conjugados (enlaces simples y dobles alternados), pero generalmente están separados por un grupo metileno (-CH=CH-CH2-CH=CH-). Las propiedades físicas de los ácidos grasos y de los compuestos que los contienen están determinadas en gran parte por la longitud y el grado de insaturación de la cadena hidrocarbonada, es decir, cuanto más larga es la cadena acilo del ácido graso y menor el número de dobles enlaces, menor es la solubilidad en agua. (Lehninger y otros, Principles of Biochemistry, vol. 1, Macmillan, 2005).
Biosíntesis de ácidos grasos
La formación irreversible de malonil-CoA a partir de acetil-CoA está catalizada por la acetil-CoA carboxilasa, y se considera la primera etapa determinante en la biosíntesis de ácidos grasos (FIGURA 1). La acetil-CoA carboxilasa lleva biotina como grupo prostético, unida covalentemente mediante un enlace amido al grupo ε-amino de un resto de lisina en una de las tres subunidades de la molécula enzimática. El grupo carboxilo, derivado de bicarbonato (HCO3-), se transfiere en primer lugar a la biotina mediante una reacción dependiente de ATP. El grupo biotinilo sirve de transportador temporal de CO2 y en la segunda etapa lo transfiriere al acetil-CoA, dando malonil-CoA. (Lehninger y otros, Principles of Biochemistry, volumen 1, Macmillan, 2005).
A diferencia de otras bacterias heterótrofas, como la E. coli, que deben metabolizar la glucosa de los medios a acetil-CoA para iniciar la síntesis de ácidos grasos, el precursor de la síntesis de ácidos grasos en las cianobacterias, es decir el acetil-CoA, viene directamente del ciclo de Calvin-Benson, que fija el dióxido de carbono utilizando energía y disminuyendo la potencia proporcionada por las reacciones lumínicas de la fotosíntesis.
La secuencia de reacción por la cual se forman las largas cadenas de átomos de carbono en los ácidos grasos consta de cuatro pasos: (1) condensación; (2) reducción; (3) deshidratación; y (4) reducción. El grupo acilo saturado producido durante esta serie de reacciones se recicla para convertirse en el substrato de otra condensación con un grupo malonilo activado. Cada vez que se completa el ciclo, la cadena de acilo graso se alarga dos carbonos. En muchas células el alargamiento de la cadena termina cuando ésta alcanza los 16 carbonos y el producto (palmitato, 16:0) sale del ciclo. Los átomos de carbono del metilo y carboxilo del grupo acetilo pasan a ser respectivamente los carbonos C-16 y C-15 del palmitato; el resto de átomos de carbono procede del malonil-CoA. Todas las reacciones del proceso sintético están catalizadas por un complejo multienzimático, la ácido graso sintasa (Lehninger y otros, Principles of Biochemistry, volumen 1, Macmillan, 2005).
Ciclo de alargamiento en la síntesis de ácidos grasos
La síntesis de ácidos grasos representa un proceso conservado fundamental, mediante el cual se producen cadenas de acilo para ser utilizadas en varios productos finales como, por ejemplo, las membranas biológicas. El sistema enzimático que cataliza la síntesis de ácidos grasos saturados de cadena larga a partir de acetil-CoA, malonil-CoA y NADPH se denomina ácido graso sintasa (AGS) (FIGURA 1). Las ácido graso sintasas (AGS) se pueden dividir en dos clases, tipo I y II, que se encuentran principalmente en eucariotas y en bacterias y plantas, respectivamente. Se caracterizan por estar compuestos por polipéptidos multifuncionales grandes, en el caso del tipo I, o por proteínas monofuncionales expresadas discretamente, en el sistema del tipo II (Chan D. y Vogel H, Biochem J., 2010, 430(1): 1-19). La ácido graso sintasa posee seis actividades catalíticas y contiene beta-cetoacil sintasa (CS), acetil/malonil transacilasa (AT/MT), beta-hidroxiacil deshidratasa (HD), enoíl reductasa (ER), beta-cetoacil reductasa (CR), proteína transportadora de acilo (PTA) y tioesterasa (TE) (Chirala y Wakil, Lipids, 2004, 39(11):1045-53). Se ha demostrado que las reacciones promotoras de la síntesis de ácidos grasos en los organismos superiores son muy similares a las de las bacterias (Berg y otros, Biochemistry, 6ª ed., Macmillan, 2008).
La biosíntesis de ácidos grasos es iniciada por el enzima acetiltransferasa, integrante de la ácido graso sintasa, que carga el cebador acilo, normalmente acetato, del coenzima A (CoA) a un sitio de unión específico de la ácido graso sintasa (AGS). Al final del proceso, la terminación del alargamiento de cadena tiene lugar separando el producto de la ácido graso sintasa (AGS) por transesterificación a un aceptor apropiado o por hidrólisis. Los respectivos enzimas suelen ser palmitoíl transferasa y tioesterasa. La secuencia de reacciones entre la iniciación y la terminación implica el alargamiento de productos intermedios unidos al enzima mediante varios ciclos iterativos de una serie distinta de etapas de reacción. Cada ciclo incluye (i) malonil-transacilación del CoA al enzima mediante la malonil transferasa,
(ii) condensación del acil-enzima con malonato enzimático para dar el 3-cetoacil-enzima mediante 3-cetoacil sintasa,
(iii) reducción del producto intermedio 3-ceto- a 3-hidroxiacilo mediante la cetoacil-reductasa, (iv) deshidratación del enzima 3-hidroxiacilo a 2,3-trans-enoato mediante deshidratasa y (v) por último, reducción del enoato al enzima acilo saturado mediante la enoíl reductasa. El grupo prostético 4’-fosfopanteteína juega un papel primordial en la unión del substrato, en el procesamiento de los productos intermedios y en su conexión entre los diversos centros catalíticos de la ácido graso sintasa (AGS). Este cofactor se une covalentemente a un grupo hidroxilo de serina específico del dominio PTA o, dependiendo del sistema AGS, al componente PTA de la AGS. En algunas bacterias, la secuencia iterativa de ciclos de alargamiento puede ser interrumpida a una longitud de cadena de 10 carbonos por un ciclo en el que interviene una isomerasa intrínseca que convierte el producto intermedio 2-trans- en el compuesto isómero 3cis-decenoílo, que luego no se reduce, sino que se alarga adicionalmente formando ácidos grasos monoinsaturados de cadena larga (Schweizer y Hofmann, Microbiol Mol Biol Rev., 2004, 68(3): 501-17).
Proteína transportadora de acilo (PTA)
La proteína transportadora de acilo (PTA) -el cofactor proteico que durante el proceso de síntesis se une por enlace covalente a productos intermedios de acilo graso mediante un conector de fosfopanteteína -es fundamental para la síntesis de ácidos grasos. Es una proteína altamente conservada que lleva productos intermedios de acilo durante la síntesis de los ácidos grasos. La PTA aporta cadenas de acilo para la síntesis de lípidos y ácido lipoico, así como para la percepción de quorum, la bioluminiscencia y la activación de toxinas. Además las PTA o las PTP (proteínas transportadoras de peptidilo) también se usan para sintetizar polipéptidos y péptidos no ribosómicos, que producen metabolitos secundarios importantes, tales como el antibiótico lipopéptido daptomicina y la enterobactina siderófora portadora de hierro (Chan y Vogel, Biochem. J., 2010, 430:1-19).
En las levaduras y los mamíferos, la PTA existe como un dominio independiente dentro de una extensa poliproteína multifuncional de ácido graso sintasa (AGS tipo I), mientras que en las bacterias y plantas es una pequeña proteína monomérica (AGS tipo II) (Byers y Gong, Biochem) Cell Biol., 2007, 85(6): 649-62).
La TPA es muy abundante en la E. coli; constituye aproximadamente un 0,25% de todas las proteínas solubles y representa uno de los cuatro principales centros de interacción proteína-proteína, siendo los otros las ADN y ARN
polimerasas, así como las proteínas ribosómicas. En los sistemas de AGS del tipo I la PTA forma parte de extensos polipéptidos multidominio que también contienen los otros dominios proteicos para la síntesis de AG en forma lineal. Aunque la arquitectura y la identidad secuencial de los sistemas de AGS del tipo I son diferentes de los enzimas disociados de tipo II, muchas de las unidades funcionales de estos complejos son similares. Por otro lado hay otros dominios como los enzimas enoíl reductasa y deshidratasa que varían significativamente entre los sistemas de tipo Ia, Ib y II (Chan y Vogel, Biochem. J., 2010, 430: 1-19). Por otra parte hay dominios, tales como los enzimas enoíl reductasa y deshidratasa, que varían significativamente entre los sistemas de tipo Ia, Ib y II (Chan y Vogel, Biochem. J., 2010, 430: 1-19).
Acil-PTA tioesterasas
La principal reacción de terminación de la biosíntesis de ácidos grasos está catalizada por tioesterasas de proteína transportadora acilo-acilo (acil-PTA) en los eucariotas. Los estudios anteriores han demostrado que el enzima acil-PTA tioesterasa termina el alargamiento del acilo de un grupo acilo graso, hidrolizando un grupo acilo de un ácido graso. En las plantas, una acil-PTA tioesterasa termina el proceso de alargamiento del acilo por hidrólisis del acil-PTA tioéster; luego se libera ácido graso libre de la ácido graso sintasa. En la E. coli el grupo acilo de cadena larga es transferido directamente de la PTA al glicerol-3-fosfato por una glicerol-3-fosfato aciltransferasa, y normalmente no se encuentran ácidos grasos libres como productos intermedios en la biosíntesis de lípidos. Como en la mayoría de los demás organismos, los principales productos finales de la ácido graso sintasa de las plantas y de la E. coli son generalmente ácidos grasos de 16 o 18 carbonos. La longitud de la cadena en E. coli está determinada por las 3-cetoacil-PTA sintasas I y II y por la glicerol-3-fosfato aciltransferasa (Voelker y Davies, J. Bacteriol, 1994, 17: 73207327).
4-Hidroxibenzoíl-CoA tioesterasas (4-HBTs)
Durante el siglo pasado se liberaron al medio ambiente grandes cantidades de 4-clorobenzoato (4-CBA) producido industrialmente o de precursores de 4-CBA (herbicidas y pesticidas de bifenilo policlorado) (Cork, D. y Krueger, J. (1991) Adv. Appl. Microbiol., 36:1-66; Furukawa, K. (1994) Biodegradation, 5:289-300; Haggblom, M. (1992) FEMS Microbiol. Rev., 9:29-71; Higson, F. (1992) Adv. Appl. Microbiol., 37:135-164; Zhuang, Z. y otros, (2003) Applied and Environmental Microbiology, 69:2707-2711; y Zhuang Z. y otros (2008) Biochemistry, vol. 47(9):2789-2796). Las supuestas tioesterasas están descritas en Database UniProt con los números de acceso Q65J22 y Q2W2A6. Las tioesterasas tienen un 97,1% de identidad con la SEQ ID NO:1 y un 53,0% de identidad con la SEQ ID NO:2, respectivamente. En los últimos años se han identificado varios microorganismos degradadores del 4-CBA que viven en el suelo y catabolizan hidrocarburos halogenados que aparecen en el medio ambiente, utilizándolos como fuente principal de carbono (Hileman, B. (1993) Chem. Eng. News, 71:11-20). Zhihao Zhuang y otros, (2008) Biochem, 47 (a): 2789-2796 describen la tioesterasa bacteriana YciA+.
La primera etapa del esquema bioquímico mediante el cual el 4-clorobenzoato se tioesterifica con CoA requiere una molécula de Mg2+-ATP y es catalizada por la 4-clorobenzoíl-CoA ligasa. La segunda etapa es catalizada por la 4clorobenzoíl-CoA deshalogenasa e implica la sustitución hidrolítica de un hidroxilo por un grupo cloro en la posición para del anillo aromático. En la tercera y última etapa el enlace tioéster entre el fragmento CoA y el grupo 4-hidroxibenzoílo es escindido por la 4-hidroxibenzoíl-CoA tioesterasa (4-HBT). Los genes que codifican estos tres enzimas se organizan en un operón bajo el control positivo del 4-clorobenzoil-CoA (Dunaway-Mariano, D. y Babbitt, P. (1994) Biodegradation, 5:259-276).
La patente U.S. nº 5,455,167 describe genes y constructos para la expresión de genes codificadores de acil-PTA tioesterasas de plantas superiores, así como un constructo para la expresión de un gen codificador de LuxD Vibrio harveyi acil-transferasa (YP_001448362.1 GI:156977456), perteneciente a Pfam PF02273, en plantas superiores. La publicación PCT número WO2007/136762 revela microorganismos recombinantes diseñados por ingeniería genética para la producción fermentativa de derivados de ácidos grasos tales como, entre otros, alcoholes grasos y ésteres de ceras, en los cuales la cepa huésped puede expresar una tioesterasa de plantas superiores o la TesA acil-CoA tioesterasa de E. coli. La publicación PCT nº WO2008/100251 describe métodos para diseñar microorganismos por ingeniería genética que incluyen genes codificadores de celulosomas sintéticos, con el fin de preparar productos hidrocarbonados (que pueden ser, entre otros, alcanos, alquenos, alquinos, dienos, ácidos grasos, isoprenoides, alcoholes grasos, ésteres de ácidos grasos, polihidroxialcanoatos, ácidos orgánicos o similares). El microorganismo que contiene una o más secuencias de ácido nucleico exógeno codificadoras de un celulosoma sintético también puede incluir un gen de tioesterasa exógena, como la TesA acil-CoA tioesterasa de E. coli o un gen de tioesterasa vegetal, que se puede expresar en las células huésped.
RESUMEN
Un aspecto de la presente invención es un microorganismo para usar en la producción de al menos un ácido graso y/o un derivado de ácido graso, según el cual el microorganismo incluye al menos una molécula de ácido nucleico recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa (4-HBT) y la 4-hidroxibenzoíl-CoA tioesterasa tiene al menos un 70% de la secuencia de aminoácidos idéntica a la SEQ ID NO:1 o a la SEQ ID NO:2. Preferible, pero no necesariamente, el microorganismo es de tipo fotosintético.
Dicho microorganismo incluye una molécula de ácido nucleico recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa y también puede producir al menos un ácido graso libre y/o un derivado de ácido graso en una cantidad superior a la que produciría el mismo microorganismo sin la molécula de ácido nucleico recombinante. Por ejemplo, en algunas formas de ejecución el microorganismo produce al menos 5 mg por litro (por ejemplo, al menos 10 mg por litro, al menos 20 mg por litro, al menos 30 mg por litro, al menos 40 mg por litro o al menos 50 mg por litro) de ácidos grasos libres y/o derivados de los mismos durante un período de seis horas hasta diez días.
Además, u opcionalmente, dicho microorganismo incluye una molécula de ácido nucleico recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa y que puede producir al menos un ácido graso libre y/o un derivado del mismo cuya cadena acilo tenga una longitud comprendida entre 8 y 24 carbonos (por ejemplo, una longitud de cadena acilo de 8 hasta 18 o de 12 hasta 16 carbonos). Por ejemplo, al menos un ácido graso libre y/o un derivado del mismo producido por dicho microorganismo puede tener una longitud de cadena acilo de 8, 10, 12, 14, 16, 18, 20, 22 y/o 24 carbonos. En aquellos casos en que el derivado de ácido graso comprenda un éster de cera, éste debería incluir los carbonos estéricos (carbonos A), así como los carbonos de cadena acílica (carbonos B). En aquellos casos en que el derivado de ácido graso comprende uno o más compuestos sin grupos carbonilo (p.ej. alcoholes grasos, alcanos y alquenos) debe entenderse que la longitud de la cadena “acilo” de dichos compuestos corresponde al número total de carbonos en esas moléculas.
Asimismo, adicional o alternativamente, dicho microorganismo incluye al menos un gen recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa y que puede producir al menos un derivado de ácido graso tal como uno o más aldehídos grasos, alcoholes grasos, ésteres de ceras, alcanos, alquenos y/o una combinación de los mismos, pero sin limitarse a ellos. Por ejemplo, el microorganismo puede producir al menos un derivado de ácido graso que tenga un número total de carbonos de 7 hasta 36 (por ejemplo, de 7 hasta 34 o de 11 hasta 32 carbonos). Adicional o alternativamente, al menos un derivado de ácido graso producido por el microorganismo puede tener un número total de carbonos de 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 28, 30, 32, 34 y/o 36.
También adicional o alternativamente, dicho microorganismo incluye al menos un gen recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa y al menos un 30 por ciento en peso (por ejemplo, al menos un 40% en peso, al menos un 50% en peso o al menos un 60% en peso ) de los ácidos grasos libres y/o de los derivados producidos por el microorganismo son ácidos grasos libres cuya cadena acilo tiene una longitud de 8, 10, 12, 14, 16 y/o 18 carbonos y/o derivados de ácidos grasos cuyo número total de carbonos es de 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 26, 28, 30, 32, 34, y/o 36.
La 4-hidroxibenzoíl-CoA tioesterasa es un miembro de la familia Pfam PF03061. Aún adicional o alternativamente, el microorganismo codifica una 4-hidroxibenzoil-CoA tioesterasa que incluye el dominio PF03061 de Pfam y además el microorganismo puede producir un ácido graso cuya cadena de acilo tiene una longitud de 8, 10, 12, 14, 16 y/o 18 carbonos y/o un derivado de ácido graso cuyo número total de carbonos es de 7 a 36.
El microorganismo incluye al menos un gen recombinante codificador de una 4-hidroxibenzoil-CoA tioesterasa que tiene al menos el 70% de identidad de aminoácidos (por ejemplo, al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o aproximadamente el 100% de identidad secuencial) con SEQ ID NO:1 o SEQ ID NO:2. Además el microorganismo puede producir un ácido graso cuya cadena acilo tenga una longitud de 8, 10, 12, 14, 16 y/o 18 átomos de carbono y/o un derivado de ácido graso cuyo número total de átomos de carbono sea de 7 a 36. En algunas formas de ejecución el microorganismo contiene adicionalmente una molécula de ácido nucleico que incluye la secuencia de nucleótidos SEQ ID NO:3 o SEQ ID NO:4.
Aquí también se proporciona una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de un polipéptido que tiene una secuencia de aminoácidos cuya identidad con la SEC ID NO:1 es al menos del 98%. Por ejemplo, una molécula de ácido nucleico aislada o recombinante, según la presente invención, puede comprender una secuencia codificadora de un polipéptido cuya secuencia de aminoácidos tenga al menos un 99% o aproximadamente un 100% de identidad secuencial con la SEQ ID NO:1. También se revela aquí una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de un polipéptido que incluye una secuencia de aminoácidos cuya identidad secuencial con la SEQ ID NO:1 es al menos del 70%, al menos del 75%, al menos del 80%, al menos del 85%, al menos del 90%, al menos del 95%, al menos del 96%, al menos del 97%, al menos del 98%, al menos del 99% o aproximadamente del 100%, en la cual el polipéptido puede hidrolizar un substrato acil-PTA. Alternativa o adicionalmente, la molécula de ácido nucleico aislada o recombinante comprende una secuencia codificadora de un polipéptido que incluye una secuencia de aminoácidos cuya identidad secuencial con la SEQ ID NO:1 es al menos del 70%, al menos del 75%, al menos del 80%, al menos del 85%, al menos del 90%, al menos del 95%, al menos del 96%, al menos del 97%, al menos del 98%, al menos del 99% o aproximadamente del 100%, y al expresarse en un microorganismo huésped produce como resultado un ácido graso libre o un derivado de ácido graso mediante el microorganismo huésped. Por ejemplo, la expresión de un polipéptido que tenga una secuencia con al menos un 70% de identidad con la SEQ ID NO:1 puede producir como resultado al menos una cantidad doble de un ácido graso libre o de un derivado de ácido graso generado por un microorganismo que es idéntico en todos los aspectos al microorganismos huésped, pero que no expresa el polipéptido que tiene una secuencia de aminoácidos al menos un 70% idéntica a la
SEQ ID NO:1
Aquí también se proporciona una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de un polipéptido que tiene una secuencia de aminoácidos cuya identidad con la SEC ID NO:2 es al menos del 55%. Por ejemplo, una molécula de ácido nucleico aislada o recombinante, según la presente invención, puede comprender una secuencia codificadora de un polipéptido cuya secuencia de aminoácidos tenga al menos un 75%, al menos un 80%, al menos un 85%, al menos un 90%, al menos un 95%, al menos un 96%, al menos un 97%, al menos un 98%, al menos un 99% o aproximadamente un 100% de identidad secuencial con la SEQ ID NO:2. También se revela aquí una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de un polipéptido que incluye una secuencia de aminoácidos cuya identidad secuencial con la SEQ ID NO:2 es al menos del 50%, en la cual el polipéptido puede hidrolizar un substrato acil-PTA. Por ejemplo, la molécula de ácido nucleico aislada o recombinante comprende una secuencia codificadora de un polipéptido que incluye una secuencia de aminoácidos cuya identidad con la SEC ID NO:2 es al menos del 50% (por ejemplo de al menos el 55%, al menos el 60%, al menos el 65%, al menos el 70%, al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o aproximadamente el 100%), en la cual el polipéptido puede hidrolizar un substrato acil-PTA. De forma alternativa o adicional, una molécula de ácido nucleico aislada o recombinante, según la presente invención, puede comprender una secuencia que tenga al menos el 55% de identidad de aminoácidos (por ejemplo de al menos el 60%, al menos el 65%, al menos el 70%, al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o aproximadamente el 100% de identidad secuencial) con la SEQ ID NO:2 y al expresarse en un microorganismo huésped produzca como resultado al menos un ácido graso libre o un derivado de ácido graso. Por ejemplo, la expresión de un polipéptido que tenga una secuencia con al menos un 55% de identidad con la SEQ ID NO:2 puede producir como resultado al menos una cantidad doble de un ácido graso libre o de un derivado de ácido graso generado por un microorganismo que es idéntico en todos los aspectos, pero que no expresa el polipéptido que tiene una secuencia de aminoácidos al menos un 55% idéntica a la SEQ ID NO:2.
En algunas formas de ejecución, una molécula de ácido nucleico que codifique una 4-hidroxibenzoíl-CoA tioesterasa se puede integrar de manera estable en un cromosoma de un microorganismo. De modo adicional o alternativo, un ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa puede encontrarse en un episoma que se replica autónomamente. Por ejemplo, un ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa que se halle en un episoma y/o esté integrado en el genoma del microorganismo puede ser una molécula de ácido nucleico exógeno introducida en el microorganismo huésped (o en un precursor del microorganismo huésped), y también puede ser una molécula de ácido nucleico recombinante producida por ingeniería genética.
También, adicional o alternativamente, el microorganismo manipulado genéticamente puede incluir un constructo de expresión que incluya la molécula de ácido nucleico recombinante codificador de la 4-hidroxibenzoíl-CoA tioesterasa y una o más secuencias adicionales reguladoras de la expresión del gen de 4-hidroxibenzoíl-CoA tioesterasa. Por ejemplo, el constructo de expresión puede incluir un promotor operativo en las células huésped, que puede ser, por ejemplo, un promotor bacteriano, viral, fágico o eucariótico. Como alternativa el promotor puede ser de tipo sintético. Además, un promotor de un constructo de expresión que incluya un gen codificador de una 4-hidroxibenzoíl-CoA tioesterasa puede ser un promotor constitutivo o, en formas de ejecución alternativas, un promotor inducible. Por ejemplo, el promotor inducible puede ser controlado por un metal o un compuesto tal como lactosa o un análogo de lactosa y/o mediante luz, y puede ser, por ejemplo, un promotor lac, tac o trc, un promotor secA, un promotor rbc, un promotor psaAB o un promotor psbA.
Asimismo, adicional o alternativamente, el microorganismo de la invención descrita incluye una molécula de ácido nucleico recombinante que codifica una 4-hidroxibenzoíl-CoA tioesterasa y además comprende una molécula de ácido nucleico recombinante codificador de un enzima acetil-CoA carboxilasa y/o una molécula de ácido nucleico recombinante codificador de una β-cetoacil sintasa (KAS). También adicional o alternativamente, el microorganismo de la invención descrita ha atenuado/interrumpido la expresión de uno o más genes que codifican acil-PTA sintasa, acil-CoA sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa o acetato cinasa. Así, por ejemplo, cualquiera de estos genes puede ser inactivado por mutagénesis insercional y/o regulado a la baja por interferencia de ARN o por silenciamiento genético mediado por ARN antisentido.
En cualquiera de las formas de ejecución aquí facilitadas el microorganismo manipulado genéticamente puede ser, por ejemplo, una eubacteria, una arqueobacteria, un hongo, una levadura, un heteroconto, una cianobacteria o un alga. De acuerdo con algunas formas de ejecución de la presente invención, el microorganismo huésped es de tipo fotosintético, tal como una bacteria o alga fotosintética, incluyendo especies de microalgas eucariotas. Por ejemplo, el microorganismo genéticamente modificado puede ser una especie de un género de microalgas, incluyendo, de manera no excluyente, Achnanthes, Amphiprora, Amphora, Ankistrodesmus, Asteromonas, Boekelovia, Borodinella, Botryococcus, Bracteococcus, Chaetoceros, Carteria, Chlamydomonas, Chlorococcum, Chlorogonium, Chlorella, Chroomonas, Chrysosphaera, Cricosphaera, Crypthecodinium, Cryptomonas, Cyclotella, Dunaliella, Ellipsoidon, Emiliania, Eremosphaera, Ernodesmius, Euglena, Franceia, Fragilaria, Gloeothamnion, Haematococcus, Halocafeteria, Hymenomonas, Isochrysis, Lepocinclis, Micractinium, Monoraphidium, Nannochloris, Nannochloropsis,
Navicula , Neochloris, Nephrochloris, Nephroselmis, Nitzschia, Ochromonas, Oedogonium, Oocystis, Ostreococcus, Pavlova, Parachlorella, Pascheria, Phaeodactylum, Phagus, Picochlorum, Platymonas, Pleurochrysis, Pleurococcus, Prototheca, Pseudochlorella, Pseudoneochloris, Pyramimonas, Pyrobotrys, Scenedesmus, Skeletonema, Spyrogyra , Stichococcus, Tetraselmis, Thalassiosira, Viridiella y Volvox.
Más particularmente, el microorganismo puede ser de tipo procariótico fotosintético. Por ejemplo, el microorganismo fotosintético puede ser una especie de un género cianobacteriano, incluyendo, sin limitarse a ellos, Agmenellum, Anabaena, Anabaenopsis, Anacystis, Aphanizomenon, Arthrospira, Asterocapsa, Borzia, Calothrix, Chamaesiphon, Chlorogloeopsis, Chroococcidiopsis, Chroococcus, Crinalium, Cyanobacterium, Cyanobium, Cyanocystis, Cyanospira, Cyanothece, Cylindrospermopsis, Cylindrospermum, Dactylococcopsis, Dermocarpella, Fischerella, Fremyella, Geitleria, Geitlerinema, Gloeobacter, Gloeocapsa, Gloeothece, Halospirulina, Iyengariella, Leptolyngbya, Limnothrix, Lyngbya, Microcoleus, Microcystis, Myxosarcina, Nodularia, Nostoc, Nostochopsis, Oscillatoria, Phormidium, Planktothrix, Pleurocapsa, Prochlorococcus, Prochloron, Prochlorothrix, Pseudanabaena, Rivularia, Schizothrix, Scytonema, Spirulina, Stanieria, Starria, Stigonema, Symploca, Synechococcus, Synechocystis, Thermosynechococcus, Tolypothrix, Trichodesmium, Tychonema, y Xenococcus.
Según otro aspecto, la presente revelación se refiere a un cultivo para producir un ácido graso libre y/o un derivado de ácido graso, que contiene una población de microorganismos en la cual puede estar incluida una molécula de un ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa. En ciertas formas de ejecución preferidas el microorganismo es de tipo fotosintético y los medios de crecimiento del cultivo no incluyen una fuente de carbono reducido, o al menos una cantidad sustancial de una fuente de carbono reducido, entendiendo como tal una cantidad que pueda sostener el crecimiento del cultivo en ausencia de otra fuente de energía.
En el cultivo los microorganismos pueden producir (y opcional, pero preferentemente, liberar y/o secretar) al menos un ácido graso libre y/o un derivado de ácido graso. Adicional o alternativamente los microorganismos producen en el cultivo una mayor cantidad de un ácido graso y/o de un derivado de ácido graso en comparación con un cultivo de los mismos microorganismos sin la inclusión de una molécula de ácido nucleico recombinante codificador de una 4hidroxibenzoíl-CoA tioesterasa, el cual es idéntico en los demás aspectos. También adicional o alternativamente, los microorganismos del cultivo incluyen una molécula de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa y además el cultivo puede incluir al menos 5 mg por litro (por ejemplo, al menos 10 mg por litro, al menos 20 mg por litro, al menos 30 mg por litro, al menos 40 mg por litro o al menos 50 mg por litro) de ácidos grasos libres y/o de derivados de ácidos grasos durante un período que oscila entre seis horas y diez días. Los ácidos grasos y/o los derivados de ácidos grasos pueden estar presentes en los medios, por ejemplo, como precipitados en la superficie del medio o cerca de ella, pegados al recipiente de los medios formando gotitas que incluyen gotas suspendidas (p.ej. una emulsión), como un capa relativamente inmiscible flotando en la parte superior del medio de cultivo acuoso, como “espuma”, película, gel, semisólido, coloide, partículas finas, partículas, sólidos o agregados que pueden estar dispersados, suspendidos o atrapados dentro del medio de cultivo, unidos a las células del microorganismo huésped, separados de alguna otra forma en fases, o como una combinación de dichas formas.
Además o alternativamente puede ser que el microorganismo huésped sea de tipo fotosintético y que el medio de crecimiento del cultivo no incluya una cantidad sustancial de una fuente de carbono reducido, entendiendo como tal una cantidad que pueda sostener el crecimiento del cultivo en ausencia de otra fuente de energía. También adicional
o alternativamente, se puede suministrar al cultivo al menos una fuente de carbono inorgánico, como por ejemplo bicarbonato o dióxido de carbono (CO2), y/o los microorganismos fotosintéticos del cultivo pueden exponerse a la luz durante al menos una parte del período de cultivo.
Adicionalmente se puede aislar del cultivo, por ejemplo de las células, de los medios de crecimiento o del cultivo completo, un ácido graso libre y/o un derivado de ácido graso. La separación puede llevarse a cabo, por ejemplo, por extracción orgánica de células completas y/o lisadas, por eliminación de ácidos grasos libres y/o derivados de ácidos grasos en forma de precipitados (p.ej. de la capa superior del medio de cultivo, lo cual también se conoce como “descremado”), mediante el uso de adsorbentes particulados, burbujas y/o matrices que pueden fijar los ácidos grasos o los derivados de ácidos grasos, o combinaciones de los mismos.
DESCRIPCIÓN BREVE DE LAS FIGURAS
La FIGURA 1 muestra un diagrama esquemático de la vía biosintética para la producción de ácido grasos libres y derivados de ácido grasos. La FIGURA 2 muestra el mapa físico del vector de expresión (RB-RS1) empleado para construir una biblioteca metagenómica. La FIGURA 3 muestra el perfil de ácidos grasos libres (AGL) aislados del cultivo de células de E. coli que expresan el gen 340-64 (SEQ ID NO:3), en comparación con una acil-PTA tioesterasa de plantas superiores (25 control). La FIGURA 4 es un gráfico de los ácidos grasos libres (AGL) aislados del cultivo de células de E. coli que expresan el gen 3-1 (SEQ ID NO:4), en comparación con un control (25 control). La FIGURA 5 es un gráfico de los ácidos grasos libres (AGL) aislados del cultivo de E. coli (cepa K19 que carece de una acil-CoA sintetasa funcional) que expresa el gen 340-64 (SEQ ID NO:3), en comparación con un control
(control: vector RBRS1 vacío (VV)). La concentración de ácidos grasos libres (AGL) se normalizó a la DO de los cultivos de E. coli. La FIGURA 6 muestra los patrones de migración de substratos acil-PTA en un gel nativo de acrilamida al 20% que contiene urea 2,5 M. Los substratos de acil-PTA (C16-TPA) se incubaron con extractos celulares obtenidos de E. coli que expresa distintos clones (PE0045 (extracto de control), 3-1 4-HBT (SEQ ID NO:4) o 340-64 4-HBT (SEQ ID NO:3)).
DESCRIPCIÓN DETALLADA DE LA PRESENTE INVENCIÓN
La invención descrita se refiere a un microorganismo, a 4-hidroxibenzoíl-CoA tioesterasas y a un método para la producción de uno o más ácidos grasos libres y/o de sus derivados, incluyendo la expresión de 4-hidroxibenzoílCoA-tioestearasa en un microorganismo (p.ej. expresando una molécula de ácido nucleico recombinante codificador de 4-hidroxibenzoíl-CoA tioesterasa).
Glosario
Las abreviaturas empleadas aquí para los aminoácidos son las que se usan convencionalmente: A = Ala = alanina; R = Arg = arginina; N = Asn = asparagina; D = Asp = ácido aspártico; C = Cys = cisteína; Q = Gln = glutamina; E = Glu = ácido glutámico; G = Gly = glicina; H = His = histidina; I = Ile = isoleucina; L = Leu = leucina; K = Lys = lisina; M = Met = metionina; F = Phe = fenilalanina; P = Pro = prolina; S = Ser = serina; T = Thr = treonina; W = Trp = triptófano; Y = Tyr = tirosina; V = Val = valina. Los aminoácidos pueden ser L- o D-aminoácidos. Un aminoácido se puede reemplazar por un aminoácido sintético modificado para aumentar la vida media del péptido, su potencia, o su biodisponibilidad.
Tal como se utiliza aquí, la frase “sustitución conservadora de aminoácidos” o “mutación conservadora” se refiere a la sustitución de un aminoácido por otro aminoácido con una propiedad común. Una manera funcional de definir propiedades comunes entre aminoácidos individuales consiste en analizar las frecuencias normalizadas de cambios de aminoácidos entre las respectivas proteínas de organismos homólogos (Schulz, G.E. y R.H. Schirmer, Principles of Protein Structure, editorial Springer). Según tales análisis se pueden definir grupos de aminoácidos de modo que los intercambios entre aminoácidos tengan lugar preferentemente dentro de un mismo grupo y por lo tanto estos aminoácidos tienen un impacto muy parecido en la estructura proteica general (Schulz, GE y RH Schirmer, Principles of Protein Structure [Principios de la estructura proteica], editorial Springer). Los ejemplos de grupos de aminoácidos definidos de esta manera pueden incluir: un “grupo cargado/polar”, que engloba Glu, Asp, Asn, Gln, Lys, Arg y His; un “grupo aromático o cíclico”, que engloba Pro, Phe, Tyr y Trp; y un “grupo alifático”, que engloba Gly, Ala, Val, Leu, Ile, Met, Ser, Thr y Cys. Dentro de cada grupo también se pueden identificar subgrupos. Por ejemplo, el grupo de aminoácidos cargados/polares se puede subdividir en subgrupos que incluyen: el “subgrupo cargado positivamente”, que engloba Lys, Arg y His; el “subgrupo cargado negativamente”, que engloba Glu y Asp; y el “subgrupo polar” que engloba Asn y Gln. En otro ejemplo, el grupo aromático o cíclico se puede subdividir en subgrupos que incluyen: el “subgrupo de anillos nitrogenados”, que engloba Pro, His y Trp; y el “subgrupo de fenilo”, que engloba Phe y Tyr. En otro ejemplo adicional el grupo alifático se puede subdividir en subgrupos que incluyen: el “subgrupo apolar alifático grande”, que engloba Val, Leu e Ile; el “subgrupo alifático ligeramente polar”, que engloba Met, Ser, Thr y Cys; y el “subgrupo de restos pequeños”, que engloba Gly y Ala. Los ejemplos de mutaciones conservadoras incluyen las sustituciones entre aminoácidos dentro de dichos subgrupos, tales como:
alanina (A), serina (S), treonina (T);
ácido aspártico (D), ácido glutámico (E);
asparagina (N), glutamina (Q);
arginina (R), lisina (K);
isoleucina (I), leucina (L), metionina (M), valina (V); y
fenilalanina (F), tirosina (Y), triptófano (W). pero sin limitarse a ellos.
Tal como se emplea aquí, el término “tioesterasa de proteína transportadora acilo-acilo” o “acil-PTA tioesterasa” se refiere a un enzima tioesterasa que hidroliza un enlace éster acilo-TPA de manera preferente sobre otros substratos, tales como un substrato acil-CoA y/o un substrato de hidroxibenzoíl-CoA (como por ejemplo 4-hidroxibenzoíl-CoA, 2,5-dihidroxibenzoíl-CoA o análogos), y puede incluir una acil-PTA tioesterasa perteneciente a la familia de proteínas (Pfam) PF01643 (en pfam.cgb.ki.se/; en pfam.janelia.org/; en pfam.sanger.ac.uk).
Tal como se emplean aquí, los términos “acil-coenzima A tioesterasa”, “acil-CoA tioesterasa” y “acil-CoA hidrolasa”, se refieren a un enzima tioesterasa que cataliza la hidrólisis del enlace tioéster presente en las moléculas del éster acil-CoA para producir el coenzima A (CoASH) y el correspondiente ácido graso no esterificado.
Tal como se emplea aquí, el término “atenuar” significa debilitar o disminuir la fuerza, intensidad, actividad, efecto o cantidad.
Tal como se usa aquí, el término “autótrofo” se refiere a un organismo que produce compuestos orgánicos complejos (carbohidratos, grasas y proteínas) a partir de moléculas inorgánicas sencillas, utilizando energía de la luz (mediante fotosíntesis) o reacciones químicas inorgánicas. Normalmente tienen capacidad de crear su propio alimento. Algunos autótrofos pueden fijar dióxido de carbono.
Tal como se emplea aquí, el término “autotrófico” se refiere a un organismo que es capaz de producir compuestos orgánicos complejos (carbohidratos, grasas y proteínas) a partir de moléculas inorgánicas sencillas, usando energía de la luz (por fotosíntesis) y/o reacciones químicas inorgánicas. Tal como se usa aquí, el término “fotoautotrófico” se refiere a un organismo capaz de producir compuestos orgánicos complejos (carbohidratos, grasas y proteínas) a partir de moléculas inorgánicas sencillas, usando energía de la luz (por fotosíntesis). “Crecimiento fototrófico” es el crecimiento que utiliza luz como fuente de energía.
Tal como se usa aquí, el término “biocombustible” se refiere a cualquier combustible obtenido a partir de un recurso biológico renovable.
Tal como se emplea aquí, el término “fuente de carbono” se refiere a un compuesto que proporciona los esqueletos carbonados necesarios para la síntesis de nuevas moléculas orgánicas.
Tal como se emplea aquí, el término “clado” se refiere a un grupo de taxones o especies biológicas que comparten características heredadas de un ancestro común. Un clado incluye un linaje ancestral y todos los descendientes de este ancestro. El término también se emplea para referirse a una clasificación de genes o proteínas por la afinidad (homología) de sus secuencias.
Un gen con “codones optimizados” para la expresión en un organismo es un gen cuya secuencia de nucleótidos ha sido alterada respecto a la secuencia nucleótida original, de manera que uno o más codones de la secuencia de nucleótidos se han transformado en un codón diferente que codifica el mismo aminoácido, y el nuevo codón se usa con más frecuencia en los genes del organismo útil que el codón original. La degeneración del código genético hace que todos los aminoácidos, excepto la metionina y el triptófano, sean codificados por más de un codón. Por ejemplo, la arginina, la leucina y la serina son codificadas por seis codones diferentes, y la glicina, la alanina, la valina, la treonina y la prolina son codificadas por cuatro codones diferentes. Muchos organismos usan ciertos codones para codificar un aminoácido concreto con más frecuencia que otros. Sin querer limitar cualquier aspecto de la presente revelación a un mecanismo particular se cree que algunos ARNt de un aminoácido determinado predominan sobre otros dentro de un organismo particular, y los genes que requieren un ARNt infrecuente para la traducción de la proteína codificada se pueden expresar a un nivel bajo, debido en parte a la cantidad limitada del ARNt infrecuente.
Por tanto, para niveles adecuados u óptimos de expresión de una proteína codificada, un gen puede tener “codones optimizados” con el fin de transformar uno o más codones en nuevos codones (“codones preferidos”) que figuran entre los utilizados con mayor frecuencia en los genes del organismo huésped (lo cual se conoce como “preferencia de codones” del organismo). Tal como se emplea en el contexto de la presente invención, un gen con “codones optimizados” o una molécula de ácido nucleico de la presente invención no requieren tener cada codón alterado para adaptarse a la preferencia de codones del organismo huésped previsto, ni tampoco es necesario que los codones alterados de un gen con “codones optimizados” o una molécula de ácido nucleico se transformen en el codón más prevalente utilizado por el organismo de interés. Por ejemplo, un gen con codones optimizados puede tener uno o más codones transformados en codones utilizados con mayor frecuencia que el codón o codones originales, tanto si se usan, o no, con mayor frecuencia en el organismo para codificar un aminoácido concreto.
Tal como se emplea aquí, el término “elemento regulador controlable” o “elemento regulador” se refiere a secuencias de ácido nucleico capaces de efectuar la expresión de los ácidos nucleicos o del péptido o producto proteico de los mismos. Los elementos reguladores controlables se pueden unir operativamente a los ácidos nucleicos, péptidos o proteínas de la presente revelación. Los elementos reguladores controlables tales como, de manera no excluyente, las secuencias de control, no necesitan ser contiguos a los ácidos nucleicos, péptidos o proteínas cuya expresión es controlada por ellos, siempre que actúen dirigiendo su expresión. Así, por ejemplo, pueden encontrarse secuencias intermedias no traducidas, pero transcritas, entre una secuencia promotora y un ácido nucleico según la presente invención, y la secuencia promotora todavía puede considerarse “operativamente unida” a la secuencia codificadora.
Otras secuencias de control de este tipo incluyen, sin limitarse a ellas, las secuencias potenciadoras, las secuencias reguladoras de la traducción, las secuencias reguladoras de la estabilidad del ARNm, las señales de poliadenilación, las señales de terminación y los sitios de unión a ribosomas.
Tal como se usa aquí, el término “endógeno” se refiere a sustancias creadas o producidas dentro de un organismo. Un gen o una proteína endógenos son aquellos que residen en una especie que también procede de esa especie.
Un “episoma” es una molécula de ácido nucleico que no está integrada en el cromosoma o cromosomas de la célula y se replica autónomamente en una célula. Una molécula o secuencia episómica de ácidos nucleicos es un gen, una molécula de ácido nucleico o una secuencia de ácidos nucleicos que están integrados en un episoma. Un ejemplo
de un episoma lo constituye un plásmido, que es una molécula circular de ADN externa al o a los cromosomas, que incluye un origen de replicación y se replica autónomamente dentro de la célula.
“Constructo de expresión” se refiere a un ácido nucleico que ha sido generado por intervención humana, incluyendo los medios recombinantes o la síntesis química directa, con una serie de elementos de ácido nucleico especificados que permiten la transcripción y/o la traducción de un ácido nucleico particular en una célula huésped. El constructo de expresión puede ser parte de un plásmido, virus o fragmento de ácido nucleico.
Tal como se usa aquí, el término “exógeno” se refiere a una sustancia o molécula que se origina o produce fuera de un organismo. Tal como se usa aquí, el término “gen exógeno” o “molécula de ácido nucleico exógeno” se refiere a un ácido nucleico que codifica la expresión de un ARN y/o de una proteína que se ha introducido (“transformado”) en una célula o en un precursor de la célula. Un gen exógeno puede ser de una especie diferente (y por lo tanto un gen “heterólogo”) o de la misma especie (y por lo tanto un gen “homólogo”), en relación con la célula que está siendo transformada. Una célula transformada se puede denominar célula recombinante. Una molécula de ácido nucleico, un gen o una proteína “endógenos” pueden constituir el gen o proteína propios del organismo, pues son producidos por él de manera natural.
Tal como se usa aquí, el término “que expresa” o “expresión” significa la transcripción y traducción de una molécula de ácido nucleico por una célula. La expresión puede ser, por ejemplo, constitutiva o regulada, como la debida a un promotor inducible (p.ej. el operón lac, que puede ser activado por isopropil-β-D-1-tiogalactopiranósido (IPTG)).
Tal como se usa aquí, el término “ácido graso” se refiere a un ácido carboxílico no esterificado que tiene una cadena alquilo de al menos 3 carbonos (es decir, una cadena acilo de al menos 4 carbonos) o a su correspondiente anión carboxilato, representado respectivamente como RCOOH o RCOO-, donde R es una cadena alquilo de 3 hasta 23 átomos de carbono. Un “ácido graso libre” está sustancialmente no asociado, por ejemplo, con una proteína, dentro
o fuera de un organismo (p.ej. el almacenamiento globular y/o micelar dentro de un organismo, sin esterificación, todavía se puede calificar como ácido graso libre). Por lo tanto, un ácido graso libre según la presente descripción no tiene por qué ser necesariamente ser un ácido estricto o estar estructuralmente “libre”, pero un ácido graso libre no incluye específicamente un resto de acilo cuyo oxígeno del carboxilato esté unido por enlace covalente a cualquier otro resto, aparte de un átomo de hidrógeno, lo cual significa que los ésteres de los ácidos grasos no están incluidos específicamente en los ácidos grasos libres. Sin embargo un ácido graso libre puede incluir ventajosamente un resto acilo que contenga al menos cuatro carbonos (por ejemplo, al menos 6 carbonos, por ejemplo al menos 8 carbonos), y (i) esté unido covalentemente a un átomo de hidrógeno, (ii) tenga una carga iónica a la cual pueda asociarse un contraión (incluso si está suelto y/o separado por disolvente) y/o (iii) esté unido (no covalentemente) con un resto distinto de hidrógeno, por ejemplo mediante un enlace éster, de modo que un ácido graso libre se pueda transformar con relativa facilidad en la correspondiente forma ácida o en la correspondiente forma iónica (p.ej. mediante enlaces de hidrógeno o similares. Los ejemplos no limitativos de contraiones pueden incluir sales metálicas (tales como las de calcio, sodio, potasio, aluminio, hierro y similares, y combinaciones de los mismas), otros iones inorgánicos (tales como amonio, mono-, di-, tri- y tetra-alquilamonio, sulfonio, fosfonio y similares, y combinaciones de los mismos), iones orgánicos (tales como los carbocationes) y similares, y combinaciones de los mismos. Tal como se usa aquí, el término “ácidos grasos libres” también se refiere a ácidos grasos que no están unidos covalentemente a ningún otro resto, con la excepción del hidrógeno (unido por el grupo ácido carboxílico). Por ejemplo, un ácido graso libre no va unido a otras moléculas como TPA, coenzima A (CoA) o glicerina (por ejemplo, como parte de una molécula de un triglicérido, diglicérido, monoglicérido o fosfolípido). Los ácidos grasos libres contienen un grupo carboxilo (-COOH), que se puede ionizar en forma de un carboxilato aniónico (R-COO-; R: hidrocarburos).
Los ácidos grasos pueden tener un número par o impar de átomos de carbono (p.ej. el heptadecanoico = C17) y también pueden tener cadenas ramificadas (p.ej. el ácido isopalmítico, el ácido anteisononadecanoico) o unidades carbocíclicas (p.ej. el ácido estercúlico, el ácido chalmúgrico).
En algunos ácidos grasos la cadena hidrocarbonada es completamente saturada (lo cual significa que no contiene dobles enlaces) y no está ramificada; otros contienen uno (monoinsaturado) o más enlaces dobles (insaturados). Una nomenclatura simplificada para estos compuestos especifica la longitud de la cadena y el número de enlaces dobles, separados por dos puntos; el ácido palmítico, saturado, de 16 carbonos, se abrevia 16:0, y el ácido oleico, de 18 carbonos, con un doble enlace, es 18:1. Las posiciones de cualquier enlace doble se especifican mediante números superíndices después de Δ (delta); un ácido graso de 20 carbonos con un doble enlace entre C-9 y C-10 (C-1 es el carbono carboxílico) y otro entre C-12 y C-13, por ejemplo, se abrevia 20:2 (Δ9,12). Los ácidos grasos más comunes tienen números pares de átomos de carbono en una cadena no ramificada de 12 a 24 carbonos. El número par de carbonos es el resultado del modo de síntesis de estos compuestos, que comporta la condensación de unidades de acetato (dos carbonos). La posición de los dobles enlaces también es regular; en la mayoría de los ácidos grasos monoinsaturados el doble enlace se halla entre C-9 y C-10 (Δ9) y otros dobles enlaces en los ácidos grasos poliinsaturados son generalmente Δ12 y Δ15. Los dobles enlaces de casi todos los ácidos grasos insaturados naturales están en la configuración cis. (Lehninger y otros, Principles of Biochemistry, vol. 1, Macmillan, 2005).
Los ejemplos de ácidos grasos saturados incluyen, sin limitarse a ellos: ácido butanoico (butírico) (C4), ácido hexanoico (caproico) (C6), ácido octanoico (caprílico) (C8), ácido decanoico (cáprico) (C10), ácido dodecanoico
(ácido láurico) (C12), ácido tetradecanoico (mirístico) (C14), ácido hexadecanoico (palmítico) (C16), ácido octadecanoico (esteárico) (C18) y ácido eicosanoico (araquídico) (C20), ácido docosanoico (behénico) (C22), ácido tetracosanoico (lignocérico) (C24). Los ejemplos de ácidos grasos insaturados incluyen, sin limitarse a ellos: ácido miristoleico (C14:1, cisΔ9), ácido palmitoleico (C16:1, cisΔ9), ácido sapiénico (C16:1, cisΔ6), ácido oleico (C18:1, cisΔ9), ácido linoleico (C18:2, cisΔ9, cisΔ12), ácido α-linoleico (C18:3, cisΔ9, cisΔ12, cisΔ15), ácido araquidónico (C20:4, cisΔ5, cisΔ8, cisΔ11, cisΔ14), ácido eicosapentaenoico (C20:5, cisΔ5, cisΔ8, cisΔ11, cisΔ4, cisΔ17), ácido erúcico (C22:1, cisΔ13) y ácido docosahexaenoico (C22:6, cisΔ4, cisΔ1, cisΔ10, cisΔ13 , cisΔ16, cisΔ19). Los ácidos grasos de cadena larga también se pueden preparar partiendo de ácidos grasos de cadena más corta de mayor disponibilidad (C12-C18) por medio de procedimientos apropiados de extensión de cadena.
Los ejemplos no limitativos de ácidos grasos de cadena ramificada de origen natural incluyen los ácidos grasos iso (principalmente de número par de átomos de carbono) y los ácidos grasos anteiso (principalmente de número impar de átomos de carbono), los ácidos polimetil-ramificados en lípidos bacterianos y los ácidos basados en el fitol.
Los ácidos cíclicos más comunes contienen una unidad de ciclopropano, ciclopropeno o ciclopenteno. Los ácidos de ciclopropano se hallan en los fosfolípidos de las membranas bacterianas y son principalmente ácidos C17 o C19 (lactobacílicos). La unidad de ciclopropano, como el doble enlace cis, introduce una discontinuidad en la molécula y aumenta la fluidez en la membrana.
Las propiedades físicas de los ácidos grasos y de los compuestos que los contienen están determinadas en gran medida por la longitud y el grado de insaturación de la cadena hidrocarbonada. La cadena hidrocarbonada no polar explica la escasa solubilidad de los ácidos grasos en agua. Cuanto más larga sea la cadena de acilo graso y menos dobles enlaces haya, menor será la solubilidad en agua. El grupo de ácido carboxílico es polar (e ionizado a pH neutro) y explica la ligera solubilidad de los ácidos grasos de cadena corta en agua. Los puntos de fusión de los ácidos grasos y de los compuestos que los contienen también están fuertemente influidos por la longitud y el grado de insaturación de la cadena hidrocarbonada. En los compuestos totalmente saturados, la rotación libre alrededor de cada uno de los enlaces carbono-carbono confiere a la cadena hidrocarbonada una gran flexibilidad; la conformación más estable es esta forma completamente extendida, en la cual se minimiza el impedimento estérico de los átomos vecinos. Estas moléculas pueden compactarse estrechamente en matrices casi cristalinas, con átomos a lo largo de todas sus longitudes, en contacto van der Waals con los átomos de moléculas vecinas. Un doble enlace cis fuerza una torsión de la cadena hidrocarbonada. Los ácidos grasos que tienen uno o varios de estos pliegues no se pueden compactar tan estrechamente como los ácidos grasos totalmente saturados y por lo tanto sus interacciones mutuas son más débiles. Como se requiere menos energía térmica para desordenar estas matrices poco organizadas de ácidos grasos insaturados, sus puntos de fusión son más bajos que los de los ácidos grasos saturados de la misma longitud de cadena (Lehninger y otros, Principles of Biochemistry, vol. 1, Macmillan, 2005).
Tal como se usa aquí, el término “derivado de ácido graso” se refiere a una molécula orgánica derivada de un ácido graso. Los ejemplos de derivados de ácidos grasos incluyen, sin limitarse a ellos, ésteres de ácidos grasos C1-C5 tales como los ésteres metílicos de ácidos grasos y los ésteres etílicos de ácidos grasos, los ésteres de ceras, los alcoholes grasos, los aldehídos grasos y los alcanos y alquenos grasos.
Tal como se emplea aquí, el término “alcohol graso” se refiere a un alcohol preparado a partir de un ácido graso o de un derivado de ácido graso y tiene la fórmula ROH. La cadena hidrocarbonada del alcohol graso puede ser lineal o ramificada. La cadena hidrocarbonada puede ser saturada o insaturada.
Tal como se emplea aquí, el término “aldehído graso” se refiere a un aldehído preparado a partir de un ácido graso o de un derivado de ácido graso y tiene la fórmula RCHO. El hidrocarburo del aldehído graso puede ser saturado o insaturado.
Tal como se usa aquí, el término “gen” se refiere a una molécula de ácido nucleico que codifica una proteína o un ARN funcional (por ejemplo un ARNt). Un gen puede incluir regiones que no codifiquen la proteína final o el producto de ARN, tales como regiones 5’ o 3’ no traducidas, intrones, sitios de unión a ribosomas, regiones promotoras o potenciadoras u otras regiones de secuencias asociadas y/o reguladoras.
Los términos “expresión genética” y “expresión” se usan aquí indistintamente para referirse al proceso por el cual la información heredable de un gen, como una secuencia de ADN, se transforma en un producto genético funcional tal como una proteína o ARN.
Tal como se emplea aquí, el término “ingeniería genética” se refiere al uso de métodos de biología molecular para manipular secuencias de ácidos nucleicos e introducir moléculas de ácido nucleico en los organismos huésped. Tal como se usa aquí, la expresión “modificada por ingeniería genética” se refiere a una célula que ha sido sometida a manipulaciones de ADN recombinante, tales como la introducción de moléculas de ácido nucleico exógeno, dando como resultado una célula cuya forma no se encuentra originalmente en la naturaleza.
Tal como se emplea aquí, el término “crecimiento” se refiere a un proceso de ampliación, alargamiento o incremento cuantitativo, o puede indicar un aumento del tamaño, del número o del volumen de las células de una población.
Tal como se usa aquí, el término “heterotrófico” se refiere a la necesidad de substratos de carbono reducido para el crecimiento.
Tal como se usa aquí, el término “heterótrofo” se refiere a un organismo que no produce su propio alimento y debe adquirir algunos de sus nutrientes del entorno, p.ej. en forma de carbono reducido.
Un “homólogo” de un gen o de una proteína se refiere a su equivalente funcional en otras especies.
Tal como se usa aquí, el término “hidrocarburo” se refiere a cualquiera de los compuestos orgánicos que constan exclusivamente de hidrógeno y carbono en diversas relaciones.
El término “hibridación” se refiere a la unión de dos moléculas de ácido nucleico monocatenario entre sí mediante apareamiento de bases. Los nucleótidos se unen a su complemento en condiciones normales; por consiguiente dos cadenas perfectamente complementarias se unirán (o se “hibridarán”) fácilmente entre sí. Sin embargo, debido a las distintas geometrías moleculares de los nucleótidos, una sola inconsistencia entre las dos cadenas hará que la unión entre ambas sea energéticamente más desfavorable. La medición de los efectos de la incompatibilidad de las bases mediante la cuantificación de la velocidad a la que se hibridan dos cadenas puede proporcionar información sobre la similitud de las secuencias de bases entre las dos cadenas que se están hibridando.
Tal como se usan aquí, los términos “4-hidroxibenzoíl-CoA tioesterasa”, “hidroxibenzoíl-CoA tioesterasa”, “4-hidroxibenzoato tioesterasa” y “4-HBT” se refieren a un enzima tioesterasa (EC 3.1.2.23) capaz de catalizar la escisión del enlace tioéster del 4-hidroxibenzoíl-CoA para formar hidroxibenzoato, que es la última de las tres etapas de la vía de conversión del 4-clorobenzoato a hidroxibenzoato.
Tal como se emplea aquí, el término “inductor” se refiere a una molécula capaz de iniciar la transcripción de un gen controlada por un promotor inducible.
Tal como se emplea aquí, el término “promotor inducible” se refiere a un promotor cuya actividad promotora de la transcripción de un gen al cual va unido operativamente es controlada por una variable ambiental (p.ej. temperatura, luz o similar) o por la presencia de un factor tal como un compuesto o biomolécula específicos. El término “promotor constitutivo” se refiere a un promotor cuya actividad se mantiene a un nivel bastante constante en todas las células de un organismo, con poca o ninguna dependencia de las condiciones ambientales de la célula (como por ejemplo la concentración de un substrato).
Tal como se usan aquí, los términos “que inhibe”, “inhibe” e “inhibición” se refieren a la disminución de la magnitud o la velocidad de un proceso, a la paralización total del proceso o a la reducción, limitación o bloqueo de su actividad o función. La inhibición puede incluir una reducción o descenso de cantidad, velocidad, actividad, función o proceso de al menos el 5%, por ejemplo de al menos el 10%, al menos el 15%, al menos el 20%, al menos el 25%, al menos el 30%, al menos el 40%, al menos el 45%, al menos el 50%, al menos el 55%, al menos el 60%, al menos el 65%, al menos el 70%, al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 98% o al menos el 99%, en comparación con una sustancia de referencia no inhibida.
“Carbono inorgánico” es un compuesto o molécula que contiene carbono, pero no puede ser usado como fuente de energía por un organismo. Normalmente el “carbono inorgánico” está en forma de CO2 (dióxido de carbono), ácido carbónico, bicarbonato o carbonato, que no pueden oxidarse para obtener energía o ser utilizados como fuente de poder reductor por los organismos.
Tal como se usa aquí, el término “mutagénesis insercional” se refiere a una mutagénesis de ADN por inserción de ADN exógeno en un gen.
Tal como se usa aquí, el término “aislar” se refiere a un proceso de obtención de una sustancia, molécula, proteína, péptido, ácido nucleico o anticuerpo que esté esencialmente libre de otras sustancias con las que suele encontrarse en la naturaleza o en sistemas in vivo, hasta un nivel práctico y apropiado para su uso previsto.
El término “aislado” se refiere a un material tal como un ácido nucleico, un péptido o una proteína, que: (1) está sustancial o esencialmente libre de componentes que normalmente lo acompañan o interactúan con él tal, como se encuentra en su entorno natural, o (2) si el material se encuentra en su entorno natural, ha sido alterado de forma sintética (no natural) por intervención humana intencionada para una composición y/o ha sido introducido en un sitio de la célula (p.ej. genoma u orgánulo subcelular) que no es natural para un material procedente de dicho entorno. La expresión “sustancial o esencialmente libre” se utiliza para referirse a un material que está al menos 80% libre, por ejemplo al menos 90% libre, al menos 95% libre o al menos 99% libre (porcentajes en peso, solo si son aplicables) de los componentes que normalmente lo acompañan o interactúan con él en su entorno natural. El material aislado contiene opcionalmente material que no lo acompaña en su entorno natural.
Tal como se usa aquí, el término “heterólogo” se refiere a ácidos nucleicos derivados de una especie diferente de aquella en la cual se introducen o de aquella en que residen, mediante manipulación genética del organismo o de su
precursor. Una proteína heteróloga procede de una especie distinta de aquella en la cual se produce o se introduce. Una secuencia de ácido nucleico, un gen o una proteína heterólogos son una secuencia de ácido nucleico, un gen o una proteína que provienen de un organismo distinto de aquél en el cual se introducen o residen.
Haciendo referencia a elementos de regulación genética, “heterólogo” se refiere a un elemento regulador de genes que está unido operativamente a un gen con el cual no está relacionado en la naturaleza. Tal como se emplea aquí, el término “expresión heteróloga” significa que un ácido nucleico heterólogo codificador de una proteína (p.ej. de un enzima) se introduce en una célula que normalmente no produce (es decir, no expresa) esta proteína.
Tal como se usa aquí, el término “análogo de lactosa” se refiere a un compuesto empleado como sustituto de la lactosa, reemplazando el fragmento de glucosa de la lactosa por otro grupo químico. Los ejemplos de análogos de lactosa incluyen, sin limitarse a ellos: isopropil-β-D-tiogalactósido (IPTG), fenil-β-D-galactosa (fenil-Gal) y alolactosa.
Tal como se usa aquí, el término “” se refiere a un grupo químicamente diverso de compuestos, cuya característica común y definitoria es su insolubilidad en agua.
Tal como se usa aquí, el término “ingeniería metabólica” se refiere en general a la alteración orientada y deliberada de las rutas metabólicas encontradas en un organismo, con el fin comprender y utilizar mejor las vías celulares para la transformación química, la transducción de energía y el ensamblaje supramolecular.
Tal como se usa aquí, el término “intermediario metabólico” se refiere a una molécula precursora producida por una serie de reacciones enzimáticas y alterada por las reacciones enzimáticas subsiguientes.
El término “microorganismo” se refiere a un organismo vivo de un tamaño tan pequeño que solo es visible con la ayuda de un microscopio.
Tal como se usa aquí, el término “mixotrófico” se refiere a células u organismos capaces de utilizar una mezcla de diferentes fuentes de energía y carbono, por ejemplo mediante fototrofia (que significa crecimiento por consumo de energía lumínica) y quimiotrofia (que significa crecimiento por consumo de la energía producida por la oxidación de dadores de electrones) o entre autotrofia química y la heterotrofia.
Tal como se usa aquí, el término “ácido nucleico” se refiere a un polímero desoxirribonucleótido o ribonucleótido de forma monocatenaria o bicatenaria, y a no ser que se limite de otra manera, engloba análogos conocidos que tienen la naturaleza esencial de los nucleótidos naturales, pues se hibridan con ácidos nucleicos monocatenarios de modo similar a los nucleótidos naturales (p.ej. ácidos nucleicos peptídicos).
Tal como se usa aquí, el término “nucleótido” se refiere a un compuesto químico formado por una base heterocíclica, un azúcar y uno o más grupos fosfato. En los nucleótidos más usuales la base es un derivado de purina o pirimidina y el azúcar es la pentosa desoxirribosa o ribosa. Los nucleótidos son los monómeros de los ácidos nucleicos, con tres o más de ellos unidos entre sí para formar un ácido nucleico. Los nucleótidos son las unidades estructurales del ARN, del ADN y de varios cofactores, incluyendo entre otros CoA, FAD, DMN, NAD y NADP. Las purinas incluyen adenina (A) y guanina (G); las pirimidinas incluyen citosina (C), timina (T) y uracilo (U).
Tal como se usa aquí, el término “unido operativamente” se refiere a un enlace funcional entre un elemento o región de regulación genética y una segunda secuencia de ácido nucleico, de tal manera que, dicho elemento o región de regulación genética promueve, inhibe, termina, inicia o media la transcripción, traducción, renovación, procesamiento
o transporte de la secuencia de ácido nucleico correspondiente a la segunda secuencia.
Tal como se emplea aquí, el término “origen de replicación” se refiere a una secuencia particular de un genoma, cromosoma o episoma en la cual se inicia la replicación del ADN.
Tal como se emplea aquí, el término “marco abierto de lectura” se refiere a una secuencia de nucleótidos de una molécula de ADN, que codifica una secuencia de aminoácidos ininterrumpida por un codón de parada que tiene el capacidad de codificar al menos una porción de un péptido o de una proteína. Un marco abierto de lectura completo comienza con un codón de inicio (típicamente ATG), le sigue una serie de codones, cada uno de los cuales codifica un aminoácido, y termina con un codón de parada (TAA, TAG o TGA). A menudo los marcos abiertos de lectura se pueden confirmar cotejando sus secuencias con una base de datos de genes secuenciados o con marcadores de secuencias expresadas (EST).
Tal como se usa aquí, el término “sobreexpresado” se refiere a una cantidad de un gen o de un producto genético mayor que la cantidad del gen o producto genético en condiciones normales.
Tal como se usa aquí, el término “péptido” se refiere a un biopolímero formado por la unión de aminoácidos en un orden definido. El enlace entre un resto de aminoácido y el siguiente se conoce como enlace amido o peptídico. Tal como se usa aquí, el término “polipéptido” se refiere a una cadena sencilla de aminoácidos y “proteína” se refiere a uno o más polipéptidos. Los términos polipéptido, péptido y proteína también engloban modificaciones, incluyendo,
sin limitarse a ellas, la glicosilación, la unión de lípidos, la sulfatación, la gamma-carboxilación de restos de ácido glutámico, la hidroxilación y la ribosilación de ADP. Los polipéptidos pueden no ser totalmente lineales. Por ejemplo, los polipéptidos pueden estar ramificados, como resultado de una ubiquitinación, y pueden ser circulares, con o sin ramificación, en general como resultado de sucesos postraduccionales, incluyendo los de procesos naturales y los provocados por la manipulación humana, que no ocurren naturalmente.
El término “Pfam” se refiere a una gran colección de dominios proteicos y de familias de proteínas mantenidas por el consorcio Pfam y disponibles en varios sitios web mundiales patrocinados, incluyendo: pfam.sanger.ac.uk/ (Welcome Trust, Sanger Institute); pfam.sbc.su.se/ (Stockholm Bioinformatics Center); pfam.janelia.org/ (Janelia Farm, Howard Hughes Medical Institute); pfam.jouy.inra.fr/ (Institut national de la Recherche Agronomique); y pfam.ccbb.re.kr/. La última edición de Pfam es la Pfam 24.0 (octubre de 2009, 11912 familias), basada en la versión 15.6 de la base de datos de proteínas de UniProt, una mezcla de Swiss-Prot versión 57.6 y TrEMBL versión 40.6. Los dominios y familias Pfam se identifican mediante múltiples alineamientos de secuencias y modelos ocultos de Markov (HMM).
Las familias Pfam-A, que están basadas en asignaciones de gran calidad, son generadas mediante un alineamiento de semillas curadas, utilizando miembros representativos de una familia de proteínas y perfiles de modelos ocultos de Markov basados en la alineación de las semillas. Todas las secuencias identificadas que pertenecen a la familia se usan luego para generar automáticamente una alineación completa para la familia (Sonnhammer y otros (1998) Nucleic Acids Research 26: 320-322; Bateman y otros (2000) Nucleic Acids Research 26: 263- 266; Bateman y otros (2004) Nucleic Acids Research 32, Database Issue: D138D141; Finn y otros (2006) Nucleic Acids Research Database Issue 34: D247-251; Finn y otros (2010) Nucleic Acids Research Database Issue 38: D211-222). Al acceder a la base de datos Pfam utilizando, por ejemplo, cualquiera de los anteriores sitios web de referencia, las secuencias de proteínas pueden examinarse frente a los modelos ocultos de Markov (HMM) mediante el software de búsqueda de homología HMMER (p.ej. HMMER3, hmmer.janelia.org/). Las coincidencias importantes que identifican una proteína buscada como perteneciente a una familia Pfam (o que tienen un dominio Pfam particular) son aquellas cuya puntuación en bits es mayor o igual que el umbral de recopilación para el dominio Pfam. Tal como se usa aquí, el término “umbral de recopilación (UR)” o “límite de recopilación” se refiere a un valor umbral de búsqueda utilizado para construir una alineación completa. El umbral de recopilación es la puntuación mínima que debe alcanzar una secuencia para encajar en la alineación completa de una entrada de Pfam. El umbral de recopilación para la familia de 4-hidroxibenzoíl-CoA tioesterasa (PF03061) es 20,6. Los valores de esperanza matemática (valores e) también se pueden emplear como criterio para incluir una proteína consultada en un pfam o para determinar si una proteína consultada tiene un dominio pfam particular, de tal modo que los valores e bajos (muy inferiores a 1,0, por ejemplo inferiores a 0,1 o inferiores o iguales a 0,01) representan bajas probabilidades de que una coincidencia sea debida al azar.
Tal como se usa aquí, el término “fotótrofo” se refiere a un organismo que utiliza la luz solar como su fuente principal de energía. Crecimiento o cultivo “fototrófico” significa crecimiento o cultivo en el cual los organismos utilizan luz y no moléculas orgánicas como energía.
Tal como se emplea aquí, el término “microorganismo fotosintético” incluye de manera no excluyente todas las algas, microalgas y bacterias fotosintéticas que pueden crecer fototróficamente.
Tal como se usa aquí, el término “plásmido” se refiere a una molécula de ADN que es distinta del ADN cromosómico de una célula y puede replicarse independientemente de él. Es bicatenaria y en muchos casos circular.
Tal como se usa aquí, el término “polipéptido” se refiere a un péptido que contiene aproximadamente 10 hasta 1000 aminoácidos.
El término “polinucleótido” o “molécula de ácido nucleico” se refiere a un desoxirribopolinucleótido, ribopolinucleótido
o a un análogo de ellos que tiene la naturaleza básica de un desoxirribopolinucleótido o ribopolinucleótido naturales, pues en condiciones estrictas se hibrida sustancialmente con la misma secuencia de nucleótidos
El término "polinucleótido" o "molécula de ácido nucleico" se refiere a un desoxirribopolinucleótido, ribopolinucleótido
o un análogo del mismo que tiene la naturaleza esencial de un desoxirribopolinucleótido o ribonucleótido naturales, pues en condiciones estrictas se hibrida sustancialmente con la misma secuencia de nucleótidos que los nucleótidos de origen natural y/o permite la traducción al mismo o a los mismos aminoácidos que el o los nucleótidos de origen natural. Un polinucleótido puede ser de tamaño normal o una subsecuencia de un gen estructural o regulador natural
o heterólogo. Salvo indicación contraria, el término incluye la referencia a la secuencia especificada, así como a su secuencia complementaria. Por tanto, los ADN o ARN cuyas cadenas principales están modificadas por motivos de estabilidad o por otras razones son “polinucleótidos” según el término aquí contemplado. Además, los ADN o ARN que contienen bases inusuales como la inosina o bases modificadas como las tritiladas, por citar solo dos ejemplos, también son polinucleótidos según el término aquí empleado. Se entiende que los expertos en la materia conocen una gran variedad de modificaciones efectuadas en el ADN y el ARN, que sirven para muchos fines útiles. Tal como se emplea aquí, el término polinucleótido abarca las formas de modificación química, enzimática o metabólica de los polinucleótidos, así como las formas químicas del ADN y del ARN que son características de los virus y las células, incluyendo, entre otras cosas, células simples y complejas.
El término “cebador” se refiere a una molécula de ácido nucleico que al hibridarse con una cadena de ADN o ARN es capaz de servir de substrato al que se agregan nucleótidos durante la síntesis de un producto de extensión, en presencia de un agente de polimerización adecuado (p.ej. una ADN polimerasa). En algunos casos el cebador es suficientemente largo para hibridarse de manera única con una región específica de una cadena de ADN o ARN.
Tal como se usa aquí, el término “promotor” se refiere a una región del ADN próxima al sitio inicial de transcripción, que interviene en el reconocimiento y en la unión de la ARN polimerasa y otras proteínas para iniciar la transcripción. Un promotor determinado puede trabajar en sintonía con otras regiones reguladoras (potenciadores, silenciadores, elementos límite/aislantes) con el fin de indicar el nivel de transcripción de un gen determinado.
Tal como se usa aquí, el término “promotor lac” se refiere a un promotor del operón lac cuya actividad transcriptora es impedida por una proteína represora (es decir, la proteína LacI codificada por el gen lacI), pero favorecida por un inductor, tal como la lactosa o análogos de la misma (p.ej. isopropil-β-D-tiogalactósido (IPTG)). El inductor se une a la proteína represora y evita que reprima la transcripción génica.
Tal como se usa aquí, el término “promotor tac” se refiere a un promotor híbrido fuerte compuesto por la región de posición -35 del promotor trp y la región de posición -10 del promotor/operador lacUV5. La expresión del promotor tac es reprimida por la proteína LacI. El alelo lacIq es una mutación promotora que incrementa la concentración intracelular del represor LacI, dando como resultado una fuerte represión del promotor tac. La actividad transcriptora del promotor tac está controlada por una lactosa o análogos de la misma.
Tal como se usa aquí, el término “promotor trc” se refiere a una secuencia promotora híbrida de los promotores lac y trp. La actividad transcriptora del promotor trc también está controlada por la lactosa o por análogos de la misma. Un ejemplo de un promotor trc es el promotor trcY (5’-CTGAAATGAGCTGTTGACAATTAATCATCCGGCTCGTATAATG TGTGGAATTGTGAGCGGATAACAATTTCACACTAAGGAGGAAAA AAA-3’; SEQ ID NO: 52).
Tal como se usa aquí, el término “recombinación” se refiere al proceso por el cual se separan y recombinan piezas de ADN. Tal como se usa aquí, el término “recombinación homóloga” se refiere a un tipo de recombinación genética en la cual se intercambian secuencias de nucleótidos entre dos moléculas de ADN similares o idénticas.
Una molécula de ácido nucleico “recombinante” o "modificada genéticamente" es una molécula de ácido nucleico que ha sido alterada mediante manipulación humana. Como ejemplos no limitativos, una molécula de ácido nucleico recombinante incluye cualquier molécula de ácido nucleico que: 1) ha sido sintetizada o modificada in vitro total o parcialmente, por ejemplo utilizando técnicas químicas o enzimáticas (p.ej. con el uso de síntesis química de ácidos nucleicos o con el uso de enzimas para la replicación, polimerización, digestión (exonucleolítica o endonucleolítica), ligación, transcripción inversa, transcripción, modificación de bases (incluyendo p.ej. la metilación), integración o recombinación (incluyendo recombinación homóloga y específica de sitio) de moléculas de ácido nucleico; 2) incluye secuencias de nucleótidos unidos que no lo están en la naturaleza, 3) ha sido diseñada genéticamente empleando técnicas de clonación molecular, de tal manera que carezca de uno o más nucleótidos respecto a la secuencia de la molécula de ácido nucleico natural, y/o 4) ha sido manipulada empleando técnicas de clonación molecular, de tal manera que tenga uno o más cambios o reordenaciones de la secuencia respecto a la secuencia de ácido nucleico natural. Como ejemplos no limitativos, un ADNc es una molécula de ADN recombinante, como cualquier molécula de ácido nucleico generada in vitro por reacción o reacciones de polimerasa o a la que se han unido conectores, o que ha sido integrada en un vector tal como los de clonación o expresión.
Cuando se aplica a organismos, el término recombinante, diseñado genéticamente o modificado genéticamente se refiere a los organismos que han sido manipulados mediante la introducción de una secuencia de ácido nucleico exógeno o recombinante en el organismo, e incluye organismos que tienen genes inactivados, mutaciones dirigidas y sustitución de genes o sustitución, deleción o inserción de promotores, así como organismos con genes exógenos que han sido introducidos en el organismo. Una molécula de ácido nucleico exógena o recombinante se puede integrar en el genoma del organismo recombinante/modificado genéticamente o en otros casos no puede integrarse en el genoma del organismo recombinante/modificado genéticamente.
Tal como se usa aquí, el término “proteína recombinante” se refiere a una proteína obtenida por ingeniería genética.
Tal como se usa aquí, el término “recombinasa” se refiere a un enzima que cataliza la recombinación genética.
“Carbono reducido” o “compuesto de carbono reducido” o “fuente de carbono reducido” se refiere a una molécula a base de carbono que lleva carbono e hidrógeno y puede ser utilizada como fuente de energía por un organismo, ya sea por oxidación o glicólisis. Como ejemplos no limitativos de carbono reducido cabe citar los azúcares (incluyendo los polisacáridos y el almidón), alcoholes (incluyendo glicerina y azúcar-alcoholes), formas de ácidos orgánicos (p.ej. acetato, citrato, succinato, etc.), aminoácidos, proteínas, lípidos y ácidos grasos. Algunas veces se alude al carbono reducido como “carbono orgánico”.
El término “secuencia reguladora” (también denominado “región reguladora” o “elemento regulador”) se refiere a un promotor, a un potenciador, a una región 5’ no traducida, a una región 3’ no traducida, a un sitio de unión a ribosoma
o a otro segmento de ADN o ARN que regulan la expresión de un gen próximo.
Los términos “resto de aminoácido” y “aminoácido” se usan indistintamente para referirse a un aminoácido que está incorporado en una proteína, un polipéptido o un péptido, incluyendo, sin limitarse a ellos, un aminoácido de origen natural y análogos conocidos de aminoácidos naturales que pueden funcionar de manera similar a los aminoácidos naturales.
Los términos siguientes se usan aquí para describir las relaciones secuenciales entre dos o más ácidos nucleicos o polinucleótidos: (a) “secuencia de referencia”, (b) “ventana comparativa”, (c) “identidad secuencial”, (d) “porcentaje de identidad secuencial” y (e) “identidad sustancial”.
El término "secuencia de referencia" se refiere a una secuencia utilizada como base para comparar secuencias. Una secuencia de referencia puede ser un subconjunto o la totalidad de una secuencia especificada, como por ejemplo un segmento de una secuencia de tamaño normal de un ADNc o de un gen o la secuencia completa del ADNc o del gen.
El término “ventana comparativa” se refiere a un segmento contiguo y especificado de una secuencia polinucleótida que puede compararse con una secuencia de referencia, y la porción de la secuencia de polinucleótidos incluida en la ventana comparativa puede tener adiciones o deleciones (es decir, huecos) respecto a la secuencia de referencia (en la cual no hay adiciones ni deleciones) para la alineación óptima de las dos secuencias. En general la ventana comparativa tiene al menos 20 nucleótidos contiguos de longitud, y también puede tener al menos 30 nucleótidos contiguos de longitud, por ejemplo al menos 40 nucleótidos contiguos de longitud, al menos 50 nucleótidos contiguos de longitud, al menos 100 nucleótidos contiguos de longitud o más. Los especialistas en la materia entienden que para evitar una gran similitud con una secuencia de referencia a causa de la inclusión de huecos en la secuencia polinucleótida se suele introducir una penalización por hueco y se resta del número de coincidencias.
Los métodos de alineación de secuencias para compararlas son bien conocidos del estado técnico. La alineación óptima de las secuencias para su comparación se puede efectuar mediante el algoritmo de homología local de Smith y Waterman, Adv. Appl. Mates. 2:482 (1981); mediante el algoritmo de alineación por homología de Needleman y Wunsch, J. Mol. Biol. 48:443 (1970); mediante el método de búsqueda por similitud de Pearson y Lipman, Proc. Natl. Acad. Sci. 85:2444 (1988); mediante implementaciones computarizadas de estos algoritmos, incluyendo de manera no excluyente: CLUSTAL del programa PC/Gene de Intelligenetics, Mountain View, Calif.; GAP, BESTFIT, BLAST, FASTA y TFASTA del paquete de software Wisconsin Genetics, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis., EUA; el programa CLUSTAL está bien descrito por Higgins y Sharp, Gene 73:237-244 (1988); Higgins y Sharp, CABIOS 5:151-153 (1989); Corpet y otros, Nucleic Acids Research 16:10881-90 (1988); Huang y otros, Computer Applications in the Biosciences 8:155-65 (1992), y Pearson y otros, Methods in Molecular Biology 24:307-331 (1994). La familia de programas BLAST, que se puede utilizar para búsquedas de similitud en bases de datos, incluye: BLASTN para secuencias problema de nucleótidos frente a secuencias nucleótidas de las bases de datos; BLASTX para secuencias problema de nucleótidos frente a secuencias proteicas de las bases de datos; BLASTP para secuencias problema de proteínas frente a secuencias proteicas de las bases de datos; TBLASTN para secuencias problema de proteínas frente a secuencias nucleótidas de las bases de datos; y TBLASTX para secuencias problema de nucleótidos frente a secuencias nucleótidas de las bases de datos. Véase Current Protocols in Molecular Biology, capítulo 19, Ausubel y otros, Eds., Greene Publishing y Wiley-Interscience, Nueva York (1995).
A no ser que se indique lo contrario, los valores de identidad/similitud de secuencias aquí facilitados se refieren al valor obtenido mediante el uso de la serie de programas BLAST 2.0, empleando parámetros por defecto. Altschul y otros, Nucleic Acids Res. 25:3389-3402 (1997). El software para llevar a cabo análisis BLAST está disponible al público, por ejemplo a través del National Center for Biotechnology Information en ncbi.nlm.nih.gov. Este algoritmo consiste en buscar primero pares de secuencias de puntuación alta (HSP) identificando palabras cortas de longitud W en la secuencia problema, que coincidan o cumplan con alguna puntuación umbral T valorada positivamente al alinearlas con una palabra de la misma longitud en una secuencia de la base de datos. T se denomina umbral de puntuación de palabra vecina (Altschul y otros, arriba citado). Estos aciertos iniciales de palabras vecinas sirven de semilla para iniciar búsquedas de HSP más largas que las contengan. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia, hasta donde pueda incrementarse la puntuación de la alineación acumulada. Para las secuencias de nucleótidos, las puntuaciones acumuladas se calculan utilizando los parámetros M (puntuación de recompensa para un par de restos coincidentes, siempre > 0) y N (puntuación de penalización para restos no coincidentes, siempre < 0). En el caso de las secuencias de aminoácidos, para calcular la puntuación acumulada se utiliza una matriz de puntuación. La extensión de los aciertos de palabra en cada dirección se detiene cuando: la puntuación de la alineación acumulada disminuye en la cantidad X desde su valor máximo alcanzado; la puntuación cae al valor cero o inferior, debido a la acumulación de una o más alineaciones de restos de puntuación negativa; o se alcanza el final de cualquiera de las secuencias. Los parámetros W, T y X del algoritmo BLAST determinan la sensibilidad y la velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) usa como valores por defecto una longitud de palabra (W) de 11, una esperanza (E) de 10, un límite de 100, M = 5, N = - 4, y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa BLASTP utiliza
como valores por defecto una longitud de palabra (W) de 3, una esperanza (E) de 10 y la matriz de puntuación BLOSUM62 (véase Henikoff & Henikoff, Proc. Natl. Acad. Sci. EUA, 1989, 89: 10915).
Además de calcular el porcentaje de identidad de la secuencia, el algoritmo BLAST también efectúa un análisis estadístico de la similitud entre dos secuencias (véase p.ej. Karlin y Altschul, Proc. Natl. Acad. Sci. EUA, 1993, 90: 5873-5787). Una medición de la similitud ofrecida por el algoritmo BLAST es la probabilidad de suma más pequeña (P(N)), la cual proporciona una indicación de la probabilidad de que ocurra por azar una coincidencia entre dos secuencias de nucleótidos o aminoácidos. Las búsquedas de BLAST suponen que las proteínas se pueden modelar como secuencias aleatorias. Sin embargo muchas proteínas reales contienen regiones de secuencias no aleatorias, que pueden ser tramos homopoliméricos, repeticiones de períodos cortos o regiones enriquecidas en uno o más aminoácidos. Estas regiones de baja complejidad se pueden alinear entre proteínas no relacionadas, aunque otras regiones de la proteína sean totalmente diferentes. Se pueden usar varios programas filtro de baja complejidad para disminuir dichas alineaciones poco complejas. Por ejemplo, se pueden emplear los filtros de baja complejidad SEG (Wooten y Federhen, Comp. Chem., 1993, 17:149-163) y XNU (Claverie y States, Comp. Chem., 1993, 17:191-201) solos o combinados.
Tal como se usa aquí, en el contexto de dos secuencias de ácidos nucleicos o polipéptidos “identidad de secuencia”
o “identidad” se refiere a los restos de dos secuencias que son iguales cuando se alinean para una correspondencia máxima a lo largo de una ventana de comparación especificada. Al usar el porcentaje de identidad de secuencias referido a las proteínas, se reconoce que las posiciones de los restos que no son idénticos difieren a menudo por sustituciones conservadoras de aminoácidos, es decir, donde los restos de aminoácidos son sustituidos por otros restos de aminoácidos con propiedades químicas similares (p.ej. de carga y/o carácter hidrófobo) y por lo tanto no alteran las propiedades funcionales de la molécula. Cuando las secuencias difieren por sustituciones conservadoras, el porcentaje de identidad de secuencias se puede ajustar hacia arriba para corregirlo de acuerdo con la naturaleza conservadora de la sustitución. Se dice que las secuencias que difieren por tales sustituciones conservadoras tienen “similitud de secuencia” o “similitud”. Los medios para realizar este ajuste son bien conocidos de los especialistas en la materia, lo cual consiste normalmente en puntuar una sustitución conservadora como una falta de coincidencia parcial en lugar de completa, aumentando así el porcentaje de identidad de secuencia. Así, por ejemplo, cuando se asigna una puntuación de 1 a un aminoácido idéntico y una puntuación de cero a una sustitución no conservadora, a una sustitución conservadora se le da una puntuación comprendida entre 0 y 1. La puntuación de las sustituciones conservadoras se calcula, p.ej. según el algoritmo de Meyers y Miller, Computer Applic. Biol. Sci., 1988, 4:11-17, p.ej. tal como está implementado en el programa PC/GENE (Intelligenetics, Mountain View, Calif., EUA).
Tal como se emplea aquí, “porcentaje de identidad de secuencias” significa el valor determinado al comparar dos secuencias alineadas óptimamente a lo largo de una ventana comparativa, teniendo en cuenta que la porción de la secuencia de polinucleótidos en la ventana de comparación puede incluir adiciones o deleciones (es decir, huecos) respecto a la secuencia de referencia (que no contiene adiciones o eliminaciones) para la alineación óptima de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en que aparece la base de ácido nucleico o el resto de aminoácido idénticos en ambas secuencias, con el fin de obtener el número de posiciones coincidentes, dividiendo el número de posiciones coincidentes por el número total de posiciones en la ventana de comparación y multiplicando el resultado por 100 para dar el porcentaje de identidad de secuencias. A menos que se indique lo contrario, el % de homología de una secuencia se refiere a toda la longitud de la secuencia problema (la ventana comparativa).
El término “identidad sustancial” de secuencias polinucleótidas significa que un polinucleótido incluye una secuencia que tiene al menos el 70% de identidad secuencial, por ejemplo al menos el 80% de identidad secuencial, al menos el 85% de identidad secuencial, al menos el 90% de identidad secuencial, al menos el 95% de identidad secuencial, al menos el 96% de identidad secuencial, al menos el 97% de identidad secuencial, al menos el 98% de identidad secuencial o al menos el 99% de identidad secuencial, en comparación con una secuencia de referencia, según uno de los programas de alineación descritos, usando parámetros estándar. Un experto reconocerá que estos valores se pueden ajustar debidamente para determinar la respectiva identidad de las proteínas codificadas por dos secuencias nucleótidas, teniendo en cuenta la degeneración de codones, la similitud de los aminoácidos, el posicionamiento del marco de lectura y similares. Para estos propósitos, identidad sustancial de las secuencias de aminoácidos significa normalmente una identidad secuencial de al menos el 60%, por ejemplo de al menos el 70%, de al menos el 80%, de al menos el 85%, de al menos el 90% o de al menos el 95%. Otra condición de que las secuencias nucleótidas sean sustancialmente idénticas es que dos moléculas se hibriden entre sí en condiciones estrictas. Sin embargo los ácidos nucleicos que no se hibridan entre sí en condiciones estrictas todavía son sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto puede ocurrir p.ej. cuando se crea una copia de un ácido nucleico usando la máxima degeneración de codones permitida por el código genético. Una indicación de que dos secuencias de ácido nucleico son sustancialmente idénticas es que el polipéptido codificador del primer ácido nucleico tiene reactividad inmunológica cruzada con el polipéptido codificado por el segundo ácido nucleico.
En el contexto de un péptido el término “identidad sustancial” indica que un péptido contiene una secuencia con al menos un 70% de identidad secuencial con una secuencia de referencia, por ejemplo al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98% o al menos el 99% de identidad secuencial con la secuencia de referencia en una ventana comparativa especificada. Alternativamente se
lleva a cabo una alineación óptima, empleando el algoritmo de alineación por homología de Needleman y Wunsch, J. Mol. Biol. 48: 443 (1970). Un indicio de que dos secuencias peptídicas son básicamente idénticas es que uno de los péptidos sea inmunológicamente reactivo con anticuerpos producidos contra el segundo péptido. Por consiguiente, un péptido es sustancialmente idéntico a un segundo péptido si, por ejemplo, los dos péptidos difieren solo por una sustitución conservadora. Los péptidos “sustancialmente similares” comparten secuencias, tal como se ha indicado arriba, aunque las posiciones de los restos que no son idénticas pueden diferir por los cambios conservadores de aminoácidos.
Una “variante” de un gen o de una secuencia de ácido nucleico es una secuencia que tiene al menos un 65% de identidad con el gen o secuencia de ácido nucleico referenciado, y puede incluir una o más deleciones, adiciones o sustituciones de bases respecto a la secuencia referenciada. Las diferencias secuenciales pueden ser el resultado de cambios, ya sea naturales o diseñados, en la secuencia o en la estructura. En el curso de la replicación normal o de la duplicación pueden producirse cambios en la naturaleza de la secuencia particular de ácidos nucleicos. Los cambios diseñados se pueden proyectar e introducir específicamente en la secuencia con fines específicos. Estos cambios específicos se pueden hacer in vitro, utilizando una variedad de técnicas de mutagénesis. Dichas variantes secuenciales, generadas específicamente, se pueden denominar “mutantes” de la secuencia original.
Una “variante” de un péptido o de una proteína es una secuencia peptídica o proteica con una o más posiciones de aminoácidos variadas respecto al péptido o proteína de referencia. Una variante puede de tipo natural o el resultado de una o más mutaciones espontáneas, inducidas o diseñadas genéticamente en la molécula de ácido nucleico que codifica el péptido o la proteína variante. Un péptido variante también puede ser sintetizado químicamente.
Una “variante conservadora” de un polipéptido es un polipéptido que tiene una o más sustituciones conservadoras de aminoácidos respecto al polipéptido de referencia, de manera que la actividad, la afinidad por el substrato y la afinidad de unión del polipéptido no difieren sustancialmente de las del polipéptido de referencia.
Un experto en este campo también puede producir variantes polipeptídicas con sustituciones, deleciones, adiciones y/o sustituciones simples o múltiples de aminoácidos. Estas variantes pueden incluir, entre otras: (a) variantes en las cuales uno o más restos de aminoácidos se sustituyen por aminoácidos conservadores o no conservadores; (b) variantes en las que se añaden uno o más aminoácidos; (c) variantes en las que al menos un aminoácido incluye un grupo sustituyente; (d) variantes en las cuales se sustituyen restos de aminoácidos de una especie por el respectivo resto de otra especie en posiciones conservadas o no conservadas; y (e) variantes en las que una proteína diana se fusiona con otro péptido o polipéptido tal como una pareja de fusión, un marcador proteico u otro fragmento químico capaz de conferir características útiles a la proteína diana, como, por ejemplo, un epítopo para un anticuerpo. Las técnicas para obtener dichas variantes, que incluyen técnicas genéticas (supresiones, deleciones, mutaciones, etc.), químicas y enzimáticas, son conocidas por los expertos en la técnica. Tal como se utiliza aquí, el término “mutación” se refiere a una alteración en la secuencia de ADN dentro de un gen o cromosoma de un organismo, que da como resultado la creación de un nuevo carácter o rasgo no encontrado en el tipo parental o en el proceso por el cual dicho cambio ocurre en un cromosoma, ya sea mediante una variación en la secuencia de nucleótidos del ADN que codifica un gen o mediante un cambio en la disposición física de un cromosoma. Los tres mecanismos de mutación incluyen la sustitución (el intercambio de un par de bases con otro), la adición (la inserción de una o más bases en una secuencia) y la deleción (la pérdida de uno o más pares de bases).
Tal como se usa aquí, la expresión “se hibrida específicamente” se refiere al proceso por el cual un ácido nucleico forma característica o claramente pares de bases con regiones complementarias de al menos una cadena de la secuencia diana de ácido nucleico que originalmente no estaba emparejada con el ácido nucleico. Un ácido nucleico que se hibrida selectivamente experimenta la hibridación en condiciones estrictas de la secuencia de ácido nucleico con una secuencia diana de ácido nucleico especificada hasta un grado detectable (p.ej. al menos 2 veces sobre el fondo) mayor que su hibridación con secuencias de ácido nucleico no diana y hasta la exclusión sustancial de ácidos nucleicos no diana. Las secuencias que se hibridan selectivamente suelen tener al menos un 80% de identidad secuencial, al menos el 85% de identidad secuencial, al menos el 90% de identidad secuencial, al menos el 95% de identidad secuencial, al menos el 96% de identidad secuencial, al menos el 97% de identidad secuencial, al menos el 98% de identidad secuencial, al menos el 99% de identidad secuencial o aproximadamente el 100% de identidad secuencial (es decir, complementaria) entre sí.
Tal como se emplea aquí, la expresión “integrado de forma estable” significa que un material genético exógeno o heterólogo está integrado en el genoma de un huésped y es heredado por los descendientes de la célula.
Tal como se emplea aquí, el término “tioesterasa (TE)” o “tioéster hidrolasa” se refiere a un gran grupo de enzimas cuyos miembros hidrolizan el enlace tioéster entre un grupo carbonilo y un átomo de azufre. Están clasificados por el Comité de nomenclatura de la unión internacional de bioquímica y biología molecular (NC-IUBMB) en EC (comisión de enzimas) 3.1.2.1 hasta EC 3.1.2.27, así como en EC 3.1.2.- para las TE no clasificadas. Los substratos de 15 de estos 27 grupos llevan el coenzima A (CoA), dos contienen proteínas transportadoras de acilo (PTA), cuatro tienen glutatión o sus derivados, uno tiene ubiquitina y dos contienen otros fragmentos. Además, se han eliminado tres agrupaciones (Cantu y otros (2010) Protein Science, 19:1281-1295).
Tal como se usa aquí, el término “triacilglicerol” o “triglicéridos” se refiere a una clase de compuestos que constan de glicerina (un trihidroxi-alcohol de tres carbonos) con un ácido graso unido mediante un enlace éster a cada uno de los tres grupos OH.
Tal como se usa aquí, el término “péptido de tránsito” se refiere a una secuencia peptídica, a menudo en el extremo N-terminal de una proteína precursora, que dirige un producto genético hacia su destino celular específico, como por ejemplo un plasto.
Tal como se usa aquí, el término “infraexpresado” se refiere a una cantidad disminuida de un gen o de un producto genético, en comparación con la cantidad de un gen o de un producto genético en condiciones normales.
Tal como se usa aquí, el término “vector” se refiere a cualquier elemento que actúe como vehículo o transportador, como por ejemplo un fago, un plásmido, un cósmido, un bácmido o un virus, al que pueda unirse otra secuencia o elemento genético (ya sea ADN o ARN) para que esta secuencia o elemento pueda llevarse a una célula huésped.
Tal como se usa aquí, el término “vector de expresión” se refiere en general a una molécula de ácido nucleico que ha sido construida de modo que, tras la inserción de una molécula de ADN, su secuencia codificadora se transcribe adecuadamente en una molécula de ARN y la molécula de ARN se puede traducir opcionalmente en una proteína. El constructo de ácido nucleico, que puede ser un vector, se diseña frecuentemente por ingeniería genética para que incluya secuencias reguladoras que actúen como regiones potenciadoras y promotoras dirigidas a la transcripción eficiente del marco abierto de lectura transportado en el vector de expresión.
La base de datos universal de proteínas o de recursos proteicos “Uniprot” comprende una amplia base de datos de proteínas extraída de Swiss-Prot, TrEMBL (biblioteca de datos de secuencias nucleótidas del EMBL traducida) y de la base de datos de secuencias proteicas. Las secuencias de proteínas se pueden comparar con la base de datos de Uniprot en uniprot.org.
Tal como se emplea aquí, el término “cera” o “ésteres de cera” se refiere a ésteres de ácidos grasos de cadena larga y a alcoholes alifáticos monohídricos de cadena lineal, que forman sustancias sólidas o maleables bajo una serie de condiciones físicas específicas.
Tal como se usa aquí, el término “de tipo natural” se refiere a un organismo o fenotipo tal como se encuentra en la naturaleza.
I. Microorganismo modificado genéticamente para producir ácidos grasos libres y/o sus derivados
La invención descrita proporciona microorganismos como los definidos en las reivindicaciones 1-12, que incluyen moléculas de ácido nucleico recombinante codificadoras de 4-hidroxibenzoíl-CoA tioesterasas (4-HBT) usadas para producir ácidos grasos libres y/o derivados de ellos. Los genes de 4-hidroxibenzoíl-CoA tioesterasa que aumentaron la producción de ácidos grasos libres se identificaron por medio de un examen funcional y se validaron en un ensayo bioquímico específico, utilizando acil-PTA como substrato. La familia de 4-hidroxibenzoíl-CoA-tioesterasa se designa como PF03061 en la base de datos de familias proteicas denominada Pfam bioinformatics (Bateman y otros (2000) Nucleic Acids Research 28:263-266; Bateman y otros (2006) Nucleic Acids Research 32:D138- D141, Finn y otros (2010) Nucleic Acids Research 38:D211-222). Las tioesterasas procarióticas que se expresan en un microorganismo fotosintético como el facilitado aquí pueden tener la designación EC 3.1.2.23 según la Comisión de enzimas (EC).
La superfamilia de las 4-hidroxibenzoíl-CoA tioesterasas ha sido inscrita anteriormente en la base de datos pública por su actividad hidrolítica del 4-hidroxibenzoil-CoA. Basándose en el análisis bioinformático, en la caracterización bioquímica y en la expresión de las secuencias identificadas en microorganismos, la invención descrita estipula que los enzimas 4-hidroxibenzoíl-CoA tioesterasas también poseen actividad hidrolítica hacia los substratos de acil-PTA y por lo tanto se pueden utilizar para producir ácidos grasos libres y/o sus derivados en microorganismos.
Según un aspecto, la presente invención facilita un microorganismo que incluye una molécula de ácido nucleico recombinante con una secuencia codificadora de una 4-hidroxibenzoíl-CoA tioesterasa, que tiene al menos un 70% de identidad secuencial de aminoácidos con la SEQ ID NO:1 o la SEQ ID NO:2. El microorganismo genéticamente modificado puede producir al menos un ácido graso libre y/o un derivado del mismo. Cuando se expresa en un microorganismo, la 4-hidroxibenzoíl-CoA tioesterasa puede hidrolizar una molécula de acil-PTA.
Además, la cantidad de al menos un ácido graso libre y/o un derivado del mismo producido por el microorganismo modificado genéticamente puede ser al menos el doble de la cantidad de ácido graso libre y/o derivado del mismo producido por el mismo microorganismo sin la inclusión de un gen exógeno de 4-hidroxibenzoíl-CoA tioesterasa. Por ejemplo, el microorganismo fotosintético que incluye la molécula de ácido nucleico recombinante codificador de la 4hidroxibenzoíl-CoA tioesterasa puede producir al menos 30 mg por litro, por ejemplo al menos 40 mg por litro o al menos 50 mg por litro de ácidos grasos libres y/o sus derivados. Por ejemplo, el microorganismo huésped puede expresar la tioesterasa de manera que se produzcan uno o más ácidos grasos y/o derivados de ácidos grasos.
El microorganismo genéticamente modificado puede ser de cualquier tipo, incluyendo, entre otros, heterocontos (que incluyen traustoquítridos), hongos, bacterias, microalgas o cianobacterias. Los ejemplos de huéspedes microbianos adecuados para usar con la invención divulgada incluyen, sin limitarse a ellos, miembros de los géneros Clostridium, Zymomonas, Escherichia, Salmonella, Rhodococcus, Pseudomonas, Bacillus, Lactobacillus, Enterococcus, Alcaligenes, Klebsiella, Paenibacillus, Arthrobacter, Corynebacterium. , Brevibacterium, Pichia, Candida, Hansenula y Saccharomyces. Los ejemplos particulares de huéspedes traustoquítridos incluyen, de manera no excluyente, Schizochytrium sp. y Thraustochytrium sp.
Adicional o alternativamente el organismo huésped modificado genéticamente puede ser un microorganismo de tipo fotosintético tal como una microalga. Las algas eucariotas representativas que pueden ser útiles como organismos huésped incluyen, de modo no excluyente, algas verdes (clorofitas), algas rojas (rodofitas), diatomeas (bacilariofitas), prasinofitas, glaucofitas, cloraracniofitas, euglenofitas, cromofitas y dinoflagelados. Los ejemplos no limitativos de un género de microalgas que lleven una molécula de ácido nucleico exógeno codificador de una acil-PTA tioesterasa procariota incluyen, de manera no excluyente: Achnanthes, Amphiprora, Amphora, Ankistrodesmus, Asteromonas, Boekelovia, Borodinella, Botryococcus, Bracteococcus, Chaetoceros, Carteria, Chlamydomonas, Chlorococcum, Chlorogonium, Chlorella, Chroomonas, Chrysosphaera, Cricosphaera, Crypthecodinium, Cryptomonas, Cyclotella, Dunaliella, Ellipsoidon, Emiliania, Eremosphaera, Ernodesmius, Euglena, Franceia, Fragilaria, Gloeothamnion, Haematococcus, Halocafeteria, Hymenomonas, Isochrysis, Lepocinclis, Micractinium, Monoraphidium, Nannochloris, Nannochloropsis, Navicula, Neochloris, Nephrochloris, Nephroselmis, Nitzschia, Ochromonas, Oedogonium, Oocystis, Ostreococcus, Pavlova, Parachlorella, Pascheria, Phaeodactylum, Phagus, Picochlorum, Platymonas, Pleurochrysis,, Pleurococcus, Prototheca, Pseudochlorella, Pseudoneochloris, Pyramimonas, Pyrobotrys, Scenedesmus, Skeletonema, Spyrogyra, Stichococcus, Tetraselmis, Thalassiosira, Viridiella y Volvox.
Alternativamente, el microorganismo puede ser de una especie cianobacteriana. Los ejemplos no limitativos de un género cianobacteriano que contenga una molécula de ácido nucleico exógeno codificador de una 4-hydroxibenzoíl-CoA tioesterasa incluyen, sin limitarse a ellos: Agmenellum, Anabaena, Anabaenopsis, Anacystis, Aphanizomenon, Arthrospira, Asterocapsa, Borzia, Calothrix, Chamaesiphon, Chlorogloeopsis, Chroococcidiopsis, Chroococcus, Crinalium, Cyanobacterium, Cyanobium, Cyanocystis, Cyanospira, Cyanothece, Cylindrospermopsis, Cylindrospermum, Dactylococcopsis, Dermocarpella, Fischerella, Fremyella, Geitleria, Geitlerinema, Gloeobacter, Gloeocapsa, Gloeothece, Halospirulina, lyengariella, Leptolyngbya, Limnothrix, Lyngbya, Microcoleus, Microcystis, Myxosarcina, Nodularia, Nostoc, Nostochopsis, Oscillatoria, Phormidium, Planktothrix, Pleurocapsa, Prochlorococcus, Prochloron, Prochlorothrix, Pseudanabaena, Rivularia, Schizothrix, Scytonema, Spirulina, Stanieria, Starria, Stigonema, Symploca, Synechococcus, Synechocystis, Thermosynechococcus, Tolypothrix, Trichodesmium, Tychonema y Xenococcus. Por ejemplo, el microorganismo fotosintético puede ser una especie de Synechococcus, Synechocystis o Thermosynechococcus. Opcionalmente el microorganismo puede ser una especie de Cyanobium, Cyanothece o Cyanobacterium, o, también alternativamente el microorganismo puede ser una especie de Gloeobacter, Lyngbya o Leptolyngba.
El gen de 4-hidroxibenzoíl-CoA tioesterasa es un gen de 4-hidroxibenzoíl-CoA tioesterasa que al expresarse en el microorganismo puede hacer que éste produzca ácidos grasos libres y/o sus derivados. Las 4-hidroxibenzoíl-CoA tioesterasas consideradas útiles en la presente invención pueden incluir miembros de la familia 4-hidroxibenzoíl-CoA tioesterasa (p.ej. PF03061; véase pfam.cgb.ki.se/ o pfam.janelia.org/ o pfam.sanger.ac.uk/) que al consultarlos en la base de datos de familias proteicas denominada Pfam bioinformatics pueden mostrar una coincidencia con la familia 4-hidroxibenzoíl-CoA tioesterasa (PF03061) de Pfam, cuya puntuación en bits supere la puntuación del umbral de recopilación (por ejemplo, una puntuación mayor que 20,6), y/o puede mostrar una coincidencia en Pfam-A con la familia 4-hidroxibenzoíl-CoA tioesterasa de Pfam, cuyo valor esperado (valor e) sea inferior a 0,01 (Bateman y otros (2000) Nucleic Acids Research 28:263-266; Bateman y otros (2006) Nucleic Acids Research 32:D138-D141, Finn y otros (2010) Nucleic Acids Research 38:D211-222). Las 4-hidroxibenzoíl-CoA tioesterasas expresadas en un microorganismo fotosintético como el proporcionado aquí pueden tener la designación de Comisión de enzimas (EC) EC 3.1.2.23.
La presente invención se refiere además a microorganismos que incluyen moléculas de ácido nucleico codificador de variantes de las 4-hidroxibenzoíl-CoA tioesterasas que tienen p.ej. al menos un 70% de identidad, por ejemplo al menos el 75%, al menos el 80%, al menos el 85 %, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o aproximadamente 100% de identidad con las secuencias SEQ ID NO:1
o SEQ ID NO:2 de aminoácidos, de modo que las variantes poseen la actividad hidrolítica de acil-PTA y la expresión de la variante en un microorganismo puede dar como resultado la producción de un ácido graso libre y/o un derivado del mismo en una cantidad mayor (por ejemplo, al menos el doble) que la producida por un microorganismo que no incluye la molécula de ácido nucleico codificador de la 4-hidroxibenzoíl-CoA tioesterasa. Las conexiones secuenciaestructura-función de las tioesterasas han progresado de manera importante en los últimos años (véase por ejemplo, Dillon y Bateman, BMC Bioinformatics 2004, 5:109; Mayer y Shanklin, J. Biological Chem., 2005, 280: 3621-3627); Mayer y Shanklin, BMC Plant Biology, 2007, 7:1).
Además, o como alternativa, el microorganismo modificado genéticamente que lleva una molécula de ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa puede producir al menos un ácido graso libre cuya cadena acilo tenga una longitud de 8 carbonos, de 10 carbonos, de 12 carbonos, de 14 carbonos, de 16 carbonos, de 18
carbonos, de 20 carbonos, de 22 carbonos y/o de 24 carbonos. También adicionalmente, o como alternativa, los microorganismos manipulados genéticamente pueden producir al menos un ácido graso libre cuya cadena acilo tenga una longitud de 8 a 18 carbonos, por ejemplo de 12 a 16 carbonos.
Aunque las 4-hidroxibenzoíl-CoA tioesterasas se conocen por su acción hidrolítica de substratos de 4-hidroxibenzoíl-CoA, tal como se revela en los ejemplos de la presente invención, ahora se demuestra que las 4-hidroxibenzoíl-CoA tioesterasas también son capaces de hidrolizar substratos de acil-PTA que tienen varias longitudes diferentes de cadena acilo. Por ejemplo, la presente invención contempla el empleo de 4-hidroxibenzoíl-CoA tioesterasas que pueden tener preferencia por uno o más substratos de acil-PTA con longitudes de cadena acilo de 8, 10, 12, 14, 16, 18, 20, 22 y/o 24 carbonos. Adicional o alternativamente, una 4-hidroxibenzoíl-CoA tioesterasa puede hidrolizar uno
o más substratos de proteína transportadora de acilo-acilo (PTA) cuya cadena de acilo tenga una longitud de 8 a 18 carbonos, por ejemplo de 12 a 16 carbonos. También adicionalmente, o como alternativa, una 4-hidroxibenzoíl-CoA tioesterasa, según algunas formas de ejecución de la presente invención, puede tener su mayor nivel de actividad en un substrato de acil-PTA cuya cadena acilo tenga una longitud de 8, 10, 12, 14, 16 y/o 18 carbonos.
En algunas formas de ejecución, el microorganismo con el gen recombinante que expresa una 4-hidroxibenzoíl-CoA tioesterasa puede producir predominantemente ácidos grasos libres cuya cadena acilo tenga una longitud de 8, 10, 12, 14, 16 y/o 18 carbonos y/o derivados de ácidos grasos que tengan un número total de 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 y/o 36 carbonos. Adicional o alternativamente, al menos el 30% en peso, por ejemplo al menos el 40% en peso, al menos el 50% en peso, al menos el 60% en peso, al menos el 70% en peso, al menos el 80% en peso, al menos el 90% en peso o al menos el 95% en peso de los ácidos grasos libres producidos por un microorganismo manipulado genéticamente, como el aquí descrito, pueden ser ácidos grasos cuya cadena acilo tenga una longitud de 8, 10, 12, 14, 16 y/o 18 carbonos y/o derivados de ácido graso que tengan un número total de 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 y/o 36 carbonos. Uno o más ácidos grasos libres o derivados de ácidos grasos producidos por el microorganismo modificado genéticamente pueden ser saturados o tener uno o más dobles enlaces.
En algunas formas de ejecución, el microorganismo manipulado genéticamente que expresa una 4-hidroxibenzoíl-CoA tioesterasa puede producir ácidos grasos libres y/o derivados de ácidos grasos con más de una longitud de cadena acilo, por ejemplo, cualquier combinación de dos o más que tengan longitudes de cadena acilo de 8, 10, 12, 14, 16, 18, 20, 22 y/o 24 carbonos. En una de dichas formas de ejecución, al menos el 50% en peso, por ejemplo al menos el 60% en peso, al menos el 70% en peso, al menos el 80% en peso, al menos el 90% en peso o al menos el 95% en peso de los ácidos grasos libres y/o derivados de los mismos producidos por un microorganismo modificado genéticamente como el aquí revelado pueden tener longitudes de cadena acilo de 8, 10, 12, 14, 16, 18, 20, 22 y/o 24 carbonos. Además o alternativamente, en tales formas de ejecución al menos el 50% en peso, por ejemplo al menos el 60% en peso, al menos el 70% en peso, al menos el 80% en peso, al menos el 90% en peso o al menos el 95% en peso de los ácidos grasos libres producidos por un microorganismo modificado genéticamente, como el revelado aquí, pueden ser: ácidos grasos C8 y C24, ácidos grasos C8 y C22, ácidos grasos C8 y C20, ácidos grasos C8 y C18, ácidos grasos C8 y C16, ácidos grasos C8 y C14, ácidos grasos C8 y C12 o ácidos grasos C8 y C10; ácidos grasos C10 y C24, ácidos grasos C10 y C22, ácidos grasos C10 y C20, ácidos grasos C10 y C18, ácidos grasos C10 y C16, ácidos grasos C10 y C14 o ácidos grasos C10 y C12; ácidos grasos C12 y C24, ácidos grasos C12 y C22, ácidos grasos C12 y C20, ácidos grasos C12 y C18, ácidos grasos C12 y C16 o ácidos grasos C12 y C14; ácidos grasos C14 y C24, ácidos grasos C14 y C22, ácidos grasos C14 y C20, ácidos grasos C14 y C18 o ácidos grasos C14 y C16; ácidos grasos C16 y C24, ácidos grasos C16 y C22, ácidos grasos C16 y C20, y ácidos grasos C16 y C18; o similares.
Además o como alternativa, el microorganismo modificado genéticamente puede contener una molécula de ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa que tenga una secuencia de aminoácidos con al menos un 70% de identidad, por ejemplo al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90% o al menos el 95% de identidad con la SEQ ID NO:1, y el microorganismo puede producir un ácido graso con una longitud de cadena acilo de 8, 10, 12, 14, 16 y/o 18 carbonos (opcionalmente que al menos el 50% en peso de los ácidos grasos producidos tengan una longitud de cadena acilo de 8 a 18 carbonos) y/o un derivado de ácido graso que tenga un número total de carbonos de 7 a 36 (por ejemplo de 7 a 32; de 11 a 30 y/o de 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20, 22, 24, 26, 28, 30, 32, 34 y/o 36 carbonos).
Los ejemplos no limitativos de tioesterasas que tienen al menos un 85% de identidad con la SEQ ID NO:1 incluyen: la tioesterasa putativa YneP de Bacillus licheniformis (DSM 13) (SEQ ID NO:6) con número de acceso Genbank AAU23580 e identificador GenInfo GI: 52003638; la proteína hipotética BSNT_02984 de Bacillus subtilis (subsp. natto BEST195) (SEQ ID NO:7) con número de acceso Genbank BAI85489 e identificador GenInfo GI: 291484414; la proteína no caracterizada yneP de Bacillus subtilis (SEQ ID NO:8) con número de acceso Genbank Q45061 e identificador GenInfo GI: 257096998; la acil-CoA tioesterasa putativa de Bacillus subtilis (subsp. spizizenii cepa W23) (SEQ ID NO:9) con número de acceso Genbank YP_003866210 e identificador GenInfo GI:305674538; la acil-CoA tioesterasa putativa de Bacillus amyloliquefaciens DSM7 (SEQ ID NO:10) con número de acceso Genbank YP_ 003920487 e identificador GenInfo GI:308173782; YneP de Bacillus amyloliquefaciens FZB42 (SEQ ID NO:11) con número de acceso Genbank YP_001421379 e identificador GenInfo GI:154686218; YneP de Bacillus subtilis subsp. subtilis cepa 168 (SEQ ID NO:12) con número de acceso Genbank CAA97601 e identificador GenInfo GI: 1405456;
la acil-CoA tioesterasa putativa de Bacillus atrophaeus 1942 (SEQ ID NO:13) con número de acceso Genbank ADP32363 e identificador GenInfo GI:310868888; YneP de Bacillus pumilus ATCC 7061 (SEQ ID NO:14) con número de acceso Genbank ZP_03053441 e identificador GenInfo GI:194014824; 4-hidroxibenzoíl-CoA tioesterasa de Bacillus pumilus SAFR-032 (SEQ ID NO:15) con número de acceso Genbank YP_001486942 e identificador GenInfo GI:157692480; proteína hipotética BSG1_15910 de Bacillus sp. SG-1 (SEQ ID NO:16) con número de acceso Genbank ZP_01858961 e identificador GenInfo GI:149180457; proteína de la familia tioesterasa de Bacillus megaterium DSM 319 (SEQ ID NO:17) con número de acceso Genbank YP_003597734 e identificador GenInfo GI:295704659; proteína de la familia tioesterasa de Bacillus megaterium QM B1551 (SEQ ID NO:18) con número de acceso Genbank YP_003563005 e identificador GenInfo GI:294499305; proteína de la superfamilia tioesterasa de Bacillus coagulans 36D1 (SEQ ID NO:19) con número de acceso Genbank ZP_04433271 e identificador GenInfo GI:229544212; proteína de la superfamilia tioesterasa de Geobacillus thermoglucosidasius C56-YS93 (SEQ ID NO:20) con número de acceso Genbank ZP_06810002 e identificador GenInfo GI:295400022; proteína de la superfamilia tioesterasa de Geobacillus sp. C56-T3 (SEQ ID NO:21) con número de acceso Genbank ADI26934 e identificador GenInfo GI:297253488; proteína de la superfamilia tioesterasa de Geobacillus sp. Y412MC61 (SEQ ID NO:22) con número de acceso Genbank ACX79004 e identificador GenInfo GI:261376261; proteína de la superfamilia tioesterasa de Geobacillus sp. WCH70 (SEQ ID NO:23) con número de acceso Genbank YP_002949888 e identificador GenInfo GI:239827264; proteína hipotética GK1562 de Geobacillus kaustophilus HTA426 (SEQ ID NO:24) con número de acceso Genbank YP_147415 e identificador GenInfo GI:56420097; proteína de la superfamilia tioesterasa de Geobacillus sp. G11MC16 (SEQ ID NO:25) con número de acceso Genbank ZP_03147050 e identificador GenInfo GI:196248349; proteína análoga a 4-hidroxibenzoíl-CoA tioesterasa de Geobacillus thermodenitrificans NG80-2 (SEQ ID NO:26) con número de acceso Genbank YP_001125525 e identificador GenInfo GI:138895072; y proteína hipotética B14911_12282 de Bacillus sp. NRRL B-14911 (SEQ ID NO:27) con número de acceso Genbank ZP_01171315 e identificador GenInfo GI:89098431.
También adicional o alternativamente, un microorganismo manipulado genéticamente puede incluir una molécula de ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa que tiene una secuencia de aminoácidos con tiene al menos un 70% de identidad, por ejemplo al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90% o al menos el 95% de identidad con la SEQ ID NO: 2, y el microorganismo puede producir un ácido graso libre que tenga una longitud de cadena acilo de 8, 10, 12, 14, 16 y/o 18 carbonos (por ejemplo, con una longitud de cadena acilo de 8, 12, 16 y/o 18 carbonos y/u opcionalmente con al menos un 50% en peso de ácidos grasos producidos con una longitud de cadena acilo de 12 a 16 carbonos) y/o un derivado de ácido graso que tenga un número total de átomos de carbono de 7 a 36 (por ejemplo de 7 a 32, de 11 a 30 y/o de 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20, 22, 24, 26, 28, 30, 32, 34 y/o 36 carbonos).
Los ejemplos no limitativos de tioesterasas que tienen al menos un 30% de identidad con la SEQ ID NO:2 incluyen: tioesterasa de Magnetospirillum magneticum AMB-1 (SEQ ID NO:28) con número de acceso Genbank YP_422578 e identificador GenInfo GI:83312314; tioesterasa pronosticada de Magnetospirillum magnetotacticum MS-1 COG0824 (SEQ ID NO:29) con número de acceso Genbank ZP_00055337 e identificador GenInfo GI: 23015565; acil-CoA tioesterasa asociada al sistema tol-pal de Burkholderia cenocepacia (SEQ ID NO:30) con número de acceso Genbank ACA89951 e identificador GenInfo GI:169815368; 4-hidroxibenzoíl-CoA tioesterasa de Rhodopseudomonas palustris BisA53 (SEQ ID NO:31) con número de acceso Genbank YP_782882 e identificador GenInfo GI:115525971; 4-hidroxibenzoíl-CoA tioesterasa de Burkholderia cenocepacia HI2424 (SEQ ID NO:32) con número de acceso Genbank ABK07557 e identificador GenInfo GI:116646916; 4-hidroxibenzoíl-CoA tioesterasa de Burkholderia cenocepacia PC184 (SEQ ID NO:33) con número de acceso Genbank ZP_04939537 e identificador GenInfo GI:254246216; 4-hidroxibenzoíl-CoA tioesterasa de Magnetospirillum gryphiswaldense MSR-1 (SEQ ID NO:34) con número de acceso Genbank CAM73991 e identificador GenInfo GI:144897127; acil-CoA tioesterasa asociada al sistema tol-pal de Burkholderia ambifaria MEX-5 (SEQ ID NO:35) con número de acceso Genbank ZP_02911196 e identificador GenInfo GI:171322375; acil-CoA tioesterasa asociada al sistema tol-pal de Burkholderia ambifaria MC40-6 (SEQ ID NO:36) con número de acceso Genbank ACB63194 e identificador GenInfo GI:171992275; 4-hidroxibenzoíl-CoA tioesterasa de Burkholderia ambifaria AMMD (SEQ ID NO:37) con número de acceso Genbank YP_772574 e identificador GenInfo GI: 115350735; acil-CoA hidrolasa de cadena corta de Granulibacter bethesdensis CGDNIH1 (SEQ ID NO:38) con número de acceso Genbank YP_744923 e identificador GenInfo GI: 114327766; tioesterasa de Haemophilus somnus 129PT (SEQ ID NO:39) con número de acceso Genbank YP_718466 e identificador GenInfo GI: 113460404; acil-CoA tioesterasa asociada al sistema Pol-Pal de Haemophilus somnus 2336 (SEQ ID NO:40) con número de acceso Genbank YP_001783484 e identificador GenInfo GI:170717543; tioesterasa de Proteus mirabilis HI4320 (SEQ ID NO:41) con número de acceso Genbank YP_ 002150349 e identificador GenInfo GI: 197284477; acil-CoA tioesterasa asociada al sistema tol-pal de Burkholderia ambifaria IOP40-10 (SEQ ID NO:42) con número de acceso Genbank ZP_02892046 e identificador GenInfo GI:170701069; tioesterasa de Proteus mirabilis ATCC 29906 (SEQ ID NO:43) con número de acceso Genbank ZP_03841041 e identificador GenInfo GI:227356655; 4-hidroxibenzoíl-CoA tioesterasa de Rhodopseudomonas palustris BisB18 (SEQ ID NO:44) con número de acceso Genbank YP_531800 e identificador GenInfo GI:90423430; acil-CoA tioéster hidrolasa de Azospirillum sp. B510 (SEQ ID NO:45) con número de acceso Genbank YP_ 003448162 e identificador GenInfo GI:288957821; acil-CoA tioesterasa asociada al sistema tol-pal de Rhodopseudomonas palustris DX-1 (SEQ ID NO:46) con número de acceso Genbank ZP_06358294 e identificador GenInfo GI:283840748; superfamilia de tioesterasas de Bradyrhizobium sp. BTAi1 (SEQ ID NO:47) con número de acceso Genbank ABQ38791 e identificador GenInfo GI: 146410285; subunidad enzimática pequeña tipo tioesterasa
de Rhodospirillum centenum SW (SEQ ID NO:48) con número de acceso Genbank YP_002298014 e identificador GenInfo GI:209965099; acil-CoA tioesterasa asociada al sistema tol-pal de Methylosinus trichosporium OB3b (SEQ ID NO:49) con número de acceso Genbank ZP_06889725 e identificador GenInfo GI:296447812; 4-hidroxibenzoíl-CoA tioesterasa de Rhodopseudomonas palustris HaA2 (SEQ ID NO:50) con número de acceso Genbank YP_ 487867 e identificador GenInfo GI:86751371; y acil-CoA tioesterasa asociada al sistema tol-pal de Methylobacterium extorquens PA1 (SEQ ID NO:51) con número de acceso Genbank ABY33133 e identificador GenInfo GI: 163665766.
En algunas formas de ejecución el microorganismo modificado genéticamente que incluye una 4-hidroxibenzoíl-CoA tioesterasa puede producir un aldehído graso, un alcohol graso y/o un éster de cera y opcionalmente puede incluir una o más moléculas de ácido nucleico codificador de una acil-CoA reductasa, de una ácido carboxílico reductasa, de una acil-PTA reductasa, de una aldehído graso reductasa, de una cera sintasa o de una combinación de ellas. Los ésteres de cera incluyen una cadena acilo (cadena A) en el lado carbonílico del enlace éster y una cadena éster (cadena B) unida al oxígeno del enlace éster; una o ambas pueden proceder de un ácido graso generado, por ejemplo, por una tioesterasa tal como la 4-hidroxibenzoíl-CoA tioesterasa. Los ésteres de cera pueden tener un número total de carbonos (una “longitud de cadena A + B”) de, por ejemplo, de 10 hasta 36 carbonos, por ejemplo de 16 a 36 carbonos, de 16 a 32 carbonos o de 24 a 32 carbonos.
Adicional o alternativamente, el microorganismo modificado genéticamente que incluye una 4-hidroxibenzoíl-CoA tioesterasa puede producir un alcano y/o un alqueno, y opcionalmente puede incluir al menos una molécula de ácido nucleico codificador de una ácido graso descarboxilasa, de una aldehído graso descarboxilasa, de una acil-CoA reductasa, de una ácido carboxílico reductasa, de una acil-PTA reductasa o de una combinación de los mismas. Los alcanos y/o alquenos producidos por un microorganismo fotosintético, y/o derivados de él, que incluye una molécula de ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa pueden tener, por ejemplo, una longitud de cadena de 7, 9, 11, 13, 15, 17, 19, 21 y/o 23 carbonos (p.ej. una o más longitudes de cadena impares, de 7 a 17 carbonos, de 7 a 15 carbonos o de 11 a 15 carbonos).
También adicional o alternativamente, un microorganismo modificado genéticamente capaz de producir un alcohol graso, un aldehído graso, un éster de cera, un alcano o un alqueno puede incluir opcionalmente una molécula de ácido nucleico codificador de una acil-CoA sintetasa.
La molécula de ácido nucleico codificador de la 4-hidroxibenzoíl-CoA tioesterasa puede integrarse de forma estable en el cromosoma del microorganismo huésped, en un episoma que se replique autónomamente, en un constructo de expresión o en una combinación de los mismos. Adicional o alternativamente, los microorganismos genéticamente modificados pueden transformarse con genes exógenos de procariotas mediante la introducción de constructos de expresión de ácidos nucleicos apropiados que pueden incluir, además del gen de interés, secuencias de expresión génica y, opcionalmente, secuencias que pueden mediar la recombinación en el cromosoma huésped.
Los constructos de expresión se pueden introducir en células procarióticas y eucarióticas mediante técnicas usuales de transformación o transfección. Tal como se usan en este contexto, los términos “transformación” y “transfección”, conjugación y transducción tienen el propósito de englobar una variedad de métodos conocidos del estado técnico para introducir ácido nucleico extraño (por ejemplo ADN) en una célula huésped, incluyendo, sin limitarse a ellos, la coprecipitación con fosfato cálcico o cloruro cálcico, la transfección mediada por DEAE-dextrano, la lipofección, la competencia natural, la transferencia mediada químicamente, la electroporación y/o el bombardeo con partículas. En Molecular Cloning -A Laboratory Manual (2010), Cold Spring Harbor Laboratory Press, pueden encontrarse métodos adecuados para la transformación o transfección de células huésped.
Por ejemplo, las algas y las bacterias fotosintéticas se pueden transformar por cualquier método idóneo, incluyendo, como ejemplos no limitativos, la absorción de ADN natural (Chung y otros (1998) FEMS Microbiol. Lett. 164: 353361; Frigaard y otros (2004) Methods Mol. Biol. 274: 325-40; Zang y otros (2007) J. Microbiol. 45: 241-245), la conjugación, la transducción, la transformación con perlas de vidrio (Kindle y otros (1989) J. Cell Biol. 109: 2589-601; Feng y otros (2009) Mol. Biol. Rep. 36: 1433-9; Patente U.S. nº 5,661,017), la transformación con filamentos de carburo de silicio (Dunahay y otros (1997) Methods Mol. Biol. (1997) 62: 503-9), la biolística (Dawson y otros (1997) Curr. Microbiol., 35: 356-62; Hallmann y otros (1997) 94: 7469-7474; Jakobiak y otros (2004) Protist 155: 381-93; Tan y otros (2005) J. Microbiol., 43: 361-365, Steinbrenner y otros (2006) Appl Environ. Microbiol. 72: 7477-7484; Kroth (2007) Methods Mol. Biol. 390: 257-267; Patente U.S. nº 5,661,017), la electroporación (Kjaerulff y otros (1994) Photosynth. Res. 41: 277-283; Iwai y otros (2004). Plant Cell Physiol. 45: 171-5; Ravindran y otros (2006) J. Microbiol. Methods 66: 174-6; Sun y otros (2006) Gene 377: 1340-649; Wang y otros (2007) Appl. Microbiol. Biotechnol. 76: 651-657; Chaurasia y otros (2008) J. Microbiol. Methods 73: 133-141; Ludwig y otros (2008) Appl. Microbiol. Biotechnol. 78: 729-35), la transformación mediada por láser o la incubación con ADN en presencia o tras el pretratamiento con cualquiera de los dendrímeros de poli(amidoamina) (Pasupathy y otros (2008) Biotechnol. J. 3: 1078-82), polietilenglicol (Ohnuma y otros (2008) Plant Cell Physiol. 49: 117-120), lípidos catiónicos (Muradawa yotros (2008) J. Biosci. Bioeng. 105: 77-80), dextrano, fosfato cálcico o cloruro cálcico (Méndez-Álvarez y otros (1994)
J. Bacteriol. 176: 7395-7397), opcionalmente después del tratamiento de las células con enzimas de degradación de la pared celular (Perrone y otros, (1998) Mol. Biol. Cell 9: 3351-3365). La transformación mediada por Agrobacterium también se puede realizar en células de algas, por ejemplo después de eliminar o herir la pared celular de las algas
(p.ej. publicación internacional nº WO 2000/62601, Kumar y otros (2004) Plant Sci. 166: 731-738). Los métodos biolísticos sirven para transformar los cloroplastos de especies vegetales y algas eucarióticas (véase, por ejemplo, Ramesh y otros (2004) Methods Mol. Biol. 274: 355-307; Doestch y otros (2001) Curr. Genet. 39: 49-60; Patente
U.S. nº 7,294,506; y las publicaciones internacionales nº WO 2003/091413, WO 2005/005643 y WO 2007/133558.
En muchos casos, para la expresión óptima de una proteína recombinante puede resultar beneficioso el empleo de secuencias codificadoras capaces de producir ARNm con codones usados preferentemente por la célula huésped que debe transformarse. Por lo tanto, para mejorar la expresión de los transgenes, el uso de codones del transgén se puede hacer coincidir con la preferencia codónica específica del organismo en el que se expresa el transgén. Por ejemplo, en la patente U.S. nº 7,135,290 se describen métodos de recodificación de genes para la expresión en microalgas. Todos los codones de un gen, o un subconjunto de ellos, se pueden cambiar para incorporar un codón utilizado preferentemente por el organismo huésped. En la base de datos de uso de codones del Genbank, p.ej., hay información adicional disponible para la optimización de codones.
En algunas formas de ejecución, la secuencia de nucleótidos que codifica las tioesterasas en los microorganismos transformados con una molécula de ácido nucleico aislada, incluyendo una secuencia de ácido nucleico codificador de una 4-hidroxibenzoíl-CoA tioesterasa, se puede unir operativamente a uno o más elementos controladores de la expresión y opcionalmente se puede someter a una optimización codónica para la expresión en el microorganismo.
Además o como alternativa, la molécula de ácido nucleico exógeno, como la revelada aquí, se puede clonar en un vector de expresión para la transformación en un microorganismo como, por ejemplo, una microalga o una bacteria fotosintética. El vector puede incluir secuencias que promuevan la expresión del transgén de interés (p.ej. un gen exógeno de 4H-hidroxibenzoíl-CoA tioesterasa), por ejemplo un promotor heterólogo, y para la expresión en células eucariotas puede incluir opcionalmente, sin limitarse a ellas, una secuencia intrónica, una secuencia que tenga una señal de poliadenilación, etc. Alternativamente, si el vector no contiene un promotor unido operativamente al gen de interés, éste puede transformarse en las células de forma que resulte unido operativamente a un promotor endógeno por recombinación homóloga o integración del vector.
Los vectores diseñados para la expresión de un gen en microalgas pueden incluir un promotor activo en microalgas, unido operativamente al gen exógeno que está siendo introducido. En los vectores de expresión se pueden utilizar varios promotores y terminadores de genes que actúen en microalgas, incluyendo, sin limitarse a ellos, promotores y terminadores de procariotas o eucariotas, tales como, sin limitarse a ellas, Chlamydomonas y otras algas (véase, por ejemplo, Plant Cell Physiol 49: 625-632, 2008), promotores y terminadores provenientes de virus, y promotores y terminadores sintéticos.
Para la transformación de diatomeas se pueden usar en estos vectores de expresión varios promotores de genes que funcionan en ellas, incluyendo, sin limitarse a ellos: promotores de Thalassiosira y otras algas heterocontas, promotores procedentes de virus y promotores sintéticos. Los promotores de Thalassiosira pseudonana que serían adecuados para usar en vectores de expresión incluyen, sin limitación, un promotor de alfa-tubulina, un promotor de beta-tubulina y un promotor de actina. Los promotores de Phaeodactylum tricornutum que serían adecuados para usar en vectores de expresión incluyen, sin limitación, un promotor de alfa-tubulina, un promotor de beta-tubulina y un promotor de actina. Los terminadores asociados a estos genes, otros genes de diatomeas o genes heterólogos particulares se pueden usar para detener la transcripción y proporcionar la señal apropiada para la poliadenilación.
Si se desea, para expresar la molécula de ácido nucleico exógeno, tal como la 4-hidroxibenzoíl-CoA tioesterasa, en el plástido – donde tiene lugar la biosíntesis de ácidos grasos en las microalgas -se puede añadir al extremo Nterminal de la molécula de ácido nucleico exógeno una secuencia nucleótida codificadora de un péptido de tránsito del cloroplasto. Como alternativa, la molécula de ácido nucleico exógeno codificador de una 4-hidroxibenzoíl-CoA tioesterasa se puede introducir directamente en el cromosoma plastidial de las microalgas sin alterar la capacidad fotosintética del plástido. Los métodos de transformación de plástidos son bien conocidos de cara a la introducción de una molécula de ácido nucleico en un cloroplasto de células vegetales (véanse, por ejemplo, las publicaciones internacionales nº WO 2010/019813 y WO 95/16783, las patentes U.S. nº 5,451,513, 5,545,817 y 5,545,818; y McBride y otros, Proc. Natl. Acad. Sci. USA 91: 7301-7305 (1994).
En algunos casos puede ser ventajoso expresar un enzima -tal como, sin limitarse a ella, una 4-hidroxibenzoil-CoA tioesterasa -en un determinado momento durante el crecimiento del organismo huésped modificado genéticamente, a fin de minimizar cualquier efecto perjudicial en el crecimiento de este organismo y/o maximizar el rendimiento del producto de ácido graso de interés. En estos casos se puede unir operativamente a un promotor inducible una o más moléculas de ácido nucleico exógeno codificador de una 4-hidroxibenzoíl-CoA tioesterasa incorporada al organismo modificado genéticamente. El promotor puede ser, por ejemplo, sin limitarse a ellos, un promotor lac, un promotor tet (p.ej. patente U.S. nº 5,851,796), un promotor híbrido que incluya una o ambas porciones de un promotor tet o lac, un promotor sensible a hormonas (p.ej. un promotor sensible a ecdisona, véase la patente U.S. nº 6,379,945), un promotor de metalotioneína (patente U.S. nº 6,410,828) y/o un promotor relacionado con una patogénesis (PR) que pueda ser sensible a un producto químico tal como, por ejemplo, ácido salicílico, etileno, tiamina o BTH (patente U.S. nº 5,689,044). Un promotor inducible puede ser sensible a la luz o a la oscuridad (patentes U.S. nº 5,750,385 y 5,639,952), a la temperatura (patente U.S. nº 5,447,858, Abe y otros, Plant Cell Physiol., 49: 625-632 (2008); Shroda
y otros, Plant J. 21: 121-131 (2000)), o a factores análogos o sus combinaciones. La lista anterior se ofrece como ejemplo y no pretende ser limitativa. Las secuencias promotoras pueden provenir de cualquier organismo, siempre que sean funcionales en el organismo huésped. Los promotores inducibles, tal como se emplean en los constructos de la presente revelación, pueden utilizar una o más porciones/dominios de los promotores anteriormente citados y/u otros promotores inducibles fusionados con al menos una porción de un promotor distinto que opere en el organismo huésped para conferir inducibilidad a un promotor que opera en la especie huésped.
Por ejemplo, para la transformación de cianobacterias se puede utilizar una variedad de promotores que funcionen en ellas, incluyendo, entre otros, los promotores lac, tac y trc y derivados de ellos que sean inducibles por adición de isopropil β-D-1-tiogalactopiranósido (IPTG), promotores asociados naturalmente a genes de resistencia a antibióticos procedentes de un transposón o cromosoma bacteriano (neomicina fosfotransferasa, cloranfenicol acetiltransferasa, espectinomicina adeniltransferasa, etc.), promotores asociados a diversos genes bacterianos heterólogos y a varios genes cianobacterianos naturales, promotores procedentes de virus y fagos y promotores sintéticos. Una forma de ejecución de tal promotor incluye un promotor trcY inducible por IPTG (SEQ ID NO:52). Como promotores aislados de cianobacterias que son utilizables cabe citar, sin limitación, secA (secreción, controlada por el estado redox de la célula), rbc (operón Rubisco), psaAB (proteínas del centro de reacción PSI; reguladas por la luz) y psbA (proteína D1 de PSII; inducible por la luz).
Asimismo se puede utilizar una amplia variedad de terminadores transcripcionales para la construcción del vector de expresión. Los ejemplos de posibles terminadores incluyen, sin limitarse a ellos, psbA, psaAB, rbc, secA y proteína de cubierta T7.
Los vectores de transformación también pueden incluir opcionalmente un marcador seleccionable como, sin limitarse a ellos, un gen de resistencia a fármacos, un gen de resistencia a herbicidas, un enzima o factor metabólico básico para la supervivencia del huésped (por ejemplo un marcador auxótrofo) y análogos, así como combinaciones de los mismos. Las células transformadas se pueden seleccionar opcionalmente basándose en su capacidad de crecer en presencia del marcador seleccionable, en unas condiciones en que las células carentes del casete de resistencia o del marcador auxótrofo no crecerían. Como alternativa puede haber un marcador no seleccionable en un vector tal como un gen codificador de una proteína o un enzima fluorescente que genere un producto de reacción detectable.
Los vectores de expresión se pueden introducir en los microorganismos mediante métodos estándar, incluyendo, sin limitarse a ellos, absorción de ADN natural, conjugación, electroporación, bombardeo con partículas y abrasión con perlas de vidrio, fibras de SiC u otras partículas. Los vectores, por ejemplo, (1) se pueden dirigir para la integración en el cromosoma del huésped, incluyendo secuencias flanqueadoras que permiten la recombinación homóloga en el cromosoma, (2) se pueden dirigir para la integración en plásmidos endógenos, incluyendo secuencias flanqueadoras que permiten la recombinación homóloga en los plásmidos endógenos, y/o (3) se pueden diseñar de forma que los vectores de expresión se repliquen dentro del huésped elegido.
El microorganismo modificado genéticamente puede comprender también una o más moléculas adicionales de ácido nucleico recombinante capaces de potenciar la producción de ácidos grasos y/o derivados de ácidos grasos, tales como, por ejemplo, un gen codificador de un enzima acetil-CoA carboxilasa y/o un gen codificador de una β-cetoacil sintasa (KAS), tal como un enzima KAS III, KAS II o KAS I. Además o alternativamente, el microorganismo puede tener la expresión atenuada de un gen codificador de acil-PTA sintasa, acil-CoA sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato quinasa, o similares, o una combinación de los mismos
En algunas formas de ejecución el microorganismo modificado genéticamente puede ser de tipo fotosintético, y el medio de cultivo puede ser un medio que no incluya un compuesto de carbono reducido para suministrar energía al microorganismo fotosintético diseñado genéticamente y, aun así, el cultivo que contiene este microorganismo puede incluir al menos 5 mg por litro, por ejemplo, al menos 10 mg por litro, al menos 20 mg por litro, al menos 30 mg por litro, al menos 40 mg por litro o al menos 50 mg por litro de ácidos grasos libres y/o de derivados de grasos ácidos producidos por el microorganismo.
La molécula de ácido nucleico recombinante codificador de la 4-hidroxibenzoíl-CoA tioesterasa puede ser cualquiera de las descritas anteriormente, por ejemplo un miembro de la familia PF03061 de Pfam, y/o una molécula que al consultarla en la base de datos Pfam dé una coincidencia con PF03061 cuya puntuación en bits sea superior al valor umbral de recopilación de 20,6. En algunos ejemplos el microorganismo puede llevar una molécula de ácido nucleico recombinante codificador de un polipéptido que se inscribe en pfam PF03061 con una puntuación de bits superior a 20,6 y un valor e inferior a 0,1, y dicho polipéptido tiene una secuencia de aminoácidos con al menos un 50% de identidad, al menos el 55% de identidad, al menos el 60% de identidad, al menos el 65% de identidad, al menos el 70% de identidad, por ejemplo al menos el 75%, al menos el 80%, al menos el 85%, al menos el 90% o al menos el 95% de identidad con la SEQ ID NO:2, de modo que el microorganismo produce al menos un ácido graso libre o al menos un derivado de ácido graso. En algunos ejemplos, el microorganismo puede incluir una molécula de ácido nucleico recombinante codificador de un polipéptido que se inscribe en pfam PF03061 con una puntuación de bits superior a 20,6 y un valor e inferior a 0,1, y dicho polipéptido tiene una secuencia de aminoácidos con al menos un 70% de identidad, al menos un 75% de identidad, al menos un 80% de identidad, al menos un 85% de identidad, al
menos un 90% de identidad, por ejemplo al menos un 95% de identidad, al menos un 96% de identidad, al menos un 97% de identidad, al menos 98% de identidad, al menos 99% de identidad o aproximadamente 100% de identidad con la SEQ ID NO:1, de modo que el microorganismo produce al menos un ácido graso libre o al menos un derivado de ácido graso.
Tal como se menciona aquí, la molécula de ácido nucleico se puede unir operativamente a un promotor activo en un microorganismo fotosintético y, opcionalmente, a una o más secuencias adicionales reguladoras de ácido nucleico, tales como, por ejemplo, una secuencia de terminación transcripcional. Además, o alternativamente, la molécula de ácido nucleico puede estar en un plásmido autorreplicante que se introduce en un microorganismo fotosintético y/o puede integrarse en el genoma de un microorganismo fotosintético.
En algunas formas de ejecución los ácidos grasos y/o los derivados de ácidos grasos pueden estar presentes en los medios, por ejemplo como precipitados en o sobre la superficie del medio, junto a ella o cerca de ella; adheridos al recipiente del medio formando gotitas, incluyendo gotitas suspendidas (p.ej. una emulsión); formando una capa relativamente inmiscible que flota en la parte superior del medio de cultivo acuoso; como una “espuma”, película, gel, semisólido, coloide, partículas finas, gránulos, sólidos o agregados que pueden estar dispersados, suspendidos o incorporados en el medio de cultivo; asociados con las células del microorganismo fotosintético; en fases separadas de alguna otra forma, o una mezcla de las ellas.
En formas de ejecución preferidas, al menos un ácido graso libre producido mediante un cultivo como el revelado aquí puede tener una longitud de cadena acilo de 8 hasta 24 carbonos, por ejemplo de 8 a 18 carbonos, de 12 a 16 carbonos o de 8, 10, 12 , 14, 16, 18, 20, 22 y/o 24 carbonos. En aquellas formas de ejecución en las que se produce al menos un derivado de ácido graso (tal como uno o más alcoholes grasos, aldehídos grasos, ésteres de cera, alcanos y alquenos) mediante un cultivo como el revelado aquí, dicho derivado de ácido graso puede tener un número total de carbonos de 7 hasta 36, por ejemplo de 11 a 34, de 12 a 32, o de 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 , 22, 23, 24, 26, 28, 30, 32, 34 y/o 36.
El medio de cultivo puede ser ventajosamente cualquiera que sea idóneo para el crecimiento de un microorganismo huésped fotosintético. El cultivo puede contener una fuente de carbono reducido, tal como, por ejemplo, uno o más azúcares o ácidos orgánicos que el microorganismo pueda consumir para crecer de modo heterótrofo o mixótrofo. Además o alternativamente puede ser que el medio de cultivo no contenga una cantidad sustancial de un compuesto de carbono reducido utilizable como fuente de energía para el organismo y/o que incluya una fuente de carbono inorgánico tal como CO2 o bicarbonato.
II. Métodos para producir ácidos grasos libres y/o sus derivados
Un aspecto de la presente invención se refiere a un método, como el definido en la reivindicación 13, para producir un ácido graso libre y/o un derivado de ácido graso en un cultivo, el cual consiste en cultivar un microorganismo que incluye al menos una secuencia de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa con medios de cultivo en condiciones que permitan la expresión de la 4-hidroxibenzoíl-CoA tioesterasa. La expresión del gen exógeno de 4-hidroxibenzoíl-CoA tioesterasa en el microorganismo puede dar como resultado la producción de al menos un ácido graso libre y/o de un derivado de ácido graso.
En una forma de ejecución el cultivo que incluye el microorganismo con el gen recombinante que expresa una 4hidroxibenzoíl-CoA tioesterasa puede producir al menos una cantidad doble de ácido graso y/o de derivado de ácido graso en comparación con un cultivo idéntico en todos los aspectos, exceptuando que el microorganismo no incluye una secuencia de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa. Por ejemplo, el microorganismo que contiene la molécula de ácido nucleico recombinante codificador de la 4-hidroxibenzoíl-CoA tioesterasa tiene la capacidad de producir (y opcional pero preferiblemente liberar y/o secretar) al menos 5 mg por litro, por ejemplo al menos 10 mg por litro, al menos 20 mg por litro, al menos 30 mg por litro, al menos 40 mg por litro o al menos 50 mg por litro de ácidos grasos libres y/o de derivados de ácidos grasos.
El método puede comprender además el aislamiento/la eliminación del ácido graso libre y/o del derivado de ácido graso del cultivo, p.ej. de las células, de los medios de cultivo o del cultivo entero. Por ejemplo, el aislamiento puede tener lugar por extracción orgánica de células íntegras o lisadas, eliminación de los ácidos grasos libres o derivados de ácidos grasos en forma de precipitado o de la capa superior de los medios de cultivo (“descremado”), empleando adsorbentes particulados, burbujas o matrices que fijen los ácidos grasos y/o sus derivados o similares, o cualquier combinación de los mismos.
El microorganismo manipulado genéticamente puede ser cualquiera de los descritos aquí, incluyendo una molécula de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa, cuya expresión puede producir ácidos grasos libres y/o derivados de ácidos grasos. La 4-hidroxibenzoíl-CoA tioesterasa puede ser expresada por el microorganismo durante al menos una parte del tiempo durante el cual se cultiva el microorganismo fotosintético y/o tras la adición de un inductor al cultivo. Los ejemplos no limitativos de un inductor incluyen lactosa o un análogo de lactosa tal como isopropil β-D-1-tiogalactopiranósido, y luz, que puede aportarse en forma de luz solar o luz artificial, como por ejemplo luz fluorescente.
Además o como alternativa, el microorganismo modificado genéticamente puede ser un microorganismo fotosintético y se puede cultivar fototróficamente, en cuyo caso los medios de cultivo no suelen contener una cantidad sustancial (p.ej. ninguna) de una fuente de carbono reducido. Al crecer fotótroficamente, el microorganismo fotosintético utiliza luz como su fuente de energía y el microorganismo usa una fuente de carbono inorgánico como CO2 o bicarbonato para sintetizar biomoléculas. Alternativamente se puede aportar una molécula o un compuesto de carbono orgánico al medio de cultivo fototrófico del microorganismo, pero o no puede ser absorbido o metabolizado por la célula para obtener energía o no está presente en una cantidad efectiva que proporcione la energía suficiente para el desarrollo del cultivo celular.
En muchas formas de ejecución el cultivo puede llevar una fuente de carbono inorgánico, incluyendo, sin limitarse a ellos, bicarbonato, carbonato cálcico y/o CO2, presente en el aire o aportado de forma enriquecida respecto al CO2 ambiental, por ejemplo como un 5% en volumen de CO2 en el aire. Además o alternativamente, los microorganismos fotosintéticos se pueden exponer a la luz durante al menos una parte del período de cultivo. Las fuentes de luz artificial se pueden usar como única fuente de luz o para intensificar o prolongar la luz natural.
“Cultivar” se refiere al fomento intencional del crecimiento (aumento del tamaño celular, del contenido celular y/o de la actividad celular) y/o de la propagación (aumento del número de células, p.ej. a través de la mitosis) de una o más células mediante el empleo de condiciones selectivas y/o controladas. La combinación de crecimiento y propagación puede denominarse “proliferación”. Los ejemplos de condiciones selectivas y/o controladas pueden incluir el uso de un medio definido (con características conocidas, tales como pH, fuerza iónica y fuente de carbono), temperatura especificada, tensión de oxígeno, niveles de dióxido de carbono y crecimiento en un biorreactor, entre otras.
Los microorganismos fotosintéticos, como las microalgas o las cianobacterias, se pueden cultivar fototróficamente en ausencia de una cantidad sustancial de una fuente fijada de carbono, o mixotróficamente, cuando a los cultivos se aporta luz durante al menos una parte del día y también una fuente de carbono reducido, tal como un azúcar (p.ej. glucosa, fructosa, galactosa, manosa, ramnosa, arabinosa, xilosa, lactosa, sacarosa, maltosa), una forma de ácido orgánico (p.ej. acetato, citrato, succinato) y/o glicerina. Como alternativa el microorganismo fotosintético se puede cultivar mixotróficamente, de tal modo que el organismo crezca en presencia de luz durante al menos una parte del día y también con el aporte de una o más fuentes de carbono reducido. Como alternativa las células se pueden cultivar heterotróficamente, aportando a los medios una fuente de carbono reducido para el consumo energético y la síntesis bioquímica. Un organismo fotosintético se puede cultivar mixotróficamente durante un período de tiempo, seguido de otro período de cultivo fototrófico, o viceversa.
En el estado técnico se conocen diversos medios para el cultivo fototrófico y/o mixotrófico de algas y cianobacterias, y los medios se pueden optimizar para potenciar el crecimiento o la producción de productos de ácido graso de una especie particular.
Los microorganismos utilizables conforme a los métodos de la presente invención se pueden encontrar en diversas ubicaciones y entornos por todo el mundo. Como consecuencia de su aislamiento de otras especies y la divergencia evolutiva resultante puede variar el medio de cultivo particular para el crecimiento óptimo y la generación de lípidos y/o constituyentes hidrocarbonados. En algunos casos, ciertas cepas de microorganismos pueden ser incapaces de crecer en un medio de cultivo específico, debido a la presencia de algún componente inhibidor o a la ausencia de algún requerimiento nutricional básico para la cepa particular del microorganismo.
En general los medios de cultivo sólidos y líquidos son asequibles a través de una amplia variedad de fuentes, así como lo son las instrucciones de preparación de medios particulares adecuados para una amplia variedad de cepas de microorganismos. Por ejemplo, los diversos medios de agua dulce y agua salada pueden incluir los descritos en Barsanti, L. y Gualtieri, P. (2005) Algae: Anatomy, Biochemistry, and Biotechnology [Algas: Anatomía, Bioquímica y Biotecnología], CRC Press, Taylor & Francis Group, Boca Raton, Florida, EUA, para medios y métodos del cultivo de algas. También pueden verse recetas de medios algales en los sitios web de varias colecciones de cultivos de algas, incluyendo como ejemplos no limitativos, la colección de cultivos de algas UTEX (sbs.utexas.edu/utex/media.aspx); la colección de cultivos de algas y protozoos (ccap.ac.uk/media/pdfrecipes); y la base de datos Katedra Botaniky (/botany.natur.cuni.cz/algo/caup-media.html).
En algunas formas de ejecución los medios usados para cultivar un organismo productor de ácidos grasos pueden contener una mayor concentración de un metal (aportado normalmente en forma salina y/o iónica) tal como, por ejemplo, sodio, potasio, magnesio, calcio, estroncio, bario, berilio, plomo, hierro, níquel, cobalto, estaño, cromo, aluminio, cinc, cobre o similares, o combinaciones de los mismos (particularmente metales multivalentes tales como magnesio, calcio y/o hierro), en comparación con una formulación de medio estándar tal como, por ejemplo, el medio estándar BG-11 (Medio ATCC 616, ejemplo 6) o un medio modificado como el Medio ATCC 854 (BG-11 modificado para contener vitamina B12) o el Medio ATCC 617 (BG-11 modificado para cianobacterias marinas, que contiene NaCl adicional y vitamina B12).
Por ejemplo, un medio utilizado para cultivar microorganismos productores de ácidos grasos libres puede contener al menos 2 veces, por ejemplo al menos 3 veces, al menos 4 veces, al menos 5 veces, al menos 6 veces, al menos 7 veces, al menos 8 veces, al menos 9 veces, al menos 10 veces, entre 2 y 10 veces, y/o entre 10 y 100 veces la
cantidad de metal (p.ej. calcio) con respecto a un medio estándar. El medio utilizado para cultivar microorganismos capaces de producir ácidos grasos libres puede contener, por ejemplo, al menos aproximadamente 0,5 mM, entre 0,5 mM y 1 mM aproximadamente, entre 1 mM y 2 mM aproximadamente, entre 2 mM y 5 mM aproximadamente, entre 5 mM y 10 mM aproximadamente, entre 10 mM y 25 mM aproximadamente, y más de 25 mM de metal (p.ej. calcio) en la formulación.
En otras formas de ejecución, al usar en el medio una cantidad en exceso de metal (p.ej. de calcio), al menos una porción del ácido o ácidos grasos puede ser secuestrada por precipitación de jabón, lo cual puede reducir los efectos tóxicos del ácido o ácidos grasos libres. La adición de metal (p.ej. de calcio) al medio puede aumentar adicional o alternativamente la tolerancia de los microorganismos en medios con una concentración relativamente alta de ácidos grasos libres. Además o alternativamente, las cepas productoras de ácidos grasos pueden ser ventajosamente más robustas con un exceso de contenido de metal (p.ej. de calcio). Aunque el componente en exceso está descrito aquí como un metal, se contempla que pueda designarse de manera más general como una fuente de contraiones de carboxilato, por ejemplo una fuente de contraiones formadora de jabón, una fuente de iones metálicos (indicada aquí como “metal”), una fuente de contraiones multivalentes (es decir, de valencia +2 o mayor), una fuente de contraiones divalentes o alguna combinación de ellos. Para la producción de ácidos grasos y/o derivados de ácidos grasos, los microorganismos fotosintéticos se pueden cultivar en interiores (p.ej. en fotobiorreactores, matraces agitados, tubos de ensayo, viales, placas de microvaloración, placas de Petri o similares) o al aire libre (p.ej. en estanques, canales, fosos, conductos o similares). Además o alternativamente se puede aportar a los microorganismos fotosintéticos una fuente de carbono inorgánico (tal como, de modo no excluyente, CO2), incluyendo, entre otras, aire, aire enriquecido en CO2 o gases de combustión.
A no ser que se definan de otra manera, todos los términos técnicos y científicos empleados aquí tienen el mismo significado que el entendido comúnmente por un especialista en la materia a la que pertenece la presente invención.
Las secuencias de aminoácidos y ácidos nucleicos se identifican mediante los números de acceso o identificadores GenInfo. Los números de acceso son identificadores únicos de un registro de secuencias públicamente asequible en el sitio de Internet del National Center for Biotechnology Information [Centro nacional de información biotecnológica] mantenido por los United States National Institutes of Health [Institutos nacionales de salud de los Estados Unidos], al que se puede acceder en ncbi.nlm.nih.gov. El número de identificación de secuencia "GenInfo Identifier" (GI) es específico de una secuencia de nucleótidos o aminoácidos. Si una secuencia cambia de algún modo, se le asigna un nuevo número GI. Hay disponible una herramienta de historial de revisiones de secuencias para rastrear los diversos números GI, los números de versión y las fechas de actualización de las secuencias que aparecieron en un registro específico de Genbank. La búsqueda y la obtención de secuencias de ácidos nucleicos o genes, o de secuencias proteicas, basada en números de acceso y números GI es bien conocida en los campos de la biología celular, la bioquímica, la biología molecular y la genética molecular.
También debe advertirse que, tal como se usan aquí y en las reivindicaciones adjuntas, las formas singulares “un”, “una” y “el” incluyen las referencias al plural, a menos que el contexto indique claramente lo contrario. El uso de “o” en una lista de dos o más elementos indica que se contempla cualquier combinación de ellos; por ejemplo, “A o B” indica que A solo, B solo, o ambos A y B están propuestos. Todos los términos técnicos y científicos utilizados en este documento tienen el mismo significado.
Las publicaciones comentadas en este documento se aportan únicamente como divulgación antes de la fecha de presentación de la presente solicitud de patente. Nada en este documento debe interpretarse como una admisión de que la invención descrita no tenga derecho a anteceder a tal publicación en virtud de la invención anterior. Además, las fechas de publicación aportadas pueden ser distintas de las fechas de publicación reales, las cuales necesitarían ser confirmadas independientemente.
EJEMPLOS
Los siguientes ejemplos se ofrecen para facilitar a los expertos en la materia una revelación y descripción completa de cómo realizar y aplicar la invención descrita, y no están pensados para limitar el alcance de lo que los presentes inventores consideran como su invención, ni tampoco debe interpretarse que los ensayos descritos a continuación sean todas o las únicas pruebas efectuadas. Se han hecho esfuerzos para asegurar la exactitud de los números empleados (p.ej. cantidades, temperaturas, etc.), pero hay que contar con algunos posibles errores y desviaciones experimentales. A no ser que se indique lo contrario, las partes son partes en peso, el peso molecular es el peso molecular medio ponderado, la temperatura es en grados centígrados y la presión es la atmosférica o parecida.
Ejemplo 1. Creación de una biblioteca metagenómica
1.1. Aislamiento de ADN metagenómico
Para aislar ADN metagenómicos que pudieran contener genes novedosos de tioesterasa, se recogieron muestras de ~20 litros de agua completa de un estanque de peces en Pacific Aquafarms, situado al norte del Mar Salton en el sur de California.
Se filtraron aproximadamente 8 l de agua del sitio anterior, usando un tren de filtración Millipore de acero inoxidable, a través de filtros de ~ 20 µm, ~ 3 µm, ~ 0,8 µm y ~ 0,1 µm. Se colocó un filtro de ~ 0,1 µm en una bolsa de congelador Ziploc® hermética al aire (S.C. Johnson, Racine, WI). Se añadió un corte del filtro a unos medios de desarrollo de poblaciones de microorganismos, a fin de producir bibliotecas metagenómicas. Una muestra del filtro se cultivó en medio Luria Broth (LB), agitando a ~ 225 rpm y aproximadamente 30ºC, y otra muestra del filtro se cultivó en medio Luria Broth (LB), agitando a ~ 225 rpm y aproximadamente 40ºC, en ambos casos por la noche. Después del período de crecimiento se recogieron las suspensiones celulares por centrifugación a ~ 4000 g durante aproximadamente 10 minutos a temperatura ambiente (~ 20-25ºC). Los sedimentos celulares se resuspendieron en Tris-Cl ~ 50 mM, pH ~ 8,0 (que llevaba EDTA ~ 10 mM, ~ 100 µg/ml de RNasa A, ~ 4 mg/ml de lisozima, ~ 100 µg/ml de lisostafina y ~ 500 U/ml de mutanolisina) y se incubaron a ~ 37ºC, agitando (~ 100 rpm). Los homogenados se sedimentaron por centrifugación durante aproximadamente 30 minutos a ~ 16.000 g, a ~ 4ºC. Los sobrenadantes se transfirieron a tubos nuevos y se mezclaron con un volumen igual de etanol frío (aproximadamente - 20ºC) al 100% para precipitar el ADN. El precipitado se recogió por centrifugación a ~ 16.000 g, a ~ 4ºC, o se arrolló sobre un asa de inoculación estéril desechable. El ADN se lavó luego en etanol al ~ 75% y se secó a temperatura ambiente, y se resuspendió en Tris-Cl ~ 50 mM, pH ~ 8,0, para el fraccionamiento y la construcción de la biblioteca.
1.2. Construcción de la biblioteca de ADN metagenómico y evaluación funcional
Los ADN metagenómicos aislados de la muestra metagenómica amplificada a ~ 30ºC y de la muestra metagenómica amplificada a ~ 40ºC se digirieron parcialmente con endonucleasa de restricción Sau3AI y se ligaron al sitio BamHI del vector bacteriano/cianobacteriano de expresión/integración RB-RS1 (SEC ID NO:5; FIGURA 2) para generar las bibliotecas metagenómicas de ~ 30ºC y ~ 40ºC. El vector de expresión RB-RS1 se construyó utilizando una cadena principal de pUC, de la cual se suprimió el gen de lactamasa que confiere resistencia a la ampicilina. El vector se construyó de tal manera, que el promotor lac, el gen lacZ alfa y un gen de resistencia a la kanamicina estuvieran flanqueados por la secuencia RS 1 “arriba” y las secuencias RS1 “abajo” para la recombinación homóloga en el sitio RS1 del genoma de Synechocystis (Williams y otros (1988) Methods in Enzymology, 167: 766-778). Las bibliotecas de ~ 30ºC y ~ 40ºC se transformaron en células competentes de E. coli K19 y las colonias resistentes a kanamicina se cribaron para la producción de ácidos grasos libres mediante un ensayo en placas con azul Nilo.
Se usó un ensayo en placas para identificar las colonias de E. coli recombinante que producían ácidos grasos libres en un medio sólido que contenía ~ 10 µg/ml de azul Nilo A (Alfa Aesar # A17174). El azul Nilo tiñe los lípidos polares (ácidos grasos, fosfolípidos) de azul. Las colonias se examinaron por inspección visual para detectar las manchas, colocando las placas en una caja de luz estándar. Las colonias que mostraron un nivel alto de azul Nilo A respecto a los controles de fondo fueron seleccionadas, cultivadas y cribadas adicionalmente para determinar la cantidad total de ácido graso libre no esterificado (AGL), usando un kit de detección de ácidos grasos libres (#SFA-1, Zenbio, Inc, Research Triangle Park, NC).
El contenido de ácidos grasos libres de las muestras que presentaron niveles elevados de ácidos grasos libres sobre los controles de fondo en el ensayo en placas con azul Nilo y en el ensayo con el kit de detección de ácidos grasos libres se analizaron adicionalmente por cromatografía de gases (CG) con detección de ionización de llama (CG-DIL). Se seleccionaron doscientos clones que mostraban niveles altos de ácidos grasos libres según el análisis de CG-DIL en comparación con los controles de fondo y se determinaron las secuencias nucleótidas de los clones. Después de la secuenciación del ADN, de la eliminación de los clones redundantes y del análisis bioinformático, se observó un patrón de clones recurrentes que pertenecían a una familia de genes de la 4-hidroxibenzoíl-CoA tioesterasa. Entre la familia de los genes de la 4-hidroxibenzoíl-CoA tioesterasa se caracterizaron con mayor detalle dos clones, 340-64 (SEQ ID NO:3) y3-1 (SEQ ID NO:4).
Ejemplo 2. Expresión de ADN metagenómico en E. coli
Para la expresión de los genes de tioesterasa procariota en E. coli se inocularon ~ 1,2 ml de medio 2x YT -que contenía ~ 50 µg/ml de espectinomicina y ~ 1 mM de Isopropil β-D-1-tiogalactopiranósido (IPTG) -en un tubo de vidrio con ~ 30 microlitros de un cultivo saturado de cada cepa bacteriana y se cultivaron durante aproximadamente 24 horas. Se extrajeron unos 0,6 ml del cultivo para el análisis bioquímico.
Ejemplo 3. Análisis de muestras de ácidos grasos procedentes de E. coli
Para identificar y cuantificar los ácidos grasos producidos por las cepas de E. coli modificadas se añadieron ~ 0,6 ml de los cultivos de E. coli a viales de vidrio de ~ 2 ml para cromatografía de gases con tapones recubiertos de PTFE (politetrafluoroetileno) (National Scientific). Se añadieron a la muestra cultivada cincuenta microlitros de un patrón interno conjunto que incluía los ácidos grasos libres con cadenas acilo de 9 carbonos (C9:0), 13 carbonos (C13:0) y 17 carbonos (C17:0), cada uno de ellos a una concentración de ~ 600 µg/ml en hexano, seguido de ~ 50 microlitros de H2SO4 al ~ 50%, ~ 100 microlitros de NaCl ~ 5 M y ~ 850 microlitros de hexano. La concentración final de cada estándar interno fue de ~ 50 µg/ml. Los ácidos grasos para preparar el conjunto de patrones internos se adquirieron a Fluka o Nu Chek Prep. Luego los cultivos se removieron vorticialmente en un agitador multitubular a ~ 2.500 rpm durante ~ 30 minutos. Los viales se centrifugaron finalmente durante ~ 3 min a ~ 2500 rpm para lograr una buena
separación entre las fases orgánica y acuosa. Las capas de hexano fueron muestreadas mediante un Autosampler Gerstel MPS2L.
Las muestras de ácido graso de E. coli se analizaron utilizando un cromatógrafo de gases Agilent modelo 7890A equipado con un DIL (detector de ionización de llama) que incluía una columna capilar de J&W Scientific DB-FFAP (~ 15 m de longitud, ~ 0,25 mm de diámetro interno, ~ 0,25 mm de espesor de film) acoplada a un espectrofotómetro de masas Agilent 5975C. El horno de CG se programó de la siguiente manera: ~ 140ºC durante ~ 0,5 min., luego se calentó a ~ 20ºC/min. hasta ~ 230ºC (manteniendo esta temperatura 5 min). La temperatura del inyector se mantuvo a ~ 250ºC y se usó una inyección de ~ 1 µl dividida en relación ~ 40:1. Como gas portador se empleó helio a un caudal aproximado de 1,2 ml/min. Los analitos se identificaron comparando los tiempos de retención con patrones inyectados individualmente. El rango de calibración para los analitos fue de ~ 2 µg/ml hasta ~ 200 µg/ml para ácidos grasos con una longitud de cadena de 8 carbonos (C8:0) a 16 carbonos y un doble enlace (C16:1) y de ~ 0,5 µg/ml hasta ~ 50 µg/ml para ácidos grasos con una longitud de cadena de 18 carbonos, sin dobles enlaces, (C18:0) a 18 carbonos con dos dobles enlaces (C18:2). Los ensayos de adición y recuperación en cultivos de células íntegras demostraron que el método de extracción dio una recuperación consistente de cada analito dentro de un rango del 85% -115% aproximadamente.
Tal como muestran las FIGURAS 3, 4 y 5, la expresión de las 4-hidroxibenzoíl-CoA tioesterasas en E. coli dio como resultado un aumento de la producción de ácidos grasos libres en el cultivo, con niveles de ácidos grasos libres tan o más altos que los producidos por las células de E. coli que expresan una tioesterasa vegetal superior de una especie de Cuphea (etiquetada como 25 control). Tal como muestra la FIGURA 3, la expresión de la 4-hidroxibenzoíl-CoA tioesterasa 340-64 (SEQ ID NO:3) en E. coli indujo la producción de ácidos grasos libres con una longitud de cadena acilo de 8, 10, 12, 16, y 18 carbonos
Tal como muestra la FIGURA 4, la expresión de la 4-hidroxibenzoíl-CoA tioesterasa 3-1 (SEQ ID NO:2) en E. coli también dio como resultado la producción de ácidos grasos libres con longitudes de cadena acilo de 8, 10, 12, 16 y 18 carbonos, siendo mayor la cantidad de ácidos grasos libres con una longitud de cadena acilo de 8, 10, 16 y 18 carbonos en el cultivo que contenía las células que expresan la SEQ ID NO:2, en comparación con un cultivo control que contenía células que expresan una tioesterasa vegetal superior de una especie de Cuphea (etiquetada como 25 control).
La FIGURA 5 muestra el nivel de ácidos grasos libres producidos por las células de E. coli K-19 (que carecen de una acil-CoA sintetasa funcional, un enzima en la vía de degradación de ácidos grasos) que expresan la 4-hidroxibenzoíl tioesterasa 340-64 (SEQ ID NO:3) o un vector de control vacío (control RBRS1 EV). La cantidad de ácido graso libre se normalizó a la D.O. de las celdas K19. La expresión de la 4-hidroxibenzoíl-CoA tioesterasa 340-64 (SEQ ID NO:3) en las células K19 también aumentó el nivel de ácidos grasos libres con longitudes de cadena acilo de 8, 10, 12, 14, 16 y 18 carbonos producidos por la cepa.
Ejemplo 4. Ensayo de acil-PTA tioesterasa
Como las células productoras de ácidos grasos libres se transformaron con genes codificadores de 4-HBT, que no es sabido que generen ácidos grasos libres a partir de acil-PTA, los enzimas se expresaron en cepas de E. coli con el fin de producir los enzimas utilizables en ensayos in vitro para determinar su actividad de tioesterasa en substratos de acil-PTA.
A tal fin, las células de E. coli se transformaron con 340-64 (SEQ ID NO:3), 3-1 (SEQ ID NO:4), o con un vector vacío (SEQ ID NO:5) como control y la expresión se indujo añadiendo isopropil β-D-1-tiogalactopiranósido (IPTG) al medio del cultivo de E. coli. Los cultivos (~ 10 ml) se inocularon con colonias individuales y se incubaron hasta que la DO del cultivo llegó a ~ 0,6, en cuyo momento se añadió IPTG hasta una concentración final de ~ 1 mM y las células se cultivaron durante la noche. Después se sedimentaron las células, los sedimentos celulares se lavaron con 1x solución salina tamponada con fosfato (PBS) y los extractos celulares se prepararon resuspendiendo los sedimentos en ~ 0,5 ml de tampón de lisis celular xTractor (Clontech, Mountain View, CA).
El ensayo de acil-PTA tioesterasa se realizó de la siguiente manera: ~5 µl de un substrato de acil-PTA C16 ~ 10 µM sintetizado enzimáticamente en un tampón (Tris-HCl ~100 mM, pH ~ 8,0, NaCl ~ 100 mM) se mezclaron con ~ 3 µl de extractos celulares de células 3-1 productoras de HBT, células 340-64 productoras de HBT o de un extracto de control de células de E. coli que no expresan una tioesterasa (PE0045). Las mezclas se incubaron durante ~ 5, ~ 10 y ~ 30 minutos y las reacciones se detuvieron calentando a ~ 70ºC durante ~ 5 min. Se añadieron aproximadamente 10 µl de colorante de carga de urea natural 2,5x a las mezclas de reacción. Las muestras se cargaron sobre de gel de acrilamida al ~ 20% con urea natural ~ 2,5 M y se cromatografiaron en condiciones no desnaturalizantes a ~ 120 voltios durante ~ 60 min. El gel se tiñó con colorante de gel Simplyblue® (Invitrogen, Carlsbad, CA).
La FIGURA 6 muestra los patrones de migración de los substratos de acil-PTA en un gel de acrilamida natural, que se incubaron con extractos celulares preparados a partir de células de E. coli que expresan diferentes clones, o con un extracto de control (PE0045). Las bandas 1-3 muestran los patrones de migración de los substratos de acil-PTA (~ 5 µl de ~ 10 µM) incubados con ~ 3 µl de tampón de lisis celular xTractor (banda 1) o con un lisado hecho de las
células que contenían un vector de control (PE0045, ~ 3 µl) durante ~ 5 minutos (banda 2) o ~ 10 minutos (banda 3). La banda 4 indica un marcador de tamaño proteico. Las bandas 5-7 (etiquetadas como 3-1) muestran los patrones de migración de los substratos de acil-PTA incubados con ~ 3 µl de extractos (aproximadamente 5 mg/ml) obtenidos a partir de las células que expresan la 4-hidroxibenzoíl tioesterasa 3-1 (SEQ ID NO:2) durante ~ 5 minutos (banda 5), ~ 10 minutos (banda 6) y ~ 30 minutos (banda 7), respectivamente. Las bandas 8-10 muestran los patrones de migración de los substratos de acil-PTA incubados con los extractos obtenidos a partir de las células que expresan la 4-hidroxibenzoíl tioesterasa 340-64 (SEQ ID NO:1) durante ~ 5 minutos (banda 8), ~ 10 minutos (banda 9) y ~ 30 minutos (banda 10), respectivamente.
Tal como muestra la FIGURA 6, en contraste con un control (un substrato de acil-PTA con extracto de PE0045), en la incubación de substratos de acil-PTA con los extractos celulares preparados a partir de las células de E. coli que expresan 340-64 (SEQ ID NO:1) o 3-1 (SEQ ID NO:2) la 4-hidroxibenzoíl-CoA tioesterasa produjo un incremento espectacular en la cantidad de PTA libres, a la vez que disminuía la cantidad de substratos de PTA conjugados con ácidos grasos (C16-PTA). Estos resultados indican que tanto la 3-1 (SEQ ID NO:1) como la 340-64 (SEQ ID NO:2) tienen una acción de hidrolítica hacia el substrato de acil-PTA.
Ejemplo 5. Transformación de cianobacterias
Los plásmidos que contienen los genes 340-64 y 3-1 de la 4-hidroxibenzoíl-CoA tioesterasa se introducen en un huésped cianobacteriano. Se transforman células Synechocystis sp. PCC 6803 básicamente según Zang y otros (J. Microbiology, 2007, 45: 241-245). En resumen, las células se cultivan bajo luz constante hasta una densidad óptica a 730 (DO730) de aproximadamente 0,7 a 0,9 (una DO730 de ~ 0,25 corresponde a ~ 1 x 108 células/ml) y se recogen por centrifugación a ~ 2.000 g durante ~ 15 minutos a temperatura ambiente. El sedimento celular se resuspende en unas 0,3 veces el volumen de medio de cultivo BG-11 fresco y se utiliza inmediatamente para la transformación. Se añade aproximadamente 1 microgramo de ADN plásmido (que contiene un gen de 4-hidroxibenzoíl-CoA tioesterasa) a ~ 0,3 ml de células, se mezcla con cuidado y se incuba a ~ 30ºC durante ~ 5 horas con iluminación, pero sin agitar. Las células se extienden sobre un filtro (membrana Whatmann de policarbonato Nuclepore con surcos grabados, PC ~ 47 mm, ~ 0,2 micras) colocado en placas de agar con ~ 50 ml de BG-11 y se dejan recuperar durante unas 16 a 24 horas bajo la luz, y a continuación el filtro se levanta y se coloca sobre una placa con BG-11 fresco que contiene espectinomicina (~ 20 µg/ml) a fin de seleccionar transformantes. Las colonias resultantes se siguen analizando para detectar la presencia de los genes de 4-hidroxibenzoíl-CoA tioesterasa por PCR.
Ejemplo 6. Cultivo de cianobacterias
Las células de Synechocystis transformadas con los constructos de expresión que llevan los genes 340-64 (SEQ ID NO:3) y 3-1 (SEQ ID NO:4) se cultivan fototróficamente en ausencia de una fuente de carbono reducido y usando la luz como fuente de energía. Se inoculan aproximadamente diez ml de medio BG-11 que contiene ~ 1 mM de IPTG en viales de vidrio de ~ 20 ml a una DO730nm de ~ 0,6 y se cultivan durante ~ 6,5 días (~ 150 rpm) a ~ 30ºC con iluminación constante (~ 40 µEinsteins m-2 sec-1). Se extraen aproximadamente 0,6 ml de cultivo para el análisis bioquímico. Los ingredientes del medio BG-11 (medio ATCC 616: medio BG-11 para algas verde-azuladas) son los siguientes:
NaNO3 1,5 g K2HPO4 40 mg MgSO4·7H2O 75 mg CaCl2·2H2O 36 mgÁcido cítrico 6 mg Citrato férrico-amónico 6 mg EDTA 1 mg Na2CO3 20 mg Mezcla de trazas metálicas A5 (véase abajo) 1 ml Agar (en caso necesario) 10 g Agua destilada 1 l pH final ajustado a ∼7,1 Autoclave a ∼121ºC durante 15 minutos.
Composición de la mezcla de trazas metálicas A5:
H3BO3 2,86 g
MnCl2·4H2O 1,81 g
ZnSO4·7H2O 0,22 g
Na2MoO4·2H2O 0,39 g
CuSO4·5H2O 79,0 mg
Co(NO3)2·6H2O 49,4 mg
Agua destilada 1 l
Ejemplo 7. Análisis de muestras de ácidos grasos procedentes de cianobacterias (Synechocystis)
Las muestras de ácidos grasos de Synechocystis se analizan en un cromatógrafo de gases Agilent modelo 7890A, equipado con un DIL (detector de ionización de llama), que comprende una columna capilar J & W Scientific DB5 FFAP (~ 15 m de longitud, ~ 0,25 mm de diámetro interno, ~ 0,25 µm de espesor de película) acoplada a un espectrofotómetro de masas Agilent 5975C. El horno de cromatografía de gases se programa de la siguiente modo: ~ 140ºC durante ~ 0,5 min, después se calienta a ~ 20ºC/min. hasta ~ 230ºC (manteniendo esta temperatura durante ~ 5 minutos). La temperatura del inyector se mantiene a ~ 250ºC y se usa una inyección de ~ 1,0 µl dividida en relación ~ 40:1. Como gas portador se usa helio a un caudal de ~ 1,2 ml/min. Los analitos se identifican comparando
10 los tiempos de retención con patrones inyectados individualmente.
LISTADO DE SECUENCIAS
<110> Compañía de investigación e ingeniería de ExxonMobil 15
<120> Microorganismos diseñados por ingeniería genética que incluyen 4-hidroxibenzoíl-CoA tioesterasas y métodos de uso de los mismos para producir ácidos grasos libres y derivados de ácidos grasos
<130> 2010EM383 (PM0010) 20
<160> 52
<170> PatentIn versión 3.5
25 <210> 1
<211> 138
<212> PRT
<213> desconocida
30 <220>
<223> 4-hidroxibenzoíl-CoA tioesterasa de un microorganismo no especificado
<400> 1
<210> 2
<211> 152 5 <212> PRT
<213> desconocida
<220>
<223> 4-hidroxibenzoíl-CoA tioesterasa de un microorganismo no especificado 10
<400> 2
<210> 3
<211> 417 5 <212> ADN
<213> desconocida
<220>
<223> Gen codificador de 4-hidroxibenzoíl-CoA tioesterasa de un microorganismo no especificado 10
<400> 3
<210> 4
<211> 459
<212> ADN
<213> desconocida 5
<220>
<223> Gen codificador de 4-hidroxibenzoíl-CoA tioesterasa de un microorganismo no especificado
<400> 4 10
<210> 5
<211> 4619 15 <212> ADN
<213> Secuencia artificial
<220>
<223> Vector bacteriano/cianobacteriano de expresión/integración RB-RS1 20
<400> 5
<210> 6
<211> 138
<212> PRT
<213> Bacillus licheniformis ATCC 14580
<400> 6
<210> 7
<211> 138
<212> PRT
<213> Bacillus subtilis subsp. natto BEST195
<400> 7
<210> 8
<211> 138
<212> PRT
<213> Bacillus subtilis
<400> 8
<210> 9
<211> 138
<212> PRT
<213> Bacillus subtilis subsp. spizizenii cepa. W23
<400> 9
<210> 10
<211> 138
<212> PRT
<213> Bacillus amyloliquefaciens DSM7
<400> 10
<210> 11
<211> 138
<212> PRT
<213> Bacillus amyloliquefaciens FZB42
<400> 11
<210> 12
<211> 121
<212> PRT
<213> Bacillus subtilis subsp. subtilis str. 168
<400> 12
<210> 13
<211> 138
<212> PRT
<213> Bacillus atrophaeus 1942
<400> 13
<210> 14
<211> 140
<212> PRT
<213> Bacillus pumilus ATCC 7061
<400> 14
<210> 15
<211> 140
<212> PRT
<213> Bacillus pumilus SAFR-032
<400> 15
<210> 16
<211> 98
<212> PRT
<213> Bacillus sp. SG-1
<400> 16
5 <210> 17
<211> 140
<212> PRT
<213> Bacillus megaterium DSM 319
10 <400> 17
<210> 18
<211> 144
<212> PRT
<213> Bacillus megaterium QM B1551
<400> 18
<210> 19
<211> 139
<212> PRT
<213> Bacillus coagulans 36D1
<400> 19
5 <210> 20
<211> 138
<212> PRT
<213> Geobacillus thermoglucosidasius C56-YS93
10 <400> 20
<210> 21
<211> 138
<212> PRT
<213> Geobacillus sp. C56-T3
<400> 21
<210> 22
<211> 138
<212> PRT
<213> Geobacillus sp. Y412MC61
<400> 22
<210> 23
<211> 138
<212> PRT
<213> Geobacillus sp. WCH70
<400> 23
<210> 24
<211> 138
<212> PRT
<213> Geobacillus kaustophilus HTA426
<400> 24
<210> 25
<211> 138
<212> PRT
<213> Geobacillus sp. G11MC16
<400> 25
5 <210> 26
<211> 132
<212> PRT
<213> Geobacillus thermodenitrificans NG80-2
10 <400> 26
<210> 27
<211> 144
<212> PRT
<213> Bacillus sp. NRRL B-14911
<400> 27
<210> 28
<211> 193
<212> PRT
<213> Magnetospirillum magneticum AMB-1
<400> 28
10 <210> 29
<211> 139
<212> PRT
<213> Magnetospirillum magnetotacticum MS-1
<400> 29
5 <210> 30
<211> 161
<212> PRT
<213> Burkholderia cenocepacia MC0-3
10 <400> 30
<210> 31
<211> 204
<212> PRT
<213> Rhodopseudomonas palustris BisA53
<400> 31
<210> 32
<211> 161
<212> PRT
<213> Burkholderia cenocepacia HI2424
<400> 32
<210> 33
<211> 161
<212> PRT
<213> Burkholderia cenocepacia PC184
<400> 33
<210> 34
<211> 141
<212> PRT
<213> Magnetospirillum gryphiswaldense MSR-1
<400> 34
5 <210> 35
<211> 158
<212> PRT
<213> Burkholderia ambifaria MEX-5
10 <400> 35
<210> 36
<211> 161
<212> PRT
<213> Burkholderia ambifaria MC40-6
<400> 36
<210> 37
<211> 160
<212> PRT
<213> Burkholderia ambifaria AMMD
<400> 37
10 <210> 38
<211> 151
<212> PRT
<213> Granulibacter bethesdensis CGDNIH1
15 <400> 38
<210> 39
<211> 141
<212> PRT
<213> Haemophilus somnus 129PT
<400> 39
<210> 40
<211> 141
<212> PRT
<213> Haemophilus somnus 2336
<400> 40
<210> 41
<211> 131
<212> PRT
<213> Proteus mirabilis HI4320
<400> 41
<210> 42
<211> 158
<212> PRT
<213> Burkholderia ambifaria IOP40-10
<400> 42
<210> 43
<211> 142
<212> PRT
<213> Proteus mirabilis ATCC 29906
<400> 43
<210> 44
<211> 191
<212> PRT
<213> Rhodopseudomonas palustris BisB18
<400> 44
<210> 45
<211> 160
<212> PRT
<213> Azospirillum sp. B510
<400> 45
10 <210> 46
<211> 148
<212> PRT
<213> Rhodopseudomonas palustris DX-1
15 <400> 46
<210> 47
<211> 149
<212> PRT
<213> Bradyrhizobium sp. BTAi1
<400> 47
<210> 48
<211> 172
<212> PRT
<213> Rhodospirillum centenum SW
<400> 48
<210> 49
<211> 144
<212> PRT
<213> Methylosinus trichosporium OB3b
<400> 49
<210> 50
<211> 163
<212> PRT
<213> Rhodopseudomonas palustris HaA2
<400> 50
<210> 51
<211> 153
<212> PRT
<213> Methylobacterium extorquens PA1
<400> 51
<210> 52
<211> 90 5 <212> DNA
<213> Secuencia artificial
<220>
<223> Promotor trcY inducible por IPTG
10 <400> 52

Claims (18)

  1. REIVINDICACIONES
    1.
    Microorganismo para usar en la producción de al menos un ácido graso libre y/o un derivado de ácido graso, que comprende una molécula de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa, la cual tiene al menos un 70% identidad secuencial de aminoácidos con la SEQ ID NO:1 o la SEQ ID NO:2.
  2. 2.
    El microorganismo según la reivindicación 1, en que al menos dicho derivado de ácido graso incluye al menos un aldehído graso, al menos un alcohol graso, al menos un éster de cera, al menos un alcano, al menos un alqueno o una combinación de los mismos, y/o tiene un número total de carbonos de 7 hasta 36.
  3. 3.
    El microorganismo según cualquiera de las reivindicaciones anteriores, el cual es capaz de producir al menos un ácido graso que tenga una longitud de cadena acilo de 8 hasta 24 carbonos o de 8 hasta 18 carbonos.
  4. 4.
    El microorganismo según cualquiera de las reivindicaciones anteriores, en el cual al menos un 30% en peso de los ácidos grasos libres producidos por el microorganismo son ácidos grasos libres que tienen una longitud de cadena acilo de 8 carbonos, 10 carbonos, 12 carbonos, 14 carbonos, 16 carbonos, 18 carbonos o cualquier mezcla de los mismos.
  5. 5.
    El microorganismo según cualquiera de las reivindicaciones anteriores, en el cual la 4-hidroxibenzoíl-CoA tioesterasa es procariótica y tiene al menos un 75% de identidad secuencial de aminoácidos, por ejemplo al menos el 80%, al menos el 85%, al menos el 90%, al menos el 95%, al menos el 96%, al menos el 97%, al menos el 98%, al menos el 99% o aproximadamente 100% de identidad secuencial con la SEQ ID NO:1 o la SEQ ID NO:2.
  6. 6.
    El microorganismo según cualquiera de las reivindicaciones anteriores, en el cual la molécula de ácido nucleico codificador de la 4-hidroxibenzoíl-CoA tioesterasa comprende la secuencia nucleótida SEQ ID NO:3 o SEQ ID NO:4.
  7. 7.
    El microorganismo según cualquiera de las reivindicaciones anteriores, en el cual la molécula de ácido nucleico codificador de la 4-hidroxibenzoíl-CoA tioesterasa se integra de forma estable en un cromosoma del microorganismo y/o es un constructo de expresión.
  8. 8.
    El microorganismo según la reivindicación 7, en el cual el constructo de expresión incluye un promotor unido operativamente a la molécula de ácido nucleico codificador de la 4-hidroxibenzoíl-CoA tioesterasa, de manera que el promotor es funcional en el microorganismo.
  9. 9.
    El microorganismo según cualquiera de las reivindicaciones anteriores, que además incluye al menos otra molécula de ácido nucleico que codifica acetil-CoA carboxilasa o β-cetoacetil sintasa (KAS), de tal manera que la expresión de la molécula adicional de ácido nucleico en el microorganismo fotosintético potencia la producción de un ácido graso libre y/o de un derivado de ácido graso.
  10. 10.
    El microorganismo según cualquiera de las reivindicaciones anteriores, que tiene la expresión atenuada de al menos un gen codificador de una proteína, incluyendo proteína transportadora de acilo-acilo (PTA) sintasa, acil-CoA deshidrogenasa, glicerol-3-fosfato deshidrogenasa, acetaldehído-CoA deshidrogenasa, piruvato deshidrogenasa, acetato cinasa o combinaciones de ellas.
  11. 11.
    El microorganismo según cualquiera de las reivindicaciones anteriores, que es una bacteria, un heteroconto, un traustoquítrido o un hongo, y puede ser un miembro de los géneros Clostridium, Zymomonas, Escherichia, Salmonella, Rhodococcus, Pseudomonas, Bacillus, Lactobacillus, Enterococcus, Alcaligenes, Klebsiella, Paenibacillus, Arthrobacter, Corynebacterium, Brevibacterium, Pichia, Candida, Hansenula o Saccharomyces.
  12. 12.
    El microorganismo según cualquiera de las reivindicaciones 1-10, el cual es un microorganismo fotosintético y puede ser una microalga o una cianobacteria.
  13. 13.
    Método para producir un ácido graso libre y/o un derivado de ácido graso en un cultivo, el cual consiste en cultivar un microorganismo en medios de crecimiento, de manera que el microorganismo incluye al menos una molécula de ácido nucleico recombinante codificador de una 4-hidroxibenzoíl-CoA tioesterasa según cualquiera de las reivindicaciones anteriores; y el microorganismo se cultiva en unas condiciones que permiten la expresión del gen de 4-hidroxibenzoíl-CoA tioesterasa exógeno durante un período de cultivo.
  14. 14.
    El método según la reivindicación 13, en el cual al menos una porción del ácido graso libre y/o del derivado de ácido graso es secretada en los medios de cultivo.
  15. 15.
    El método según la reivindicación 13 o 14, en que el microorganismo es un microorganismo fotosintético y además el medio de cultivo no incluye una cantidad sustancial de una fuente de carbono reducido, de modo que al
    cultivo se le suministra al menos una fuente de carbono inorgánico y/o el cultivo se expone a la luz durante al menos una parte del período de cultivo.
  16. 16. El método según cualquiera de las reivindicaciones 13-15, el cual consiste además en aislar al menos un 5 ácido graso libre y/o un derivado de ácido graso del microorganismo, de los medios de cultivo o de todo el cultivo.
  17. 17. Una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de una 4-hidroxibenzoíl CoA tioesterasa capaz de hidrolizar la acil-PTA y que tiene una secuencia de aminoácidos con al menos un 55%, al menos el 60%, al menos el 65%, al menos el 70%, al menos el 75%, al menos el 80%, al menos
    10 el 85%, al menos el 95%, al menos el 97% o aproximadamente el 100% de identidad con la SEQ ID NO:2.
  18. 18. Una molécula de ácido nucleico aislada o recombinante que comprende una secuencia codificadora de una 4-hidroxibenzoíl CoA tioesterasa capaz de hidrolizar la acil-PTA y que tiene una secuencia de aminoácidos al menos 98%, al menos 99% o aproximadamente 100% idéntica a la SEQ ID NO:1.
    FIGURA 1
    FIGURA 2
    FIGURA 3
    FIGURA 4
    FIGURA 5
    FIGURA 6
ES11850126.1T 2010-12-23 2011-12-13 Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas Active ES2665516T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201061426568P 2010-12-23 2010-12-23
US201061426568P 2010-12-23
PCT/US2011/064641 WO2012087670A2 (en) 2010-12-23 2011-12-13 Genetically engineered microorganisms comprising 4-hydroxybenzoly-coa thioesterases and methods of using the same for producing free fatty acids and fatty acid derivatives

Publications (1)

Publication Number Publication Date
ES2665516T3 true ES2665516T3 (es) 2018-04-26

Family

ID=46314757

Family Applications (1)

Application Number Title Priority Date Filing Date
ES11850126.1T Active ES2665516T3 (es) 2010-12-23 2011-12-13 Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas

Country Status (10)

Country Link
US (1) US8846370B2 (es)
EP (1) EP2655648B1 (es)
CN (1) CN103958692B (es)
AU (1) AU2011349729B2 (es)
BR (1) BR112013016020A2 (es)
ES (1) ES2665516T3 (es)
IL (1) IL226779B (es)
MX (1) MX336787B (es)
PT (1) PT2655648T (es)
WO (1) WO2012087670A2 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9222111B2 (en) * 2011-03-24 2015-12-29 Kao Corporation Method of producing lauric acid-containing oil or fat
WO2012135668A1 (en) 2011-03-31 2012-10-04 Exxonmobil Research And Engineering Company Metabolic pathway targeting by transcription factor overexpression
BR112014007115A2 (pt) 2011-09-27 2017-04-25 Exxonmobil Res & Eng Co éster sintases de cera acil-acp
CA2915779A1 (en) * 2013-06-25 2014-12-31 Cellectis Modified diatoms for biofuel production
US10087430B2 (en) 2014-01-28 2018-10-02 Dsm Ip Assets B.V. Factors for the production and accumulation of polyunsaturated fatty acids (PUFAS) derived from PUFA synthases
EP3655528A1 (en) * 2017-07-21 2020-05-27 Basf Se Method of transforming bacterial cells
CN108048425A (zh) * 2017-12-19 2018-05-18 湖北工业大学 一种对羟基苯甲酰-coa硫酯酶及其制备方法
CN109907210B (zh) * 2019-03-25 2021-12-31 河南农业大学 酰基辅酶a硫酯酶及其基因在降解玉米赤霉烯酮中的应用、降解玉米赤霉烯酮的制剂
CN112063645A (zh) * 2020-09-25 2020-12-11 南京工业大学 一种制备c14脂肪酸的方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5447858A (en) 1984-04-13 1995-09-05 Mycogen Plant Sciences, Inc. Heat shock promoter and gene
US5753475A (en) 1985-01-17 1998-05-19 Calgene, Inc. Methods and compositions for regulated transcription and expression of heterologous genes
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
US5639952A (en) 1989-01-05 1997-06-17 Mycogen Plant Science, Inc. Dark and light regulated chlorophyll A/B binding protein promoter-regulatory system
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5455167A (en) 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
US5661017A (en) 1993-09-14 1997-08-26 Dunahay; Terri Goodman Method to transform algae, materials therefor, and products produced thereby
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
RU97121687A (ru) 1995-05-26 2005-01-20 Синджента Лимитед (Gb) Ген-переключатель, представляющий ген рецептора экдизона
US5851796A (en) 1995-06-07 1998-12-22 Yale University Autoregulatory tetracycline-regulated system for inducible gene expression in eucaryotes
DE69937306T2 (de) 1998-11-20 2008-06-05 Dow Agrosciences Llc, Indianapolis Regulatorische sequenzen für die genexpression in pflanzlichem embryogewebe
WO2000062601A1 (en) 1999-04-15 2000-10-26 Northeastern University Agrobacterium-mediated genetic transformation of multicellular marine algae, resultant strains and their products
US20030041353A1 (en) 2001-04-18 2003-02-27 Henry Daniell Mutiple gene expression for engineering novel pathways and hyperexpression of foreign proteins in plants
WO2003091413A2 (en) 2002-04-23 2003-11-06 The Scripps Research Institute Expression of polypeptides in chloroplasts, and compositions and methods for expressing same
US7135290B2 (en) 2003-04-12 2006-11-14 Solazyme, Inc. Methods and compositions for evolving hydrogenase genes
MXPA06000092A (es) 2003-07-01 2006-04-07 Biolex Inc Transformacion de cloroplasto de la lenteja de agua.
CN1926431A (zh) * 2004-01-09 2007-03-07 诺维信股份有限公司 地衣芽孢杆菌染色体
EP2287178A3 (en) * 2004-01-09 2011-05-18 Novozymes, Inc. Bacillus licheniformis YvmC inactivation
WO2008100251A1 (en) 2007-02-13 2008-08-21 Ls9, Inc. Modified microorganism uses therefor
US7678561B2 (en) 2006-05-09 2010-03-16 The Scripps Research Institute Robust expression of a bioactive mammalian protein in chlamydomonas chloroplast
AU2007254151A1 (en) 2006-05-19 2007-11-29 Ls9, Inc. Production of fatty acids and derivatives thereof
WO2010019813A2 (en) 2008-08-13 2010-02-18 Sapphire Energy, Inc. Production of fatty actds by genetically modified photosynthetic organisms
CN105647842A (zh) 2008-12-23 2016-06-08 Reg生命科学有限责任公司 硫酯酶相关的方法和组合物
EP2655615A4 (en) * 2010-12-23 2014-04-23 Exxonmobil Res & Eng Co PROKARYOTIC ACYL ACP THIOESTERASES FOR THE PREPARATION OF FATTY ACIDS IN GENETICALLY MODIFIED MICROORGANISMS
BR112014007115A2 (pt) * 2011-09-27 2017-04-25 Exxonmobil Res & Eng Co éster sintases de cera acil-acp

Also Published As

Publication number Publication date
EP2655648A2 (en) 2013-10-30
AU2011349729B2 (en) 2015-09-24
CN103958692B (zh) 2020-02-21
MX2013007288A (es) 2014-01-31
IL226779B (en) 2018-01-31
US8846370B2 (en) 2014-09-30
EP2655648B1 (en) 2018-01-17
CN103958692A (zh) 2014-07-30
US20120164713A1 (en) 2012-06-28
WO2012087670A2 (en) 2012-06-28
AU2011349729A1 (en) 2013-07-04
MX336787B (es) 2016-02-02
PT2655648T (pt) 2018-04-16
BR112013016020A2 (pt) 2017-07-11
WO2012087670A3 (en) 2014-04-10
EP2655648A4 (en) 2015-06-03

Similar Documents

Publication Publication Date Title
ES2665516T3 (es) Microorganismos modificados genéticamente que comprenden 4-hidroxibenzoíl-CoA-tioesterasas, y métodos de uso de los mismos para producir ácidos grasos libres, derivados de ácidos grasos y 4-hidroxibenzoíl-CoA-tioesterasas
US8530207B2 (en) Photosynthetic microorganisms comprising exogenous prokaryotic acyl-ACP thioesterases and methods for producing fatty acids
ES2678647T3 (es) Acil-ACP sintasas de éster de cera
JP6209590B2 (ja) 脱水素酵素の発現によって脂肪酸合成を改善するための細胞系および方法
EP2655625B1 (en) Polypeptides having lipolytic activity, recombinant microorganisms containing exogeneous polypeptides having lipolytic activity and production of fatty acids and fatty acid derivatives thereby
US9765126B2 (en) Compositions and methods for modulating biomass productivity
US9096834B2 (en) Recombinant microorganisms comprising thioesterase and lysophosphatidic acid acyltransferase genes for fatty acid production
US8940508B2 (en) Enhancement of biomass production by disruption of light energy dissipation pathways
ES2795842T3 (es) Producción mejorada de ácidos grasos y derivados de ácidos grasos por microorganismos recombinantes
US20170267984A1 (en) Chlorophyllase overproduction to enhance photosynthetic efficiency