WO2021234309A1 - Method for the biosynthesis of phenylpropanoids - Google Patents
Method for the biosynthesis of phenylpropanoids Download PDFInfo
- Publication number
- WO2021234309A1 WO2021234309A1 PCT/FR2021/050911 FR2021050911W WO2021234309A1 WO 2021234309 A1 WO2021234309 A1 WO 2021234309A1 FR 2021050911 W FR2021050911 W FR 2021050911W WO 2021234309 A1 WO2021234309 A1 WO 2021234309A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- sequence
- seq
- activity
- exhibiting
- polypeptides
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01003—Aldehyde dehydrogenase (NAD+) (1.2.1.3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y102/00—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
- C12Y102/01—Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
- C12Y102/01044—Cinnamoyl-CoA reductase (1.2.1.44)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y201/00—Transferases transferring one-carbon groups (2.1)
- C12Y201/01—Methyltransferases (2.1.1)
- C12Y201/01104—Caffeoyl-CoA O-methyltransferase (2.1.1.104)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/02—Thioester hydrolases (3.1.2)
- C12Y301/02002—Palmitoyl-CoA hydrolase (3.1.2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y602/00—Ligases forming carbon-sulfur bonds (6.2)
- C12Y602/01—Acid-Thiol Ligases (6.2.1)
- C12Y602/01012—4-Coumarate-CoA ligase (6.2.1.12)
Definitions
- the present invention relates to the use of a recombinant microorganism for producing an organic acid via the hydrolysis of a coenzyme A thioester, and more particularly to a recombinant microorganism capable of producing phenylpropanoid compounds. It also relates to production methods using such microorganisms.
- Ferulic acid and sinapic acid are phenylpropanoids derived from cinnamic acid with antioxidant and anti-free radical properties. Ferulic acid can be used as a precursor in the manufacture of antimicrobial substances for soaps, perfumes and cosmetics as well as for the production of vanillin and sinapic acid. It also finds applications in the medical field, in particular because of its antioxidant properties.
- Ferulic acid or sinapic acid is obtained by biodegradation of lignocellulosic biomass.
- the amount of product obtained by this process is relatively small and therefore leads to a particularly high cost of producing these products per kilogram.
- the present invention relates to a recombinant microorganism comprising (i) a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a heterologous nucleic acid sequence encoding.
- a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase preferably comprising a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, and optionally a sequence of heterologous nucleic acid encoding a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase (ALDH).
- the microorganism is preferably a bacterium, a yeast or a fungus, in particular a yeast, in particular a yeast of the genus Saccharomyces, and more particularly preferably Saccharomyces cerevisiae.
- the recombinant microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase.
- said acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity.
- said acyl-coenzyme A thioesterase can comprise a sequence chosen from the sequences SEQ.
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting the activity acyl-coenzyme A thioesterase.
- the recombinant microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH.
- said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and showing CCR activity; and / or said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
- the recombinant microorganism according to the invention may further comprise a heterologous nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT), preferably a Caféoyl-CoA O-Methyltransferase (CCoAMT), preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NOs: 10 to 16, 40 and 41, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly a CCoAMT comprising a sequence chosen from the sequences SEQ ID NOs: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CCoAMT activity; and / or a heterologous nucleic acid sequence encoding a 4-coum
- the recombinant microorganism according to the invention may further comprise a heterologous nucleic acid sequence encoding an enzyme or an enzymatic complex capable of converting p-coumaric acid into caffeic acid, preferably
- heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 25 and polypeptides comprising a sequence having at least minus 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 25 and exhibiting p-coumarate 3 hydroxylase activity; and or
- heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate (HPA) 3-monooxygenase oxygenase, preferably comprising a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with the sequence SEQID NO: 17 and exhibiting 4-hydroxyphenylacetate (HPA) 3-monooxygenase oxygenase activity
- a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate (HPA) 3 - monooxygenase reductase, preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate (HPA) 3-monooxygenase reductase activity.
- the recombinant microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a coding for a cytochrome P450 reductase (CPR), preferably comprising a sequence chosen from SEQ ID Nos: 22 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 22 and exhibiting cytochrome P450 reductase activity.
- CPR cytochrome P450 reductase
- the recombinant microorganism according to the invention can also comprise
- TAL tyrosine ammonia lyase
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the recombinant microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a phospho-2-dehydro-3-deoxyheptonate aldolase resistant to feedback control by tyrosine and / or a heterologous nucleic acid sequence encoding a chorismate. mutase resistant to tyrosine feedback. Furthermore, in said microorganism, an endogenous gene encoding a phenylpyruvate decarboxylase and / or an endogenous gene encoding a ferulic acid decarboxylase can be inactivated.
- the present invention relates to the use of a microorganism according to the invention for producing a carboxylic acid.
- the carboxylic acid is a compound of formula (II)
- R 1, R 2 and R 3 are selected, independently of each other, from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
- a recombinant microorganism according to the invention for producing a phenylpropanoid chosen from ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid.
- the phenylpropanoid is preferably ferulic acid or sinapic acid, and more particularly preferably ferulic acid.
- It also relates to a method for the production of a carboxylic acid, comprising the culture of a microorganism according to the invention, and optionally the harvest and / or the purification of said carboxylic acid.
- the carboxylic acid is a compound of formula (II) as defined above.
- the carboxylic acid produced by the microorganism according to the invention is a phenylpropanoid chosen from ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid, preferably chosen from ferulic acid. and sinapic acid, and more particularly preferably ferulic acid.
- Figure 1 represents the production of ferulic acid from caffeic acid of yeasts expressing the thioesterase of SEQ ID NO: 1 (Thiol), the thioesterase of SEQ ID NO: 2 (Thio3), or cinnamoyl-CoA reductase of SEQ ID NO: 4 and the aldehyde dehydrogenase of SEQ ID NO: 3 (CCR ALDH).
- the negative control (0) does not express any of these enzymes.
- FIG. 2 represents the production of sinapic acid of strain 367 expressing the thioesterase of SEQ ID NO: 2 (Thio3) and of the negative control (0: strain 617).
- Figure 3 represents the production of sinapic acid of strain 616 expressing the cinnamoyl-CoA reductase of SEQ ID NO: 4 and the aldehyde dehydrogenase of SEQ ID NO: 3 (CCR ALDH) and of the negative control (0: strain 617).
- Figure 4 represents the production of ferulic acid of strains 339 to 343, 345, 347, 367 to 371, 373, 375, 423 to 427, 429, 431, 451 to 455, 457 and 459
- CcoAMTl SEQ ID NO: 10
- CcoAMT2 SEQ ID NO: 11
- CcoAMT3 SEQ ID NO: 12
- CcoAMT4 SEQ ID NO: 13
- CcoAMT5 SEQ ID NO: 14
- CcoAMT6 SEQ ID NO: 15, CcoAMT7: SEQ ID NO: 16, 4CL1: SEQ ID NO: 5, 4CL5: SEQ ID NO: 6, 4CLA: SEQ ID NO: 8, 4CLB: SEQ ID NO: 9, Thio3: SEQ ID NO: 2) and negative controls (0: strains 334, 335, 337 and 338), grown in the presence of caffeic acid.
- Figure 5 represents the production of sinapic acid of strains 339 to 343, 345, 347, 367 to 371, 373, 375, 395 to 399, 401, 403, 423 to 427, 429, 431, 451 to 455, 457 and 459
- CcoAMT1 SEQ ID NO: 10
- CcoAMT2 SEQ ID NO: 11
- CcoAMT3 SEQ ID NO: 12
- CcoAMT4 SEQ ID NO: 13
- CcoAMT5 SEQ ID NO: 14
- CcoAMT6 SEQ ID NO: 15, CcoAMT7: SEQ ID NO: 16, 4CL1: SEQ ID NO: 5, 4CL5: SEQ ID NO: 6, 4CL7: SEQ ID NO: 7, 4CLA: SEQ ID NO: 8, 4CLB: SEQ ID NO: 9, Thio3: SEQ ID NO: 2) and negative controls (0: strains 334, 335, 336, 337 and 338), cultured in the presence of 5-hydroxyferulic acid.
- FIG. 6 represents the production of ferulic acid of strains 595, 596 and 597 cultivated in the presence of p-coumaric acid and of the negative control (0: strain 507).
- FIG. 7 represents the production of ferulic acid of strains 592, 593 and 594 cultivated in the presence of glucose and of the negative control (0: strain 516).
- Figure 8 represents a pathway for biosynthesis of ferulic acid from glucose.
- Figure 9 illustrates the enzymatic activities of acyl-coenzyme A thioesterase or cinnamoyl-CoA reductase and aldehyde dehydrogenase on feruloyl-Coa and sinapoyl-CoA.
- Synthesis routes involving compounds linked to coenzyme A are little used in biotechnology. Indeed, the difficulty in detecting and measuring the quantities of synthetic intermediates makes their handling difficult.
- the inventors have however explored these biosynthetic pathways and developed a microorganism capable of producing organic acids via the hydrolysis of CoA thioesters such as ferulic acid or sinapic acid.
- the production method using this microorganism also has the advantage of going through intermediates linked to CoA and therefore unable to leave the cells. This therefore allows easier and less expensive extraction of the final compounds of interest.
- the production method according to the invention thus makes it possible to obtain biobased phenylpropanoids via a biosynthesis process which is more respectful of the environment.
- microorganism refers to a prokaryotic or eukaryotic microorganism, in particular a yeast, a fungus or a bacterium.
- recombinant microorganism is meant a microorganism which is not found in nature and which contains a genome modified following an insertion, modification or deletion of one or more heterologous genetic elements.
- nucleic acid By “recombinant nucleic acid” is meant a nucleic acid which has been modified and does not exist in nature.
- this term can refer to a coding sequence or a gene which is operably linked to a promoter which is not the natural promoter. It can also refer to a coding sequence in which introns have been deleted for genes comprising exons and introns.
- heterologous is meant a nucleic acid sequence or a protein which is not naturally present in the host cell and which has been introduced therein by genetic engineering.
- the heterologous sequence can be present in the cell in episomal or chromosomal form.
- the origin of the heterologous sequence may be different of the cell in which it is introduced. However, it can also come from the same species as the cell into which it is introduced but be considered heterologous due to its environment which is not natural.
- the nucleic acid sequence is heterologous when it is under the control of a promoter other than its natural promoter or when it is introduced in a place different from that where it is naturally located.
- the host cell may contain an endogenous copy of the nucleic acid sequence prior to the introduction of the heterologous nucleic acid sequence or it may not contain an endogenous copy.
- the nucleic acid sequence can be heterologous in the sense that the coding sequence has been optimized for expression in the host cell, for example by optimizing the use of codons.
- the term "heterologous nucleic acid sequence” refers to a nucleic acid sequence which encodes a protein which is heterologous to the host cell, i.e. which does not. is not naturally present in the host cell.
- endogenous relative to the host cell, refers to a genetic element or protein naturally present in said cell.
- gene denotes any nucleic acid encoding a protein.
- the term gene encompasses DNA, such as cDNA (complementary DNA) or gDNA (genomic DNA), as well as RNA.
- the gene can first be prepared by recombinant, enzymatic and / or chemical techniques, and then replicated in a host cell or an in vitro system.
- the gene typically comprises an open reading frame encoding a desired protein.
- the gene may contain additional sequences such as a transcription terminator or a signal peptide. Due to the degeneration of the genetic code, several nucleic acids can encode a particular polypeptide.
- codons in the coding sequence for a given polypeptide can be modified such that optimal expression in a particular cell is obtained, for example by using codon translation tables appropriate for that cell.
- Nucleic acids can also be optimized to a preferable GC content for said cell and / or to reduce the number of repeat sequences.
- the heterologous nucleic acids have been optimized by codon for expression in the host cell of interest. Optimization of codons can be accomplished by routine methods known in the art (see, e.g., Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).
- control sequences denotes the nucleic acid sequences necessary for the expression of a gene.
- the control sequences can be endogenous or heterologous. Control sequences well known and currently used by those skilled in the art will be preferred. Such control sequences include, but are not limited to, a leader, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence and a transcription terminator. Preferably, the control sequences comprise a promoter and a transcription terminator.
- expression cassette denotes a nucleic acid construct comprising a coding region, i.e. a gene, and a regulatory region, i.e. comprising one or more control sequences. , linked in an operational manner.
- control sequences are adapted to the host cell.
- the term "expression vector” refers to a DNA or RNA molecule which comprises an expression cassette.
- the expression vector is a linear or circular, preferably linear, double stranded DNA molecule.
- the vector may further include an origin of replication, a selection marker, etc.
- percentage identity between two nucleic acid or amino acid sequences within the meaning of the present invention is intended to denote a percentage of nucleotides or of identical amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed at random and over their entire length.
- the best alignment or optimal alignment is the alignment for which the percentage identity between the two sequences to be compared, as calculated below, is the highest.
- Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by comparison window to identify and compare the local regions of sequence similarity.
- Alignment for the purpose of determining percent amino acid sequence identity can be accomplished in various ways which are well known in the art, for example using computer software available on the web on the Internet such as http: //www.clustal.org/omega/ or http://www.ebi.ac.uk/Tools/emboss/. Those skilled in the art can determine the appropriate parameters for measuring alignment, including any algorithm necessary to achieve maximum alignment over the full length of the sequences being compared.
- percent amino acid sequence identity values refer to values generated using the EMBOSS Needle pair sequence alignment program which creates an optimal overall alignment of two sequences.
- all of the identity percentages mentioned in this application can be set at at least 60%, at least 70%, at least 80%, at least 85%, preferably at least 90% identity , more preferably at least 95% identity.
- all the percentages of sequence identity of the enzymes are at least 80% or at least 85%, preferably at least 90% or at least 95%, are considered as described. 'sequence identity.
- the polypeptides may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions relative to the sequences described in SEQs. ID Nos. In particular, these additions, substitutions or deletions can be introduced at the N-terminus, C-terminus or at both ends.
- the polypeptides can optionally be in the form of a fusion protein. In this case, the percentage identity is calculated only on the domain of the fusion protein exhibiting the desired activity.
- the terms "overexpression” and “increased expression” as used herein are used interchangeably and mean that the expression of a coding sequence or protein is increased relative to the unmodified host cell, for example a wild-type cell or not comprising the genetic modifications described herein.
- wild is meant an unmodified cell existing in nature.
- the increased expression of a protein is usually achieved by increasing the expression of the gene encoding said protein.
- the terms “overexpression” and “expression” may be used interchangeably.
- a person skilled in the art can use all the known techniques such as increasing the number of copies of the gene in the cell, the use of a promoter inducing a high level of expression. of the gene, i.e. a strong promoter, the use of corresponding messenger RNA stabilizing elements or specific RBS (ribosome binding site) sequences.
- overexpression can be achieved by increasing the number of copies of the gene in the cell.
- One or more copies of the gene can be introduced into the genome by recombination methods, known to those skilled in the art, including gene replacement or multicopy insertion.
- an expression cassette comprising the gene is integrated into the genome.
- the gene can be carried by an expression vector, preferably a plasmid, comprising an expression cassette with the gene of interest preferably placed under the control of a suitable promoter.
- the expression vector can be present in the host cell in one or more copies depending on the nature of the origin of replication.
- the overexpression of a gene can also be obtained by using a promoter inducing a high level of expression of the gene.
- the promoter of an endogenous gene can be replaced by a stronger promoter, that is to say a promoter inducing a higher level of expression.
- the endogenous gene under the control of a promoter which is not the natural promoter is called heterologous nucleic acid.
- Promoters suitable for use in the present invention are known to those skilled in the art and can be constitutive or inducible, and be endogenous or heterologous.
- the microorganism according to the present invention can be a eukaryotic or prokaryotic microorganism.
- the microorganism is a eukaryotic microorganism, preferably chosen from yeasts and fungi.
- the microorganism is a yeast, in particular a yeast of the order Saccharomycetales, Sporidiobolales and Schizosaccharomycetales.
- the yeast can for example be selected from yeasts of the genus Saccharomyces, Pichia, Kluyveromyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, Debaryomyces, Komagataella, Scheffersomyces, Torulaspora or Zygosaccharomyces.
- the yeast can be chosen from the species Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, Pichia pastoris, Kluyidaveromyces lactos, Candizaccharomyces pomeris, Candizomyces pessomyces, Candizomyces kluyveri. Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii and Lipomyces starkeyi.
- the microorganism is a yeast belonging to the genus Saccharomyces, preferably a yeast chosen from the species Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis and Saccharomyces oviformis.
- the microorganism is a yeast of the species Saccharomyces cerevisiae.
- the microorganism may be a fungus, preferably a filamentous fungus, in particular a fungus chosen from among the fungi of genera Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus and Pyricularia. More particularly preferably, the fungus is chosen from Aspergillus nidulans, Aspergillus niger, Aspergillus awomari, Aspergillus oryzae, Aspergillus terreus, Neurospora crassa, Trichoderma reesei and Trichoderma viride.
- the microorganism is a prokaryotic microorganism, preferably a bacterium.
- the microorganism may be a bacterium chosen from bacteria of the phyla Acidobacteria, Actinobacteria, Aguificae, Bacterioidetes, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Fusimoneitrobacteresitrobacteres, Fusimoneitrobacteres, oresitrobacteresira , Planctomycetes, Proteobacteria, Spirochaetes, Thermodesulfobacteria, Thermomicrobia, Thermotogae, or Verrucomicrobia.
- the bacterium belongs to the genus Acaryochloris, Acetobacter, Actinobacillus, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Anaerobiospirillum, Aguifex, Arthrobacter, Arthrospira, Azobacter, Bacillus, Brevibacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chromatis, , Cyanothece, Enterobacter, Deinococcus
- the bacterium is chosen from the species Agrobacterium tumefaciens, Anaerobiospirillum succiniciproducens, Actinobacillus succinogenes, Aguifex aeolicus, Aguifex pyrophilus, Bacillus subtilis, Bacillus amyloliguefacines, Brevibacterium ammoniagenes, Closumrevibickiidium, Ammonium, Closumidicidium, Brevibacterium ammoniagenes, Closumrevibickiidium, Closumidicidium, Bacillus amyloliguefacins, Brevibacterium ammoniagenes, Closumidicidium, Brevibacterium ammoniagenes, Closumidicidium, Brevibacterium ammoniagenes, Closumidicidium, Brevibacterium, Clostricidium, Closumidium, Bacillus amyloliguefacins, Brevibacterium.
- the microorganism is an Escherichia coli bacterium, for example chosen from E. coli BL21, E. coli BL21 (DE3), E. coli MG1655, E. coli W31 and their derivatives.
- the microorganism is a bacterium of the genus Streptomyces, in particular Streptomyces venezuelae.
- the microorganism is a yeast, a bacterium or a fungus, preferably a yeast or a bacterium.
- the microorganism is a yeast, preferably a yeast belonging to the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae.
- coenzyme A is capable of forming, with the carboxyl functions of certain compounds, such as caffeic acid or 5-hydroxyferulic acid, thioesters called carboxyl-CoA.
- carboxyl-CoA refers to a thioester of coenzyme A in which hydrolysis of the thioester bond generates a carboxyl group.
- this term refers to a compound of formula (I) (I) where
- R 1, R 2 and R 3 are independently selected from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and d a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
- Rs is selected from the group consisting of hydrogen, alkyl C 1 -C 6 branched or unbranched alkenes and groups C 1 -C 6 branched or unbranched. More particularly preferably, Rs is chosen from the group consisting of a hydrogen atom and a methyl group.
- R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-Rs group, where Rs is a methyl group, and
- R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-Rs group, where Rs is a methyl group, and
- carboxyl-CoA refers to caféoyl-CoA, feruloyl-CoA, sinapoyl-CoA and / or 5-hydroxyferuloyl-CoA.
- this term refers to feruloyl-CoA and / or sinapoyl-CoA.
- the recombinant microorganism according to the present invention is genetically modified to produce a carboxylic acid from a carboxyl-CoA.
- This microorganism is in particular capable of producing phenylpropanoids such as ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid, from molecules coupled to CoA such as feruloyl-CoA, sinapoyl- CoA, caféoyl-CoA and 5-hydroxyferuloyl-CoA (cf. Figures 8 and 9).
- this microorganism is able to produce ferulic acid from feruloyl-CoA, sinapic acid from sinapoyl-CoA, caffeic acid from caffeoyl-CoA and acid 5 -hydroxyferulic from 5- hydroxyferuloyl-CoA.
- Certain plants such as Petunia hybrida or Curcuma longa L, also seem capable of directly hydrolyzing phenylpropanoyl-CoA via thioesterases which catalyze the hydrolysis of a thioester bond by releasing a carboxylic acid and a thiol group (Adebesin et al, Plant J. 2018 January; 93: 905-916; Ramirez-Ahumada et al, Phytochemistry. 2006 Sep; 67 (18): 2017-29) and which are mainly described in the fatty acid biosynthesis pathway.
- the inventors have surprisingly demonstrated here that these two types of mechanisms could be used in a microorganism, and in particular in a yeast, to produce carboxylic acids, and in particular phenylpropanoids.
- the microorganism according to the invention can thus express a heterologous acyl-coenzyme A thioesterase and / or express a cinnamoyl-CoA reductase (CCR) and an aldehyde dehydrogenase (ALDH).
- CCR cinnamoyl-CoA reductase
- ADH aldehyde dehydrogenase
- the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase.
- acyl-coenzyme A thioesterase or “Thio” refers to an enzyme endowed with acyl-coenzyme A thioesterase activity, i.e. an enzyme capable of hydrolyzing the bond. ester of a carboxyl-CoA and thus liberate on the one hand the CoA and on the other hand a carboxylic acid (cf. FIG. 9).
- This term refers in particular to an enzyme capable of hydrolyzing the thioester bond of feruloyl-CoA and thus of producing ferulic acid and / or of hydrolyzing the thioester bond of sinapoyl-CoA and thus of producing sinapic acid.
- this term refers to an enzyme capable of hydrolyzing the thioester bond of feruloyl-CoA and thus of producing ferulic acid and / or of hydrolyzing the thioester bond of sinapoyl-CoA and thus of producing l '. sinapic acid.
- the detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- the acyl-coenzyme A thioesterase activity can be detected in vitro, for example as described in the article by Adebesin et al. (Plant J. 2018 Mar; 93 (5): 905-916).
- an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative acyl-CoA thioesterase), and a carboxyl-CoA substrate under optimal conditions (pH, temperature, ions, etc.).
- the appearance of the carboxylic acid obtained by hydrolysis of the ester bond of the carboxyl-CoA substrate can be observed either with a UV spectrophotometer at a given wavelength, or by HPLC.
- the acyl-coenzyme A thioesterase activity can also be detected in vivo, in particular by using the method described in the experimental part below.
- the acyl-coenzyme A thioesterase activity can be detected in vivo using a microorganism expressing the enzyme to be tested.
- the carboxyl-CoA substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium.
- the carboxylic acid produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique.
- acyl-coenzyme A thioesterase activity can be detected by production of ferulic acid in the presence of feruloyl-CoA, production of sinapic acid in the presence of sinapoyl-CoA, production of caffeic acid in the presence of caffeoyl-CoA and / or the production of 5-hydroxyferulic acid in the presence of 5-hydroxyferuloyl-CoA.
- the acyl-coenzyme A thioesterase activity can be detected in vivo using a microorganism expressing the enzyme to be tested and capable of converting caffeic acid into feruloyl-CoA and / or of converting 5- acid. hydroxyferulic to sinapoyl-CoA.
- the acyl-coenzyme A thioesterase activity is then detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
- the acyl-coenzyme A thioesterase can be a plant enzyme, preferably an enzyme from plants of the genus Petunia, Oryza, Arabidopsis, Capsella, Camellia, brassica, Raphanus or Nicotiana, in particular Petunia hybrida, Oryza meyeriana (in particular Oryza meyeriana var. granulata) Arabidopsis thaliana, Capsella ru bel la, Camellia sativa, brassica rapa, Raphanus sativus or Nicotiana tabacum.
- the acyl-coenzyme A thioesterase can also be an enzyme of plants of the genus Petunia, Arabidopsis, Capsella, Camellia, brassica, Raphanus or Nicotiana, in particular Petunia hybrida, Arabidopsis thaliana, Capsella rubella, Camellia sativa, brassica rapa, Raphanus sativus or Nicotiana tabacum.
- this enzyme can be an enzyme produced by a microorganism, for example by a yeast of the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae.
- the enzyme corresponds to the endogenous enzyme of the microorganism.
- the enzyme can be overexpressed, for example by replacing the endogenous promoter with a strong heterologous promoter and / or by increasing the number of copies of the gene.
- the acyl-coenzyme A thioesterase is a plant enzyme, in particular of Petunia hybrida, of Oryza meyeriana (in particular Oryza meyeriana var.
- the acyl-coenzyme A thioesterase can be an enzyme from Arabidopsis thaliana, in particular the thioesterase described in SEQ ID NO: 1.
- the acyl-coenzyme A thioesterase can be an enzyme from Petunia hybrida, in particular thioesterase. described in SEQ. ID NO: 2.
- the acyl-coenzyme A thioesterase can be an enzyme from Oryza meyeriana (in particular Oryza meyeriana var. Granulata) in particular the thioesterase described in SEQ ID NO: 39.
- the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity.
- the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity.
- the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ. ID NO: 1 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 1 and exhibiting acyl-coenzyme A thioesterase activity.
- the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ ID NO: 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 39 and exhibiting acyl-coenzyme A thioesterase activity.
- the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ ID NO: 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity.
- the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase (ALDH).
- CCR cinnamoyl-CoA reductase
- ADH aldehyde dehydrogenase
- CCR catalyzes the reduction of carboxyl-CoA such as feruloyl-CoA and sinapoyl-CoA, thereby forming aldehydes such as coniferaldehyde and sinapaldehyde.
- ALDH then catalyzes the oxidation of the aldehydes thus formed into carboxylic acids such as ferulic acid and sinapic acid.
- cinnamoyl-CoA reductase or "CCR” refers to an enzyme belonging to the EC class 1.2.1.44 and which catalyzes the reduction of a substituted cinnamoyl-CoA, for example feruloyl-CoA.
- this term refers to an enzyme which catalyzes the reduction of feruloyl-CoA to coniferaldehyde and / or of sinapoyl-CoA to sinapaldehyde.
- CCR activity can be detected in vitro, for example as described in the article by Chao et al. (Planta. 2017 Jan; 245 (l): 61-75)
- an enzymatic test can be performed and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative CCR), a carboxyl-CoA substrate and NADPH under optimal conditions (pH, temperature, ions, etc.).
- the appearance of the form aldehyde can be is observed, either by UV spectrophotometer with a given wavelength, or by HPLC.
- the CCR activity can also be detected in vivo, in particular by using the method described in the experimental part below.
- CCR activity can be detected in vivo using a microorganism expressing the enzyme to be tested.
- the carboxyl-CoA substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium.
- the aldehyde produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique.
- the CCR activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid into feruloyl-CoA and / or 5-hydroxyferulic acid into sinapoyl-CoA and capable of converting coniferaldehyde into ferulic acid and / or sinapaldehyde into sinapic acid, that is to say expressing an ALDH enzyme as defined below.
- CCR activity is detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
- CCR can be a plant enzyme, preferably of the genus Populus, Arabidopsis, Oryza, Zea, Medicago or Sorghum, in particular Populus tomentosa, Arabidopsis thaliana, Oryza sativa, Zea Mays, Medicago truncatula or Sorghum bicolor.
- CCR is an enzyme from Populus tomentosa, in particular CCR described in SEQ ID NO: 4.
- the CCR comprises a sequence chosen from the sequence SEQ. ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting CCR activity.
- aldehyde dehydrogenase refers to an enzyme belonging to class EC 1.2.1.3 and which catalyzes the oxidation of an aldehyde, for example coniferaldehyde or sinapaldehyde, to acid.
- carboxylic acid for example ferulic acid or sinapic acid.
- this term refers to an enzyme which catalyzes the oxidation of coniferaldehyde to ferulic acid and / or the oxidation of sinapaldehyde to sinapic acid.
- ALDH activity can be detected in vitro for example using a commercially available in vitro test kit.
- an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative ALDH), an aldehyde and of NAD under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of the acid form and of NADH can be observed either by UV spectrophotometer at 450 nm or by HPLC.
- the ALDH activity can also be detected in vivo, in particular by using the method described in the experimental part below.
- ALDH activity can be detected in vivo using a microorganism expressing the enzyme to be tested.
- the aldehyde substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium.
- the carboxylic acid produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique.
- the ALDH activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid into feruloyl-CoA and / or 5-hydroxyferulic acid into sinapoyl-CoA and capable of converting feruloyl-CoA into coniferaldehyde and / or sinapoyl-CoA into sinapaldehyde, that is to say expressing a CCR enzyme as defined above.
- the ALDH activity is detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
- the ALDH can be a plant enzyme, preferably of the genus Arabidopsis, Populus, Oryza, Zea, Medicago or Sorghum, in particular Arabidopsis thaliana, Populus tomentosa, Oryza sativa, Zea Mays, Medicago truncatula or Sorghum bicolor.
- this enzyme can be an enzyme produced by a microorganism, for example by a yeast of the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae.
- the enzyme corresponds to the endogenous enzyme of the microorganism.
- the enzyme can be overexpressed, for example by replacing the endogenous promoter with a strong heterologous promoter and / or by increasing the number of copies of the gene.
- the ALDH is a plant enzyme, and more particularly, an enzyme from Arabidopsis thaliana, in particular the ALDH described in SEQ ID NO: 3.
- the ALDH comprises a sequence chosen from the sequence SEQ. ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
- the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which
- - Said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and presenting CCR activity;
- said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
- the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase as defined above, and optionally comprises a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH as defined above.
- the microorganism according to the invention can produce the carboxyl-CoA of interest, naturally or after genetic modification. Alternatively, this substrate can be brought to it in the culture medium.
- the microorganism is capable of producing the carboxyl-CoA of interest, in particular caféoyl-CoA, 5-hydroxyferuloyl-CoA, feruloyl-CoA and / or sinapoyl-CoA, from a synthetic intermediate or from glucose.
- the microorganism is capable of producing feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, for example caffeic acid or 5-hydroxyferulic acid, or from glucose, preferably from glucose.
- the microorganism according to the invention can be genetically modified to produce the carboxyl-CoA of interest (substrate for acyl-coenzyme A thioesterase and / or CCR) ,. Alternatively, this substrate can be brought to it in the culture medium.
- the microorganism according to the invention is preferably genetically modified to be capable of producing the carboxyl-CoA of interest, preferably caffeoyl-CoA, 5-hydroxyferuloyl-CoA, feruloyl-CoA or sinapoyl-CoA, so more particularly preferred feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, for example cinnamic acid, p-coumaric acid, caffeic acid or 5-hydroxyferulic acid, or to from glucose via phenylalanine or tyrosine.
- a synthetic intermediate for example cinnamic acid, p-coumaric acid, caffeic acid or 5-hydroxyferulic acid, or to from glucose via phenylalanine or tyrosine.
- the microorganism according to the invention is capable of producing the carboxyl-CoA of interest, preferably feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, such as caffeic acid or 5-hydroxyferulic acid.
- a synthetic intermediate such as caffeic acid or 5-hydroxyferulic acid.
- Production of feruloyl-CoA or sinapoyl-CoA from caffeic acid or 5-hydroxyferulic acid is the result of two enzymatic reactions, the first involving a 4-coumaroyl-CoA ligase and the second a caffeoyl-CoA O-methyltransferase.
- the microorganism according to the invention may also comprise, in addition to acyl-coenzyme A thioesterase and / or the CCR / ALDH combination, a heterologous nucleic acid sequence encoding a caffeoyl-CoA O-methyltransferase (CCoAMT) and / or or a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), preferably a heterologous nucleic acid sequence encoding CCoAMT and a heterologous nucleic acid sequence encoding a 4CL.
- a heterologous nucleic acid sequence encoding a caffeoyl-CoA O-methyltransferase (CCoAMT) and / or or a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL)
- 4CL 4-coumaroyl-CoA ligase
- the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL).
- 4CL 4-coumaroyl-CoA ligase
- 4CL refers to an enzyme capable of producing caffeoyl-CoA from caffeic acid and CoA and / or 5-hydroxyferuloyl- CoA from 5-hydroxyferulic acid and CoA. This enzyme belongs to class EC 6.2.1.12.
- the detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative 4-coumarate CoA ligase ), caffeic acid or 5-hydroxyferulic acid, ATP and CoA under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caféoyl CoA or 5-hydroxyferuloyl-CoA is observed with a UV spectrophotometer with a given wavelength.
- 4CL can be a plant enzyme, preferably of the genus Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus , Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pélargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Tsellumungiella, Trituga, Trituga or Zea.
- this enzyme can be an enzyme produced by a microorganism, for example of the genus Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter or Yarrowia.
- 4CL is a plant enzyme, in particular an enzyme from a plant of the genus Arabidopsis, Citrus or Populus. More specifically, the 4CL can be a 4CL of Arabidopsis thaliana, in particular a 4CL described in one of the sequences SEQ ID Nos: 5, 7 and 9, a 4CL of Citrus clementina, in particular a 4CL described in SEQ. ID NO: 6 or a Populus tomentosa 4CL, in particular a 4CL described in SEQ ID NO: 8.
- the 4CL comprises a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the one of these sequences and exhibiting 4CL activity.
- the 4CL comprises a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with any of these sequences and exhibiting 4CL activity.
- the 4CL is preferably chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity.
- the 4CL comprises a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity.
- the microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a caffeoyl-CoA O-methyltransferase (CCoAMT).
- CoAMT caffeoyl-CoA O-methyltransferase
- the term "caffeoyl-CoA O-methyltransferase” or “CCoAMT” refers to an enzyme belonging to the EC class 2.1.1.104 and which catalyzes the conversion of caffeoyl-CoA to feruloyl-CoA and / or 5-hydroxyferuloyl-CoA to sinapoyl-CoA.
- this term refers to an enzyme which catalyzes the conversion of caffeoyl-CoA to feruloyl-CoA and of 5-hydroxyferuloyl-CoA to sinapoyl-CoA.
- CCoAMT activity can be detected in vitro, eg using a commercially available in vitro assay (eg SAM510 assay from G-Biosciences, Cat. # 786-430).
- an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative CCoAMT), of S- adenosylmethionine (SAM), and a mixture of enzymes (5-adenosylhomocyteine nucleosidase (EC 3.2.2.9), adenine deaminase (EC 3.5.4.2) and xanthine oxidase (EC 1.17.3.2) under optimal conditions (pH, temperature , ions, etc.).
- CCoAMT the enzyme to be tested
- SAM S- adenosylmethionine
- a mixture of enzymes (5-adenosylhomocyteine nucleosidase (EC 3.2.2.9), adenine deaminase (EC 3.5.4.2) and xanthine oxidase (EC 1.17.3.2) under optimal conditions (pH, temperature , ions, etc.
- CCoAMT activity can also be detected in vivo, in particular using the method described in the experimental part below In particular, CCoAMT activity can be detected in vivo using a microorganism expressing the enzyme to be tested.
- the substrate for said enzyme (caféoyl-CoA or 5-hydroxyferuloyl-CoA) is either synthesized by the microorganism, or brought into the culture medium.
- the feruloyl-CoA or the sinapoyl-CoA produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique.
- CCoAMT activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid to caffeoyl-CoA and / or 5-hydroxyferulic acid to 5-hydroxyferuloyl-CoA, i.e. expressing a 4CL enzyme such as defined above.
- CCoAMT activity is detected by the production of feruloyl-CoA and / or sinapoyl-CoA in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
- CCoAMT can be a plant enzyme, preferably of the genus Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis, Panicum, Rauvolfia or Populus, and more particularly preferably of the genus Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis or Populus.
- the CCoAMT can be an enzyme from Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana, Panicum virgatum, Rauvolfia serpentina or Populus trichocarpa, preferably an enzyme from Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tobacco. , Arabidopsis thaliana or Populus trichocarpa.
- CCoAMT can be an enzyme from Vitis vinifera, in particular CCoAMT described in SEQ ID NO: 10, an enzyme from Medicago sativa, in particular CCoAMT described in SEQ. ID NO: 11, an enzyme from Eucalyptus globus, in particular CCoAMT described in SEQ ID NO: 12, an enzyme from Nicotiana tabacum, in particular CCoAMT described in SEQ ID NO: 13 or 14, enzyme from Arabidopsis thaliana, in particular CCoAMT described in SEQ ID NO: 15, an enzyme from Populus trichocarpa, in particular CCoAMT described in SEQ ID NO: 16, an enzyme from Panicum virgatum, in particular CCoAMT described in SEQ ID NO: 40 or an enzyme from Rauvolfia serpentina, in particular CCoAMT described in SEQ ID NO: 41.
- the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CCoAMT activity.
- the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity.
- the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting CCoAMT activity.
- the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
- CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity;
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
- CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- heterologous nucleic acid sequence encoding a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 6 and exhibiting 4CL activity.
- the microorganism can further comprise
- acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and very particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with
- heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity
- said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
- the microorganism according to the invention may also be capable of producing the carboxyl-CoA of interest, preferably feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate such as cinnamic acid, p-coumaric acid or L-Dopa (3,4-dihydroxy-L-phenylalanine), or from glucose via phenylalanine or tyrosine.
- a synthetic intermediate such as cinnamic acid, p-coumaric acid or L-Dopa (3,4-dihydroxy-L-phenylalanine)
- glucose via phenylalanine or tyrosine.
- caffeic acid from tyrosine can involve two routes: the first involves the transformation of tyrosine into p-coumaric acid and then acid p-coumaric into caffeic acid, the second involves the transformation of tyrosine into L-Dopa and then of L-Dopa into caffeic acid (cf. Figure 8).
- caffeic acid from p-coumaric acid or L-Dopa from tyrosine may be by an enzyme or an enzyme complex having p-coumarate 3-hydroxylase activity.
- the microorganism according to the invention may comprise, in addition to the heterologous nucleic acid sequences described above encoding an acyl-coenzyme A thioesterase and / or a CCR / ALDH combination, a CCoAMT and a 4CL, one or more heterologous nucleic acid sequences encoding an enzyme or an enzyme complex having p-coumarate 3-hydroxylase activity.
- p-coumarate 3-hydroxylase activity refers to an enzyme or enzyme complex catalyzing the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-.
- Dopa To determine if there is p-coumarate 3 hydroxylase activity, an enzymatic test can be performed which consists of in vitro incubation of the enzyme or enzyme complex, p-coumaric acid or L-Tyrosine, and optionally FAD and NADH, under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
- this activity can be the result of an enzyme complex comprising a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) and a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC).
- HpaB 4-hydroxyphenylacetate 3-monooxygenase oxygenase
- HpaC 4-hydroxyphenylacetate 3-monooxygenase reductase
- 4-hydroxyphenylacetate 3-monooxygenase oxygenase refers to an enzyme exhibiting p-coumarate 3-hydroxylase activity when in the presence of 4-hydroxyphenylacetate 3-monooxygenase reductase.
- 4-hydroxyphenylacetate 3-monooxygenase reductase refers to an enzyme exhibiting p-coumarate 3-hydroxylase activity when in the presence of 4-hydroxyphenylacetate 3-monooxygenase oxygenase.
- the HpaB and HpaC enzymes are produced by bacteria, preferably Escherichia coli, bacteria of the genus Pseudomonas, in particular Pseudomonas aeruginosa, or bacteria of the genus Salmonella, in particular Salmonella enterica.
- the enzymes HpaB and HpaC can originate from the same bacteria or from different bacteria.
- HpaB can be an enzyme from Pseudomonas aeruginosa, in particular HpaB described in SEQ ID NO: 17, or an enzyme from Escherichia coli, in particular HpaB described in SEQ ID NO: 26.
- the HpaB comprises a sequence chosen from the sequences SEQ ID NO: 17 and 26 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity.
- the HpaB comprises a sequence chosen from the sequence SEQ ID NO: 17 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity.
- HpaC can be an enzyme from Salmonella enterica, in particular HpaC described in SEQ ID NO: 18, or an enzyme from Escherichia coli, in particular HpaC described in SEQ ID NO: 27.
- the HpaC comprises a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity.
- the HpaC comprises a sequence chosen from the sequence SEQ ID NO: 18 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity.
- the microorganism comprises
- heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase, preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and
- heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase, preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity.
- HpaB and HpaC As an alternative to the use of HpaB and HpaC or in combination with them, it is possible to use on the one hand an enzyme making it possible to convert tyrosine into L-Dopa, namely a 4-methoxybenzoate O-demethylase , and on the other hand an enzyme making it possible to convert p-coumaric acid into caffeic acid, namely a p-coumarate 3-hydroxylase (cf. FIG. 8).
- These enzymes are part of the cytochrome P450 (CYP) family and are CPR dependent, i.e. they are active in the presence of a cytochrome P450 reductase (CPR).
- Cytochrome P450 reductase can be an endogenous enzyme or a heterologous enzyme.
- the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a CPR dependent p-coumarate 3-hydroxylase (C3H), that is to say an enzyme capable of converting p-coumaric acid. in caffeic acid in the presence of a CPR (EC 1.14.13).
- C3H CPR dependent p-coumarate 3-hydroxylase
- the p-coumarate 3-hydroxylase activity of this enzyme can be tested as indicated above and in the presence of CPR.
- C3H can be an enzyme from bacteria, in particular bacteria of the Saccharothrix genus.
- C3H can be an enzyme from Saccharothrix espanaensis, preferably the enzyme described in SEQ ID NO: 25.
- the C3H comprises a sequence chosen from the sequence SEQ. ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity.
- the microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase. that is, an enzyme capable of converting L-tyrosine to L-Dopa in the presence of CPR (EC 1.14.99.15).
- a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase. that is, an enzyme capable of converting L-tyrosine to L-Dopa in the presence of CPR (EC 1.14.99.15).
- the p-coumarate 3-hydroxylase activity of this enzyme can be tested as indicated above and in the presence of CPR and tyrosine.
- 4-Methoxybenzoate O-demethylase can be an enzyme from bacteria, in particular from Rhodopseudomonas palustris, Pseudomonas putida, or Escherichia coli, from plants, in particular from Beta vulgaris, from mammals, in particular from Oryctolagus cuniculus, or from fungi, in particular from Rhodotorula glutinis.
- 4-methoxybenzoate O-demethylase is an enzyme from Rhodopseudomonas palustris, in particular the enzyme described in SEQ ID NO: 28, or from Beta vulgaris, in particular the enzyme described in SEQ ID NO: 29.
- the 4-methoxybenzoate O-demethylase comprises a sequence chosen from SEQ ID NOs: 28 and 29 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting L-tyrosine hydrolase activity.
- the production of p-coumaric acid from tyrosine involves an enzyme exhibiting tyrosine ammonia lyase (TAL) activity.
- the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an enzyme having tyrosine ammonia lyase activity.
- tyrosine ammonia lyase or "TAL" refers to an enzyme catalyzing the production of p-coumaric acid from L-tyrosine (EC 4.3.1.23).
- the detection of a tyrosine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- the TAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of tyrosine under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of p-coumaric acid is observed in UPLC-MS in comparison with the expected standard.
- TALs may also exhibit dihydroxyphenylalanine ammonia lyase (DAL) and / or phenylalanine ammonia lyase (PAL) activity.
- DAL dihydroxyphenylalanine ammonia lyase
- PAL phenylalanine ammonia lyase
- TAL can be an enzyme produced by a bacterium, in particular a bacterium of the genus Rhodobacter, preferably Rhodobacter capsulatus or Rhodobacter sphaeroides, of the genus Ralstonia, preferably Ralstonia metallidurans, or of the genus Flavobacteriaceae, preferably Flavobacterium johnsoniae. It can also be an enzyme produced by a plant, for example by Camellia sinensis, Fragaria x ananassa or Zea mays.
- TAL is an enzyme produced by a yeast, in particular a yeast of the genus Rh
- TAL can be an enzyme from Flavobacterium johnsoniae, preferably the enzyme described in SEQ ID NO: 30, or an enzyme from Rhodotorula glutinis, preferably the enzyme described in SEQ. ID NO: 19.
- the TAL comprises a sequence chosen from SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity. of sequence with one of these sequences and exhibiting TAL activity.
- the TAL comprises a sequence selected from the sequence SEQ ID NO: 19 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the production of caffeic acid from L-Dopa involves an enzyme exhibiting dihydroxyphenylalanine ammonia lyase (DAL) activity.
- the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an enzyme having dihydroxyphenylalanine ammonia lyase activity.
- dihydroxyphenylalanine ammonia lyase or "DAL” refers to an enzyme catalyzing the production of caffeic acid from L-Dopa (EC 4.3.1.11).
- the detection of a dihydroxyphenylalanine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- the DAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of L-Dopa under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid is observed in UPLC-MS compared to the expected standard.
- the recombinant microorganism comprises
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ.
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a heterologous nucleic acid sequence encoding a C3H preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity reductase, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO : 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and - a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising
- the recombinant microorganism comprises
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70
- a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate activity
- HpaB a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ.
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity oxygenase
- a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO : 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- said HpaC preferably comprising a sequence chosen from sequences SEQ ID NO: 18 and 27 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity
- a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the recombinant microorganism comprises
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70
- HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity
- a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the microorganism may further comprise
- acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and very particularly preferably a acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with
- caffeic acid from phenylalanine involves specific enzymes of this pathway, namely a phenylalanine ammonia lyase (PAL) capable of producing cinnamic acid from phenylalanine and a cinnamate 4-hydroxylase (C4H) capable of producing p-coumaric acid from cinnamic acid, and the enzymes or enzymatic complexes described above capable of converting p-coumaric acid into caffeic acid (cf. Figure 8).
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the microorganism according to the invention may comprise, in addition to the heterologous nucleic acid sequences described above encoding an acyl-coenzyme A thioesterase and / or a CCR / ALDH combination, a CCoAMT, a 4CL and an enzyme or a enzymatic complex having p-coumarate 3-hydroxylase activity, a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and / or a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H).
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- phenylalanine ammonia lyase or "PAL” refers to an enzyme catalyzing the production of cinnamic acid (also called trans-cinnamic acid) from phenylalanine (EC 4.3.1.24).
- the detection of a phenylalanine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- the PAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of phenylalanine under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
- Some PALs may also exhibit TAL activity and / or DAL activity.
- the PAL is from a plant, for example a plant of the genus Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Camellia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus , Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petrose
- the PAL comprises a sequence chosen from SEQ. ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the activity
- the PAL comprises a sequence selected from the sequence SEQ ID NO: 20 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity.
- C4H cinnamon 4-hydroxylase
- the detection of a cinnamate 4-hydroxylase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- the C4H activity can in particular be detected via an enzymatic test which consists of the in vitro incubation of a mixture composed of the enzyme to be tested, cinnamic acid, NADPH, H + and O2 in the optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of p-coumaric acid is observed in UPLC-MS in comparison with the expected standard.
- C4H is from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phaseolus, Pinus, Populus, Ruta, Saccharum , Solanum, Vitis, Vigna or Zea.
- C4H can be an enzyme from Arabidopsis thaliana, preferably the enzyme described in SEQ ID NO: 21, or an enzyme from Citrus sinensis, preferably one of the enzymes described in SEQ ID NOs: 33 and 34.
- the C4H comprises a sequence chosen from SEQ ID NOs: 21, 33 and 34 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting C4H activity.
- C4H comprises a sequence selected from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 21 and exhibiting C4H activity.
- the microorganism according to the invention comprises
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the recombinant microorganism comprises
- CCoAMT a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptide
- PAL phenylalanine ammonia lyase
- PAL phenylalanine ammonia lyase
- a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase
- C4H preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the C4H activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
- the recombinant microorganism comprises a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ. ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting l p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and
- a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase preferably comprising a sequence chosen from SEQ. ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferred, comprising a sequence chosen from the sequence SEQ. ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the microorganism can also comprise a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the recombinant microorganism comprises
- CCoAMT a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and polypeptides comprising a sequence having at least 60, 70,
- HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
- CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity
- a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80
- HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity
- PAL phenylalanine ammonia lyase
- C4H cinnamate 4-hydroxylase
- the microorganism can also comprise a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the microorganism may further comprise
- acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and in any manner particularly preferred an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with
- CPR cytochrome P450 reductase
- the latter may further comprise an endogenous nucleic acid encoding a cytochrome P450 reductase.
- endogenous CPR can be overexpressed, for example by replacing the promoter of the endogenous gene with a strong heterologous promoter and / or by increasing the number of copies of the endogenous gene.
- the microorganism according to the invention can comprise a heterologous nucleic acid sequence which codes for a cytochrome P450 reductase (CPR).
- cytochrome P450 reductase or “CPR” refers to an enzyme involved in the transfer of electrons from NADPH and belonging to class EC 1.6.2.4.
- CPR activity can be carried out by any method known to those skilled in the art, in vivo or in vitro.
- CPRs are enzymes which catalyze the transfer of electrons from NADPH to cytochromes p450 (eg C3H or C4H).
- the CPR activity can in particular be detected using an enzymatic kit combining the oxidation of NADPH by CPR with the reduction of a colorless substrate into a colored product with an absorbance peak at a given wavelength, the color generation rate being directly proportional to CPR activity.
- An example of a commercial kit based on this principle is the “CPR activity assay kit” from PromoKine (Cat # PK-CA577-K700).
- the CPR preferably originates from a eukaryote, in particular from a yeast, for example a yeast of the genus Saccharomyces, or from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Wisteria, Helianthus, Lotus, Mesembryanthemum, Phaseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis or Zea.
- a yeast for example a yeast of the genus Saccharomyces
- a plant for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Wisteria, Helianthus, Lotus, Mesembryanthemum, Phaseolus, Physcomitrella, Pinus, Populus
- the CPR can be an enzyme from Catharanthus roseus, preferably the enzyme described in SEQ ID NO: 22, an enzyme from Saccharomyces cerevisiae, preferably the enzyme described in SEQ. ID NO: 35, or an enzyme from Arabidopsis thaliana, preferably one of the enzymes described in SEQ ID NOs: 36 and 37.
- CPR can also be a chimeric protein such as that described in the article from Aigrain et al (2009, EMBO reports, 10, 742-747; SEQ ID NO: 38).
- the CPR comprises a sequence chosen from SEQ ID NOs: 22, 35, 36, 37 and 38 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CPR activity.
- the CPR comprises a sequence selected from SEQ ID NO: 22 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 22 and exhibiting CPR activity.
- the microorganism according to the invention can also be modified to increase the production of tyrosine and / or phenylalanine, preferably tyrosine.
- the microorganism according to the invention produces large amounts of tyrosine and / or phenylalanine, in particular from a simple carbon source such as glucose.
- This increase can be obtained by any method known to those skilled in the art and in particular by expressing one or more variants of one or more enzymes involved in the synthesis of these amino acids, said variants being resistant to feedback by tyrosine and / or phenylalanine, preferably resistant to tyrosine feedback.
- the microorganism can be modified to express a variant of 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase (EC 2.5.1.54) and / or chorismate mutase (EC 5.4.99.5) , resistant to tyrosine feedback.
- DAHP 3-deoxy-D-arabino-hepturosonate-7-phosphate
- EC 5.4.99.5 chorismate mutase
- the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase resistant to feedback control by tyrosine and / or a heterologous nucleic acid sequence encoding a chorismate mutase resistant to tyrosine feedback.
- DAHP 3-deoxy-D-arabino-hepturosonate-7-phosphate
- DAHP 3-deoxy-D-arabino-hepturosonate-7-phosphate
- AR04 amino acid sequence
- AR07 chorismate mutase
- Variants resistant to tyrosine feedback of these enzymes are known, for example the AR04 K229L mutant (SEQ ID NO: 23) and the AR07 G141S mutant (SEQ ID NO: 24).
- the microorganism according to the invention comprises
- a heterologous nucleic acid sequence encoding a 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase resistant to feedback control by tyrosine and comprising a sequence chosen from SEQ ID NO: 23 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 23, said polypeptides exhibiting 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP ) synthase resistant to feedback control by tyrosine and, preferably, a leucine at the position corresponding to position 229 of SEQ ID NO: 23; and or
- heterologous nucleic acid sequence encoding a chorismate mutase resistant to feedback control by tyrosine and comprising a sequence chosen from SEQ ID NO: 24 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 24, said polypeptides exhibiting chorismate mutase activity resistant to feedback control by tyrosine and, preferably, a serine at the position corresponding to position 141 of SEQ ID NO: 24 .
- the increase in the production of tyrosine and / or phenylalanine can also be obtained by redirecting the carbon flow from other metabolic pathways towards that of tyrosine and / or phenylalanine, preferably tyrosine.
- modifications and the genes involved are well known to those skilled in the art (see US Pat. No. 8,809,028; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).
- one or more endogenous genes encoding an enzyme involved in the pathway for degradation of Ehrlich amino acids are inactivated.
- the gene or genes can be inactivated by any method known to those skilled in the art, in particular by deletion total or partial, or by insertion of a nucleic acid sequence in the coding sequence, in particular a sequence shifting the reading frame or inserting a stop codon.
- an endogenous gene encoding a phenylpyruvate decarboxylase can be inactivated.
- This enzyme is responsible for the first step in Ehrlich's amino acid degradation pathway.
- phenylpyruvate decarboxylase is encoded by the ARO10 gene (NCBI Gene ID: 851987).
- the latter can also be modified to inactivate the endogenous gene (s) encoding a ferulic acid decarboxylase.
- This enzyme catalyzes in particular the decarboxylation of ferulic acid, p-coumaric acid and cinnamic acid to produce their vinyl derivatives, namely 4-vinylguaiacol, 4-vinylphenol and styrene respectively. It belongs to class EC 4.1.1.102. Its inactivation makes it possible to increase the available quantities of cinnamic acid and p-coumaric acid and the quantities of ferulic acid produced in the microorganism according to the invention.
- the gene or genes encoding this enzyme in the microorganism according to the invention can be easily identified by a person skilled in the art.
- ferulic acid decarboxylase is encoded by the FDC1 gene (NCBI Gene ID: 852152).
- the gene (s) can be inactivated by any method known to those skilled in the art, in particular by total or partial deletion, or by insertion of a nucleic acid sequence into the coding sequence, in particular a sequence shifting the reading frame or inserting a stop codon.
- Each nucleic acid sequence encoding an enzyme as described above is included in an expression cassette.
- the coding nucleic sequences have been optimized for expression in the host microorganism.
- the coding nucleic sequence is operably linked to the elements necessary for the expression of the gene, in particular for transcription and translation. These elements are chosen so as to be functional in the host recombinant microorganism. These elements can include, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. The methods for selecting these elements as a function of the host cell in which expression is desired are well known to those skilled in the art.
- the promoter is a strong promoter.
- the promoter can be constitutive or inducible, preferably constitutive.
- a promoter can control the expression of one or more nucleic acid sequences encoding one or more enzymes as described above.
- the promoter can be selected from the following promoters: Lacl, LacZ, pLacT, ptac, pARA, pBAD, the bacteriophage T3 or T7 RNA polymerase promoters, the polyhedrin promoter, the lambda phage PR or PL promoter.
- the promoter is pLac.
- the promoter can be selected from the following promoters: the pTDH3 promoter, the pTEF1 promoter, the pTEF2 promoter, the pCCW12 promoter, the pHHF2 promoter, the pHTB2 promoter and the pRPL18B promoter.
- inducible promoters which can be used in yeast are the tetO-2, GAL10, GAL10-CYC1 and PH05 promoters.
- All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described or a combination of some of these can be included in a common expression vector or in different expression vectors.
- the present invention therefore also relates to a vector comprising
- the vector comprises - (i) a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a nucleic acid sequence encoding a aldehyde dehydrogenase (ALDH), preferably a nucleic acid sequence encoding an acyl-coenzyme A thioesterase, and
- the vector comprises
- nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT) and a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), or a combination of the two, each of these enzymes being as defined above.
- CoAMT Caféoyl-CoA O-Methyltransferase
- 4CL 4-coumaroyl-CoA ligase
- the vector can in particular comprise combinations of particular coding sequences as described above.
- nucleic acid sequence By “comprising a nucleic acid sequence”, it is preferably understood “comprising an expression cassette comprising the nucleic acid sequence”.
- Vectors include heterologous coding sequences as long as the coding sequences can be optimized for the host microorganism, be under the control of heterologous promoter (s) and / or can combine coding sequences which are not from the same organism. of origin and / or which are not present in the same arrangement.
- heterologous promoter s
- the vector can be any DNA sequence into which it is possible to insert foreign nucleic acids, the vectors making it possible to introduce foreign DNA into the host microorganism.
- the vector can be, for example, a plasmid, a phagemid, a cosmid, an artificial chromosome, in particular a YAC, or a BAC.
- the expression vectors can further comprise nucleic sequences encoding selection markers.
- the selection markers can be genes for resistance to one or more antibiotics or genes for auxotrophy.
- the auxotrophy gene can for example be HIS5, URA3, LEU2 or TRP1.
- the antibiotic resistance gene may for example preferably be a resistance gene to ampicillin, chloramphenicol, spectinomycin, streptomycin, kanamycin, hygromycin, geneticin, fluoroacetamide, fluorocitrate, phleomycin, amphotericin-B and / or nureseothricin.
- the host microorganism can be transformed / transfected in a transient or stable manner and the nucleic acid, the cassette or the vector according to the invention can be contained therein in the form of an episome or in a form integrated into the genome of the cell. host.
- the expression vector can also comprise one or more sequences allowing the targeted insertion of the vector, of the expression cassette or of the nucleic acid into the genome of the host cell.
- All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described above can be inserted into the / a chromosome of the recombinant microorganism.
- all or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described can be stored in episomal form, in particular in the form of a plasmid.
- the microorganism can comprise several copies of nucleic acid sequences encoding an enzyme as described above. In particular, it can comprise 2 to 10 copies, for example 2, 3, 4, 5, 6, 7, 8, 9 or 10 copies of a nucleic acid sequence encoding an enzyme as described above.
- the host microorganism can be transformed / transfected with several vectors according to the invention, which are identical or different. It can also be transformed / transfected with one or more other vectors coding, for example, for other enzymes necessary for the production of the carboxylic acid.
- the present invention also relates to a method for preparing a recombinant microorganism according to the present invention comprising the introduction of a vector as defined above into the microorganism and the selection of the microorganisms comprising said vector.
- It also relates to a method for preparing a microorganism according to the present invention comprising the introduction - (i) a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a sequence d 'nucleic acid encoding an aldehyde dehydrogenase (ALDH),
- the method of preparing a microorganism according to the present invention comprises the introduction
- nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT) and a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase ( 4CL), or a combination of the two, and the selection of microorganisms comprising said nucleic acid sequences, each of these enzymes being as defined above.
- CoAMT Caféoyl-CoA O-Methyltransferase
- 4CL 4-coumaroyl-CoA ligase
- the present invention also relates to the use of a microorganism according to the invention for producing a carboxylic acid, in particular a carboxylic acid derived from a carboxyl-CoA. It also relates to a method of producing a carboxylic acid, in particular a carboxylic acid derived from a carboxyl-CoA, comprising the culture of a microorganism according to the invention and optionally the harvest and / or purification of said carboxylic acid.
- carboxylic acid refers to a compound comprising a carboxyl group (-C (O) OH).
- the carboxylic acid is a carboxylic acid.
- aromatic that is to say a compound comprising a carboxyl group (-C (O) OH) and an aromatic group, preferably a phenyl ring.
- carboxylic acid derived from a carboxyl-CoA refers to a carboxylic acid, preferably an aromatic carboxylic acid obtained from a carboxyl-CoA, that is to say a carboxylic acid whose pathway.
- biosynthesis within the microorganism according to the invention involves at least one intermediate linked to CoA which is converted into said carboxylic acid by the action of (i) acyl-coenzyme A thioesterase and / or (ii) cinnamoyl- CoA reductase (CCR) and aldehyde dehydrogenase (ALDH) expressed from heterologous nucleic acid sequences introduced into the microorganism.
- CCR acyl-coenzyme A thioesterase
- ADH aldehyde dehydrogenase
- the carboxylic acid produced by the production method according to the invention is preferably a phenylpropanoid chosen from cinnamic acid, p-coumaric acid, caffeic acid, ferulic acid, 5 acid. -hydroxyferulic and sinapic acid, and more particularly preferably a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid.
- the carboxylic acid is a compound of formula (II) as defined below.
- the present invention relates to the use of a microorganism according to the invention for the production of a compound of formula (II)
- R 1, R 2 and R 3 are selected, independently of each other, from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
- R 5 is selected from the group consisting of hydrogen, alkyl C 1 -C 6 branched or unbranched alkenes and groups C 1 -C 6 branched or unbranched. More particularly preferably, R 5 is chosen from the group consisting of a hydrogen atom and a methyl group. according to a particular embodiment,
- R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and a group OR 5 , where R 5 is a methyl group, and
- - R 1, R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-R5 group, where R5 is a methyl group, and
- the microorganism according to the invention at least catalyzes the hydrolysis reaction of a carboxyl-CoA of formula (I)
- the compound of formula (II) is chosen from ferulic acid and sinapic acid.
- the compound of formula (II) is ferulic acid.
- the present invention relates to the use of a microorganism according to the invention for producing a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid. It also relates to a method of producing a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid, comprising the culture of a microorganism according to the invention and optionally the harvest. and / or the purification of said phenylpropanoid.
- the phenylpropanoid is chosen from ferulic acid and sinapic acid.
- the phenylpropanoid is ferulic acid.
- the microorganism according to the invention at least catalyzes the hydrolysis reaction of feruloyl-CoA to ferulic acid, of caffeoyl-CoA to caffeic acid, of 5-hydroxyferuloyl-CoA to 5-hydroxyferulic acid and / or of sinapoyl-CoA to sinapic acid, preferably the hydrolysis reaction of feruloyl-CoA to ferulic acid and / or of sinapoyl-CoA to sinapic acid, and very particularly preferably the hydrolysis reaction of feruloyl-CoA to ferulic acid.
- the compound produced by the method according to the invention can be either the final product or a synthetic or biosynthetic intermediate for the preparation of other compounds.
- the conditions for culturing the microorganism according to the invention can be adapted according to conventional techniques, well known to those skilled in the art.
- the microorganism is cultivated in an appropriate culture medium.
- suitable culture medium generally designates a culture medium providing nutrients essential or beneficial to the maintenance and / or growth of said.
- microorganism such as carbon sources; nitrogen sources such as ammonium sulfate; sources of phosphorus, for example, potassium phosphate monobasic; trace elements, for example copper, iodide, iron, magnesium, zinc or molybdate salts; vitamins and other growth factors such as amino acids or other growth promoters.
- Defoamer can be added as needed.
- this suitable culture medium can be chemically defined or “undefined”.
- the culture medium can thus be of identical or similar composition to a synthetic medium, as defined by Verduyn et al., (Yeast.
- the culture medium can comprise a simple carbon source, such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, polymers of glucose, molasses, or the byproducts of these sugars.
- a simple carbon source such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, polymers of glucose, molasses, or the byproducts of these sugars.
- the “undefined” medium can be a liquid medium composed of hydrolysates of microorganisms and / or proteins, for example and not exclusively of yeast extract and / or peptones.
- a simple carbon source such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, glucose polymers. , molasses, or by-products of these sugars.
- the microorganism according to the invention can comprise all or part of the route of biosynthesis of the carboxylic acid of interest.
- the production can be carried out in the presence of a simple carbon source such as glucose, or in the presence of a synthetic intermediate such as tyrosine, phenylalanine, cinnamic acid or p-coumaric acid.
- a simple carbon source such as glucose
- a synthetic intermediate such as tyrosine, phenylalanine, cinnamic acid or p-coumaric acid.
- the synthesis intermediate can also be caffeic acid, caffeoyl-CoA or feruloyl-CoA.
- the synthetic intermediate can also be 5-hydroxyferulic acid, 5-hydroxyferuloyl-CoA or sinapoyl-CoA.
- the synthesis intermediate can also be caffeoyl-CoA.
- the synthetic intermediate can also be 5-hydroxyferuloyl-CoA.
- the microorganism according to the invention is used in a method for producing ferulic acid from caffeic acid.
- the culture of the microorganism is carried out in the presence of caffeic acid in the culture medium.
- the microorganism comprises
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ. ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A activity thioesterase, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having
- heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- a heterologous nucleic acid sequence encoding a CCoAMT in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity
- the microorganism according to the invention is used in a method for producing ferulic acid from glucose.
- the culture of the microorganism is carried out without supplying any intermediate compound in the medium, that is to say without supplying tyrosine, phenylalanine, cinnamic acid, p-coumaric acid, caffeic acid, caffeoyl-CoA and / or feruloyl-CoA.
- the microorganism comprises
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ.
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and / or - a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity,
- a heterologous nucleic acid sequence encoding a CCoAMT in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from among the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the activity
- CCoAMT and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- a heterologous nucleic acid sequence encoding a C3H preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least
- a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ.
- PAL phenylalanine ammonia lyase
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting C4H activity, and more particularly preferred, comprising a sequence chosen from the sequence SEQ. ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity; and or
- a heterologous nucleic acid sequence encoding a TAL preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the microorganism comprises
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting the activity acyl-coenzyme A thioesterase; and or
- a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity
- said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCo
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate activity
- HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity
- HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80
- PAL phenylalanine ammonia lyase
- polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85,
- C4H cinnamate 4-hydroxylase
- a heterologous nucleic acid sequence encoding a TAL preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
- the microorganism according to the invention is used in a method for producing sinapic acid from 5-hydroxyferulic acid.
- the culture of the microorganism is carried out without adding an intermediate compound to the medium, that is to say without adding 5-hydroxyferuloyl-CoA and / or sinapoyl-CoA.
- the microorganism comprises
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A activity thioesterase, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at
- heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH preferably said CCR comprising a sequence chosen from the sequence SEQ. ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting the ALDH activity , and further includes
- a heterologous nucleic acid sequence encoding a CCoAMT in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- a heterologous nucleic acid sequence encoding a 4CL preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity.
- the microorganism comprises
- a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferred an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- a heterologous nucleic acid sequence encoding a CCoAMT preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and
- the microorganism according to the invention is used in a method for producing caffeic acid from caffeoyl-CoA.
- Caffeoyl-CoA can be produced by the microorganism or added to the culture medium.
- the microorganism comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs : 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence
- coenzyme A thioesterase and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity.
- the microorganism according to the invention is used in a method for producing 5-hydroxyferulic acid from 5-hydroxyferuloyl-CoA.
- 5-Hydroxyferuloyl-CoA can be produced by the microorganism or added to the culture medium.
- the microorganism comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs : 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and
- any mode of culture allowing the production on an industrial scale of molecules of interest can be envisaged.
- the culture is carried out in bioreactors, in particular in batch, fed-batch, chemostat and / or continuous culture mode. Controlled vitamin supply during the process may also benefit productivity (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60: 67-72).
- the culture is generally carried out in bioreactors, with possible steps of solid and / or liquid precultures in Erlenmeyer flasks, with an appropriate culture medium.
- the conditions for the culture of the microorganisms according to the invention are easily adaptable by a person skilled in the art, depending on the microorganism.
- the culture temperature is in particular for yeasts between 20 ° C and 40 ° C, preferably between 28 ° C and 40 ° C, and more particularly around 30 ° C for cerevisiae.
- the microorganism according to the present invention can be cultured for 1 to 30 days, and preferably 1 to 10 days.
- the present invention also relates to the use of a microorganism according to the invention for catalyzing the conversion of a carboxyl-CoA, preferably of formula (I) into a carboxylic acid, preferably of formula (II). It further relates to a process for catalyzing the conversion of a carboxyl-CoA, preferably of formula (I) into a carboxylic acid, preferably of formula (II), comprising the culture of a microorganism according to the invention in the presence of said carboxyl-CoA or of one of these precursors, and optionally the harvest and / or purification of said carboxylic acid. All of the embodiments described above also relate to this aspect.
- the microorganism according to the invention can be used to catalyze the conversion of feruloyl-CoA to ferulic acid, of caféoyl-CoA to caffeic acid, of 5-hydroxyferuloyl-CoAen to 5-hydroxyferulic acid and / or of sinapoyl-CoAen acid. sinapic.
- the carboxyl-CoA is feruloyl-CoA
- the carboxylic acid is ferulic acid
- the precursor is chosen from glucose, phenylalanine, tyrosine, cinnamic acid, p acid.
- -coumaric, caffeic acid and caffeoyl-CoA preferably is caffeic acid.
- the carboxyl-CoA is sinapoyl-CoA
- the carboxylic acid is sinapic acid
- the precursor is chosen from glucose, phenylalanine, tyrosine, cinnamic acid, acid.
- p-coumaric, 5-hydroxyferulic acid and 5-hydroxyferuloyl-CoA preferably is 5-hydroxyferulic acid.
- yeast strains used in the examples were obtained from Saccharomyces cerevisiae S288C (Mortimer RK and Johnston JR (1986) Genealogy of principal strains of the yeast genetic stock center. Genetics 113 (1): 35-43). This yeast has an auxotrophy for uracil, tryptophan and leucine.
- the constructions were carried out in the strain of Escherichia coli MH1 before their transfer to the yeast.
- the AR010 (YDR380W) and FDC1 (YDR539W) genes were inactivated, i.e. by integration instead of the open reading frame, of a linear DNA comprising a marker of selection bounded by the upstream and downstream regions of the gene.
- the genes whose codons have been optimized for expression in yeast have been synthesized by Twist Biosciences, San Francisco, USA or DC Biosciences, Dundee, UK.
- the genes AR04 (GenBank accession number: NP_009808) and AR07 (GenBank accession number: NP_015385) were amplified by PCR from the genomic DNA of S. cerevisiae, then were mutated so that their product was resistant to retro- inhibition (FBR: Feed Back Resistance) (Gold et al., Microb Cell Fact. 2015; 14: 73).
- the promoters and terminators were amplified by PCR from the genomic DNA of S. cerevisiae.
- the genes obtained by synthesis or by PCR comprise at the 5 'and 3' end, a BbsI (GAAGAC) or Bsal (GGTCTC) restriction site, compatible with the cloning system used. All of the genes, promoters and terminators were cloned into the restriction sites of the pSBK vector.
- the vector pSBK comprises the selection marker URA3, LEU2 or TRP1.
- the yeast strains were cultured for 72 hours at 30 ° C., in a 24-well plate, with continuous stirring (200 RPM), in 1 ml of SD medium (Dutscher, Brumath, France) supplemented or not with CSM (Completed Supplement Mixture; Formedium, UK).
- Glucose is added at 20 g / L and when required p-coumaric acid, caffeic acid or 5-hydroxy-ferulic acid has been added to the medium at a concentration of 100 mg / L.
- Each strain was inoculated at OD 0.2 from a 24 h preculture cultivated under the same conditions.
- Samples of 100 ⁇ L are collected for each experiment. 50 ⁇ L are transferred to a new plate, to which are added 50 ⁇ L of the internal standard solution. Each sample is then homogenized by suction-discharge, then centrifuged for 5 min at 3000 rpm at room temperature. The final concentration of the internal standard (Protocatechuic Acid) is 0.5 mg / L.
- UHPLC-TQ Analysis by UHPLC-TQ: The samples were analyzed by a UHPLC Vanquish-H (Thermo) coupled to a triple-quadrupole UHPLC-TQ. (Thermo).
- the column is a Waters Acquity UPLC @ USST3 column (8 ⁇ m 2.1 X 100 mm) associated with a HSST3 1.8 ⁇ m 2.1 X 5 mm pre-column.
- Mobile phase A is a solution of 0.1% formic acid in LC / MS grade water and mobile phase B is a solution of 0.1% formic acid in pure acetonitrile of LC / MS quality.
- the temperature of the column is 50 ° C and the temperature of the autosampler is 10 ° C.
- the parameters of the electrospray source are: - voltage of the positive mode spray at 4000V
- the gene encoding the thioesterase of Arabidopsis thaliana (Thiol, SEQ ID NO: 1) or of Petunia hybrida (Thio3, SEQ. ID NO: 2) was inserted into the strain 221 which expresses the 4CL of Arabidopsis thaliana (4CL1 , SEQ ID NO: 5) and the Arabidopsis thaliana CCoAMT (CC0AMT6, SEQ ID NO: 15) and in which the ArolO and Fdc genes have been inactivated (strain 221).
- the strains obtained are strains 345 and 239.
- the genes encoding the CCR of Populus tomentosa (SEQ ID NO: 4) and for the ALDH of Arabidopsis thaliana (SEQ ID NO: 3) were also inserted into strain 221 to obtain strain 214.
- the gene encoding the thioesterase of Oryza meyeriana var. granulata was inserted into a strain which expresses the 4CL of Citrus clementina (4CL5, SEQ ID NO: 6) and the CCoAMT of Arabidopsis thaliana (CC0AMT6, SEQ ID NO: 15) and in which the ArolO and Fdc genes have been inactivated.
- the strain obtained is strain 806.
- the production of ferulic acid is tested in the presence of 100 mg / L of caffeic acid.
- a strain was obtained by inserting the genes encoding the thioesterase of Petunia hybrida (Thio3, SEQ ID NO: 2), the 4CL of Citrus sinensis (4CL5, SEQ ID NO: 6) and the CCoAMT of Vitis vinifera (CCoAMTl, SEQ ID NO: 10) in a strain in which the ArolO and Fdc genes have been inactivated.
- the strain thus obtained is strain 367.
- the genes encoding the 4CL of Citrus sinensis (4CL5, SEQ ID NO: 6), the CCoAMT of Vitis vinifera (CCoAMT1, SEQ ID NO: 10), the CCR of Populus tomentosa (SEQ ID NO: 4) and ALDH from Arabidopsis thaliana (SEQ ID NO: 3) were inserted into a strain in which the ArolO and Fdc genes have been inactivated. The strain thus obtained is strain 616.
- strains of yeast were constructed, all expressing the thioesterase from Petunia hybrida (Thio3, SEQ ID NO: 2) and in which the ArolO and Fdc genes have been inactivated.
- these strains were added five different 4CL (4CL1, 4CL5, 4CL7, 4CLA and 4CLB).
- the 5 strains thus obtained are strains 334, 335, 336, 337 and 338.
- strain 335 was combined with two different CCoAMT (CC0AMT8 and 9, respectively SEQ ID NO: 40 and 41)). Strains 623 and 912 were thus obtained. The production of ferulic acid was tested with each of these strains in the presence of 100 mg / L of caffeic acid. After 72 hours of culture, strains 623 and 912 respectively produced 42 mg / L and 41 mg / L of ferulic acid.
- a yeast strain 507 was constructed in which the ArolO and Fdc genes were inactivated and which expresses a gene encoding HpaB from Pseudomonas aeruginosa (SEQ ID NO: 17) and a gene encoding HpaC from Salmonella enterica (SEQ ID NO: 18). Strain 507 was then modified by inserting the best performing 4CL-CCoAMT-Thio combinations:
- Strain 595 insertion of 4CL5 ⁇ Citrus sinensis, SEQ ID NO: 6), CCoAMT1 (Vitis vinifera, SEQ ID NO: 10) and Thio3 (Petunia hybrida, SEQ ID NO: 2);
- Strain 596 insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO: 16) and Thio3 (Petunia hybrida, SEQ ID NO: 2); and
- Strain 597 insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO: 15) and Thio3 (Petunia hybrida, SEQ ID NO: 2). These strains were then cultured in the presence of p-coumaric acid (100 mg / L).
- a yeast strain 516 was constructed in which the ArolO and Fdc genes were inactivated and which expresses a gene encoding an Aro4 allele resistant to feedback (AR04 K229L , SEQ ID NO: 23), a gene encoding an Aro7 allele resistant to feedback (AR07 G141S , SEQ.
- HpaB from Pseudomonas aeruginosa
- HpaC from Salmonella enterica
- SEQ ID NO: 18 a gene encoding TAL from Rhodotorula glutinis
- SEQ ID NO: 19 a gene encoding PAL from Arabidopsis thaliana
- SEQ ID NO: 21 a gene encoding C4H from Arabidopsis thaliana
- SEQ ID NO: 22 a gene encoding CPR1 from Catharantus roseus
- Strain 516 was then modified by inserting the best performing 4CL-CCoAMT-Thio combinations: Strain 592: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMTl (Vitis vinifera, SEQ ID NO: 10) and Thio3 (Petunia hybrida, SEQ ID NO: 2);
- Strain 593 insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO: 16) and Thio3 (Petunia hybrida, SEQ ID NO: 2); and
- Strain 594 insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO: 15) and Thio3 (Petunia hybrida, SEQ ID NO: 2).
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Description
METHODE DE BIOSYNTHESE DE PHENYLPROPANOÏDES PHENYLPROPANOID BIOSYNTHESIS METHOD
DOMAINE DE L'INVENTION FIELD OF THE INVENTION
La présente invention concerne l'utilisation d'un microorganisme recombinant pour produire un acide organique via l'hydrolyse d'un thioester de coenzyme A, et plus particulièrement un microorganisme recombinant capable de produire des composés phénylpropanoïdes. Elle concerne également les méthodes de production utilisant de tels microorganismes. ARRIERE-PLAN TECHNOLOGIQUE The present invention relates to the use of a recombinant microorganism for producing an organic acid via the hydrolysis of a coenzyme A thioester, and more particularly to a recombinant microorganism capable of producing phenylpropanoid compounds. It also relates to production methods using such microorganisms. TECHNOLOGICAL BACKGROUND
L'acide férulique et l'acide sinapique sont des phénylpropanoïdes dérivés de l'acide cinnamique et dotés de propriétés antioxydantes et antiradicalaires. L'acide férulique peut être utilisé en tant que précurseur dans la fabrication de substances antimicrobiennes pour les savons, parfums et cosmétiques ainsi que pour la production de vanilline et d'acide sinapique. Il trouve également des applications dans le domaine médical, notamment du fait de ses propriétés antioxydantes. Ferulic acid and sinapic acid are phenylpropanoids derived from cinnamic acid with antioxidant and anti-free radical properties. Ferulic acid can be used as a precursor in the manufacture of antimicrobial substances for soaps, perfumes and cosmetics as well as for the production of vanillin and sinapic acid. It also finds applications in the medical field, in particular because of its antioxidant properties.
L'acide férulique ou l'acide sinapique est obtenu par biodégradation de biomasse lignocellulosique. Cependant, la quantité de produit obtenu par ce procédé est relativement faible et entraîne, par conséquent, un coût de production de ces produits au kilogramme particulièrement élevé. Ferulic acid or sinapic acid is obtained by biodegradation of lignocellulosic biomass. However, the amount of product obtained by this process is relatively small and therefore leads to a particularly high cost of producing these products per kilogram.
Il existe donc un réel besoin pour un procédé de biosynthèse permettant d'obtenir ce type de composés à moindre coûts. There is therefore a real need for a biosynthesis process which makes it possible to obtain this type of compound at a lower cost.
RESUME DE L'INVENTION Dans un premier aspect, la présente invention concerne un microorganisme recombinant comprenant (i) une séquence d'acide nucléique hétérologue codant pour une acyl- coenzyme A thioestérase et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une cinnamoyl-CoA réductase (CCR) et une séquence d'acide nucléique hétérologue codant pour une aldéhyde deshydrogénase (ALDH), de préférence comprenant une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase, et optionnellement une séquence d'acide nucléique hétérologue codant pour une cinnamoyl- CoA réductase (CCR) et une séquence d'acide nucléique hétérologue codant pour une aldéhyde deshydrogénase (ALDH). Le microorganisme est de préférence une bactérie, une levure ou un champignon, en particulier une levure, notamment une levure du genre Saccharomyces, et de manière plus particulièrement préférée Saccharomyces cerevisiae. SUMMARY OF THE INVENTION In a first aspect, the present invention relates to a recombinant microorganism comprising (i) a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a heterologous nucleic acid sequence encoding. for a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase (ALDH), preferably comprising a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, and optionally a sequence of heterologous nucleic acid encoding a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase (ALDH). The microorganism is preferably a bacterium, a yeast or a fungus, in particular a yeast, in particular a yeast of the genus Saccharomyces, and more particularly preferably Saccharomyces cerevisiae.
Le microorganisme recombinant selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase. De préférence, ladite acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase. En particulier ladite acyl-coenzyme A thioestérase peut comprendre une séquence choisie parmi les séquences SEQ. ID NOs : 1 et 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO :2 et présentant l'activité acyl- coenzyme A thioestérase. The recombinant microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase. Preferably, said acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequenced with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity. In particular, said acyl-coenzyme A thioesterase can comprise a sequence chosen from the sequences SEQ. ID NOs: 1 and 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting the activity acyl-coenzyme A thioesterase.
Alternativement ou cumulativement, le microorganisme recombinant selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH. De préférence, ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et/ou ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. Alternatively or cumulatively, the recombinant microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH. Preferably, said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and showing CCR activity; and / or said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
Le microorganisme recombinant selon l'invention peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), de préférence une Caféoyl-CoA O-Méthyltransférase (CCoAMT), de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 10 à 16, 40 et 41, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NOs : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CCoAMT ; et/ou une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité 4CL. The recombinant microorganism according to the invention may further comprise a heterologous nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT), preferably a Caféoyl-CoA O-Methyltransferase (CCoAMT), preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NOs: 10 to 16, 40 and 41, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly a CCoAMT comprising a sequence chosen from the sequences SEQ ID NOs: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CCoAMT activity; and / or a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NOs: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity.
Le microorganisme recombinant selon l'invention peut comprendre en outre une séquence d'acide nucléique hétérologue codant pour une enzyme ou un complexe enzymatique capable de convertir l'acide p-coumarique en acide caféique, de préférence The recombinant microorganism according to the invention may further comprise a heterologous nucleic acid sequence encoding an enzyme or an enzymatic complex capable of converting p-coumaric acid into caffeic acid, preferably
- une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase capable de convertir l'acide p-coumarique en acide caféique, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 25 et présentant une activité p-coumarate 3 hydroxylase ; et/ou - a heterologous nucleic acid sequence encoding a p-coumarate 3-hydroxylase capable of converting p-coumaric acid into caffeic acid, preferably comprising a sequence chosen from SEQ ID Nos: 25 and polypeptides comprising a sequence having at least minus 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 25 and exhibiting p-coumarate 3 hydroxylase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate (HPA) 3-monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQID NO : 17 et présentant une activité 4-hydroxyphénylacetate (HPA) 3-monooxygénase oxygénase, et une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate (HPA) 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate (HPA) 3-monooxygénase réductase. - a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate (HPA) 3-monooxygenase oxygenase, preferably comprising a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with the sequence SEQID NO: 17 and exhibiting 4-hydroxyphenylacetate (HPA) 3-monooxygenase oxygenase activity, and a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate (HPA) 3 - monooxygenase reductase, preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate (HPA) 3-monooxygenase reductase activity.
Optionnellement, le microorganisme recombinant selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une codant pour une cytochrome P450 réductase (CPR), de préférence comprenant une séquence choisie parmi SEQ ID Nos : 22 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 22 et présentant une activité cytochrome P450 réductase. Optionally, the recombinant microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a coding for a cytochrome P450 reductase (CPR), preferably comprising a sequence chosen from SEQ ID Nos: 22 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 22 and exhibiting cytochrome P450 reductase activity.
Le microorganisme recombinant selon l'invention peut également comprendre The recombinant microorganism according to the invention can also comprise
- une séquence d'acide nucléique hétérologue codant pour une tyrosine ammonia lyase (TAL), de préférence comprenant une séquence choisie parmi SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant une activité tyrosine ammonia lyase ; et/ou - a heterologous nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), preferably comprising a sequence chosen from SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 19 and exhibiting tyrosine ammonia lyase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4- hydroxylase (C4H), de préférence une phénylalanine ammonia lyase comprenant une séquence choisie parmi SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant une activité phénylalanine ammonia lyase, et une cinnamate 4- hydroxylase comprenant une séquence choisie parmi SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 21 et présentant une activité cinnamate 4- hydroxylase. Le microorganisme recombinant selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une phospho-2-déhydro-3- déoxyheptonate aldolase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine. Par ailleurs, dans ledit microorganisme, un gène endogène codant pour une phénylpyruvate décarboxylase et/ou un gène endogène codant pour une acide férulique décarboxylase peuvent être inactivés. a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably a phenylalanine ammonia lyase comprising a sequence chosen from SEQ ID NO : 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting phenylalanine ammonia lyase activity, and a cinnamate 4-hydroxylase comprising a sequence selected from SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with the sequence SEQ. ID NO: 21 and exhibiting cinnamate 4-hydroxylase activity. The recombinant microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a phospho-2-dehydro-3-deoxyheptonate aldolase resistant to feedback control by tyrosine and / or a heterologous nucleic acid sequence encoding a chorismate. mutase resistant to tyrosine feedback. Furthermore, in said microorganism, an endogenous gene encoding a phenylpyruvate decarboxylase and / or an endogenous gene encoding a ferulic acid decarboxylase can be inactivated.
Dans un second aspect, la présente invention concerne l'utilisation d'un microorganisme selon l'invention produire un acide carboxylique. De préférence, l'acide carboxylique est un composé formule (II) In a second aspect, the present invention relates to the use of a microorganism according to the invention for producing a carboxylic acid. Preferably, the carboxylic acid is a compound of formula (II)
(N) où (N) where
Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est choisi dans le groupe constitué d'un atome d'hydrogène et d'une chaîne hydrocarbonée comprenant de 1 à 36 atomes de carbone, ramifiée ou non ramifiée ; et R 1, R 2 and R 3 are selected, independently of each other, from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
R4 est choisi dans le groupe constitué de groupes alkyles en C1-C6 et de groupes alcènes en C1-C6, ramifiés ou non ramifiés, de préférence dans le groupe constitué de -(CH2)n-, - CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1, 2, 3, 4 et 5 et m, p et q sont des nombres entiers choisis parmi 1, 2 et 3. R 4 is selected from the group consisting of alkyl groups C 1 -C 6 alkyl and alkene groups of C 1 -C 6 alkyl, branched or unbranched, preferably from the group consisting of - (CH 2) n -, - CH = CH-, - (CH2) m- (CH = CH) p- (CH 2 ) q-, where n is an integer selected from 1, 2, 3, 4 and 5 and m, p and q are numbers integers chosen from 1, 2 and 3.
Elle concerne plus particulièrement l'utilisation d'un microorganisme recombinant selon l'invention pour produire un phénylpropanoïde choisi parmi l'acide férulique, l'acide sinapique, l'acide caféique et l'acide 5-hydroxyférulique. Le phénylpropanoïde est de préférence l'acide férulique ou l'acide sinapique, et de manière plus particulièrement préférée de l'acide férulique. Elle concerne également une méthode de production d'un acide carboxylique, comprenant la culture d'un microorganisme selon l'invention, et éventuellement la récolte et/ou la purification dudit acide carboxylique. De préférence, l'acide carboxylique est un composé formule (II) tel que défini ci-dessus. De préférence, l'acide carboxylique produit par le microorganisme selon l'invention est un phénylpropanoïde choisi parmi l'acide férulique, l'acide sinapique, l'acide caféique et l'acide 5-hydroxyférulique, de préférence choisi parmi l'acide férulique et l'acide sinapique, et de manière plus particulièrement préférée de l'acide férulique. DESCRIPTION DES FIGURES It relates more particularly to the use of a recombinant microorganism according to the invention for producing a phenylpropanoid chosen from ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid. The phenylpropanoid is preferably ferulic acid or sinapic acid, and more particularly preferably ferulic acid. It also relates to a method for the production of a carboxylic acid, comprising the culture of a microorganism according to the invention, and optionally the harvest and / or the purification of said carboxylic acid. Preferably, the carboxylic acid is a compound of formula (II) as defined above. Preferably, the carboxylic acid produced by the microorganism according to the invention is a phenylpropanoid chosen from ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid, preferably chosen from ferulic acid. and sinapic acid, and more particularly preferably ferulic acid. DESCRIPTION OF FIGURES
Figure 1 : représente la production d'acide férulique à partir d'acide caféique de levures exprimant la thioestérase de la SEQ ID NO : 1 (Thiol), la thioestérase de la SEQ ID NO : 2 (Thio3), ou la cinnamoyl-CoA réductase de la SEQ ID NO : 4 et l'aldéhyde deshydrogénase de la SEQ ID NO : 3 (CCR ALDH). Le contrôle négatif (0) n'exprime aucune de ces enzymes. Figure 2 : représente la production d'acide sinapique de la souche 367 exprimant la thioestérase de la SEQ ID NO : 2 (Thio3) et du contrôle négatif (0 : souche 617). Figure 1: represents the production of ferulic acid from caffeic acid of yeasts expressing the thioesterase of SEQ ID NO: 1 (Thiol), the thioesterase of SEQ ID NO: 2 (Thio3), or cinnamoyl-CoA reductase of SEQ ID NO: 4 and the aldehyde dehydrogenase of SEQ ID NO: 3 (CCR ALDH). The negative control (0) does not express any of these enzymes. FIG. 2: represents the production of sinapic acid of strain 367 expressing the thioesterase of SEQ ID NO: 2 (Thio3) and of the negative control (0: strain 617).
Figure 3 : représente la production d'acide sinapique de la souche 616 exprimant la cinnamoyl-CoA réductase de la SEQ ID NO : 4 et l'aldéhyde deshydrogénase de la SEQ ID NO : 3 (CCR ALDH) et du contrôle négatif (0 : souche 617). Figure 4 : représente la production d'acide férulique des souches 339 à 343, 345, 347, 367 à 371, 373, 375, 423 à 427, 429, 431, 451 à 455, 457 et 459 (CcoAMTl : SEQ ID NO : 10, CcoAMT2 : SEQ ID NO : 11, CcoAMT3 : SEQ ID NO : 12, CcoAMT4 : SEQ ID NO : 13, CcoAMT5 : SEQ ID NO : 14, CcoAMT6 : SEQ ID NO : 15, CcoAMT7 : SEQ ID NO : 16, 4CL1 : SEQ ID NO : 5, 4CL5 : SEQ ID NO : 6, 4CLA : SEQ ID NO : 8, 4CLB : SEQ ID NO : 9, Thio3 : SEQ ID NO : 2) et des contrôles négatifs (0 : souches 334, 335, 337 et 338), cultivés en présence d'acide caféique. Figure 3: represents the production of sinapic acid of strain 616 expressing the cinnamoyl-CoA reductase of SEQ ID NO: 4 and the aldehyde dehydrogenase of SEQ ID NO: 3 (CCR ALDH) and of the negative control (0: strain 617). Figure 4: represents the production of ferulic acid of strains 339 to 343, 345, 347, 367 to 371, 373, 375, 423 to 427, 429, 431, 451 to 455, 457 and 459 (CcoAMTl: SEQ ID NO: 10, CcoAMT2: SEQ ID NO: 11, CcoAMT3: SEQ ID NO: 12, CcoAMT4: SEQ ID NO: 13, CcoAMT5: SEQ ID NO: 14, CcoAMT6: SEQ ID NO: 15, CcoAMT7: SEQ ID NO: 16, 4CL1: SEQ ID NO: 5, 4CL5: SEQ ID NO: 6, 4CLA: SEQ ID NO: 8, 4CLB: SEQ ID NO: 9, Thio3: SEQ ID NO: 2) and negative controls (0: strains 334, 335, 337 and 338), grown in the presence of caffeic acid.
Figure 5 : représente la production d'acide sinapique des souches 339 à 343, 345, 347, 367 à 371, 373, 375, 395 à 399, 401, 403, 423 à 427, 429, 431, 451 à 455, 457 et 459 (CcoAMTl : SEQ ID NO : 10, CcoAMT2 : SEQ ID NO : 11, CcoAMT3 : SEQ ID NO : 12, CcoAMT4 : SEQ ID NO : 13, CcoAMT5 : SEQ ID NO : 14, CcoAMT6 : SEQ ID NO : 15, CcoAMT7 : SEQ ID NO : 16, 4CL1 : SEQ ID NO : 5, 4CL5 : SEQ ID NO : 6, 4CL7 : SEQ ID NO : 7, 4CLA : SEQ ID NO : 8, 4CLB : SEQ ID NO : 9, Thio3 : SEQ ID NO : 2) et des contrôles négatifs (0 : souches 334, 335, 336, 337 et 338), cultivés en présence d'acide 5-hydroxyférulique. Figure 5: represents the production of sinapic acid of strains 339 to 343, 345, 347, 367 to 371, 373, 375, 395 to 399, 401, 403, 423 to 427, 429, 431, 451 to 455, 457 and 459 (CcoAMT1: SEQ ID NO: 10, CcoAMT2: SEQ ID NO: 11, CcoAMT3: SEQ ID NO: 12, CcoAMT4: SEQ ID NO: 13, CcoAMT5: SEQ ID NO: 14, CcoAMT6: SEQ ID NO: 15, CcoAMT7: SEQ ID NO: 16, 4CL1: SEQ ID NO: 5, 4CL5: SEQ ID NO: 6, 4CL7: SEQ ID NO: 7, 4CLA: SEQ ID NO: 8, 4CLB: SEQ ID NO: 9, Thio3: SEQ ID NO: 2) and negative controls (0: strains 334, 335, 336, 337 and 338), cultured in the presence of 5-hydroxyferulic acid.
Figure 6 : représente la production d'acide férulique des souches 595, 596 et 597 cultivées en présence d'acide p-coumarique et du contrôle négatif (0 : souche 507). Figure 7 : représente la production d'acide férulique des souches 592, 593 et 594 cultivées en présence de glucose et du contrôle négatif (0 : souche 516). FIG. 6: represents the production of ferulic acid of strains 595, 596 and 597 cultivated in the presence of p-coumaric acid and of the negative control (0: strain 507). FIG. 7: represents the production of ferulic acid of strains 592, 593 and 594 cultivated in the presence of glucose and of the negative control (0: strain 516).
Figure 8 : représente une voie de biosynthèse de l'acide férulique à partir du glucose.Figure 8: represents a pathway for biosynthesis of ferulic acid from glucose.
Figure 9 : illustre les activités enzymatiques de l'acyl-coenzyme A thioestérase ou de la cinnamoyl-CoA réductase et l'aldéhyde deshydrogénase sur le féruloyl-Coa et le sinapoyl- CoA. Figure 9: illustrates the enzymatic activities of acyl-coenzyme A thioesterase or cinnamoyl-CoA reductase and aldehyde dehydrogenase on feruloyl-Coa and sinapoyl-CoA.
DESCRIPTION DETAILLEE DE L'INVENTION DETAILED DESCRIPTION OF THE INVENTION
Les voies de synthèses impliquant des composés liés à la coenzyme A (CoA) sont peu utilisées en biotechnologie. En effet, la difficulté à détecter et mesurer les quantités des intermédiaires de synthèse rend leurs manipulations délicates. Les inventeurs ont cependant exploré ces voies de biosynthèse et développé un microorganisme capable de produire des acides organiques via l'hydrolyse de thioesters de CoA tels que l'acide férulique ou l'acide sinapique. Outre des coûts réduits par rapport aux techniques de production actuelles, la méthode de production utilisant ce microorganisme présente également l'avantage de passer par des intermédiaires liés à la CoA et donc incapables de sortir des cellules. Cela permet donc une extraction plus facile et moins coûteuse des composés d'intérêt finaux. La méthode de production selon l'invention permet ainsi d'obtenir des phénylpropanoïdes biosourcés via un procédé de biosynthèse plus respectueux de l'environnement. Synthesis routes involving compounds linked to coenzyme A (CoA) are little used in biotechnology. Indeed, the difficulty in detecting and measuring the quantities of synthetic intermediates makes their handling difficult. The inventors have however explored these biosynthetic pathways and developed a microorganism capable of producing organic acids via the hydrolysis of CoA thioesters such as ferulic acid or sinapic acid. In addition to reduced costs compared to current production techniques, the production method using this microorganism also has the advantage of going through intermediates linked to CoA and therefore unable to leave the cells. This therefore allows easier and less expensive extraction of the final compounds of interest. The production method according to the invention thus makes it possible to obtain biobased phenylpropanoids via a biosynthesis process which is more respectful of the environment.
Définitions Definitions
Tel qu'utilisé ici, le terme « microorganisme » se réfère à un microorganisme procaryote ou eucaryote, en particulier une levure, un champignon ou une bactérie. Par « microorganisme recombinant » est entendu un microorganisme qui ne se trouve pas dans la nature et qui contient un génome modifié suite à une insertion, modification ou délétion d'un ou plusieurs éléments génétiques hétérologues. As used herein, the term "microorganism" refers to a prokaryotic or eukaryotic microorganism, in particular a yeast, a fungus or a bacterium. By “recombinant microorganism” is meant a microorganism which is not found in nature and which contains a genome modified following an insertion, modification or deletion of one or more heterologous genetic elements.
Par « acide nucléigue recombinant » est entendu un acide nucléique qui a été modifié et n'existe pas dans la nature. Par exemple, ce terme peut désigner une séquence codante ou un gène qui est lié de manière opérationnelle à un promoteur qui n'est pas le promoteur naturel. Cela peut également désigner une séquence codante dans laquelle les introns ont été supprimés pour des gènes comprenant des exons et des introns. By "recombinant nucleic acid" is meant a nucleic acid which has been modified and does not exist in nature. For example, this term can refer to a coding sequence or a gene which is operably linked to a promoter which is not the natural promoter. It can also refer to a coding sequence in which introns have been deleted for genes comprising exons and introns.
Par « hétérologue » est entendu une séquence d'acide nucléique ou une protéine qui n'est pas naturellement présente dans la cellule hôte et qui y a été introduite par génie génétique. La séquence hétérologue peut être présente dans la cellule sous forme épisomale ou chromosomique. L'origine de la séquence hétérologue peut être différente de la cellule dans laquelle elle est introduite. Cependant, elle peut également provenir de la même espèce que la cellule dans laquelle elle est introduite mais être considérée comme hétérologue en raison de son environnement qui n'est pas naturel. Par exemple, la séquence nucléique est hétérologue lorsqu'elle est sous le contrôle d'un promoteur autre que son promoteur naturel ou lorsqu'elle est introduite dans un endroit différent de celui où elle est située naturellement. La cellule hôte peut contenir une copie endogène de la séquence nucléique préalablement à l'introduction de la séquence nucléique hétérologue ou elle peut ne pas contenir de copie endogène. Par ailleurs, la séquence d'acide nucléique peut être hétérologue dans le sens où la séquence codante a été optimisée pour l'expression dans la cellule hôte, par exemple par optimisation de l'utilisation des codons. De manière préférée, dans le présent document, le terme « séquence d'acide nucléique hétérologue » se réfère à une séquence d'acide nucléique qui code pour une protéine qui est hétérologue à la cellule hôte, c'est-à-dire qui n'est pas naturellement présente dans la cellule hôte. Tel qu'utilisé ici, le terme « endogène », par rapport à la cellule hôte, se réfère à un élément génétique ou à une protéine naturellement présente dans ladite cellule. By “heterologous” is meant a nucleic acid sequence or a protein which is not naturally present in the host cell and which has been introduced therein by genetic engineering. The heterologous sequence can be present in the cell in episomal or chromosomal form. The origin of the heterologous sequence may be different of the cell in which it is introduced. However, it can also come from the same species as the cell into which it is introduced but be considered heterologous due to its environment which is not natural. For example, the nucleic acid sequence is heterologous when it is under the control of a promoter other than its natural promoter or when it is introduced in a place different from that where it is naturally located. The host cell may contain an endogenous copy of the nucleic acid sequence prior to the introduction of the heterologous nucleic acid sequence or it may not contain an endogenous copy. Furthermore, the nucleic acid sequence can be heterologous in the sense that the coding sequence has been optimized for expression in the host cell, for example by optimizing the use of codons. Preferably, in the present document, the term "heterologous nucleic acid sequence" refers to a nucleic acid sequence which encodes a protein which is heterologous to the host cell, i.e. which does not. is not naturally present in the host cell. As used herein, the term "endogenous", relative to the host cell, refers to a genetic element or protein naturally present in said cell.
Le terme « gène » ou « séquence codante » désigne tout acide nucléique codant pour une protéine. Le terme gène englobe l'ADN, comme l'ADNc (ADN complémentaire) ou l'ADNg (ADN génomique), ainsi que l'ARN. Le gène peut d'abord être préparé par des techniques recombinantes, enzymatiques et/ou chimiques, et ensuite répliqué dans une cellule hôte ou un système in vitro. Le gène comprend typiquement un cadre de lecture ouvert codant pour une protéine souhaitée. Le gène peut contenir des séquences supplémentaires telles qu'un terminateur de transcription ou un peptide signal. En raison de la dégénérescence du code génétique, plusieurs acides nucléiques peuvent coder un polypeptide particulier. Ainsi, les codons dans la séquence codante pour un polypeptide donné peuvent être modifiés de telle sorte que l'expression optimale dans une cellule particulière soit obtenue, par exemple en utilisant des tables de traduction de codon appropriées pour cette cellule. Les acides nucléiques peuvent également être optimisés selon une teneur en GC préférable pour ladite cellule et/ou pour réduire le nombre de séquences répétées. Dans certains modes de réalisation, les acides nucléiques hétérologues ont été optimisés par codon pour une expression dans la cellule hôte concernée. L'optimisation des codons peut être effectuée par des procédés de routine connus dans la technique (voir, par exemple, Welch, M., et al. (2011), Methods in Enzymology 498: 43-66). The term “gene” or “coding sequence” denotes any nucleic acid encoding a protein. The term gene encompasses DNA, such as cDNA (complementary DNA) or gDNA (genomic DNA), as well as RNA. The gene can first be prepared by recombinant, enzymatic and / or chemical techniques, and then replicated in a host cell or an in vitro system. The gene typically comprises an open reading frame encoding a desired protein. The gene may contain additional sequences such as a transcription terminator or a signal peptide. Due to the degeneration of the genetic code, several nucleic acids can encode a particular polypeptide. Thus, codons in the coding sequence for a given polypeptide can be modified such that optimal expression in a particular cell is obtained, for example by using codon translation tables appropriate for that cell. Nucleic acids can also be optimized to a preferable GC content for said cell and / or to reduce the number of repeat sequences. In some embodiments, the heterologous nucleic acids have been optimized by codon for expression in the host cell of interest. Optimization of codons can be accomplished by routine methods known in the art (see, e.g., Welch, M., et al. (2011), Methods in Enzymology 498: 43-66).
Le terme « lié de manière opérationnelle » désigne une configuration dans laquelle une séquence de contrôle est placée à une position appropriée par rapport à une séquence codante, de telle sorte que la séquence de contrôle dirige l'expression de la séquence codante. Le terme « séquences de contrôle » désigne les séquences d'acide nucléique nécessaires à l'expression d'un gène. Les séquences de contrôle peuvent être endogènes ou hétérologues. Des séquences de contrôle bien connues et actuellement utilisées par l'homme du métier seront préférées. De telles séquences de contrôle comprennent, mais sans s'y limiter, un leader, une séquence de polyadénylation, une séquence de propeptide, un promoteur, une séquence de peptide de signal et un terminateur de transcription. De préférence, les séquences de contrôle comprennent un promoteur et un terminateur de transcription. The term "operably linked" refers to a configuration in which a control sequence is placed at an appropriate position relative to a coding sequence, such that the control sequence directs expression of the coding sequence. The term “control sequences” denotes the nucleic acid sequences necessary for the expression of a gene. The control sequences can be endogenous or heterologous. Control sequences well known and currently used by those skilled in the art will be preferred. Such control sequences include, but are not limited to, a leader, a polyadenylation sequence, a propeptide sequence, a promoter, a signal peptide sequence and a transcription terminator. Preferably, the control sequences comprise a promoter and a transcription terminator.
Le terme « cassette d'expression » désigne une construction d'acide nucléique comprenant une région codante, c'est-à-dire un gène, et une région de régulation, c'est-à-dire comprenant une ou plusieurs séquences de contrôle, liées de manière opérationnelle. De préférence, les séquences de contrôle sont adaptées à la cellule hôte. The term “expression cassette” denotes a nucleic acid construct comprising a coding region, i.e. a gene, and a regulatory region, i.e. comprising one or more control sequences. , linked in an operational manner. Preferably, the control sequences are adapted to the host cell.
Tel qu'utilisé ici, le terme « vecteur d'expression » désigne une molécule d'ADN ou d'ARN qui comprend une cassette d'expression. De préférence, le vecteur d'expression est une molécule d'ADN double brin linéaire ou circulaire, de préférence linéaire. Le vecteur peut comprendre en outre une origine de réplication, un marqueur de sélection, etc. As used herein, the term "expression vector" refers to a DNA or RNA molecule which comprises an expression cassette. Preferably, the expression vector is a linear or circular, preferably linear, double stranded DNA molecule. The vector may further include an origin of replication, a selection marker, etc.
Par « pourcentage d'identité » entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Le meilleur alignement ou alignement optimal est l'alignement pour lequel le pourcentage d'identité entre les deux séquences à comparer, comme calculé ci-après, est le plus élevé. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement aux fins de la détermination du pourcentage d'identité de séquence d'acides aminés peut être réalisé de diverses façons qui sont bien connues dans le domaine, par exemple en utilisant des logiciels informatiques disponibles sur le Web sur Internet tels que http://www.clustal.org/omega/ ou http://www.ebi.ac.uk/Tools/emboss/. L'homme du métier peut déterminer les paramètres appropriés pour mesurer l'alignement, y compris tout algorithme nécessaire pour obtenir un alignement maximal sur toute la longueur des séquences comparées. Aux fins de la présente invention, les valeurs de pourcentage d'identité de séquence d'acides aminés se réfère à des valeurs générées à l'aide du programme d'alignement de séquence de paires EMBOSS Needle qui crée un alignement global optimal de deux séquences à l'aide de l'algorithme Needleman-Wunsch, dans lequel tous les paramètres de recherche sont définis par défaut Matrice de notation = BLOSUM62, Gap ouvert = 10, Gap extension = 0,5, pénalité d'intervalle d'extrémité = faux, intervalle d'extrémité ouvert = 10 et écart d'extrémité étendue = 0,5. Dans certains modes de réalisation, tous les pourcentages d'identité mentionnés dans cette demande peuvent être fixés à au moins 60%, au moins 70%, au moins 80%, au moins 85%, de préférence à au moins 90% d'identité, plus préférablement à au moins 95% d'identité. En particulier, sont considérés comme décrits les modes de réalisations dans lesquels tous les pourcentages d'identité de séquence des enzymes sont d'au moins 80% ou au moins 85%, de préférence d'au moins 90% ou au moins 95% d'identité de séquence. Dans un mode de réalisation, les polypeptides peuvent présenter 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ. ID Nos. En particulier, ces additions, substitutions ou délétions peuvent être introduites à l'extrémité N-terminale, C- terminale ou aux deux extrémités. Les polypeptides peuvent éventuellement se présenter sous forme de protéine de fusion. Dans le cas, le pourcentage d'identité n'est calculé que sur le domaine de la protéine de fusion présentant l'activité recherchée. Les termes « surexpression » et « augmentation d'expression » tels qu'utilisés ici, sont utilisés de manière interchangeable et signifient que l'expression d'une séquence codante ou d'une protéine est augmentée par rapport à la cellule hôte non modifiée, par exemple une cellule de type sauvage ou ne comprenant pas les modifications génétiques décrites ici. Par « sauvage » est entendu une cellule non-modifiée existant dans la nature. L'expression accrue d'une protéine est habituellement obtenue en augmentant l'expression du gène codant pour ladite protéine. Dans les modes de réalisation dans lesquels le gène ou la protéine n'est pas naturellement présent dans le microorganisme de l'invention, c'est- à-dire un gène ou une protéine hétérologue, les termes « surexpression » et « expression » peuvent être utilisés de manière interchangeable. Pour augmenter l'expression d'un gène, l'homme du métier peut utiliser toutes les techniques connues telles que l'augmentation du nombre de copies du gène dans la cellule, l'utilisation d'un promoteur induisant un niveau élevé d'expression du gène, c'est-à-dire un promoteur fort, l'utilisation d'éléments stabilisants TARN messager correspondant ou de séquences RBS (site de liaison de ribosome) particulières. En particulier, la surexpression peut être obtenue en augmentant le nombre de copies du gène dans la cellule. Une ou plusieurs copies du gène peuvent être introduites dans le génome par des procédés de recombinaison, connus de l'homme du métier, y compris le remplacement des gènes ou l'insertion multicopie. De préférence, une cassette d'expression comprenant le gène est intégrée au génome. En variante, le gène peut être porté par un vecteur d'expression, de préférence un plasmide, comprenant une cassette d'expression avec le gène d'intérêt placé de préférence sous le contrôle d'un promoteur adapté. Le vecteur d'expression peut être présent dans la cellule hôte en une ou plusieurs copies selon la nature de l'origine de réplication. La surexpression d'un gène peut également être obtenue en utilisant un promoteur induisant un niveau élevé d'expression du gène. Par exemple, le promoteur d'un gène endogène peut être remplacé par un promoteur plus fort, c'est-à-dire un promoteur induisant un niveau d'expression plus élevé. Le gène endogène sous le contrôle d'un promoteur qui n'est pas le promoteur naturel est qualifié d'acide nucléique hétérologue. Les promoteurs appropriés pour être utilisés dans la présente invention sont connus de l'homme du métier et peuvent être constitutifs ou inductibles, et être endogènes ou hétérologues. The term “percentage identity” between two nucleic acid or amino acid sequences within the meaning of the present invention is intended to denote a percentage of nucleotides or of identical amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed at random and over their entire length. The best alignment or optimal alignment is the alignment for which the percentage identity between the two sequences to be compared, as calculated below, is the highest. Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by comparison window to identify and compare the local regions of sequence similarity. Alignment for the purpose of determining percent amino acid sequence identity can be accomplished in various ways which are well known in the art, for example using computer software available on the web on the Internet such as http: //www.clustal.org/omega/ or http://www.ebi.ac.uk/Tools/emboss/. Those skilled in the art can determine the appropriate parameters for measuring alignment, including any algorithm necessary to achieve maximum alignment over the full length of the sequences being compared. For purposes of the present invention, percent amino acid sequence identity values refer to values generated using the EMBOSS Needle pair sequence alignment program which creates an optimal overall alignment of two sequences. using the Needleman-Wunsch algorithm, in which all search parameters are set by default Scoring Matrix = BLOSUM62, Open Gap = 10, Extension Gap = 0.5, End Gap Penalty = False, Open End Gap = 10, and Extended End Gap = 0.5. In some embodiments, all of the identity percentages mentioned in this application can be set at at least 60%, at least 70%, at least 80%, at least 85%, preferably at least 90% identity , more preferably at least 95% identity. In particular, embodiments in which all the percentages of sequence identity of the enzymes are at least 80% or at least 85%, preferably at least 90% or at least 95%, are considered as described. 'sequence identity. In one embodiment, the polypeptides may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions relative to the sequences described in SEQs. ID Nos. In particular, these additions, substitutions or deletions can be introduced at the N-terminus, C-terminus or at both ends. The polypeptides can optionally be in the form of a fusion protein. In this case, the percentage identity is calculated only on the domain of the fusion protein exhibiting the desired activity. The terms "overexpression" and "increased expression" as used herein are used interchangeably and mean that the expression of a coding sequence or protein is increased relative to the unmodified host cell, for example a wild-type cell or not comprising the genetic modifications described herein. By "wild" is meant an unmodified cell existing in nature. The increased expression of a protein is usually achieved by increasing the expression of the gene encoding said protein. In embodiments in which the gene or protein is not naturally present in the microorganism of the invention, i.e. a heterologous gene or protein, the terms "overexpression" and "expression" may be used interchangeably. To increase the expression of a gene, a person skilled in the art can use all the known techniques such as increasing the number of copies of the gene in the cell, the use of a promoter inducing a high level of expression. of the gene, i.e. a strong promoter, the use of corresponding messenger RNA stabilizing elements or specific RBS (ribosome binding site) sequences. In particular, overexpression can be achieved by increasing the number of copies of the gene in the cell. One or more copies of the gene can be introduced into the genome by recombination methods, known to those skilled in the art, including gene replacement or multicopy insertion. Preferably, an expression cassette comprising the gene is integrated into the genome. As a variant, the gene can be carried by an expression vector, preferably a plasmid, comprising an expression cassette with the gene of interest preferably placed under the control of a suitable promoter. The expression vector can be present in the host cell in one or more copies depending on the nature of the origin of replication. The overexpression of a gene can also be obtained by using a promoter inducing a high level of expression of the gene. For example, the promoter of an endogenous gene can be replaced by a stronger promoter, that is to say a promoter inducing a higher level of expression. The endogenous gene under the control of a promoter which is not the natural promoter is called heterologous nucleic acid. Promoters suitable for use in the present invention are known to those skilled in the art and can be constitutive or inducible, and be endogenous or heterologous.
Par « comprenant », est également décrit « consistant » ou « consistant essentiellement ». Ainsi, les modes de réalisation dans lesquels le terme « comprenant » est remplacé par le terme « consistant » ou « consistant essentiellement » sont également décrits dans ce document. Par « consistant essentiellement » est entendu que la séquence peut présenter 1, 2, 3, 4, 5, 6, 7, 8, 9 ou 10 additions, substitutions ou délétions par rapport aux séquences décrites dans les SEQ. ID Nos. By "comprising", is also described "consisting" or "consisting essentially". Thus, the embodiments in which the term "comprising" is replaced by the term "consisting" or "essentially consisting" are also described in this document. By "consisting essentially" is understood that the sequence may have 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 additions, substitutions or deletions with respect to the sequences described in SEQs. ID Nos.
Microorganismes Microorganisms
Le microorganisme selon la présente invention peut être un microorganisme eucaryote ou procaryote. The microorganism according to the present invention can be a eukaryotic or prokaryotic microorganism.
Selon un premier mode de réalisation, le microorganisme est un microorganisme eucaryote, de préférence choisi parmi les levures et les champignons. According to a first embodiment, the microorganism is a eukaryotic microorganism, preferably chosen from yeasts and fungi.
Selon un mode de réalisation préféré, le microorganisme est une levure, en particulier une levure de l'ordre des Saccharomycetales, Sporidiobolales et Schizosaccharomycetales. La levure peut par exemple être sélectionnée parmi les levures du genre Saccharomyces, Pichia, Kluyveromyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, Debaryomyces, Komagataella, Scheffersomyces, Torulaspora ou Zygosaccharomyces. En particulier, la levure peut être choisie parmi les espèces Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, Pichia pastoris, Kluyveromyces lactis, Kluyveromyces marxianus, Schizosaccharomyces pombe, Candida albicans, Candida tropicalis, Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii et Lipomyces starkeyi. Selon un mode de réalisation particulièrement préféré, le microorganisme est une levure appartenant au genre Saccharomyces, de préférence une levure choisie parmi les espèces Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis et Saccharomyces oviformis. De manière tout particulièrement préférée, le microorganisme est une levure de l'espèce Saccharomyces cerevisiae. According to a preferred embodiment, the microorganism is a yeast, in particular a yeast of the order Saccharomycetales, Sporidiobolales and Schizosaccharomycetales. The yeast can for example be selected from yeasts of the genus Saccharomyces, Pichia, Kluyveromyces, Schizosaccharomyces, Candida, Lipomyces, Rhodotorula, Rhodosporidium, Yarrowia, Debaryomyces, Komagataella, Scheffersomyces, Torulaspora or Zygosaccharomyces. In particular, the yeast can be chosen from the species Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis, Saccharomyces oviformis, Pichia pastoris, Kluyidaveromyces lactos, Candizaccharomyces pomeris, Candizomyces pessomyces, Candizomyces kluyveri. Rhodotorula glutinis, Rhodosporidium toruloides, Yarrowia lipolytica, Debaryomyces hansenii and Lipomyces starkeyi. According to a particularly preferred embodiment, the microorganism is a yeast belonging to the genus Saccharomyces, preferably a yeast chosen from the species Saccharomyces cerevisiae, Saccharomyces carlsbergensis, Saccharomyces diastaticus, Saccharomyces douglasii, Saccharomyces kluyveri, Saccharomyces norbensis and Saccharomyces oviformis. Very particularly preferably, the microorganism is a yeast of the species Saccharomyces cerevisiae.
De manière alternative, le microorganisme peut être un champignon, de préférence un champignon filamenteux, en particulier un champignon choisi parmi les champignons des genres Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus et Pyricularia. De manière plus particulièrement préférée, le champignon est choisi parmi Aspergillus nidulans, Aspergillus niger, Aspergillus awomari, Aspergillus oryzae, Aspergillus terreus, Neurospora crassa, Trichoderma reesei et Trichoderma viride. Alternatively, the microorganism may be a fungus, preferably a filamentous fungus, in particular a fungus chosen from among the fungi of genera Aspergillus, Trichoderma, Neurospora, Podospora, Endothia, Mucor, Cochiobolus and Pyricularia. More particularly preferably, the fungus is chosen from Aspergillus nidulans, Aspergillus niger, Aspergillus awomari, Aspergillus oryzae, Aspergillus terreus, Neurospora crassa, Trichoderma reesei and Trichoderma viride.
Selon un second mode de réalisation, le microorganisme est un microorganisme procaryote, de préférence une bactérie. En particulier, le microorganisme peut être une bactérie choisie parmi les bactéries des phyla Acidobacteria, Actinobacteria, Aguificae, Bacterioidetes, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Fibrobacteres, Firmicutes, Fusobacteria, Gemmatimonadetes, Nitrospirae, Planctomycetes, Proteobacteria, Spirochaetes, Thermodesulfobacteria, Thermomicrobia, Thermotogae, ou Verrucomicrobia. De manière préférée, la bactérie appartient au genre Acaryochloris, Acetobacter, Actinobacillus, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Anaerobiospirillum, Aguifex, Arthrobacter, Arthrospira, Azobacter, Bacillus, Brevibacterium, Burkholderia, Chlorobium, Chromatium, Chlorobaculum, Clostridium, Corynebacterium, Cupriavidus, Cyanothece, Enterobacter, Deinococcus, Erwinia, Escherichia, Geobacter, Gloeobacter, Gluconobacter, Hydrogenobacter, Klebsiella, Lactobacillus, Lactococcus, Mannheimia, Mesorhizobium, Methylobacterium, Microbacterium, Microcystis, Nitrobacter, Nitrosomonas, Nitrospina, Nitrospira, Nostoc, Phormidium, Prochlorococcus, Pseudomonas, Ralstonia, Rhizobium, Rhodobacter, Rhodococcus, Rhodopseudomonas, Rhodospirillum, Salmonella, Scenedesmun, Serratia, Shigella, Staphylococcus, Streptomyces, Synechoccus, Synechocystis, Thermosynechococcus, Trichodesmium ou Zymomonas. De manière encore préférée, la bactérie est choisie parmi les espèces Agrobacterium tumefaciens, Anaerobiospirillum succiniciproducens, Actinobacillus succinogenes, Aguifex aeolicus, Aguifex pyrophilus, Bacillus subtilis, Bacillus amyloliguefacines, Brevibacterium ammoniagenes, Brevibacterium immariophilum, Clostridium pasteurianum, Clostridium ljungdahlii, Clostridium acetobutylicum, Clostridium beigerinckii, Corynebacterium glutamicum, Cupriavidus necator, Cupriavidus metallidurans, Enterobacter sakazakii, Escherichia coli, Gluconobacter oxydons, Hydrogenobacter thermophilus, Klebsiella oxytoca, Lactococcus lactis, Lactobacillus plantarum, Mannheimia succiniciproducens, Mesorhizobium loti, Pseudomonas aeruginosa, Pseudomonas mevalonii, Pseudomonas pudica, Pseudomonas putida, Pseudomonas fluorescens, Rhizobium etli, Rhodobacter capsulatus, Rhodobacter sphaeroides, Rhodospirillum rubrum, Salmonella enterica, Salmonella typhi, Salmonella typhimurium, Shigella dysenteriae, Shigella flexneri, Shigella sonnei, Staphylococcus aureus, Streptomyces coelicolor, Zymomonas mobilis, Acaryochloris marina, Anabaena variabilis, Arthrospira platensis, Arthrospira maxima, Chlorobium tepidum, Chlorobaculum sp., Cyanothece sp., Gloeobacter violaceus, Microcystis aeruginosa, Nostoc punctiforme, Prochlorococcus marinus, Synechococcus elongatus, Synechocystis sp., Thermosynechococcus elongatus, Trichodesmium erythraeum et Rhodopseudomonas palustris. Selon un mode de réalisation particulier, le microorganisme est une bactérie Escherichia coli, par exemple choisie parmi E. coli BL21, E. coli BL21 (DE3), E. coli MG1655, E. coli W31 10 et leurs dérivés. Selon un mode de réalisation particulier alternatif, le microorganisme est une bactérie du genre Streptomyces, en particulier Streptomyces venezuelae. According to a second embodiment, the microorganism is a prokaryotic microorganism, preferably a bacterium. In particular, the microorganism may be a bacterium chosen from bacteria of the phyla Acidobacteria, Actinobacteria, Aguificae, Bacterioidetes, Chlamydiae, Chlorobi, Chloroflexi, Chrysiogenetes, Cyanobacteria, Deferribacteres, Deinococcus-Thermus, Dictyoglomi, Fusimoneitrobacteresitrobacteres, Fusimoneitrobacteres, oresitrobacteresira , Planctomycetes, Proteobacteria, Spirochaetes, Thermodesulfobacteria, Thermomicrobia, Thermotogae, or Verrucomicrobia. Preferably, the bacterium belongs to the genus Acaryochloris, Acetobacter, Actinobacillus, Agrobacterium, Alicyclobacillus, Anabaena, Anacystis, Anaerobiospirillum, Aguifex, Arthrobacter, Arthrospira, Azobacter, Bacillus, Brevibacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chrorybacterium, Burkholderia, Chlorobriobidium, Chromatis, , Cyanothece, Enterobacter, Deinococcus, Erwinia, Escherichia, Geobacter, Gloeobacter, Gluconobacter, Hydrogenobacter, Klebsiella, Lactobacillus, Lactococcus, Mannheimia, Mesorhizobium, Methylobacterium, Microbacterium, Microcystitrosidosporium, Nitrososporium, Nitrososporium, MicrocystitrosoPerosporium, Nitrosospiomonus, Nitrosomonus, Nitrosomona, Nitrocysti, N , Ralstonia, Rhizobium, Rhodobacter, Rhodococcus, Rhodopseudomonas, Rhodospirillum, Salmonella, Scenedesmun, Serratia, Shigella, Staphylococcus, Streptomyces, Synechoccus, Synechocystis, Thermosynechococcus, Trichodesmium or Zymomonas. Even more preferably, the bacterium is chosen from the species Agrobacterium tumefaciens, Anaerobiospirillum succiniciproducens, Actinobacillus succinogenes, Aguifex aeolicus, Aguifex pyrophilus, Bacillus subtilis, Bacillus amyloliguefacines, Brevibacterium ammoniagenes, Closumrevibickiidium, Ammonium, Closumidicidium, Brevibacterium ammoniagenes, Closumrevibickiidium, Closumidicidium, Bacillus amyloliguefacins, Brevibacterium ammoniagenes, Closumidicidium, Brevibacterium ammoniagenes, Closumidicidium, Brevibacterium, Clostricidium, Closumidium, Bacillus amyloliguefacins, Brevibacterium. , Corynebacterium glutamicum, Cupriavidus necator, Cupriavidus metallidurans, Enterobacter sakazakii, E. coli, Gluconobacter oxydans, Hydrogenobacter thermophilus, Klebsiella oxytoca, Lactococcus lactis, Lactobacillus plantarum, Mannheimia succiniciproducens, Mesorhizobium loti, Pseudomonas aeruginosa, Pseudomonas mevalonii, Pseudomonas pudica, Pseudomonas putida, Pseudomonas fluorescens, Rhizobium etli, Rhodobacter capsulatus, Rhodobacter sphaeroides, Rhodospirillum rubrum, Salmonella enterica, Salmonella typhi, Salmonella typhimurium, Shigella dysenteriae, Shigella flexn eri, Shigella sonnei, Staphylococcus aureus, Streptomyces coelicolor, Zymomonas mobilis, Acaryochloris marina, Anabaena variabilis, Arthrospira platensis, Arthrospira maxima, Chlorobium tepidum, Chlorobaculum sp., Cyanothece sp., Gloeobaculumus marinoschlorosis aereus, Gloeocystus, Synocystugus aereus sp., Gloeobocystus, Synocystugus aereus sp. elongatus, Synechocystis sp., Thermosynechococcus elongatus, Trichodesmium erythraeum and Rhodopseudomonas palustris. According to a particular embodiment, the microorganism is an Escherichia coli bacterium, for example chosen from E. coli BL21, E. coli BL21 (DE3), E. coli MG1655, E. coli W31 and their derivatives. According to a particular alternative embodiment, the microorganism is a bacterium of the genus Streptomyces, in particular Streptomyces venezuelae.
Selon un mode de réalisation préféré, le microorganisme est une levure, une bactérie ou un champignon, de préférence une levure ou une bactérie. According to a preferred embodiment, the microorganism is a yeast, a bacterium or a fungus, preferably a yeast or a bacterium.
Selon un mode de réalisation préféré entre tous, le microorganisme est une levure, de préférence une levure appartenant au genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae. According to a most preferred embodiment, the microorganism is a yeast, preferably a yeast belonging to the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae.
Production d'un acide carboxylique à partir d'un carboxyl-CoA Production of a carboxylic acid from a carboxyl-CoA
Grâce à la fonction thiol de la cystéamine, la coenzyme A est capable de former avec les fonctions carboxyles de certains composés, tels que l'acide caféique ou l'acide 5- hydroxyférulique, des thioesters appelés carboxyl-CoA. Thanks to the thiol function of cysteamine, coenzyme A is capable of forming, with the carboxyl functions of certain compounds, such as caffeic acid or 5-hydroxyferulic acid, thioesters called carboxyl-CoA.
Tel qu'utilisé ici, le terme « carboxyl-CoA » se réfère à un thioester de coenzyme A dans lequel l'hydrolyse de la liaison thioester génère un groupe carboxyle. De préférence, ce terme se réfère à un composé de formule (I) (I) où As used herein, the term "carboxyl-CoA" refers to a thioester of coenzyme A in which hydrolysis of the thioester bond generates a carboxyl group. Preferably, this term refers to a compound of formula (I) (I) where
Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est choisi dans le groupe constitué d'un atome d'hydrogène et d'une chaîne hydrocarbonée comprenant de 1 à 36 atomes de carbone, ramifiée ou non ramifiée ; et R 1, R 2 and R 3 are independently selected from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and d a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
R4 est choisi dans le groupe constitué de groupes alkyles en C1-C6 et de groupes alcènes en C1-C6, ramifiés ou non ramifiés, de préférence dans le groupe constitué de -(CH2)n-, - CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1, 2, 3, 4 et 5 et m, p et q sont des nombres entiers choisis parmi 1, 2 et 3. De préférence, Rs est choisi dans le groupe constitué d'un atome d'hydrogène, de groupes alkyles en C1-C6 ramifiés ou non ramifiés et de groupes alcènes en C1-C6 ramifiés ou non ramifiés. De manière plus particulièrement préférée, Rs est choisi dans le groupe constitué d'un atome d'hydrogène et d'un groupe méthyle. R4 is selected from the group consisting of C1-C6 alkyl groups and C1-C6 alken groups, branched or unbranched, preferably from the group consisting of - (CH2) n -, - CH = CH-, - ( CH2) m- (CH = CH) p- (CH 2 ) q-, where n is an integer selected from 1, 2, 3, 4 and 5 and m, p and q are integers selected from 1, 2 and 3. Preferably, Rs is selected from the group consisting of hydrogen, alkyl C 1 -C 6 branched or unbranched alkenes and groups C 1 -C 6 branched or unbranched. More particularly preferably, Rs is chosen from the group consisting of a hydrogen atom and a methyl group.
Selon un mode de réalisation particulier, According to a particular embodiment,
- Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-Rs, où Rs est un groupe méthyle, et - Ri, R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-Rs group, where Rs is a methyl group, and
- R4 est choisi dans le groupe constitué de -(CH2)n-, -CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1 ou 2 et m, p et q sont des nombres entiers choisis parmi 1 ou 2. - R 4 is selected from the group consisting of - (CH 2 ) n -, -CH = CH-, - (CH 2 ) m- (CH = CH) p - (CH 2 ) q -, where n is a number integer chosen from 1 or 2 and m, p and q are integers chosen from 1 or 2.
Selon un autre mode de réalisation particulier, According to another particular embodiment,
- Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-Rs, où Rs est un groupe méthyle, et - Ri, R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-Rs group, where Rs is a methyl group, and
- R4 est -CH2-CH=CH-CH2-. - R 4 is -CH 2 -CH = CH-CH 2 -.
De manière préférée, le terme « carboxyl-CoA » se réfère au caféoyl-CoA, féruloyl-CoA, sinapoyl-CoA et/ou 5-hydroxyféruloyl-CoA. Preferably, the term “carboxyl-CoA” refers to caféoyl-CoA, feruloyl-CoA, sinapoyl-CoA and / or 5-hydroxyferuloyl-CoA.
De manière tout particulièrement préférée, ce terme se réfère au féruloyl-CoA et/ou au sinapoyl-CoA. Very particularly preferably, this term refers to feruloyl-CoA and / or sinapoyl-CoA.
Le microorganisme recombinant selon la présente invention est génétiquement modifié pour produire un acide carboxylique à partir d'un carboxyl-CoA. Ce microorganisme est notamment capable de produire des phénylpropanoïdes tels que l'acide férulique, l'acide sinapique, l'acide caféique et l'acide 5-hydroxyférulique, à partir de molécules couplées au CoA telles que le féruloyl-CoA, le sinapoyl-CoA, le caféoyl-CoA et le 5-hydroxyféruloyl-CoA (cf. Figures 8 et 9). En particulier, ce microorganisme est capable de produire de l'acide férulique à partir de féruloyl-CoA, de l'acide sinapique à partir de sinapoyl-CoA, de l'acide caféique à partir de caféoyl-CoA et de l'acide 5-hydroxyférulique à partir de 5- hydroxyféruloyl-CoA. The recombinant microorganism according to the present invention is genetically modified to produce a carboxylic acid from a carboxyl-CoA. This microorganism is in particular capable of producing phenylpropanoids such as ferulic acid, sinapic acid, caffeic acid and 5-hydroxyferulic acid, from molecules coupled to CoA such as feruloyl-CoA, sinapoyl- CoA, caféoyl-CoA and 5-hydroxyferuloyl-CoA (cf. Figures 8 and 9). In particular, this microorganism is able to produce ferulic acid from feruloyl-CoA, sinapic acid from sinapoyl-CoA, caffeic acid from caffeoyl-CoA and acid 5 -hydroxyferulic from 5- hydroxyferuloyl-CoA.
Chez les plantes, l'hydrolyse d'un composé couplé au CoA est décrite lors de la synthèse de lignine. Ce type d'hydrolyse est réalisé en 2 étapes. La première étape consiste en la libération du substrat sous sa forme aldéhyde. La seconde consiste en l'oxydation du composé aldéhyde vers sa forme acide (Fraser et Chappel, Arabidopsis Book. 2011;9:e0152). Certaines plantes telles que Pétunia hybrida ou Curcuma longa L, semblent également capables d'hydrolyser directement les phénylpropanoyl-CoA via des thioestérases qui catalysent l'hydrolyse d'une liaison thioester en libérant un acide carboxylique et un groupement thiol (Adebesin et al, Plant J. 2018 january; 93: 905-916 ; Ramirez-Ahumada et al, Phytochemistry. 2006 Sep;67(18):2017-29) et qui sont surtout décrites dans la voie de biosynthèse des acides gras. In plants, the hydrolysis of a compound coupled to CoA is described during the synthesis of lignin. This type of hydrolysis is carried out in 2 stages. The first step consists of the release of the substrate in its aldehyde form. The second consists of the oxidation of the aldehyde compound to its acid form (Fraser and Chappel, Arabidopsis Book. 2011; 9: e0152). Certain plants, such as Petunia hybrida or Curcuma longa L, also seem capable of directly hydrolyzing phenylpropanoyl-CoA via thioesterases which catalyze the hydrolysis of a thioester bond by releasing a carboxylic acid and a thiol group (Adebesin et al, Plant J. 2018 January; 93: 905-916; Ramirez-Ahumada et al, Phytochemistry. 2006 Sep; 67 (18): 2017-29) and which are mainly described in the fatty acid biosynthesis pathway.
Les inventeurs ont ici démontré de manière surprenante que ces deux types de mécanismes pouvaient être utilisés dans un microorganisme, et en particulier dans une levure, pour produire des acides carboxyliques, et en particulier des phénylpropanoïdes. Le microorganisme selon l'invention peut ainsi exprimer une acyl-coenzyme A thioestérase hétérologue et/ou exprimer une cinnamoyl-CoA réductase (CCR) et une aldéhyde deshydrogénase (ALDH). The inventors have surprisingly demonstrated here that these two types of mechanisms could be used in a microorganism, and in particular in a yeast, to produce carboxylic acids, and in particular phenylpropanoids. The microorganism according to the invention can thus express a heterologous acyl-coenzyme A thioesterase and / or express a cinnamoyl-CoA reductase (CCR) and an aldehyde dehydrogenase (ALDH).
Selon un mode de réalisation préféré, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase.According to a preferred embodiment, the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase.
Tel qu'utilisé ici, le terme « acyl-coenzyme A thioestérase » ou « Thio » se réfère à une enzyme douée d'une activité acyl-coenzyme A thioestérase, c'est-à-dire une enzyme capable d'hydrolyser la liaison ester d'un carboxyl-CoA et ainsi de libérer d'une part la CoA et d'autre part un acide carboxylique (cf. Figure 9). Ce terme se réfère notamment à une enzyme capable d'hydrolyser la liaison thioester du féruloyl-CoA et ainsi de produire de l'acide férulique et/ou d'hydrolyser la liaison thioester du sinapoyl-CoA et ainsi de produire de l'acide sinapique, et/ou d'hydrolyser la liaison thioester du caféoyl-CoA et ainsi de produire de l'acide caféique et/ou d'hydrolyser la liaison thioester du 5-hydroxyféruloyl-CoA et ainsi de produire de l'acide 5-hydroxyférulique. De préférence, ce terme se réfère à une enzyme capable d'hydrolyser la liaison thioester du féruloyl-CoA et ainsi de produire de l'acide férulique et/ou d'hydrolyser la liaison thioester du sinapoyl-CoA et ainsi de produire de l'acide sinapique. As used herein, the term "acyl-coenzyme A thioesterase" or "Thio" refers to an enzyme endowed with acyl-coenzyme A thioesterase activity, i.e. an enzyme capable of hydrolyzing the bond. ester of a carboxyl-CoA and thus liberate on the one hand the CoA and on the other hand a carboxylic acid (cf. FIG. 9). This term refers in particular to an enzyme capable of hydrolyzing the thioester bond of feruloyl-CoA and thus of producing ferulic acid and / or of hydrolyzing the thioester bond of sinapoyl-CoA and thus of producing sinapic acid. , and / or hydrolyzing the thioester bond of caffeoyl-CoA and thus producing caffeic acid and / or hydrolyzing the thioester bond of 5-hydroxyferuloyl-CoA and thus producing 5-hydroxyferulic acid. Preferably, this term refers to an enzyme capable of hydrolyzing the thioester bond of feruloyl-CoA and thus of producing ferulic acid and / or of hydrolyzing the thioester bond of sinapoyl-CoA and thus of producing l '. sinapic acid.
La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité acyl-coenzyme A thioestérase peut être détectée in vitro, par exemple comme décrit dans l'article de Adebesin et al. (Plant J. 2018 Mar;93(5):905- 916). En particulier, pour déterminer s'il y a une activité acyl-coA thioestérase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (acyl-CoA thioestérase putative), et d'un substrat carboxyl-CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide carboxylique obtenu par hydrolyse de la liaison ester du substrat carboxyl-CoA peut être est observée soit au spectrophotomètre UV à une longueur d'onde donnée, soit par HPLC. L'activité acyl-coenzyme A thioestérase peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité acyl-coenzyme A thioestérase peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le carboxyl-CoA substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'acide carboxylique produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. En particulier, l'activité acyl-coenzyme A thioestérase peut être détectée par la production d'acide férulique en présence de féruloyl-CoA, la production d'acide sinapique en présence de sinapoyl-CoA, la production d'acide caféique en présence de caféoyl-CoA et/ou la production d'acide 5-hydroxyférulique en présence de 5-hydroxyféruloyl-CoA. De manière particulièrement préférée, l'activité acyl-coenzyme A thioestérase peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester et capable de convertir l'acide caféique en féruloyl-CoA et/ou de convertir l'acide 5-hydroxyférulique en sinapoyl- CoA. L'activité acyl-coenzyme A thioestérase est alors détectée par la production d'acide férulique et/ou d'acide sinapique en présence d'acide caféique ou d'acide 5- hydroxyférulique, de préférence par une technique d'HPLC. The detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. The acyl-coenzyme A thioesterase activity can be detected in vitro, for example as described in the article by Adebesin et al. (Plant J. 2018 Mar; 93 (5): 905-916). In particular, to determine whether there is acyl-coA thioesterase activity, an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative acyl-CoA thioesterase), and a carboxyl-CoA substrate under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of the carboxylic acid obtained by hydrolysis of the ester bond of the carboxyl-CoA substrate can be observed either with a UV spectrophotometer at a given wavelength, or by HPLC. The acyl-coenzyme A thioesterase activity can also be detected in vivo, in particular by using the method described in the experimental part below. In particular, the acyl-coenzyme A thioesterase activity can be detected in vivo using a microorganism expressing the enzyme to be tested. The carboxyl-CoA substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium. The carboxylic acid produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique. Specifically, acyl-coenzyme A thioesterase activity can be detected by production of ferulic acid in the presence of feruloyl-CoA, production of sinapic acid in the presence of sinapoyl-CoA, production of caffeic acid in the presence of caffeoyl-CoA and / or the production of 5-hydroxyferulic acid in the presence of 5-hydroxyferuloyl-CoA. Particularly preferably, the acyl-coenzyme A thioesterase activity can be detected in vivo using a microorganism expressing the enzyme to be tested and capable of converting caffeic acid into feruloyl-CoA and / or of converting 5- acid. hydroxyferulic to sinapoyl-CoA. The acyl-coenzyme A thioesterase activity is then detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
L'acyl-coenzyme A thioestérase peut être une enzyme de plante, de préférence une enzyme de plantes du genre Pétunia, Oryza, Arabidopsis, Capsella, Camélia, brassica, Raphanus ou Nicotiana, en particulier Pétunia hybrida, Oryza meyeriana (en particulier Oryza meyeriana var. granulata) Arabidopsis thaliana, Capsella ru bel la , Camélia sativa, brassica rapa, Raphanus sativus ou Nicotiana tabacum. L'acyl-coenzyme A thioestérase peut aussi être une enzyme de plantes du genre Pétunia, Arabidopsis, Capsella, Camélia, brassica, Raphanus ou Nicotiana, en particulier Pétunia hybrida, Arabidopsis thaliana, Capsella rubella , Camélia sativa, brassica rapa, Raphanus sativus ou Nicotiana tabacum. The acyl-coenzyme A thioesterase can be a plant enzyme, preferably an enzyme from plants of the genus Petunia, Oryza, Arabidopsis, Capsella, Camellia, brassica, Raphanus or Nicotiana, in particular Petunia hybrida, Oryza meyeriana (in particular Oryza meyeriana var. granulata) Arabidopsis thaliana, Capsella ru bel la, Camellia sativa, brassica rapa, Raphanus sativus or Nicotiana tabacum. The acyl-coenzyme A thioesterase can also be an enzyme of plants of the genus Petunia, Arabidopsis, Capsella, Camellia, brassica, Raphanus or Nicotiana, in particular Petunia hybrida, Arabidopsis thaliana, Capsella rubella, Camellia sativa, brassica rapa, Raphanus sativus or Nicotiana tabacum.
De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple par une levure du genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae. Dans certains modes de réalisation, l'enzyme correspond à l'enzyme endogène du microorganisme. Dans ces cas, l'enzyme peut être surexprimée, par exemple en remplaçant le promoteur endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copie du gène. De manière plus particulièrement préférée, l'acyl-coenzyme A thioestérase est une enzyme de plante, en particulier de Pétunia hybrida, d'Oryza meyeriana (en particulier Oryza meyeriana var. granulata) ou d 'Arabidopsis thaliana, plus particulièrement de Pétunia hybrida ou d 'Arabidopsis thaliana. L'acyl-coenzyme A thioestérase peut être une enzyme d 'Arabidopsis thaliana, en particulier la thioestérase décrite dans la SEQ ID NO : 1. Alternativement, l'acyl-coenzyme A thioestérase peut être une enzyme de Pétunia hybrida, en particulier la thioestérase décrite dans la SEQ. ID NO : 2. Alternativement, l'acyl- coenzyme A thioestérase peut être une enzyme de d'Oryza meyeriana (en particulier Oryza meyeriana var. granulata) en particulier la thioestérase décrite dans la SEQ ID NO : 39.Alternatively, this enzyme can be an enzyme produced by a microorganism, for example by a yeast of the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae. In some embodiments, the enzyme corresponds to the endogenous enzyme of the microorganism. In these cases, the enzyme can be overexpressed, for example by replacing the endogenous promoter with a strong heterologous promoter and / or by increasing the number of copies of the gene. More particularly preferably, the acyl-coenzyme A thioesterase is a plant enzyme, in particular of Petunia hybrida, of Oryza meyeriana (in particular Oryza meyeriana var. Granulata) or of Arabidopsis thaliana, more particularly of Petunia hybrida or of Arabidopsis thaliana. The acyl-coenzyme A thioesterase can be an enzyme from Arabidopsis thaliana, in particular the thioesterase described in SEQ ID NO: 1. Alternatively, the acyl-coenzyme A thioesterase can be an enzyme from Petunia hybrida, in particular thioesterase. described in SEQ. ID NO: 2. Alternatively, the acyl-coenzyme A thioesterase can be an enzyme from Oryza meyeriana (in particular Oryza meyeriana var. Granulata) in particular the thioesterase described in SEQ ID NO: 39.
Selon un mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase. Selon un mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase. Selon un autre mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi la séquence SEQ. ID NO : 1 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 1 et présentant l'activité acyl-coenzyme A thioestérase. According to a particular embodiment, the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity. According to a particular embodiment, the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% d sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity. According to another particular embodiment, the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ. ID NO: 1 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 1 and exhibiting acyl-coenzyme A thioesterase activity.
Selon un autre mode de réalisation particulier, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi la séquence SEQ ID NO : 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 39 et présentant l'activité acyl-coenzyme A thioestérase. According to another particular embodiment, the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ ID NO: 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 39 and exhibiting acyl-coenzyme A thioesterase activity.
Selon un mode de réalisation préféré, l'acyl-coenzyme A thioestérase comprend une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase. According to a preferred embodiment, the acyl-coenzyme A thioesterase comprises a sequence chosen from the sequence SEQ ID NO: 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity.
Selon un autre mode de réalisation, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une cinnamoyl-CoA réductase (CCR) et une séquence d'acide nucléique hétérologue codant pour une aldéhyde deshydrogénase (ALDH). According to another embodiment, the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a heterologous nucleic acid sequence encoding an aldehyde dehydrogenase (ALDH).
La CCR catalyse la réduction des carboxyl-CoA telles que le féruloyl-CoA et le sinapoyl-CoA, formant ainsi des aldéhyldes tels que le coniféraldéhyde et le sinapaldéhyde. l'ALDH catalyse ensuite l'oxydation des aldéhydes ainsi formés en acides carboxyliques tels que l'acide férulique et l'acide sinapique. Tel qu'utilisé ici, le terme « cinnamoyl-CoA réductase » ou « CCR » se réfère à une enzyme appartenant à la classe EC 1.2.1.44 et qui catalyse la réduction d'un cinnamoyl-CoA substitué, par exemple le féruloyl-CoA ou le sinapoyl-CoA, en un cinnamalhéhyde correspondant, par exemple le coniféraldéhyde ou le sinapaldéhyde. De préférence, ce terme se réfère à une enzyme qui catalyse la réduction du féruloyl-CoA en coniféraldéhyde et/ou du sinapoyl-CoA en sinapaldéhyde. CCR catalyzes the reduction of carboxyl-CoA such as feruloyl-CoA and sinapoyl-CoA, thereby forming aldehydes such as coniferaldehyde and sinapaldehyde. ALDH then catalyzes the oxidation of the aldehydes thus formed into carboxylic acids such as ferulic acid and sinapic acid. As used herein, the term "cinnamoyl-CoA reductase" or "CCR" refers to an enzyme belonging to the EC class 1.2.1.44 and which catalyzes the reduction of a substituted cinnamoyl-CoA, for example feruloyl-CoA. or sinapoyl-CoA, to a corresponding cinnamalhyde, for example coniferaldehyde or sinapaldehyde. Preferably, this term refers to an enzyme which catalyzes the reduction of feruloyl-CoA to coniferaldehyde and / or of sinapoyl-CoA to sinapaldehyde.
La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité CCR peut être détectée in vitro, par exemple comme décrit dans l'article de Chao et al. (Planta. 2017 Jan;245(l):61-75) En particulier, pour déterminer s'il y a une activité Cinnamoyl-CoA réductase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (CCR putative), d'un substrat carboxyl-CoA et de NADPH dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la forme aldéhyde peut être est observée, soit au spectrophotomètre UV avec une longueur d'onde donnée, soit par HPLC. L'activité CCR peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité CCR peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le carboxyl-CoA substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'aldéhyde produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité CCR peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide caféique en féruloyl-CoA et/ou l'acide 5-hydroxyférulique en sinapoyl-CoA et capable de convertir le coniféraldéhyde en acide férulique et/ou le sinapaldéhyde en acide sinapique, c'est-à-dire exprimant une enzyme ALDH telle que définie ci-après. L'activité CCR est détectée par la production d'acide férulique et/ou d'acide sinapique en présence d'acide caféique ou d'acide 5-hydroxyférulique, de préférence par une technique d'HPLC. La CCR peut être une enzyme de plante, de préférence du genre Populus, Arabidopsis, Oryza, Zea, Medicago ou Sorghum, en particulier Populus tomentosa, Arabidopsis thaliana, Oryza sativa, Zea Mays, Medicago truncatula ou Sorghum bicolor. De préférence, la CCR est une enzyme de Populus tomentosa, en particulier la CCR décrite dans la SEQ ID NO : 4.The detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. CCR activity can be detected in vitro, for example as described in the article by Chao et al. (Planta. 2017 Jan; 245 (l): 61-75) In particular, to determine if there is Cinnamoyl-CoA reductase activity, an enzymatic test can be performed and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative CCR), a carboxyl-CoA substrate and NADPH under optimal conditions (pH, temperature, ions, etc.). After some incubation time, the appearance of the form aldehyde can be is observed, either by UV spectrophotometer with a given wavelength, or by HPLC. The CCR activity can also be detected in vivo, in particular by using the method described in the experimental part below. In particular, CCR activity can be detected in vivo using a microorganism expressing the enzyme to be tested. The carboxyl-CoA substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium. The aldehyde produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique. Particularly preferably, the CCR activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid into feruloyl-CoA and / or 5-hydroxyferulic acid into sinapoyl-CoA and capable of converting coniferaldehyde into ferulic acid and / or sinapaldehyde into sinapic acid, that is to say expressing an ALDH enzyme as defined below. CCR activity is detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique. CCR can be a plant enzyme, preferably of the genus Populus, Arabidopsis, Oryza, Zea, Medicago or Sorghum, in particular Populus tomentosa, Arabidopsis thaliana, Oryza sativa, Zea Mays, Medicago truncatula or Sorghum bicolor. Preferably, CCR is an enzyme from Populus tomentosa, in particular CCR described in SEQ ID NO: 4.
Selon un mode de réalisation préféré, la CCR comprend une séquence choisie parmi la séquence SEQ. ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR. According to a preferred embodiment, the CCR comprises a sequence chosen from the sequence SEQ. ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting CCR activity.
Tel qu'utilisé ici, le terme « aldéhyde déshydrogénase» ou « ALDH » se réfère à une enzyme appartenant à la classe EC 1.2.1.3 et qui catalyse l'oxydation d'un aldéhyde, par exemple le coniféraldéhyde ou le sinapaldéhyde, en acide carboxylique, par exemple en acide férulique ou acide sinapique. De préférence, ce terme se réfère à une enzyme qui catalyse l'oxydation du coniféraldéhyde en acide férulique et/ou l'oxydation du sinapaldéhyde en acide sinapique. As used herein, the term "aldehyde dehydrogenase" or "ALDH" refers to an enzyme belonging to class EC 1.2.1.3 and which catalyzes the oxidation of an aldehyde, for example coniferaldehyde or sinapaldehyde, to acid. carboxylic acid, for example ferulic acid or sinapic acid. Preferably, this term refers to an enzyme which catalyzes the oxidation of coniferaldehyde to ferulic acid and / or the oxidation of sinapaldehyde to sinapic acid.
La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité ALDH peut être détectée in vitro par exemple en utilisant un kit de test in vitro disponible dans le commerce. En particulier, pour déterminer s'il y a une activité aldéhyde déshydrogénase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (ALDH putative), d'un aldéhyde et de NAD dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de la forme acide et du NADH peut être est observée soit au spectrophotomètre UV à 450nm ou par HPLC. L'activité ALDH peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité ALDH peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. L'aldéhyde substrat de ladite enzyme est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. L'acide carboxylique produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité ALDH peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide caféique en féruloyl-CoA et/ou l'acide 5-hydroxyférulique en sinapoyl-CoA et capable de convertir le féruloyl-CoA en coniféraldéhyde et/ou le sinapoyl-CoA en sinapaldéhyde, c'est-à-dire exprimant une enzyme CCR telle que définie ci-dessus. L'activité ALDH est détectée par la production d'acide férulique et/ou d'acide sinapique en présence d'acide caféique ou d'acide 5-hydroxyférulique, de préférence par une technique d'HPLC. The detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. ALDH activity can be detected in vitro for example using a commercially available in vitro test kit. In particular, to determine if there is aldehyde dehydrogenase activity, an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative ALDH), an aldehyde and of NAD under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of the acid form and of NADH can be observed either by UV spectrophotometer at 450 nm or by HPLC. The ALDH activity can also be detected in vivo, in particular by using the method described in the experimental part below. In particular, ALDH activity can be detected in vivo using a microorganism expressing the enzyme to be tested. The aldehyde substrate of said enzyme is either synthesized by the microorganism or brought into the culture medium. The carboxylic acid produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique. Particularly preferably, the ALDH activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid into feruloyl-CoA and / or 5-hydroxyferulic acid into sinapoyl-CoA and capable of converting feruloyl-CoA into coniferaldehyde and / or sinapoyl-CoA into sinapaldehyde, that is to say expressing a CCR enzyme as defined above. The ALDH activity is detected by the production of ferulic acid and / or sinapic acid in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
L'ALDH peut être une enzyme de plante, de préférence du genre Arabidopsis, Populus, Oryza, Zea, Medicago ou Sorghum , en particulier Arabidopsis thaliana , Populus tomentosa, Oryza sativa, Zea Mays, Medicago truncatula ou Sorghum bicolor. The ALDH can be a plant enzyme, preferably of the genus Arabidopsis, Populus, Oryza, Zea, Medicago or Sorghum, in particular Arabidopsis thaliana, Populus tomentosa, Oryza sativa, Zea Mays, Medicago truncatula or Sorghum bicolor.
De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple par une levure du genre Saccharomyces, en particulier une levure Saccharomyces cerevisiae. Dans certains modes de réalisation, l'enzyme correspond à l'enzyme endogène du microorganisme. Dans ces cas, l'enzyme peut être surexprimée, par exemple en remplaçant le promoteur endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copie du gène. Alternatively, this enzyme can be an enzyme produced by a microorganism, for example by a yeast of the genus Saccharomyces, in particular a yeast Saccharomyces cerevisiae. In some embodiments, the enzyme corresponds to the endogenous enzyme of the microorganism. In these cases, the enzyme can be overexpressed, for example by replacing the endogenous promoter with a strong heterologous promoter and / or by increasing the number of copies of the gene.
De préférence, l'ALDH est une enzyme de plante, et de manière plus particulièrement préférée, une enzyme d 'Arabidopsis thaliana, en particulier l'ALDH décrite dans la SEQ ID NO : 3. Preferably, the ALDH is a plant enzyme, and more particularly, an enzyme from Arabidopsis thaliana, in particular the ALDH described in SEQ ID NO: 3.
Selon un mode de réalisation préféré, l'ALDH comprend une séquence choisie parmi la séquence SEQ. ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. According to a preferred embodiment, the ALDH comprises a sequence chosen from the sequence SEQ. ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
Selon un mode de réalisation particulièrement préféré, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH et dans lequel According to a particularly preferred embodiment, the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which
- ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR ; et- Said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and presenting CCR activity; and
- ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. Selon des modes de réalisation préférés, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase telle que définie ci-dessus, et comprend optionnellement une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH telles que définies ci-dessus. said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity. According to preferred embodiments, the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase as defined above, and optionally comprises a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH as defined above.
Le microorganisme selon l'invention peut produire le carboxyl-CoA d'intérêt, naturellement ou après modification génétique. Alternativement, ce substrat peut lui être apporté dans le milieu de culture. Selon un mode de réalisation particulier, le microorganisme est capable de produire le carboxyl-CoA d'intérêt, notamment le caféoyl-CoA, le 5-hydroxyféruloyl-CoA, le féruloyl-CoA et/ou le sinapoyl-CoA, à partir d'un intermédiaire de synthèse ou à partir de glucose. Selon un mode de réalisation préféré, le microorganisme est capable de produire le féruloyl-CoA ou le sinapoyl-CoA, à partir d'un intermédiaire de synthèse, par exemple l'acide caféique ou l'acide 5-hydroxyférulique, ou à partir de glucose, de préférence à partir de glucose. The microorganism according to the invention can produce the carboxyl-CoA of interest, naturally or after genetic modification. Alternatively, this substrate can be brought to it in the culture medium. According to a particular embodiment, the microorganism is capable of producing the carboxyl-CoA of interest, in particular caféoyl-CoA, 5-hydroxyferuloyl-CoA, feruloyl-CoA and / or sinapoyl-CoA, from a synthetic intermediate or from glucose. According to a preferred embodiment, the microorganism is capable of producing feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, for example caffeic acid or 5-hydroxyferulic acid, or from glucose, preferably from glucose.
Production d'un carboxyl-CoA d'intérêt Production of a carboxyl-CoA of interest
Le microorganisme selon l'invention peut être génétiquement modifié pour produire le carboxyl-CoA d'intérêt (substrat pour l'acyl-coenzyme A thioestérase et/ou la CCR),. Alternativement, ce substrat peut lui être apporté dans le milieu de culture. Le microorganisme selon l'invention est de préférence génétiquement modifié pour être capable de produire le carboxyl-CoA d'intérêt, de préférence le caféoyl-CoA, le 5- hydroxyféruloyl-CoA, le féruloyl-CoA ou le sinapoyl-CoA, de manière plus particulièrement préférée le féruloyl-CoA ou le sinapoyl-CoA, à partir d'un intermédiaire de synthèse, par exemple l'acide cinnamique, l'acide p-coumarique, l'acide caféique ou l'acide 5- hydroxyférulique, ou à partir de glucose via la phénylalanine ou la tyrosine. The microorganism according to the invention can be genetically modified to produce the carboxyl-CoA of interest (substrate for acyl-coenzyme A thioesterase and / or CCR) ,. Alternatively, this substrate can be brought to it in the culture medium. The microorganism according to the invention is preferably genetically modified to be capable of producing the carboxyl-CoA of interest, preferably caffeoyl-CoA, 5-hydroxyferuloyl-CoA, feruloyl-CoA or sinapoyl-CoA, so more particularly preferred feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, for example cinnamic acid, p-coumaric acid, caffeic acid or 5-hydroxyferulic acid, or to from glucose via phenylalanine or tyrosine.
Selon certains modes de réalisation préférés, le microorganisme selon l'invention est capable de produire le carboxyl-CoA d'intérêt, de préférence le féruloyl-CoA ou le sinapoyl- CoA, à partir d'un intermédiaire de synthèse, tel que l'acide caféique ou l'acide 5- hydroxyférulique. La production de féruloyl-CoA ou de sinapoyl-CoA à partir d'acide caféique ou d'acide 5-hydroxyférulique (production de féruloyl-CoA à partir d'acide caféique ou de sinapoyl-CoA à partir d'acide 5-hydroxyférulique) est le fait de deux réactions enzymatiques, la première impliquant une 4-coumaroyl-CoA ligase et la seconde une caféoyl-CoA O-méthyltransférase. According to certain preferred embodiments, the microorganism according to the invention is capable of producing the carboxyl-CoA of interest, preferably feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate, such as caffeic acid or 5-hydroxyferulic acid. Production of feruloyl-CoA or sinapoyl-CoA from caffeic acid or 5-hydroxyferulic acid (production of feruloyl-CoA from caffeic acid or sinapoyl-CoA from 5-hydroxyferulic acid) is the result of two enzymatic reactions, the first involving a 4-coumaroyl-CoA ligase and the second a caffeoyl-CoA O-methyltransferase.
Ainsi, le microorganisme selon l'invention peut également comprendre, outre l'acyl- coenzyme A thioestérase et/ou la combinaison CCR/ALDH, une séquence d'acide nucléique hétérologue codant pour une caféoyl-CoA O-méthyltransférase (CCoAMT) et/ou une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL), de préférence une séquence d'acide nucléique hétérologue codant pour CCoAMT et une séquence d'acide nucléique hétérologue codant pour une 4CL. Thus, the microorganism according to the invention may also comprise, in addition to acyl-coenzyme A thioesterase and / or the CCR / ALDH combination, a heterologous nucleic acid sequence encoding a caffeoyl-CoA O-methyltransferase (CCoAMT) and / or or a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), preferably a heterologous nucleic acid sequence encoding CCoAMT and a heterologous nucleic acid sequence encoding a 4CL.
Le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une 4-coumaroyl-CoA ligase (4CL). Tel qu'utilisé ici, le terme « 4-coumaroyl-CoA ligase » ou « 4CL » se réfère à une enzyme capable de produire du caféoyl-CoA à partir de l'acide caféique et de CoA et/ou du 5- hydroxyféruloyl-CoA à partir de l'acide 5-hydroxyférulique et de CoA. Cette enzyme appartient à la classe EC 6.2.1.12. The microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL). As used herein, the term "4-coumaroyl-CoA ligase" or "4CL" refers to an enzyme capable of producing caffeoyl-CoA from caffeic acid and CoA and / or 5-hydroxyferuloyl- CoA from 5-hydroxyferulic acid and CoA. This enzyme belongs to class EC 6.2.1.12.
La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. En particulier, pour déterminer s'il y a une activité 4-coumarate CoA ligase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (4-coumarate CoA ligase putative), d'acide caféique ou d'acide 5-hydroxyférulique, d'ATP et de CoA dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition du caféoyl CoA ou de 5-hydroxyféruloyl-CoA est observée au spectrophotomètre UV avec une longueur d'onde donnée. The detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. In particular, to determine if there is a 4-coumarate CoA ligase activity, an enzymatic test can be performed which consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative 4-coumarate CoA ligase ), caffeic acid or 5-hydroxyferulic acid, ATP and CoA under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caféoyl CoA or 5-hydroxyferuloyl-CoA is observed with a UV spectrophotometer with a given wavelength.
La 4CL peut être une enzyme de plante, de préférence du genre Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus, Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pélargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Thellungiella, Triticum, Tsuga, Vitis ou Zea. De manière alternative, cette enzyme peut être une enzyme produite par un microorganisme, par exemple du genre Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter ou Yarrowia. 4CL can be a plant enzyme, preferably of the genus Abies, Arabidopsis, Agastache, Amorpha, Brassica, Citrus, Cathaya, Cedrus, Crocus, Larix, Festuca, Glycine, Jugions, Keteleeria, Lithospermum, Lolium, Lotus, Lycopersicon, Malus , Medicago, Mesembryanthemum, Nicotiana, Nothotsuga, Oryza, Phaseolus, Pélargonium, Petroselinum, Physcomitrella, Picea, Prunus, Pseudolarix, Pseudotsuga, Rosa, Rubus, Ryza, Saccharum, Suaeda, Pinus, Populus, Solanum, Tsellumungiella, Trituga, Trituga or Zea. Alternatively, this enzyme can be an enzyme produced by a microorganism, for example of the genus Aspergillus, Mycosphaerella, Mycobacterium, Neisseria, Neurospora, Streptomyces, Rhodobacter or Yarrowia.
De préférence, la 4CL est une enzyme de plante, en particulier une enzyme d'une plante du genre Arabidopsis, Citrus ou Populus. De manière plus spécifique, la 4CL peut être une 4CL de Arabidopsis thaliana, en particulier une 4CL décrite dans l'une des séquences SEQ ID Nos : 5, 7 et 9, une 4CL de Citrus clementina, en particulier une 4CL décrite dans SEQ. ID NO : 6 ou une 4CL de Populus tomentosa, en particulier une 4CL décrite dans SEQ ID NO : 8. Preferably, 4CL is a plant enzyme, in particular an enzyme from a plant of the genus Arabidopsis, Citrus or Populus. More specifically, the 4CL can be a 4CL of Arabidopsis thaliana, in particular a 4CL described in one of the sequences SEQ ID Nos: 5, 7 and 9, a 4CL of Citrus clementina, in particular a 4CL described in SEQ. ID NO: 6 or a Populus tomentosa 4CL, in particular a 4CL described in SEQ ID NO: 8.
Selon un mode de réalisation, la 4CL comprend une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL. According to one embodiment, the 4CL comprises a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the one of these sequences and exhibiting 4CL activity.
Selon un mode de réalisation préféré, la 4CL comprend une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL. According to a preferred embodiment, the 4CL comprises a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with any of these sequences and exhibiting 4CL activity.
Lorsque le microorganisme recombinant selon l'invention est destiné à être utilisé dans la production d'acide férulique, la 4CL est de préférence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL. When the recombinant microorganism according to the invention is intended for use in the production of ferulic acid, the 4CL is preferably chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity.
Selon un mode de réalisation tout particulièrement préféré, la 4CL comprend une séquence choisie parmi la séquence SEQ. ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. According to a very particularly preferred embodiment, the 4CL comprises a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity.
Le microorganisme selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une caféoyl-CoA O-méthyltransférase (CCoAMT).The microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a caffeoyl-CoA O-methyltransferase (CCoAMT).
Tel qu'utilisé ici, le terme « caféoyl-CoA O-méthyltransférase» ou « CCoAMT» se réfère à une enzyme appartenant à la classe EC 2.1.1.104 et qui catalyse la conversion du caféoyl- CoA en féruloyl-CoA et/ou du 5-hydroxyféruloyl-CoA en sinapoyl-CoA. De préférence, ce terme se réfère à une enzyme qui catalyse la conversion du caféoyl-CoA en féruloyl-CoA et du 5-hydroxyféruloyl-CoA en sinapoyl-CoA. As used herein, the term "caffeoyl-CoA O-methyltransferase" or "CCoAMT" refers to an enzyme belonging to the EC class 2.1.1.104 and which catalyzes the conversion of caffeoyl-CoA to feruloyl-CoA and / or 5-hydroxyferuloyl-CoA to sinapoyl-CoA. Preferably, this term refers to an enzyme which catalyzes the conversion of caffeoyl-CoA to feruloyl-CoA and of 5-hydroxyferuloyl-CoA to sinapoyl-CoA.
La détection de cette activité peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité CCoAMT peut être détectée in vitro, par exemple en utilisant un test in vitro disponible dans le commerce (par exemple le test SAM510 de G- Biosciences, Cat.#786-430). En particulier, pour déterminer s'il y a une activité CoA methyl- transférase, un test enzymatique peut être effectué et consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester (CCoAMT putative), de S-adénosylméthionine (SAM), et d'un mélange d'enzymes (5-adénosylhomocyteine nucléosidase (EC 3.2.2.9), adénine déaminase (EC 3.5.4.2) et xanthine oxydase (EC 1.17.3.2) dans les conditions optimales (pH, température, ions...). En présence d'une activité CCoAMT, les produits obtenus sont de l'urate et du péroxyde d'hydrogène. Après un certain temps d'incubation, l'apparition de péroxyde d'hydrogène peut être détectée par réaction avec un agent colorimétrique, à savoir l'acide 3,5-dichloro-2-hydroxybenzènesulfonique (DHBS) et mesuré au spectrophotomètre UV à 510nm. L'activité CCoAMT peut également être détectée in vivo, notamment en utilisant la méthode décrite dans la partie expérimentale ci-après. En particulier, l'activité CCoAMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester. Le substrat de ladite enzyme (caféoyl-CoA ou 5- hydroxyféruloyl-CoA) est soit synthétisé par le microorganisme, soit apporté dans le milieu de culture. Le féruloyl-CoA ou le sinapoyl-CoA produit par une enzyme présentant l'activité recherchée peut ensuite être détecté par toute méthode, de préférence par une technique d'HPLC. De manière particulièrement préférée, l'activité CCoAMT peut être détectée in vivo en utilisant un microorganisme exprimant l'enzyme à tester, capable de convertir l'acide caféique en caféoyl-CoA et/ou l'acide 5-hydroxyférulique en 5-hydroxyféruloyl-CoA, c'est-à- dire exprimant une enzyme 4CL telle que définie ci-dessus. L'activité CCoAMT est détectée par la production de féruloyl-CoA et/ou de sinapoyl-CoA en présence d'acide caféique ou d'acide 5-hydroxyférulique, de préférence par une technique d'HPLC. The detection of this activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. CCoAMT activity can be detected in vitro, eg using a commercially available in vitro assay (eg SAM510 assay from G-Biosciences, Cat. # 786-430). In particular, to determine if there is a CoA methyltransferase activity, an enzymatic test can be carried out and consists of the in vitro incubation of a mixture composed of the enzyme to be tested (putative CCoAMT), of S- adenosylmethionine (SAM), and a mixture of enzymes (5-adenosylhomocyteine nucleosidase (EC 3.2.2.9), adenine deaminase (EC 3.5.4.2) and xanthine oxidase (EC 1.17.3.2) under optimal conditions (pH, temperature , ions, etc.). In the presence of CCoAMT activity, the products obtained are urate and hydrogen peroxide. After a certain incubation time, the appearance of hydrogen peroxide can be detected by reaction with a colorimetric agent, namely 3,5-dichloro-2-hydroxybenzenesulfonic acid (DHBS) and measured with a UV spectrophotometer at 510nm. CCoAMT activity can also be detected in vivo, in particular using the method described in the experimental part below In particular, CCoAMT activity can be detected in vivo using a microorganism expressing the enzyme to be tested. The substrate for said enzyme (caféoyl-CoA or 5-hydroxyferuloyl-CoA) is either synthesized by the microorganism, or brought into the culture medium. The feruloyl-CoA or the sinapoyl-CoA produced by an enzyme exhibiting the desired activity can then be detected by any method, preferably by an HPLC technique. Particularly preferably, CCoAMT activity can be detected in vivo using a microorganism expressing the enzyme to be tested, capable of converting caffeic acid to caffeoyl-CoA and / or 5-hydroxyferulic acid to 5-hydroxyferuloyl-CoA, i.e. expressing a 4CL enzyme such as defined above. CCoAMT activity is detected by the production of feruloyl-CoA and / or sinapoyl-CoA in the presence of caffeic acid or 5-hydroxyferulic acid, preferably by an HPLC technique.
La CCoAMT peut être une enzyme de plante, de préférence du genre Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis, Panicum, Rauvolfia ou Populus, et de manière plus particulièrement préférée du genre Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis ou Populus. En particulier, la CCoAMT peut être une enzyme de Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana, Panicum virgatum, Rauvolfia serpentina ou Populus trichocarpa, de préférence une enzyme de Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana ou Populus trichocarpa.CCoAMT can be a plant enzyme, preferably of the genus Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis, Panicum, Rauvolfia or Populus, and more particularly preferably of the genus Vitis, Medicago, Eucalyptus, Nicotiana, Arabidopsis or Populus. In particular, the CCoAMT can be an enzyme from Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tabacum, Arabidopsis thaliana, Panicum virgatum, Rauvolfia serpentina or Populus trichocarpa, preferably an enzyme from Vitis vinifera, Medicago sativa, Eucalyptus globus, Nicotiana tobacco. , Arabidopsis thaliana or Populus trichocarpa.
La CCoAMT peut être une enzyme de Vitis vinifera, en particulier la CCoAMT décrite dans la SEQ ID NO : 10, une enzyme de Medicago sativa, en particulier la CCoAMT décrite dans la SEQ. ID NO : 11, une enzyme d'Eucalyptus globus, en particulier la CCoAMT décrite dans la SEQ ID NO : 12, une enzyme de Nicotiana tabacum, en particulier la CCoAMT décrite dans la SEQ ID NO : 13 ou 14, une enzyme d 'Arabidopsis thaliana, en particulier la CCoAMT décrite dans la SEQ ID NO : 15, une enzyme de Populus trichocarpa, en particulier la CCoAMT décrite dans la SEQ ID NO :16, une enzyme de Panicum virgatum, en particulier la CCoAMT décrite dans la SEQ ID NO :40 ou une enzyme de Rauvolfia serpentina, en particulier la CCoAMT décrite dans la SEQ ID NO :41. CCoAMT can be an enzyme from Vitis vinifera, in particular CCoAMT described in SEQ ID NO: 10, an enzyme from Medicago sativa, in particular CCoAMT described in SEQ. ID NO: 11, an enzyme from Eucalyptus globus, in particular CCoAMT described in SEQ ID NO: 12, an enzyme from Nicotiana tabacum, in particular CCoAMT described in SEQ ID NO: 13 or 14, enzyme from Arabidopsis thaliana, in particular CCoAMT described in SEQ ID NO: 15, an enzyme from Populus trichocarpa, in particular CCoAMT described in SEQ ID NO: 16, an enzyme from Panicum virgatum, in particular CCoAMT described in SEQ ID NO: 40 or an enzyme from Rauvolfia serpentina, in particular CCoAMT described in SEQ ID NO: 41.
Selon un mode de réalisation, la CCoAMT comprend une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT. According to one embodiment, the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CCoAMT activity.
Selon un mode de réalisation particulier, la CCoAMT comprend une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT. Selon un mode de réalisation préféré, la CCoAMT comprend une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT. According to a particular embodiment, the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity. According to a preferred embodiment, the CCoAMT comprises a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting CCoAMT activity.
Selon un mode de réalisation particulier, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence uneAccording to a particular embodiment, the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; etCCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and very particularly preferably a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting the 4CL activity.
Selon un autre mode de réalisation particulier, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence uneAccording to another particular embodiment, the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and very particularly preferably a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting the 4CL activity.
Selon un mode de réalisation préféré, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et According to a preferred embodiment, the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 6 et présentant l'activité 4CL. - a heterologous nucleic acid sequence encoding a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 6 and exhibiting 4CL activity.
Dans ces deux modes de réalisation, le microorganisme peut comprendre en outreIn these two embodiments, the microorganism can further comprise
- une séquence d'acide nucléique hétérologue codant pour une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière tout particulièrement préférée une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou - a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and very particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioestera activity himself; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH et dans lequel ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
Comme mentionné ci-dessus, le microorganisme selon l'invention peut également être capable de produire le carboxyl-CoA d'intérêt, de préférence le féruloyl-CoA ou le sinapoyl- CoA, à partir d'un intermédiaire de synthèse tel que l'acide cinnamique, l'acide p- coumarique ou la L-Dopa (3,4-dihydroxy-L-phénylalanine), ou à partir de glucose via la phénylalanine ou la tyrosine. As mentioned above, the microorganism according to the invention may also be capable of producing the carboxyl-CoA of interest, preferably feruloyl-CoA or sinapoyl-CoA, from a synthetic intermediate such as cinnamic acid, p-coumaric acid or L-Dopa (3,4-dihydroxy-L-phenylalanine), or from glucose via phenylalanine or tyrosine.
A partir de la tyrosine From tyrosine
La production d'acide caféique à partir de tyrosine peut faire intervenir deux voies : la première implique la transformation de la tyrosine en acide p-coumarique puis de l'acide p-coumarique en acide caféique, la seconde implique la transformation de la tyrosine en L- Dopa puis de la L-Dopa en acide caféique (cf. Figure 8). The production of caffeic acid from tyrosine can involve two routes: the first involves the transformation of tyrosine into p-coumaric acid and then acid p-coumaric into caffeic acid, the second involves the transformation of tyrosine into L-Dopa and then of L-Dopa into caffeic acid (cf. Figure 8).
La production d'acide caféique à partir d'acide p-coumarique ou de L-Dopa à partir de tyrosine peut être le fait d'une enzyme ou d'un complexe enzymatique ayant une activité p-coumarate 3-hydroxylase. The production of caffeic acid from p-coumaric acid or L-Dopa from tyrosine may be by an enzyme or an enzyme complex having p-coumarate 3-hydroxylase activity.
Selon un mode de réalisation, le microorganisme selon l'invention peut comprendre, outre les séquences d'acide nucléique hétérologues décrites ci-dessus codant pour une acyl- coenzyme A thioestérase et/ou une combinaison CCR/ALDH, une CCoAMT et une 4CL, une ou plusieurs séquences d'acide nucléique hétérologues codant pour une enzyme ou un complexe enzymatique ayant une activité p-coumarate 3-hydroxylase. According to one embodiment, the microorganism according to the invention may comprise, in addition to the heterologous nucleic acid sequences described above encoding an acyl-coenzyme A thioesterase and / or a CCR / ALDH combination, a CCoAMT and a 4CL, one or more heterologous nucleic acid sequences encoding an enzyme or an enzyme complex having p-coumarate 3-hydroxylase activity.
Tel qu'utilisé ici, le terme « activité p-coumarate 3-hydroxylase » se réfère à une enzyme ou un complexe enzymatique catalysant la transformation de l'acide p-coumarique en acide caféique et/ou de la L-tyrosine en L-Dopa. Pour déterminer s'il y a une activité p-coumarate 3 hydroxylase, un test enzymatique peut être effectué qui consiste en l'incubation in vitro de l'enzyme ou du complexe enzymatique, d'acide p-coumarique ou de L-Tyrosine, et éventuellement de FAD et de NADH, dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition de l'acide caféique ou de la L-Dopa est observée en HPLC-MS en comparaison au standard attendu. As used herein, the term "p-coumarate 3-hydroxylase activity" refers to an enzyme or enzyme complex catalyzing the conversion of p-coumaric acid to caffeic acid and / or L-tyrosine to L-. Dopa. To determine if there is p-coumarate 3 hydroxylase activity, an enzymatic test can be performed which consists of in vitro incubation of the enzyme or enzyme complex, p-coumaric acid or L-Tyrosine, and optionally FAD and NADH, under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid or L-Dopa is observed by HPLC-MS in comparison with the expected standard.
En particulier, cette activité peut être le fait d'un complexe enzymatique comprenant une 4-hydroxyphénylacetate 3-monooxygénase oxygénase (HpaB) et une 4- hydroxyphénylacetate 3-monooxygénase réductase (HpaC). In particular, this activity can be the result of an enzyme complex comprising a 4-hydroxyphenylacetate 3-monooxygenase oxygenase (HpaB) and a 4-hydroxyphenylacetate 3-monooxygenase reductase (HpaC).
Le terme « 4-hydroxyphénylacetate 3-monooxygénase oxygénase » se réfère à une enzyme présentant une activité p-coumarate 3-hydroxylase lorsqu'elle est en présence d'une 4- hydroxyphénylacetate 3-monooxygénase réductase. Le terme « 4-hydroxyphénylacetate 3- monooxygénase réductase » se réfère à une enzyme présentant une activité p-coumarate 3-hydroxylase lorsqu'elle est en présence d'une 4-hydroxyphénylacetate 3-monooxygénase oxygénase. The term "4-hydroxyphenylacetate 3-monooxygenase oxygenase" refers to an enzyme exhibiting p-coumarate 3-hydroxylase activity when in the presence of 4-hydroxyphenylacetate 3-monooxygenase reductase. The term "4-hydroxyphenylacetate 3-monooxygenase reductase" refers to an enzyme exhibiting p-coumarate 3-hydroxylase activity when in the presence of 4-hydroxyphenylacetate 3-monooxygenase oxygenase.
De préférence, les enzymes HpaB et HpaC sont produites par des bactéries, de préférence Escherichia coli, des bactéries du genre Pseudomonas, en particulier Pseudomonas aeruginosa, ou des bactéries du genre Salmonella, en particulier Salmonella enterica. Les enzymes HpaB et HpaC peuvent être originaires de la même bactérie ou de bactéries différentes. Preferably, the HpaB and HpaC enzymes are produced by bacteria, preferably Escherichia coli, bacteria of the genus Pseudomonas, in particular Pseudomonas aeruginosa, or bacteria of the genus Salmonella, in particular Salmonella enterica. The enzymes HpaB and HpaC can originate from the same bacteria or from different bacteria.
En particulier, la HpaB peut être une enzyme de Pseudomonas aeruginosa, en particulier la HpaB décrite dans la SEQ ID NO : 17, ou une enzyme d'Escherichia coli, en particulier la HpaB décrite dans la SEQ ID NO : 26. In particular, HpaB can be an enzyme from Pseudomonas aeruginosa, in particular HpaB described in SEQ ID NO: 17, or an enzyme from Escherichia coli, in particular HpaB described in SEQ ID NO: 26.
Selon un mode de réalisation, la HpaB comprend une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase. According to one embodiment, the HpaB comprises a sequence chosen from the sequences SEQ ID NO: 17 and 26 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity.
Selon un mode de réalisation préféré, la HpaB comprend une séquence choisie parmi la séquence SEQ ID NO : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 17 et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase. According to a preferred embodiment, the HpaB comprises a sequence chosen from the sequence SEQ ID NO: 17 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity.
La HpaC peut être une enzyme de Salmonella enterica, en particulier la HpaC décrite dans la SEQ ID NO : 18, ou une enzyme d'Escherichia coli, en particulier la HpaC décrite dans la SEQ ID NO : 27. HpaC can be an enzyme from Salmonella enterica, in particular HpaC described in SEQ ID NO: 18, or an enzyme from Escherichia coli, in particular HpaC described in SEQ ID NO: 27.
Selon un mode de réalisation, la HpaC comprend une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase. According to one embodiment, the HpaC comprises a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity.
Selon un mode de réalisation préféré, la HpaC comprend une séquence choisie parmi la séquence SEQ ID NO : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase. According to a preferred embodiment, the HpaC comprises a sequence chosen from the sequence SEQ ID NO: 18 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity.
Selon un mode de réalisation particulièrement préféré, le microorganisme comprendAccording to a particularly preferred embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase oxygénase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et - a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase, preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and
- une séquence d'acide nucléique hétérologue codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, de préférence comprenant une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4- hydroxyphénylacetate 3-monooxygénase réductase. De manière alternative à l'utilisation des HpaB et HpaC ou en combinaison avec celles-ci, il est possible d'utiliser d'une part une enzyme permettant de convertir la tyrosine en L-Dopa, à savoir une 4-méthoxybenzoate O-déméthylase, et d'autre part une enzyme permettant de convertir l'acide p-coumarique en acide caféique, à savoir une p-coumarate 3- hydroxylase (cf. Figure 8). Ces enzymes font partie de la famille des cytochrome P450 (CYP) et sont CPR dépendantes, c'est-à-dire qu'elles sont actives en présence d'une cytochrome P450 réductase (CPR). La cytochrome P450 réductase peut être une enzyme endogène ou une enzyme hétérologue. - a heterologous nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase, preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity. As an alternative to the use of HpaB and HpaC or in combination with them, it is possible to use on the one hand an enzyme making it possible to convert tyrosine into L-Dopa, namely a 4-methoxybenzoate O-demethylase , and on the other hand an enzyme making it possible to convert p-coumaric acid into caffeic acid, namely a p-coumarate 3-hydroxylase (cf. FIG. 8). These enzymes are part of the cytochrome P450 (CYP) family and are CPR dependent, i.e. they are active in the presence of a cytochrome P450 reductase (CPR). Cytochrome P450 reductase can be an endogenous enzyme or a heterologous enzyme.
Ainsi, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une p-coumarate 3-hydroxylase CPR dépendante (C3H), c'est-à-dire une enzyme capable de convertir l'acide p-coumarique en acide caféique en présence d'une CPR (EC 1.14.13). L'activité p-coumarate 3-hydroxylase de cette enzyme peut être testée comme indiqué ci-dessus et en présence d'une CPR. Thus, the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding a CPR dependent p-coumarate 3-hydroxylase (C3H), that is to say an enzyme capable of converting p-coumaric acid. in caffeic acid in the presence of a CPR (EC 1.14.13). The p-coumarate 3-hydroxylase activity of this enzyme can be tested as indicated above and in the presence of CPR.
La C3H peut être une enzyme de bactérie, notamment de bactéries du genre Saccharothrix. En particulier, la C3H peut être une enzyme de Saccharothrix espanaensis, de préférence l'enzyme décrite dans la SEQ ID NO : 25. C3H can be an enzyme from bacteria, in particular bacteria of the Saccharothrix genus. In particular, C3H can be an enzyme from Saccharothrix espanaensis, preferably the enzyme described in SEQ ID NO: 25.
Dans un mode de réalisation particulier, la C3H comprend une séquence choisie parmi la séquence SEQ. ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase. In a particular embodiment, the C3H comprises a sequence chosen from the sequence SEQ. ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity.
Le microorganisme selon l'invention peut également comprendre une séquence d'acide nucléique hétérologue codant pour une 4-méthoxybenzoate O-déméthylase. c'est-à-dire une enzyme capable de convertir la L-tyrosine en L-Dopa en présence d'une CPR (EC 1.14.99.15). L'activité p-coumarate 3-hydroxylase de cette enzyme peut être testée comme indiqué ci-dessus et en présence d'une CPR et de tyrosine. The microorganism according to the invention can also comprise a heterologous nucleic acid sequence encoding a 4-methoxybenzoate O-demethylase. that is, an enzyme capable of converting L-tyrosine to L-Dopa in the presence of CPR (EC 1.14.99.15). The p-coumarate 3-hydroxylase activity of this enzyme can be tested as indicated above and in the presence of CPR and tyrosine.
La 4-méthoxybenzoate O-déméthylase peut être une enzyme de bactérie, notamment de Rhodopseudomonas palustris, Pseudomonas putida, ou Escherichia coli, de plante, notamment de Beta vulgaris, de mammifère, notamment d ’Oryctolagus cuniculus, ou de champignon, notamment de Rhodotorula glutinis. Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase est une enzyme de Rhodopseudomonas palustris, en particulier l'enzyme décrite dans la SEQ ID NO : 28, ou de Beta vulgaris, en particulier l'enzyme décrite dans la SEQ ID NO : 29. 4-Methoxybenzoate O-demethylase can be an enzyme from bacteria, in particular from Rhodopseudomonas palustris, Pseudomonas putida, or Escherichia coli, from plants, in particular from Beta vulgaris, from mammals, in particular from Oryctolagus cuniculus, or from fungi, in particular from Rhodotorula glutinis. In a particular embodiment, 4-methoxybenzoate O-demethylase is an enzyme from Rhodopseudomonas palustris, in particular the enzyme described in SEQ ID NO: 28, or from Beta vulgaris, in particular the enzyme described in SEQ ID NO: 29.
Dans un mode de réalisation particulier, la 4-méthoxybenzoate O-déméthylase comprend une séquence choisie parmi SEQ ID NOs : 28 et 29 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité L-tyrosine hydrolase. La production d'acide p-coumarique à partir de tyrosine implique une enzyme présentant une activité tyrosine ammonia lyase (TAL). Selon un mode de réalisation, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une enzyme ayant une activité tyrosine ammonia lyase. Tel qu'utilisé ici, le terme « tyrosine ammonia lyase» ou « TAL » se réfère à une enzyme catalysant la production d'acide p-coumarique à partir de L-tyrosine (EC 4.3.1.23). In a particular embodiment, the 4-methoxybenzoate O-demethylase comprises a sequence chosen from SEQ ID NOs: 28 and 29 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequences and exhibiting L-tyrosine hydrolase activity. The production of p-coumaric acid from tyrosine involves an enzyme exhibiting tyrosine ammonia lyase (TAL) activity. According to one embodiment, the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an enzyme having tyrosine ammonia lyase activity. As used herein, the term "tyrosine ammonia lyase" or "TAL" refers to an enzyme catalyzing the production of p-coumaric acid from L-tyrosine (EC 4.3.1.23).
La détection d'une activité tyrosine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité TAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de tyrosine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide p-coumarique est observée en UPLC-MS en comparaison au standard attendu. The detection of a tyrosine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. The TAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of tyrosine under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of p-coumaric acid is observed in UPLC-MS in comparison with the expected standard.
Certaines TAL peuvent également présenter une activité dihydroxyphénylalanine ammonia lyase (DAL) et/ou phénylalanine ammonia lyase (PAL). La TAL peut être une enzyme produite par une bactérie, en particulier une bactérie du genre Rhodobacter, de préférence Rhodobacter capsulatus ou Rhodobacter sphaeroides, du genre Ralstonia, de préférence Ralstonia metallidurans , ou du genre Flavobacteriaceae, de préférence Flavobacterium johnsoniae. Elle peut également être une enzyme produite par une plante, par exemple par Camellia sinensis, Fragaria x ananassa ou Zea mays. De préférence, la TAL est une enzyme produite par une levure, en particulier une levure du genre Rhodotorula, par exemple Rhodotorula glutinis. Some TALs may also exhibit dihydroxyphenylalanine ammonia lyase (DAL) and / or phenylalanine ammonia lyase (PAL) activity. TAL can be an enzyme produced by a bacterium, in particular a bacterium of the genus Rhodobacter, preferably Rhodobacter capsulatus or Rhodobacter sphaeroides, of the genus Ralstonia, preferably Ralstonia metallidurans, or of the genus Flavobacteriaceae, preferably Flavobacterium johnsoniae. It can also be an enzyme produced by a plant, for example by Camellia sinensis, Fragaria x ananassa or Zea mays. Preferably, TAL is an enzyme produced by a yeast, in particular a yeast of the genus Rhodotorula, for example Rhodotorula glutinis.
En particulier, la TAL peut être une enzyme de Flavobacterium johnsoniae, de préférence l'enzyme décrite dans la SEQ ID NO : 30, ou une enzyme de Rhodotorula glutinis, de préférence l'enzyme décrite dans la SEQ. ID NO : 19. Dans un mode de réalisation particulier, la TAL comprend une séquence choisie parmi SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL. In particular, TAL can be an enzyme from Flavobacterium johnsoniae, preferably the enzyme described in SEQ ID NO: 30, or an enzyme from Rhodotorula glutinis, preferably the enzyme described in SEQ. ID NO: 19. In a particular embodiment, the TAL comprises a sequence chosen from SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity. of sequence with one of these sequences and exhibiting TAL activity.
Dans un mode de réalisation préféré, la TAL comprend une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL. In a preferred embodiment, the TAL comprises a sequence selected from the sequence SEQ ID NO: 19 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
La production d'acide caféique à partir de L-Dopa implique une enzyme présentant une activité dihydroxyphénylalanine ammonia lyase (DAL). Selon un mode de réalisation, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue codant pour une enzyme ayant une activité dihydroxyphénylalanine ammonia lyase. Tel qu'utilisé ici, le terme « dihydroxyphénylalanine ammonia lyase» ou « DAL » se réfère à une enzyme catalysant la production d'acide caféique à partir de L-Dopa (EC 4.3.1.11).The production of caffeic acid from L-Dopa involves an enzyme exhibiting dihydroxyphenylalanine ammonia lyase (DAL) activity. According to one embodiment, the microorganism according to the invention can comprise a heterologous nucleic acid sequence encoding an enzyme having dihydroxyphenylalanine ammonia lyase activity. As used herein, the term "dihydroxyphenylalanine ammonia lyase" or "DAL" refers to an enzyme catalyzing the production of caffeic acid from L-Dopa (EC 4.3.1.11).
La détection d'une activité dihydroxyphénylalanine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité DAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de L-Dopa dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide caféique est observée en UPLC-MS en comparaison au standard attendu. The detection of a dihydroxyphenylalanine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. The DAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of L-Dopa under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of caffeic acid is observed in UPLC-MS compared to the expected standard.
Certaines DAL peuvent également présenter une activité TAL et/ou PAL. Selon un mode de réalisation particulier, le microorganisme recombinant comprendSome DALs may also exhibit TAL and / or PAL activity. According to a particular embodiment, the recombinant microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et - une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ. ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ. ID NO: 5 to 9 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and more particularly preferred, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence une C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ. ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et - une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL, et de manière plus particulièrement préférée, une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.- (i) a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and said HpaC preferably comprising a sequence chosen from sequences SEQ. ID NO: 18 and 27 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity reductase, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO : 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and - a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70 , 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Selon un autre mode de réalisation particulier, le microorganisme recombinant comprendAccording to another particular embodiment, the recombinant microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and very particularly preferably a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting the 4CL activity; and
- (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence une C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate- (i) a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate activity
3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ. ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité3-hydroxylase; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ. ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase activity oxygenase, and more particularly preferably, a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO : 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and said HpaC preferably comprising a sequence chosen from sequences SEQ ID NO: 18 and 27 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and showing activity
4-hydroxyphénylacetate 3-monooxygénase réductase ; et 4-hydroxyphenylacetate 3-monooxygenase reductase; and
- une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL, et de manière plus particulièrement préférée, une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Selon un mode de réalisation préféré, le microorganisme recombinant comprend According to a preferred embodiment, the recombinant microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ. ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi SEQ ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et - a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and said HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and
- une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL. a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Dans ces modes de réalisation, le microorganisme peut comprendre en outre In these embodiments, the microorganism may further comprise
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière tout particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou - une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH et dans lequel ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprend une séquence choisie parmi la séquence SEQ. ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. - a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and very particularly preferably a acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioest activity erase; and / or - a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprises a sequence chosen from the sequence SEQ. ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
A partir de la phénylalanine From phenylalanine
La production d'acide caféique à partir de phénylalanine fait intervenir des enzymes spécifiques de cette voie, à savoir une phénylalanine ammonia lyase (PAL) capable de produire de l'acide cinnamique à partir de la phénylalanine et une cinnamate 4-hydroxylase (C4H) capable de produire de l'acide p-coumarique à partir de l'acide cinnamique, et les enzymes ou complexes enzymatiques décrits ci-dessus capables de convertir l'acide p- coumarique en acide caféique (cf. Figure 8). The production of caffeic acid from phenylalanine involves specific enzymes of this pathway, namely a phenylalanine ammonia lyase (PAL) capable of producing cinnamic acid from phenylalanine and a cinnamate 4-hydroxylase (C4H) capable of producing p-coumaric acid from cinnamic acid, and the enzymes or enzymatic complexes described above capable of converting p-coumaric acid into caffeic acid (cf. Figure 8).
Ainsi, le microorganisme selon l'invention peut comprendre, outre les séquences d'acide nucléique hétérologues décrites ci-dessus codant pour une acyl-coenzyme A thioestérase et/ou une combinaison CCR/ALDH, une CCoAMT, une 4CL et une enzyme ou un complexe enzymatique ayant une activité p-coumarate 3-hydroxylase, une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et/ou une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL) et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H). Thus, the microorganism according to the invention may comprise, in addition to the heterologous nucleic acid sequences described above encoding an acyl-coenzyme A thioesterase and / or a CCR / ALDH combination, a CCoAMT, a 4CL and an enzyme or a enzymatic complex having p-coumarate 3-hydroxylase activity, a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and / or a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL) and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H).
Tel qu'utilisé ici, le terme « phénylalanine ammonia lyase» ou « PAL » se réfère à une enzyme catalysant la production d'acide cinnamique (aussi appelé acide trans-cinnamique) à partir de phénylalanine (EC 4.3.1.24). As used herein, the term "phenylalanine ammonia lyase" or "PAL" refers to an enzyme catalyzing the production of cinnamic acid (also called trans-cinnamic acid) from phenylalanine (EC 4.3.1.24).
La détection d'une activité phénylalanine ammonia lyase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité PAL peut notamment être détectée via un test enzymatique consistant en l'incubation in vitro d'un mélange composé de l'enzyme à tester et de phénylalanine dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide cinnamique est observée en UPLC-MS en comparaison au standard attendu. The detection of a phenylalanine ammonia lyase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. The PAL activity can in particular be detected via an enzymatic test consisting of the in vitro incubation of a mixture composed of the enzyme to be tested and of phenylalanine under optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of cinnamic acid is observed in UPLC-MS in comparison with the expected standard.
Certaines PAL peuvent également présenter une activité TAL et/ou une activité DAL. Some PALs may also exhibit TAL activity and / or DAL activity.
Plusieurs enzymes PAL ont déjà été décrites dans l'art antérieur. De préférence, La PAL provient d'une plante, par exemple une plante du genre Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Camellia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus, Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorghum, Sphenostylis, Stellaria, Stylosanthes, Triticum, Trifolium, Vaccinium, Vigna, Vitis, Zea, ou Zinnia. En particulier, la PAL peut être une enzyme d 'Arabidopsis thaliana, de préférence l'enzyme décrite dans la SEQ ID NO : 20, ou une enzyme de Citrus sinensis, de préférence l'une des enzymes décrites dans les SEQ. ID NOs : 31 et 32. Several PAL enzymes have already been described in the prior art. Preferably, the PAL is from a plant, for example a plant of the genus Arabidopsis, Agastache, Ananas, Asparagus, Brassica, Bromheadia, Bambusa, Beta, Betula, Citrus, Cucumis, Camellia, Capsicum, Cassia, Catharanthus, Cicer, Citrullus , Coffea, Cucurbita, Cynodon, Daucus, Dendrobium, Dianthus, Digitalis, Dioscorea, Eucalyptus, Gallus, Ginkgo, Glycine, Hordeum, Helianthus, Ipomoea, Lactuca, Lithospermum, Lotus, Lycopersicon, Medicago, Malus, Manihot, Medicago, Mesembryanthemum, Nicotiana, Olea, Oryza, Phaseolus, Pinus, Populus, Pisum, Persea, Petroselinum, Phalaenopsis, Phyllostachys, Physcomitrella, Picea, Pyrus, Prunus, Quercus, Raphanus, Rehmannia, Rubus, Solanum, Sorphenost, Stellaria, Stylosanthes, Triticum, Trifolium, Vaccinium, Vigna, Vitis, Zea, or Zinnia. In particular, PAL can be an enzyme from Arabidopsis thaliana, preferably the enzyme described in SEQ ID NO: 20, or an enzyme from Citrus sinensis, preferably one of the enzymes described in SEQs. ID NOs: 31 and 32.
Dans un mode de réalisation particulier, la PAL comprend une séquence choisie parmi SEQ. ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activitéIn a particular embodiment, the PAL comprises a sequence chosen from SEQ. ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the activity
PAL PAL
Dans un mode de réalisation préféré, la PAL comprend une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL. In a preferred embodiment, the PAL comprises a sequence selected from the sequence SEQ ID NO: 20 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity.
Tel qu'utilisé ici, le terme « cinnamate 4-hydroxylase» ou « C4H » se réfère à une enzyme catalysant la production d'acide p-coumarique à partir d'acide cinnamique (EC 1.14.13.11). Cette enzyme est CPR dépendante. As used herein, the term "cinnamate 4-hydroxylase" or "C4H" refers to an enzyme catalyzing the production of p-coumaric acid from cinnamic acid (EC 1.14.13.11). This enzyme is CPR dependent.
La détection d'une activité cinnamate 4-hydroxylase peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. L'activité C4H peut notamment être détectée via un test enzymatique qui consiste en l'incubation in vitro d'un mélange composé de l'enzyme à tester, d'acide cinnamique, de NADPH, d'H+ et d'Û2 dans les conditions optimales (pH, température, ions...). Après un certain temps d'incubation, l'apparition d'acide p-coumarique est observée en UPLC-MS en comparaison au standard attendu. The detection of a cinnamate 4-hydroxylase activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. The C4H activity can in particular be detected via an enzymatic test which consists of the in vitro incubation of a mixture composed of the enzyme to be tested, cinnamic acid, NADPH, H + and O2 in the optimal conditions (pH, temperature, ions, etc.). After a certain incubation time, the appearance of p-coumaric acid is observed in UPLC-MS in comparison with the expected standard.
Plusieurs enzymes C4H ont déjà été décrites dans l'art antérieur. De préférence, La C4H provient d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phaseolus, Pinus, Populus, Ruta, Saccharum, Solanum, Vitis, Vigna ou Zea. Several C4H enzymes have already been described in the prior art. Preferably, C4H is from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Physcomitreila, Phaseolus, Pinus, Populus, Ruta, Saccharum , Solanum, Vitis, Vigna or Zea.
En particulier, la C4H peut être une enzyme d 'Arabidopsis thaliana, de préférence l'enzyme décrite dans la SEQ ID NO : 21, ou une enzyme de Citrus sinensis, de préférence l'une des enzymes décrites dans les SEQ ID NOs : 33 et 34. In particular, C4H can be an enzyme from Arabidopsis thaliana, preferably the enzyme described in SEQ ID NO: 21, or an enzyme from Citrus sinensis, preferably one of the enzymes described in SEQ ID NOs: 33 and 34.
Dans un mode de réalisation particulier, la C4H comprend une séquence choisie parmi SEQ ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H. Dans un mode de réalisation préféré, la C4H comprend une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 21 et présentant l'activité C4H. Selon un mode de réalisation, le microorganisme selon l'invention comprend In a particular embodiment, the C4H comprises a sequence chosen from SEQ ID NOs: 21, 33 and 34 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting C4H activity. In a preferred embodiment, C4H comprises a sequence selected from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 21 and exhibiting C4H activity. According to one embodiment, the microorganism according to the invention comprises
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H. - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the C4H activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 21 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
Selon un mode de réalisation particulier, le microorganisme recombinant comprendAccording to a particular embodiment, the recombinant microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et- a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et - (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence une C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and very particularly preferably a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting the 4CL activity; and - (i) a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4- activity hydroxyphenylacetate 3-monooxygenase oxygenase, and said HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequence s and exhibiting the 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et - une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase- a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase
(C4H), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H. (C4H), preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the C4H activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
Selon un autre mode de réalisation particulier, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et According to another particular embodiment, the recombinant microorganism comprises a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ. ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et - (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence unea heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity, and very particularly preferably a 4CL comprising a selected sequence from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting the 4CL activity; and - (i) a heterologous nucleic acid sequence encoding a C3H, preferably a
C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting l p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4- activity hydroxyphenylacetate 3-monooxygenase oxygenase, and said HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequence s and exhibiting the 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ. ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ. ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ. ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferred, comprising a sequence chosen from the sequence SEQ. ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H. - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the C4H activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 21 and the polypeptides comprising a sequence having at least at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
Optionnellement, dans ces modes de réalisation, le microorganisme peut également comprendre une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL, et de manière plus particulièrement préférée, une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.Optionally, in these embodiments, the microorganism can also comprise a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Selon un mode de réalisation particulier préféré, le microorganisme recombinant comprendAccording to a particular preferred embodiment, the recombinant microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et- a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 6 et présentant l'activité 4CL ; et a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 6 and exhibiting 4CL activity; and
- une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi SEQ ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et - une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et- a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and said HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and - a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H. - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
Selon un autre mode de réalisation particulier préféré, le microorganisme recombinant comprend - une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence uneAccording to another particular preferred embodiment, the recombinant microorganism comprises - a heterologous nucleic acid sequence encoding a CCoAMT, preferably a
CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière plus particulièrement préférée, une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ. ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and more particularly preferably, a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4CL activity , and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi SEQ ID No : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et - a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from SEQ ID No: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and said HpaC preferably comprising a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and
- une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et- a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and
- une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H. - a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity.
Optionnellement, dans ces modes de réalisation, le microorganisme peut également comprendre une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL. Optionally, in these embodiments, the microorganism can also comprise a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Dans ces modes de réalisation, le microorganisme peut comprendre en outre In these embodiments, the microorganism may further comprise
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière tout particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou - une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH et dans lequel ladite CCR comprend une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprend une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH. - a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85 , 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and in any manner particularly preferred an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and / or - a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH and in which said CCR comprises a sequence chosen from the sequence SEQ ID NO: 4 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprises a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity.
CPR : cytochrome P450 réductase Certaines enzymes mentionnées ci-dessus telles que les C3H ou les C4H sont des enzymes CPR-dépendantes. Les activités de ces enzymes nécessitent la présence de NADPH et donc la présence d'une cytochrome P450 réductase (CPR), en particulier une NADPH-cytochrome P450 réductase. CPR: cytochrome P450 reductase Certain enzymes mentioned above such as C3H or C4H are CPR-dependent enzymes. The activities of these enzymes require the presence of NADPH and therefore the presence of a cytochrome P450 reductase (CPR), in particular a NADPH-cytochrome P450 reductase.
Ainsi, dans les différents modes de réalisation décrits ci-dessus et ci-après concernant le microorganisme selon l'invention, celui-ci peut en outre comprendre un acide nucléique endogène codant pour une cytochrome P450 réductase. Optionnellement, la CPR endogène peut être surexprimée, par exemple en remplaçant le promoteur du gène endogène par un promoteur hétérologue fort et/ou en augmentant le nombre de copies du gène endogène. Alternativement, ou en plus de cet acide nucléique endogène, le microorganisme selon l'invention peut comprendre une séquence d'acide nucléique hétérologue qui code pour une cytochrome P450 réductase (CPR). Thus, in the various embodiments described above and below concerning the microorganism according to the invention, the latter may further comprise an endogenous nucleic acid encoding a cytochrome P450 reductase. Optionally, endogenous CPR can be overexpressed, for example by replacing the promoter of the endogenous gene with a strong heterologous promoter and / or by increasing the number of copies of the endogenous gene. Alternatively, or in addition to this endogenous nucleic acid, the microorganism according to the invention can comprise a heterologous nucleic acid sequence which codes for a cytochrome P450 reductase (CPR).
Tel qu'utilisé ici, le terme « cytochrome P450 réductase » ou « CPR » se réfère à une enzyme impliquée dans le transfert d'électrons depuis le NADPH et appartenant à la classe EC 1.6.2.4. As used herein, the term "cytochrome P450 reductase" or "CPR" refers to an enzyme involved in the transfer of electrons from NADPH and belonging to class EC 1.6.2.4.
La détection d'une activité CPR peut être réalisée par toute méthode connue de l'homme du métier, in vivo ou in vitro. Les CPR sont des enzymes qui catalysent le transfert d'électrons du NADPH vers les cytochromes p450 (par exemple C3H ou C4H). Ainsi, l'activité CPR peut notamment être détectée en utilisant un kit enzymatique associant l'oxydation du NADPH par la CPR à la réduction d'un substrat incolore en un produit coloré avec un pic d'absorbance à une longueur d'onde donnée, le taux de génération de couleur étant directement proportionnel à l'activité CPR. Un exemple de kit commercial basé sur ce principe est le kit « CPR activity assay kit » de PromoKine (Cat# PK-CA577-K700). The detection of a CPR activity can be carried out by any method known to those skilled in the art, in vivo or in vitro. CPRs are enzymes which catalyze the transfer of electrons from NADPH to cytochromes p450 (eg C3H or C4H). Thus, the CPR activity can in particular be detected using an enzymatic kit combining the oxidation of NADPH by CPR with the reduction of a colorless substrate into a colored product with an absorbance peak at a given wavelength, the color generation rate being directly proportional to CPR activity. An example of a commercial kit based on this principle is the “CPR activity assay kit” from PromoKine (Cat # PK-CA577-K700).
La CPR provient de préférence d'un eucaryote, notamment d'une levure, par exemple une levure du genre Saccharomyces, ou d'une plante, par exemple une plante du genre Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Glycine, Helianthus, Lotus, Mesembryanthemum, Phaseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis ou Zea. The CPR preferably originates from a eukaryote, in particular from a yeast, for example a yeast of the genus Saccharomyces, or from a plant, for example a plant of the genus Arabidopsis, Ammi, Avicennia, Camellia, Camptotheca, Catharanthus, Citrus, Wisteria, Helianthus, Lotus, Mesembryanthemum, Phaseolus, Physcomitrella, Pinus, Populus, Ruta, Saccharum, Solanum, Vigna, Vitis or Zea.
En particulier, la CPR peut être une enzyme de Catharanthus roseus, de préférence l'enzyme décrite dans la SEQ ID NO : 22, une enzyme de Saccharomyces cerevisiae, de préférence l'enzyme décrite dans la SEQ. ID NO : 35, ou une enzyme d 'Arabidopsis thaliana, de préférence l'une des enzymes décrites dans les SEQ ID NOs : 36 et 37. La CPR peut également être une protéine chimérique telle que celle décrite dans l'article d'Aigrain et al (2009, EMBO reports, 10, 742-747 ; SEQ ID NO : 38). In particular, the CPR can be an enzyme from Catharanthus roseus, preferably the enzyme described in SEQ ID NO: 22, an enzyme from Saccharomyces cerevisiae, preferably the enzyme described in SEQ. ID NO: 35, or an enzyme from Arabidopsis thaliana, preferably one of the enzymes described in SEQ ID NOs: 36 and 37. CPR can also be a chimeric protein such as that described in the article from Aigrain et al (2009, EMBO reports, 10, 742-747; SEQ ID NO: 38).
Dans un mode de réalisation particulier, la CPR comprend une séquence choisie parmi SEQ ID NOs : 22, 35, 36, 37 et 38 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité CPR. In a particular embodiment, the CPR comprises a sequence chosen from SEQ ID NOs: 22, 35, 36, 37 and 38 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with one of these sequences and exhibiting CPR activity.
Dans un mode de réalisation préféré, la CPR comprend une séquence choisie parmi SEQ ID NO : 22 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 22 et présentant l'activité CPR. In a preferred embodiment, the CPR comprises a sequence selected from SEQ ID NO: 22 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 22 and exhibiting CPR activity.
Augmentation de la production de tyrosine et/ou de phénylalanine Increased production of tyrosine and / or phenylalanine
Dans les différents modes de réalisation décrits ci-dessus et ci-après concernant le microorganisme selon l'invention, celui-ci peut également être modifié pour augmenter la production de tyrosine et/ou de phénylalanine, de préférence de tyrosine. Ainsi, dans des modes de réalisation préférés, le microorganisme selon l'invention produit des quantités importantes de tyrosine et/ou de phénylalanine, en particulier à partir d'une source carbonée simple comme le glucose. In the various embodiments described above and below concerning the microorganism according to the invention, the latter can also be modified to increase the production of tyrosine and / or phenylalanine, preferably tyrosine. Thus, in preferred embodiments, the microorganism according to the invention produces large amounts of tyrosine and / or phenylalanine, in particular from a simple carbon source such as glucose.
Cette augmentation peut être obtenue par toute méthode connue de l'homme du métier et notamment en exprimant un ou plusieurs variants d'une ou plusieurs enzymes impliquées dans la synthèse de ces acides aminés, lesdits variants étant résistants au rétrocontrôle par la tyrosine et/ou la phénylalanine, de préférence résistants au rétrocontrôle par la tyrosine. This increase can be obtained by any method known to those skilled in the art and in particular by expressing one or more variants of one or more enzymes involved in the synthesis of these amino acids, said variants being resistant to feedback by tyrosine and / or phenylalanine, preferably resistant to tyrosine feedback.
En particulier, le microorganisme peut être modifié pour exprimer un variant de la 3-deoxy- D-arabino-hepturosonate-7-phosphate (DAHP) synthase (EC 2.5.1.54) et/ou de la chorismate mutase (EC 5.4.99.5), résistant au rétrocontrôle par la tyrosine. De tels variants sont bien connues de l'homme du métier (voir par exemple Gold et al., Microb Cell Fact. 2015;14:73). In particular, the microorganism can be modified to express a variant of 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase (EC 2.5.1.54) and / or chorismate mutase (EC 5.4.99.5) , resistant to tyrosine feedback. Such variants are well known to those skilled in the art (see for example Gold et al., Microb Cell Fact. 2015; 14: 73).
Ainsi, selon un mode de réalisation particulier, le microorganisme selon l'invention comprend une séquence d'acide nucléique hétérologue codant pour une 3-deoxy-D- arabino-hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et/ou une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine. Thus, according to a particular embodiment, the microorganism according to the invention comprises a heterologous nucleic acid sequence encoding a 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase resistant to feedback control by tyrosine and / or a heterologous nucleic acid sequence encoding a chorismate mutase resistant to tyrosine feedback.
Chez la levure 5. cerevisiae, la 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase est codée par le gène AR04 (NCBI Gene ID: 852551) et la chorismate mutase est codée par le gène AR07 (NCBI Gene ID: 856173). Des variants résistants au rétrocontrôle par la tyrosine de ces enzymes sont connus, par exemple le mutant AR04K229L (SEQ ID NO : 23) et le mutant AR07G141S (SEQ ID NO : 24). In 5. cerevisiae yeast, 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase is encoded by the AR04 gene (NCBI Gene ID: 852551) and chorismate mutase is encoded by the AR07 gene (NCBI Gene ID: 856173). Variants resistant to tyrosine feedback of these enzymes are known, for example the AR04 K229L mutant (SEQ ID NO: 23) and the AR07 G141S mutant (SEQ ID NO: 24).
Ainsi, selon un mode de réalisation préféré, le microorganisme selon l'invention comprendThus, according to a preferred embodiment, the microorganism according to the invention comprises
- une séquence d'acide nucléique hétérologue codant pour une 3-deoxy-D-arabino- hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et comprenant une séquence choisie parmi SEQ ID NO : 23 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 23, lesdits polypeptides présentant une activité 3-deoxy-D-arabino- hepturosonate-7-phosphate (DAHP) synthase résistante au rétrocontrôle par la tyrosine et, de préférence, une leucine à la position correspondant à la position 229 de la SEQ ID NO : 23 ; et/ou a heterologous nucleic acid sequence encoding a 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP) synthase resistant to feedback control by tyrosine and comprising a sequence chosen from SEQ ID NO: 23 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 23, said polypeptides exhibiting 3-deoxy-D-arabino-hepturosonate-7-phosphate (DAHP ) synthase resistant to feedback control by tyrosine and, preferably, a leucine at the position corresponding to position 229 of SEQ ID NO: 23; and or
- une séquence d'acide nucléique hétérologue codant pour une chorismate mutase résistante au rétrocontrôle par la tyrosine et comprenant une séquence choisie parmi SEQ ID NO : 24 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 24, lesdits polypeptides présentant une activité chorismate mutase résistante au rétrocontrôle par la tyrosine et, de préférence, une sérine à la position correspondant à la position 141 de la SEQ ID NO : 24.- a heterologous nucleic acid sequence encoding a chorismate mutase resistant to feedback control by tyrosine and comprising a sequence chosen from SEQ ID NO: 24 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 24, said polypeptides exhibiting chorismate mutase activity resistant to feedback control by tyrosine and, preferably, a serine at the position corresponding to position 141 of SEQ ID NO: 24 .
De manière alternative ou cumulative, l'augmentation de la production de tyrosine et/ou de phénylalanine peut également être obtenue en redirigeant le flux de carbone d'autres voies métaboliques vers celle de la tyrosine et/ou phénylalanine, de préférence de la tyrosine. Ces modifications et les gènes impliqués sont bien connus de l'homme du métier (voir US 8,809,028 ; Pandey et al, 2016, Biotechnol Adv., 34, 634-662). Alternatively or cumulatively, the increase in the production of tyrosine and / or phenylalanine can also be obtained by redirecting the carbon flow from other metabolic pathways towards that of tyrosine and / or phenylalanine, preferably tyrosine. These modifications and the genes involved are well known to those skilled in the art (see US Pat. No. 8,809,028; Pandey et al, 2016, Biotechnol Adv., 34, 634-662).
Ainsi, selon un mode de réalisation particulier, dans le microorganisme selon l'invention, un ou plusieurs gènes endogènes codant pour une enzyme impliquée dans la voie de dégradation des acides aminés d'Ehrlich, sont inactivés. Le ou les gènes peuvent être inactivés par toute méthode connue de l'homme du métier, en particulier par délétion totale ou partielle, ou par insertion d'une séquence nucléique dans la séquence codante, notamment une séquence décalant le cadre de lecture ou insérant un codon stop. Thus, according to a particular embodiment, in the microorganism according to the invention, one or more endogenous genes encoding an enzyme involved in the pathway for degradation of Ehrlich amino acids, are inactivated. The gene or genes can be inactivated by any method known to those skilled in the art, in particular by deletion total or partial, or by insertion of a nucleic acid sequence in the coding sequence, in particular a sequence shifting the reading frame or inserting a stop codon.
En particulier, dans le microorganisme selon l'invention, un gène endogène codant pour une phénylpyruvate décarboxylase peut être inactivé. Cette enzyme est responsable de la première étape de la voie de dégradation des acides aminés d'Ehrlich. Chez la levure 5. cerevisiae, la phénylpyruvate décarboxylase est codée par le gène ARO10 (NCBI Gene ID: 851987). In particular, in the microorganism according to the invention, an endogenous gene encoding a phenylpyruvate decarboxylase can be inactivated. This enzyme is responsible for the first step in Ehrlich's amino acid degradation pathway. In 5. cerevisiae yeast, phenylpyruvate decarboxylase is encoded by the ARO10 gene (NCBI Gene ID: 851987).
Inactivation de l'acide férulique décarboxylase Inactivation of ferulic acid decarboxylase
Dans les différents modes de réalisation décrits ci-dessus concernant le microorganisme selon l'invention, celui-ci peut également être modifié pour inactiver le ou les gènes endogènes codant pour une acide férulique décarboxylase. In the various embodiments described above concerning the microorganism according to the invention, the latter can also be modified to inactivate the endogenous gene (s) encoding a ferulic acid decarboxylase.
Cette enzyme catalyse notamment la décarboxylation de l'acide férulique, de l'acide p- coumarique et de l'acide cinnamique pour produire leurs dérivés vinyliques, à savoir respectivement le 4-vinylguaiacol, le 4-vinylphénol, et le styrène. Elle appartient à la classe EC 4.1.1.102. Son inactivation permet d'augmenter les quantités disponibles d'acide cinnamique et d'acide p-coumarique et les quantités produites d'acide férulique dans le microorganisme selon l'invention. This enzyme catalyzes in particular the decarboxylation of ferulic acid, p-coumaric acid and cinnamic acid to produce their vinyl derivatives, namely 4-vinylguaiacol, 4-vinylphenol and styrene respectively. It belongs to class EC 4.1.1.102. Its inactivation makes it possible to increase the available quantities of cinnamic acid and p-coumaric acid and the quantities of ferulic acid produced in the microorganism according to the invention.
Le ou les gènes codant pour cette enzyme chez le microorganisme selon l'invention peuvent être aisément identifiés par l'homme du métier. Par exemple, chez la levure Saccharomyces cerevisiae, l'acide férulique décarboxylase est codée par le gène FDC1 (NCBI Gene ID: 852152). The gene or genes encoding this enzyme in the microorganism according to the invention can be easily identified by a person skilled in the art. For example, in the yeast Saccharomyces cerevisiae, ferulic acid decarboxylase is encoded by the FDC1 gene (NCBI Gene ID: 852152).
Le ou les gènes peuvent être inactivés par toute méthode connue de l'homme du métier, en particulier par délétion totale ou partielle, ou par insertion d'une séquence nucléique dans la séquence codante, notamment une séquence décalant le cadre de lecture ou insérant un codon stop. The gene (s) can be inactivated by any method known to those skilled in the art, in particular by total or partial deletion, or by insertion of a nucleic acid sequence into the coding sequence, in particular a sequence shifting the reading frame or inserting a stop codon.
Acide nucléique recombinant, cassette et vecteur d'expression Recombinant nucleic acid, cassette and expression vector
Chaque séquence nucléique codant pour une enzyme telle que décrite précédemment est comprise dans une cassette d'expression. De préférence, les séquences nucléiques codantes ont été optimisées pour l'expression dans le microorganisme hôte. La séquence nucléique codante est liée de manière opérationnelle aux éléments nécessaires à l'expression du gène, notamment à la transcription et traduction. Ces éléments sont choisis de sorte à être fonctionnels dans le microorganisme recombinant hôte. Ces éléments peuvent comporter par exemple des promoteurs de transcription, des activateurs de transcription, des séquences terminatrices, des codons d'initiation et de terminaison. Les méthodes pour sélectionner ces éléments en fonction de la cellule hôte dans laquelle l'expression est souhaitée, sont bien connues de l'homme du métier. Each nucleic acid sequence encoding an enzyme as described above is included in an expression cassette. Preferably, the coding nucleic sequences have been optimized for expression in the host microorganism. The coding nucleic sequence is operably linked to the elements necessary for the expression of the gene, in particular for transcription and translation. These elements are chosen so as to be functional in the host recombinant microorganism. These elements can include, for example, transcription promoters, transcription activators, terminator sequences, initiation and termination codons. The methods for selecting these elements as a function of the host cell in which expression is desired are well known to those skilled in the art.
De préférence, le promoteur est un promoteur fort. Le promoteur peut être constitutif ou inductible, de préférence constitutif. Un promoteur peut contrôler l'expression d'une ou plusieurs séquences nucléiques codant pour une ou plusieurs enzymes telles que décrites ci-dessus. Preferably, the promoter is a strong promoter. The promoter can be constitutive or inducible, preferably constitutive. A promoter can control the expression of one or more nucleic acid sequences encoding one or more enzymes as described above.
Par exemple, si le microorganisme est procaryote, le promoteur peut être sélectionné parmi les promoteurs suivants : Lacl, LacZ, pLacT, ptac, pARA, pBAD, les promoteurs d'ARN polymérase de bactériophage T3 or T7, le promoteur de la polyhèdrine, le promoteur PR ou PL du phage lambda. Dans un mode de réalisation particulier, le promoteur est pLac. Si le microorganisme est eucaryote et en particulier une levure, le promoteur peut être sélectionné parmi les promoteurs suivants : le promoteur pTDH3, le promoteur pTEFl, le promoteur pTEF2, le promoteur pCCW12, le promoteur pHHF2, le promoteur pHTB2 et le promoteur pRPL18B. Des exemples de promoteurs inductibles utilisables chez la levure sont les promoteurs tetO-2, GAL10, GAL10-CYC1 et PH05. For example, if the microorganism is prokaryotic, the promoter can be selected from the following promoters: Lacl, LacZ, pLacT, ptac, pARA, pBAD, the bacteriophage T3 or T7 RNA polymerase promoters, the polyhedrin promoter, the lambda phage PR or PL promoter. In a particular embodiment, the promoter is pLac. If the microorganism is eukaryotic and in particular a yeast, the promoter can be selected from the following promoters: the pTDH3 promoter, the pTEF1 promoter, the pTEF2 promoter, the pCCW12 promoter, the pHHF2 promoter, the pHTB2 promoter and the pRPL18B promoter. Examples of inducible promoters which can be used in yeast are the tetO-2, GAL10, GAL10-CYC1 and PH05 promoters.
Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ou une combinaison de certaines de celles-ci peuvent être comprises dans un vecteur d'expression commun ou dans différents vecteurs d'expression. La présente invention concerne donc également un vecteur comprenant All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described or a combination of some of these can be included in a common expression vector or in different expression vectors. The present invention therefore also relates to a vector comprising
- (i) une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et/ou (ii) une séquence d'acide nucléique codant pour une cinnamoyl-CoA réductase (CCR) et une séquence d'acide nucléique codant pour une aldéhyde deshydrogénase (ALDH), de préférence une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et/ou - (i) a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a nucleic acid sequence encoding a aldehyde dehydrogenase (ALDH), preferably a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or
- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons. De préférence, le vecteur comprend - (i) une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et/ou (ii) une séquence d'acide nucléique codant pour une cinnamoyl-CoA réductase (CCR) et une séquence d'acide nucléique codant pour une aldéhyde deshydrogénase (ALDH), de préférence une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase, et - at least one nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT), a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), a nucleic acid sequence encoding a p-coumarate 3-hydroxylase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase, a nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), a nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H) and a sequence of nucleic acid encoding one encoding a cytochrome P450 reductase (CPR), each of these enzymes being as defined above, as well as their combinations. Preferably, the vector comprises - (i) a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a nucleic acid sequence encoding a aldehyde dehydrogenase (ALDH), preferably a nucleic acid sequence encoding an acyl-coenzyme A thioesterase, and
- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4-hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci-dessus, ainsi que leurs combinaisons. - at least one nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT), a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), a nucleic acid sequence encoding a p-coumarate 3-hydroxylase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase reductase, a nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), a nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H) and a sequence of nucleic acid encoding one encoding a cytochrome P450 reductase (CPR), each of these enzymes being as defined above, as well as their combinations.
Selon un mode particulièrement préféré, le vecteur comprend According to a particularly preferred embodiment, the vector comprises
- une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et- a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and
- au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), ou une combinaison des deux, chacune de ces enzymes étant telles que définies ci-dessus. - at least one nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT) and a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase (4CL), or a combination of the two, each of these enzymes being as defined above.
Le vecteur peut notamment comprendre des combinaisons de séquences codantes particulières telles que décrites ci-dessus. The vector can in particular comprise combinations of particular coding sequences as described above.
Par « comprendre une séquence d'acide nucléique », il est de préférence entendu « comprendre une cassette d'expression comprenant la séquence d'acide nucléique ».By "comprising a nucleic acid sequence", it is preferably understood "comprising an expression cassette comprising the nucleic acid sequence".
Les vecteurs comprennent des séquences codantes hétérologues dans la mesure où les séquences codantes peuvent être optimisées pour le microorganisme hôte, être sous le contrôle de promoteur(s) hétérologue(s) et/ou peuvent combiner des séquences codantes qui ne proviennent pas du même organisme d'origine et/ou qui ne sont pas présentes dans le même arrangement. Vectors include heterologous coding sequences as long as the coding sequences can be optimized for the host microorganism, be under the control of heterologous promoter (s) and / or can combine coding sequences which are not from the same organism. of origin and / or which are not present in the same arrangement.
Le vecteur peut être toute séquence d'ADN dans laquelle il est possible d'insérer des acides nucléiques étrangers, les vecteurs permettant d'introduire de l'ADN étranger dans le microorganisme hôte. Le vecteur peut être par exemple un plasmide, un phagemide, un cosmide, un chromosome artificiel, notamment un YAC, ou un BAC. Les vecteurs d'expression peuvent comprendre en outre des séquences nucléiques codant pour des marqueurs de sélection. Les marqueurs de sélection peuvent être des gènes de résistance à un ou plusieurs antibiotiques ou des gènes d'auxotrophie. Le gène d'auxotrophie peut par exemple être HIS5, URA3, LEU2 ou TRP1. Le gène de résistance aux antibiotiques peut par exemple être de préférence un gène de résistance à l'ampicilline, au chloramphénicol, à la spectinomycine, à la streptomycine, à la kanamycine, à l'hygromycine, à la généticine, à la fluoroacétamide, au fluorocitrate, à la phléomycine, à l'amphotéricine- B et/ou la nourséothricine. The vector can be any DNA sequence into which it is possible to insert foreign nucleic acids, the vectors making it possible to introduce foreign DNA into the host microorganism. The vector can be, for example, a plasmid, a phagemid, a cosmid, an artificial chromosome, in particular a YAC, or a BAC. The expression vectors can further comprise nucleic sequences encoding selection markers. The selection markers can be genes for resistance to one or more antibiotics or genes for auxotrophy. The auxotrophy gene can for example be HIS5, URA3, LEU2 or TRP1. The antibiotic resistance gene may for example preferably be a resistance gene to ampicillin, chloramphenicol, spectinomycin, streptomycin, kanamycin, hygromycin, geneticin, fluoroacetamide, fluorocitrate, phleomycin, amphotericin-B and / or nureseothricin.
L'introduction de vecteurs dans un microorganisme hôte est un procédé largement connu de l'homme du métier. Plusieurs méthodes sont notamment décrites dans « Current Protocols in Molecular Biology», 13.7.1-13.7.10; ou encore dans Ellis T. et al., Intégrative Biology, 2011, 3(2), 109- 118. The introduction of vectors into a host microorganism is a process widely known to those skilled in the art. Several methods are described in particular in “Current Protocols in Molecular Biology”, 13.7.1-13.7.10; or in Ellis T. et al., Integrative Biology, 2011, 3 (2), 109-118.
La microorganisme hôte peut être transformé/transfecté de manière transitoire ou stable et l'acide nucléique, la cassette ou le vecteur selon l'invention peut être contenu dans celui- ci sous forme d'épisome ou sous forme intégré dans le génome de la cellule hôte. The host microorganism can be transformed / transfected in a transient or stable manner and the nucleic acid, the cassette or the vector according to the invention can be contained therein in the form of an episome or in a form integrated into the genome of the cell. host.
Le vecteur d'expression peut également comprendre une ou plusieurs séquences permettant l'insertion ciblée du vecteur, de la cassette d'expression ou de l'acide nucléique dans le génome de la cellule hôte. The expression vector can also comprise one or more sequences allowing the targeted insertion of the vector, of the expression cassette or of the nucleic acid into the genome of the host cell.
Toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites ci-dessus peuvent être insérées dans le/un chromosome du microorganisme recombinant. A contrario, toutes ou une partie des cassettes d'expression comprenant les séquences nucléiques codant pour les enzymes telles que décrites peuvent être conservées sous forme épisomale, notamment sous forme de plasmide. Eventuellement, le microorganisme peut comprendre plusieurs copies de séquences nucléiques codant pour une enzyme telle que décrite précédemment. Notamment, il peut comprendre 2 à 10 copies, par exemple 2, 3, 4, 5, 6, 7, 8, 9 ou 10 copies d'une séquence nucléique codant pour une enzyme telle que décrite précédemment. All or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described above can be inserted into the / a chromosome of the recombinant microorganism. Conversely, all or part of the expression cassettes comprising the nucleic acid sequences encoding the enzymes as described can be stored in episomal form, in particular in the form of a plasmid. Optionally, the microorganism can comprise several copies of nucleic acid sequences encoding an enzyme as described above. In particular, it can comprise 2 to 10 copies, for example 2, 3, 4, 5, 6, 7, 8, 9 or 10 copies of a nucleic acid sequence encoding an enzyme as described above.
Eventuellement, le microorganisme hôte peut être transformé/transfecté avec plusieurs vecteurs selon l'invention, identiques ou différents. Il peut également être transformé/transfecté avec un ou plusieurs autres vecteurs codant par exemple pour d'autres enzymes nécessaires à la production de l'acide carboxylique. La présente invention concerne également une méthode de préparation d'un microorganisme recombinant selon la présente invention comprenant l'introduction d'un vecteur tel que défini précédemment dans le microorganisme et la sélection des microorganismes comprenant ledit vecteur. Elle concerne également une méthode de préparation d'un microorganisme selon la présente invention comprenant l'introduction - (i) d' une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase et/ou (ii) d'une séquence d'acide nucléique codant pour une cinnamoyl-CoA réductase (CCR) et d'une séquence d'acide nucléique codant pour une aldéhyde deshydrogénase (ALDH),Optionally, the host microorganism can be transformed / transfected with several vectors according to the invention, which are identical or different. It can also be transformed / transfected with one or more other vectors coding, for example, for other enzymes necessary for the production of the carboxylic acid. The present invention also relates to a method for preparing a recombinant microorganism according to the present invention comprising the introduction of a vector as defined above into the microorganism and the selection of the microorganisms comprising said vector. It also relates to a method for preparing a microorganism according to the present invention comprising the introduction - (i) a nucleic acid sequence encoding an acyl-coenzyme A thioesterase and / or (ii) a nucleic acid sequence encoding a cinnamoyl-CoA reductase (CCR) and a sequence d 'nucleic acid encoding an aldehyde dehydrogenase (ALDH),
- et optionnellement d'au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT), une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), une séquence d'acide nucléique codant pour une p-coumarate 3-hydroxylase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3-monooxygénase oxygénase, une séquence d'acide nucléique codant pour une 4-hydroxyphénylacetate 3- monooxygénase réductase, une séquence d'acide nucléique codant pour une tyrosine ammonia lyase (TAL), une séquence d'acide nucléique codant pour une phénylalanine ammonia lyase (PAL), une séquence d'acide nucléique codant pour une cinnamate 4- hydroxylase (C4H) et une séquence d'acide nucléique codant pour une codant pour une cytochrome P450 réductase (CPR), chacune de ces enzymes étant telles que définies ci- dessus, ainsi que leurs combinaisons, et la sélection des microorganismes comprenant lesdites séquences nucléiques. - and optionally at least one nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT), a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase ( 4CL), a nucleic acid sequence encoding a p-coumarate 3-hydroxylase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3-monooxygenase oxygenase, a nucleic acid sequence encoding a 4-hydroxyphenylacetate 3- monooxygenase reductase, a nucleic acid sequence encoding a tyrosine ammonia lyase (TAL), a nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), a nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H ) and a nucleic acid sequence encoding one encoding a cytochrome P450 reductase (CPR), each of these enzymes being as defined above, as well as their combinations, and the selection of microorganisms comprising said seque nucleic acid nces.
De préférence, la méthode de préparation d'un microorganisme selon la présente invention comprend l'introduction Preferably, the method of preparing a microorganism according to the present invention comprises the introduction
- d' une séquence d'acide nucléique codant pour une acyl-coenzyme A thioestérase- a nucleic acid sequence encoding an acyl-coenzyme A thioesterase
- et optionnellement d'au moins une séquence d'acide nucléique choisie parmi une séquence d'acide nucléique codant pour une Caféoyl-CoA O-Méthyltransférase (CCoAMT) et une séquence d'acide nucléique codant pour une 4-coumaroyl-CoA ligase (4CL), ou une combinaison des deux, et la sélection des microorganismes comprenant lesdites séquences nucléiques, chacune de ces enzymes étant telles que définies ci-dessus. - and optionally at least one nucleic acid sequence chosen from a nucleic acid sequence encoding a Caféoyl-CoA O-Methyltransferase (CCoAMT) and a nucleic acid sequence encoding a 4-coumaroyl-CoA ligase ( 4CL), or a combination of the two, and the selection of microorganisms comprising said nucleic acid sequences, each of these enzymes being as defined above.
Utilisations du microorganisme recombinant Uses of the recombinant microorganism
La présente invention concerne également l'utilisation d'un microorganisme selon l'invention pour produire un acide carboxylique, en particulier un acide carboxylique dérivé d'un carboxyl-CoA. Elle concerne aussi une méthode de production d'un acide carboxylique, en particulier un acide carboxylique dérivé d'un carboxyl-CoA, comprenant la culture d'un microorganisme selon l'invention et éventuellement la récolte et/ou la purification dudit acide carboxylique. The present invention also relates to the use of a microorganism according to the invention for producing a carboxylic acid, in particular a carboxylic acid derived from a carboxyl-CoA. It also relates to a method of producing a carboxylic acid, in particular a carboxylic acid derived from a carboxyl-CoA, comprising the culture of a microorganism according to the invention and optionally the harvest and / or purification of said carboxylic acid.
Tel qu'utilisé ici, le terme « acide carboxylique » se réfère à un composé comprenant un groupe carboxyle (-C(O)OH). De préférence, l'acide carboxylique est un acide carboxylique aromatique, c'est-à-dire un composé comprenant un groupe carboxyle (-C(O)OH) et un groupe aromatique, de préférence un cycle phényle. As used herein, the term "carboxylic acid" refers to a compound comprising a carboxyl group (-C (O) OH). Preferably, the carboxylic acid is a carboxylic acid. aromatic, that is to say a compound comprising a carboxyl group (-C (O) OH) and an aromatic group, preferably a phenyl ring.
Le terme « acide carboxylique dérivé d'un carboxyl-CoA » se réfère à un acide carboxylique, de préférence un acide carboxylique aromatique obtenu à partir d'un carboxyl-CoA, c'est- à-dire un acide carboxylique dont la voie de biosynthèse au sein du microorganisme selon l'invention fait intervenir au moins un intermédiaire lié à la CoA qui est converti en ledit acide carboxylique par l'action de (i) l'acyl-coenzyme A thioestérase et/ou (ii) la cinnamoyl- CoA réductase (CCR) et l'aldéhyde deshydrogénase (ALDH) exprimées à partir des séquences nucléiques hétérologues introduites dans le microorganisme. En particulier, l'acide carboxylique produit par la méthode de production selon l'invention est de préférence un phénylpropanoïde choisi parmi l'acide cinnamique, l'acide p- coumarique, l'acide caféique, l'acide férulique, l'acide 5-hydroxyférulique et l'acide sinapique, et manière plus particulièrement préférée un phénylpropanoïde choisi parmi l'acide caféique, l'acide férulique, l'acide 5-hydroxyférulique et l'acide sinapique. De préférence, l'acide carboxylique est un composé de formule (II) tel que défini ci-dessous.The term "carboxylic acid derived from a carboxyl-CoA" refers to a carboxylic acid, preferably an aromatic carboxylic acid obtained from a carboxyl-CoA, that is to say a carboxylic acid whose pathway. biosynthesis within the microorganism according to the invention involves at least one intermediate linked to CoA which is converted into said carboxylic acid by the action of (i) acyl-coenzyme A thioesterase and / or (ii) cinnamoyl- CoA reductase (CCR) and aldehyde dehydrogenase (ALDH) expressed from heterologous nucleic acid sequences introduced into the microorganism. In particular, the carboxylic acid produced by the production method according to the invention is preferably a phenylpropanoid chosen from cinnamic acid, p-coumaric acid, caffeic acid, ferulic acid, 5 acid. -hydroxyferulic and sinapic acid, and more particularly preferably a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid. Preferably, the carboxylic acid is a compound of formula (II) as defined below.
En particulier, la présente invention concerne l'utilisation d'un microorganisme selon l'invention pour la production d'un composé de formule (II) In particular, the present invention relates to the use of a microorganism according to the invention for the production of a compound of formula (II)
(N) où (N) where
Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est choisi dans le groupe constitué d'un atome d'hydrogène et d'une chaîne hydrocarbonée comprenant de 1 à 36 atomes de carbone, ramifiée ou non ramifiée ; et R4 est choisi dans le groupe constitué de groupes alkyles en C1-C6 et de groupes alcènes en C1-C6, ramifiés ou non ramifiés, de préférence dans le groupe constitué de -(CH2)n-, - CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1, 2, 3, 4 et 5 et m, p et q sont des nombres entiers choisis parmi 1, 2 et 3. R 1, R 2 and R 3 are selected, independently of each other, from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and R 4 is selected from the group consisting of alkyl groups C 1 -C 6 alkyl and alkene groups of C 1 -C 6 alkyl, branched or unbranched, preferably from the group consisting of - (CH 2) n -, - CH = CH-, - (CH2) m- (CH = CH) p- (CH 2 ) q-, where n is an integer selected from 1, 2, 3, 4 and 5 and m, p and q are integers chosen from 1, 2 and 3.
Elle concerne également une méthode de production d'un composé de formule (II) It also relates to a method of producing a compound of formula (II)
où or
Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est choisi dans le groupe constitué d'un atome d'hydrogène et d'une chaîne hydrocarbonée comprenant de 1 à 36 atomes de carbone, ramifiée ou non ramifiée ; et R 1, R 2 and R 3 are selected, independently of each other, from the group consisting of a hydrogen atom and a group O-R5, where R5 is selected from the group consisting of a hydrogen atom and a hydrocarbon chain comprising from 1 to 36 carbon atoms, branched or unbranched; and
R4 est choisi dans le groupe constitué de groupes alkyles en C1-C6 et de groupes alcènes en C1-C6, ramifiés ou non ramifiés, de préférence dans le groupe constitué de -(CH2)n-, - CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1, 2, 3, 4 et 5 et m, p et q sont des nombres entiers choisis parmi 1, 2 et 3, comprenant la culture d'un microorganisme selon l'invention et éventuellement la récolte et/ou la purification dudit composé. R 4 is selected from the group consisting of alkyl groups C 1 -C 6 alkyl and alkene groups of C 1 -C 6 alkyl, branched or unbranched, preferably from the group consisting of - (CH 2) n -, - CH = CH-, - (CH2) m- (CH = CH) p- (CH 2 ) q-, where n is an integer selected from 1, 2, 3, 4 and 5 and m, p and q are numbers whole chosen from 1, 2 and 3, comprising the culture of a microorganism according to the invention and optionally the harvest and / or the purification of the said compound.
De préférence, R5 est choisi dans le groupe constitué d'un atome d'hydrogène, de groupes alkyles en C1-C6 ramifiés ou non ramifiés et de groupes alcènes en C1-C6 ramifiés ou non ramifiés. De manière plus particulièrement préférée, R5 est choisi dans le groupe constitué d'un atome d'hydrogène et d'un groupe méthyle. selon un mode de réalisation particulier, Preferably, R 5 is selected from the group consisting of hydrogen, alkyl C 1 -C 6 branched or unbranched alkenes and groups C 1 -C 6 branched or unbranched. More particularly preferably, R 5 is chosen from the group consisting of a hydrogen atom and a methyl group. according to a particular embodiment,
- Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est un groupe méthyle, et - Ri, R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and a group OR 5 , where R 5 is a methyl group, and
- R4 est choisi dans le groupe constitué de -(CH2)n-, -CH=CH-, -(CH2)m-(CH=CH)p-(CH2)q-, où n est un nombre entier choisi parmi 1 ou 2 et m, p et q sont des nombres entiers choisis parmi 1 ou 2. - R 4 is selected from the group consisting of - (CH2) n -, -CH = CH-, - (CH2) m- (CH = CH) p - (CH2) q -, where n is an integer selected from 1 or 2 and m, p and q are integers chosen from 1 or 2.
Selon un autre mode de réalisation particulier, - Ri, R2 et R3 sont choisis, indépendamment les uns des autres, dans le groupe constitué d'un atome d'hydrogène et un groupe O-R5, où R5 est un groupe méthyle, et According to another particular embodiment, - R 1, R 2 and R 3 are chosen, independently of each other, from the group consisting of a hydrogen atom and an O-R5 group, where R5 is a methyl group, and
- R4 est -CH2-CH=CH-CH2-. - R 4 is -CH 2 -CH = CH-CH 2 -.
Le microorganisme selon l'invention catalyse au minimum la réaction d'hydrolyse d'un carboxyl-CoA de formule (I) The microorganism according to the invention at least catalyzes the hydrolysis reaction of a carboxyl-CoA of formula (I)
permettant d'obtenir le composé de formule (II). making it possible to obtain the compound of formula (II).
Les groupes Ri, R¾ R3 et R4 sont définis comme indiqué ci-dessus pour le composé de formule (II). The groups Ri, R ¾ R3 and R4 are defined as indicated above for the compound of formula (II).
Selon un mode de réalisation préféré, le composé de formule (II) est choisi parmi l'acide férulique et l'acide sinapique. According to a preferred embodiment, the compound of formula (II) is chosen from ferulic acid and sinapic acid.
Selon un mode de réalisation tout particulièrement préféré, le composé de formule (II) est l'acide férulique. According to a very particularly preferred embodiment, the compound of formula (II) is ferulic acid.
Selon un aspect préféré, la présente invention concerne l'utilisation d'un microorganisme selon l'invention pour produire un phénylpropanoïde choisi parmi l'acide caféique, l'acide férulique, l'acide 5-hydroxyférulique et l'acide sinapique. Elle concerne aussi une méthode de production d'un phénylpropanoïde choisi parmi l'acide caféique, l'acide férulique, l'acide 5-hydroxyférulique et l'acide sinapique, comprenant la culture d'un microorganisme selon l'invention et éventuellement la récolte et/ou la purification dudit phénylpropanoïde.According to a preferred aspect, the present invention relates to the use of a microorganism according to the invention for producing a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid. It also relates to a method of producing a phenylpropanoid chosen from caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid, comprising the culture of a microorganism according to the invention and optionally the harvest. and / or the purification of said phenylpropanoid.
De préférence, le phénylpropanoïde est choisi parmi l'acide férulique et l'acide sinapique.Preferably, the phenylpropanoid is chosen from ferulic acid and sinapic acid.
De manière tout particulièrement préférée, le phénylpropanoïde est l'acide férulique.Very particularly preferably, the phenylpropanoid is ferulic acid.
Dans cet aspect préféré, le microorganisme selon l'invention catalyse au minimum la réaction d'hydrolyse du féruloyl-CoA en acide férulique, du caféoyl-CoA en acide caféique, du 5-hydroxyféruloyl-CoA en acide 5-hydroxyférulique et/ou du sinapoyl-CoA en acide sinapique, de préférence la réaction d'hydrolyse du féruloyl-CoA en acide férulique et/ou du sinapoyl-CoA en acide sinapique, et manière tout particulièrement préférée la réaction d'hydrolyse du féruloyl-CoA en acide férulique. In this preferred aspect, the microorganism according to the invention at least catalyzes the hydrolysis reaction of feruloyl-CoA to ferulic acid, of caffeoyl-CoA to caffeic acid, of 5-hydroxyferuloyl-CoA to 5-hydroxyferulic acid and / or of sinapoyl-CoA to sinapic acid, preferably the hydrolysis reaction of feruloyl-CoA to ferulic acid and / or of sinapoyl-CoA to sinapic acid, and very particularly preferably the hydrolysis reaction of feruloyl-CoA to ferulic acid.
Le composé produit par la méthode selon l'invention peut être soit le produit final soit un intermédiaire de synthèse ou de biosynthèse pour la préparation d'autres composés.The compound produced by the method according to the invention can be either the final product or a synthetic or biosynthetic intermediate for the preparation of other compounds.
Les conditions de culture du microorganisme selon l'invention peuvent être adaptées selon les techniques classiques, bien connues de l'homme du métier. The conditions for culturing the microorganism according to the invention can be adapted according to conventional techniques, well known to those skilled in the art.
Le microorganisme est cultivé dans un milieu de culture approprié. Le terme « milieu de culture approprié » désigne d'une manière générale un milieu de culture apportant les nutriments essentiels ou bénéfiques à la maintenance et/ou à la croissance dudit microorganisme, tels que les sources carbonées ; les sources azotées telles que le sulfate d'ammonium ; les sources de phosphores, par exemple, le potassium phosphate monobasique ; les oligo-éléments, par exemple, les sels de cuivre, d'iodure, de fer, de magnésium, de zinc ou de molybdate ; les vitamines et autres facteurs de croissance tels que des acides aminés ou autres promoteurs de croissance. Un antimousse peut être ajouté selon les besoins. Selon l'invention, ce milieu de culture approprié peut être chimiquement défini ou « non défini ». Le milieu de culture peut ainsi être de composition identique ou similaire à un milieu synthétique, tel que défini par Verduyn et al., (Yeast. 1992. 8:501-17), adapté par Visser et al., (Biotechnology and bioengineering. 2002. 79:674-81), ou commercialement disponible tel que le milieu YNB (Yeast Nitrogen Base, MP Biomedicals ou Sigma-Aldrich). Notamment, le milieu de culture peut comprendre une source de carbone simple, telle le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres. Le milieu « non défini » peut être un milieu liquide composé d'hydrolysats de micro-organismes et/ou de protéines, par exemple et non exclusivement d'extrait de levure et/ou de peptones. A cette composition s'ajoute généralement une source de carbone simple, telle le glucose, le fructose, le xylose, l'éthanol, le glycérol, le galactose, le saccharose, la cellulose, la cellobiose, l'amidon, les polymères de glucose, les mélasses, ou les sous-produits de ces sucres. Le microorganisme selon l'invention peut comprendre tout ou partie de la voie de biosynthèse de l'acide carboxylique d'intérêt. Ainsi, la production peut être réalisée en présence d'une source de carbone simple telle que du glucose, ou en présence d'un intermédiaire de synthèse tel que la tyrosine, la phénylalanine, l'acide cinnamique ou l'acide p-coumarique. Pour la synthèse d'acide férulique, l'intermédiaire de synthèse peut être également l'acide caféique, le caféoyl-CoA ou le féruloyl-CoA. Pour la synthèse d'acide sinapique, l'intermédiaire de synthèse peut être également l'acide 5-hydroxyférulique, le 5- hydroxyféruloyl-CoA ou le sinapoyl-CoA. Pour la synthèse d'acide caféique, l'intermédiaire de synthèse peut être également le caféoyl-CoA. Pour la synthèse d'acide 5- hydroxyférulique, l'intermédiaire de synthèse peut être également le 5-hydroxyféruloyl- CoA. The microorganism is cultivated in an appropriate culture medium. The term "suitable culture medium" generally designates a culture medium providing nutrients essential or beneficial to the maintenance and / or growth of said. microorganism, such as carbon sources; nitrogen sources such as ammonium sulfate; sources of phosphorus, for example, potassium phosphate monobasic; trace elements, for example copper, iodide, iron, magnesium, zinc or molybdate salts; vitamins and other growth factors such as amino acids or other growth promoters. Defoamer can be added as needed. According to the invention, this suitable culture medium can be chemically defined or “undefined”. The culture medium can thus be of identical or similar composition to a synthetic medium, as defined by Verduyn et al., (Yeast. 1992. 8: 501-17), adapted by Visser et al., (Biotechnology and bioengineering. 2002. 79: 674-81), or commercially available such as YNB medium (Yeast Nitrogen Base, MP Biomedicals or Sigma-Aldrich). In particular, the culture medium can comprise a simple carbon source, such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, polymers of glucose, molasses, or the byproducts of these sugars. The “undefined” medium can be a liquid medium composed of hydrolysates of microorganisms and / or proteins, for example and not exclusively of yeast extract and / or peptones. To this composition is generally added a simple carbon source, such as glucose, fructose, xylose, ethanol, glycerol, galactose, sucrose, cellulose, cellobiose, starch, glucose polymers. , molasses, or by-products of these sugars. The microorganism according to the invention can comprise all or part of the route of biosynthesis of the carboxylic acid of interest. Thus, the production can be carried out in the presence of a simple carbon source such as glucose, or in the presence of a synthetic intermediate such as tyrosine, phenylalanine, cinnamic acid or p-coumaric acid. For the synthesis of ferulic acid, the synthesis intermediate can also be caffeic acid, caffeoyl-CoA or feruloyl-CoA. For the synthesis of sinapic acid, the synthetic intermediate can also be 5-hydroxyferulic acid, 5-hydroxyferuloyl-CoA or sinapoyl-CoA. For the synthesis of caffeic acid, the synthesis intermediate can also be caffeoyl-CoA. For the synthesis of 5-hydroxyferulic acid, the synthetic intermediate can also be 5-hydroxyferuloyl-CoA.
Selon un mode de réalisation particulier, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide férulique à partir d'acide caféique. De préférence, la culture du microorganisme est réalisé en présence d'acide caféique dans le milieu de culture. De préférence, dans ce mode de réalisation, le microorganisme comprend According to a particular embodiment, the microorganism according to the invention is used in a method for producing ferulic acid from caffeic acid. Preferably, the culture of the microorganism is carried out in the presence of caffeic acid in the culture medium. Preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, en particulier une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ. ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl- coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl- coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl- coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ. ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl- coenzyme A thioestérase ; et/ou a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ. ID NOs: 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A activity thioesterase, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprennant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, en particulier une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. De manière plus particulièrement préférée, dans ce mode de réalisation, le microorganisme comprend - a heterologous nucleic acid sequence encoding a CCoAMT, in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity. More particularly preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, de préférence une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ. ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprennant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. Selon un mode de réalisation préféré, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide férulique à partir de glucose. De préférence, la culture du microorganisme est réalisé sans apport de composé intermédiaire dans le milieu, c'est- à-dire sans apport de tyrosine, phénylalanine, acide cinnamique, l'acide p-coumarique, acide caféique, caféoyl-CoA et/ou féruloyl-CoA. a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity. According to a preferred embodiment, the microorganism according to the invention is used in a method for producing ferulic acid from glucose. Preferably, the culture of the microorganism is carried out without supplying any intermediate compound in the medium, that is to say without supplying tyrosine, phenylalanine, cinnamic acid, p-coumaric acid, caffeic acid, caffeoyl-CoA and / or feruloyl-CoA.
De préférence, dans ce mode de réalisation, le microorganisme comprend Preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, en particulier une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl- coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ. ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl- coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl- coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl- coenzyme A thioestérase ; et/ou - une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprenant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ. ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and / or - a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, en particulier une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 eta heterologous nucleic acid sequence encoding a CCoAMT, in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and
41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité41 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from among the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the activity
CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ. ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et CCoAMT, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ. ID NO: 6 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence une C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate 3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité 4-hydroxyphénylacetate 3-monooxygénase réductase ; et comprend en outre - (i) a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate 3-hydroxylase activity; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4- activity hydroxyphenylacetate 3-monooxygenase oxygenase, and said HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequence s and exhibiting the 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 18 and exhibiting 4-hydroxyphenylacetate 3-monooxygenase reductase activity; and further includes
(i) une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi SEQ. ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ. ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H ; et/ou (i) a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ. ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting C4H activity, and more particularly preferred, comprising a sequence chosen from the sequence SEQ. ID NO: 21 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity; and or
(ii) une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL, et de manière plus particulièrement préférée, une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.(ii) a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
De manière plus particulièrement préférée, dans ce mode de réalisation, le microorganisme comprend More particularly preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, de préférence une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting the activity acyl-coenzyme A thioesterase; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprenant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre - une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ. ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5, 6, 8 et 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL ; et a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ. ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5, 6, 8 and 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity; and
- (i) une séquence d'acide nucléique hétérologue codant pour une C3H, de préférence une C3H comprenant une séquence choisie parmi la séquence SEQ ID NO : 25 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 25 et présentant l'activité p-coumarate- (i) a heterologous nucleic acid sequence encoding a C3H, preferably a C3H comprising a sequence chosen from the sequence SEQ ID NO: 25 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 25 and exhibiting p-coumarate activity
3-hydroxylase ; et/ou (ii) une séquence d'acide nucléique hétérologue codant pour une HpaB et une séquence d'acide nucléique hétérologue codant pour une HpaC, ladite HpaB comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 17 et 26 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4- hydroxyphénylacetate 3-monooxygénase oxygénase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 17 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 17 et présentant une activité 4-hydroxyphénylacetate 3- monooxygénase oxygénase, et ladite HpaC comprenant de préférence une séquence choisie parmi les séquences SEQ ID NO : 18 et 27 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4-hydroxyphénylacetate 3-monooxygénase réductase, et de manière plus particulièrement préférée, une séquence choisie parmi SEQ ID Nos : 18 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 18 et présentant une activité3-hydroxylase; and / or (ii) a heterologous nucleic acid sequence encoding an HpaB and a heterologous nucleic acid sequence encoding an HpaC, said HpaB preferably comprising a sequence chosen from the sequences SEQ ID NO: 17 and 26 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting 4-hydroxyphenylacetate 3-monooxygenase oxygenase activity, and more particularly preferably , a sequence chosen from SEQ ID Nos: 17 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 17 and exhibiting 4- activity hydroxyphenylacetate 3-monooxygenase oxygenase, and said HpaC preferably comprising a sequence chosen from the sequences SEQ ID NO: 18 and 27 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% identity of sequence with one of these sequence s and exhibiting the 4-hydroxyphenylacetate 3-monooxygenase reductase activity, and more particularly preferably, a sequence chosen from SEQ ID Nos: 18 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95 % sequence identity with the sequence SEQ ID NO: 18 and exhibiting activity
4-hydroxyphénylacetate 3-monooxygénase réductase ; et comprend en outre (i) une séquence d'acide nucléique hétérologue codant pour une phénylalanine ammonia lyase (PAL), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 20, 31 et 32 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité PAL, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ. ID NO : 20 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 20 et présentant l'activité PAL ; et une séquence d'acide nucléique hétérologue codant pour une cinnamate 4-hydroxylase (C4H), de préférence comprenant une séquence choisie parmi SEQ ID NOs : 21, 33 et 34 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85,4-hydroxyphenylacetate 3-monooxygenase reductase; and further includes (i) a heterologous nucleic acid sequence encoding a phenylalanine ammonia lyase (PAL), preferably comprising a sequence chosen from SEQ ID NOs: 20, 31 and 32 and polypeptides comprising a sequence having at least 60, 70, 80 , 85, 90 or 95% sequence identity with one of these sequences and exhibiting PAL activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ. ID NO: 20 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 20 and exhibiting PAL activity; and a heterologous nucleic acid sequence encoding a cinnamate 4-hydroxylase (C4H), preferably comprising a sequence chosen from SEQ ID NOs: 21, 33 and 34 and polypeptides comprising a sequence having at least 60, 70, 80, 85,
90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité C4H, et de manière plus particulièrement préférée, comprenant une séquence choisie parmi la séquence SEQ ID NO : 21 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 21 et présentant l'activité C4H ; et/ou 90 or 95% sequence identity with one of these sequences and exhibiting the C4H activity, and more particularly preferably, comprising a sequence chosen from the sequence SEQ ID NO: 21 and polypeptides comprising a sequence having at least 60 , 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 21 and exhibiting C4H activity; and or
(ii) une séquence d'acide nucléique hétérologue codant pour une TAL, de préférence une TAL comprenant une séquence choisie parmi les séquences SEQ ID NOs : 19 et 30 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité TAL, et de manière plus particulièrement préférée, une séquence choisie parmi la séquence SEQ ID NO : 19 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 19 et présentant l'activité TAL.(ii) a heterologous nucleic acid sequence encoding a TAL, preferably a TAL comprising a sequence chosen from the sequences SEQ ID NOs: 19 and 30 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting TAL activity, and more particularly preferably, a sequence chosen from the sequence SEQ ID NO: 19 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 19 and exhibiting TAL activity.
Selon un autre mode de réalisation préféré, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide sinapique à partir d'acide 5-hydroxyférulique. De préférence, la culture du microorganisme est réalisé sans apport de composé intermédiaire dans le milieu, c'est-à-dire sans apport de 5-hydroxyféruloyl-CoA et/ou de sinapoyl-CoA.According to another preferred embodiment, the microorganism according to the invention is used in a method for producing sinapic acid from 5-hydroxyferulic acid. Preferably, the culture of the microorganism is carried out without adding an intermediate compound to the medium, that is to say without adding 5-hydroxyferuloyl-CoA and / or sinapoyl-CoA.
De préférence, dans ce mode de réalisation, le microorganisme comprend Preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, en particulier une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl- coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl- coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl- coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl- coenzyme A thioestérase ; et/ou a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1, 2 and 39 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence selected from the sequences SEQ ID NOs: 1 and 2, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A activity thioesterase, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% of sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprennant une séquence choisie parmi la séquence SEQ. ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ. ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting the ALDH activity , and further includes
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, en particulier une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, 40 et 41 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et - a heterologous nucleic acid sequence encoding a CCoAMT, in particular a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, 40 and 41 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16, and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and
- une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity.
De manière plus particulièrement préférée, dans ce mode de réalisation, le microorganisme comprend More particularly preferably, in this embodiment, the microorganism comprises
- une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, de préférence une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ. ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase ; et/ou a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly preferred an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ. ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity; and or
- une séquence d'acide nucléique hétérologue codant pour une CCR et une séquence d'acide nucléique hétérologue codant pour une ALDH, de préférence ladite CCR comprennant une séquence choisie parmi la séquence SEQ ID NO : 4 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 4 et présentant l'activité CCR, et ladite ALDH comprennant une séquence choisie parmi la séquence SEQ ID NO : 3 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 3 et présentant l'activité ALDH, et comprend en outre a heterologous nucleic acid sequence encoding a CCR and a heterologous nucleic acid sequence encoding an ALDH, preferably said CCR comprising a sequence chosen from the sequence SEQ ID NO: 4 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 4 and exhibiting the CCR activity, and said ALDH comprising a sequence chosen from the sequence SEQ ID NO: 3 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 3 and exhibiting ALDH activity, and further comprising
- une séquence d'acide nucléique hétérologue codant pour une CCoAMT, de préférence une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10 à 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT, et de manière plus particulièrement préférée, une CCoAMT comprenant une séquence choisie parmi les séquences SEQ ID NO : 10, 15 et 16 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité CCoAMT ; et une séquence d'acide nucléique hétérologue codant pour une 4CL, de préférence une 4CL comprenant une séquence choisie parmi les séquences SEQ ID NO : 5 à 9 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec l'une de ces séquences et présentant l'activité 4CL, et de manière tout particulièrement préférée une 4CL comprenant une séquence choisie parmi la séquence SEQ ID NO : 6 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 6 et présentant l'activité 4CL. a heterologous nucleic acid sequence encoding a CCoAMT, preferably a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10 to 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the CCoAMT activity, and more particularly preferably, a CCoAMT comprising a sequence chosen from the sequences SEQ ID NO: 10, 15 and 16 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting CCoAMT activity; and a heterologous nucleic acid sequence encoding a 4CL, preferably a 4CL comprising a sequence chosen from the sequences SEQ ID NO: 5 to 9 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting the 4CL activity, and very particularly preferably a 4CL comprising a sequence chosen from the sequence SEQ ID NO: 6 and the polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 6 and exhibiting 4CL activity.
Selon un autre mode de réalisation, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide caféique à partir de caféoyl-CoA. Le caféoyl-CoA peut être produit par le microorganisme ou ajouté au milieu de culture. De préférence, dans ce mode de réalisation, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, en particulier une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ. ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl-coenzyme A thioestérase. According to another embodiment, the microorganism according to the invention is used in a method for producing caffeic acid from caffeoyl-CoA. Caffeoyl-CoA can be produced by the microorganism or added to the culture medium. Preferably, in this embodiment, the microorganism comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs : 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl activity. coenzyme A thioesterase, and more particularly preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ. ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity.
Selon un autre mode de réalisation, le microorganisme selon l'invention est utilisé dans une méthode de production d'acide 5-hydroxyférulique à partir de 5-hydroxyféruloyl-CoA. Le 5- hydroxyféruloyl-CoA peut être produit par le microorganisme ou ajouté au milieu de culture. De préférence, dans ce mode de réalisation, le microorganisme comprend une séquence d'acide nucléique hétérologue codant pour une l'acyl-coenzyme A thioestérase, en particulier une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1, 2 et 39 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, de préférence une acyl-coenzyme A thioestérase comprenant une séquence choisie parmi les séquences SEQ ID NOs : 1 et 2, et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec une de ces séquences et présentant l'activité acyl-coenzyme A thioestérase, et de manière plus particulièrement préférée une l'acyl-coenzyme A thioestérase comprenant une séquence choisie parmi la séquence SEQ ID NO : 2 et les polypeptides comprenant une séquence ayant au moins 60, 70, 80, 85, 90 ou 95 % d'identité de séquence avec la séquence SEQ ID NO : 2 et présentant l'activité acyl- coenzyme A thioestérase. Selon l'invention, tout mode de culture permettant la production à l'échelle industrielle de molécules d'intérêt peut être envisagé. Avantageusement, la culture se fait en bioréacteurs, notamment en mode batch, fed-batch, chemostat et/ou culture continue. Une alimentation contrôlée en vitamines au cours du procédé peut également être bénéfique à la productivité (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60:67-72). La culture est généralement conduite en bioréacteurs, avec de possibles étapes de précultures solides et/ou liquides en Erlenmeyers, avec un milieu de culture approprié.According to another embodiment, the microorganism according to the invention is used in a method for producing 5-hydroxyferulic acid from 5-hydroxyferuloyl-CoA. 5-Hydroxyferuloyl-CoA can be produced by the microorganism or added to the culture medium. Preferably, in this embodiment, the microorganism comprises a heterologous nucleic acid sequence encoding an acyl-coenzyme A thioesterase, in particular an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs : 1, 2 and 39 and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, preferably an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequences SEQ ID NOs: 1 and 2, and polypeptides comprising a sequence having at least 60, 70, 80, 85, 90 or 95% sequence identity with one of these sequences and exhibiting acyl-coenzyme A thioesterase activity, and more particularly an acyl-coenzyme A thioesterase comprising a sequence chosen from the sequence SEQ ID NO: 2 and polypeptides comprising a sequence having at least 60, 70, 8 0, 85, 90 or 95% sequence identity with the sequence SEQ ID NO: 2 and exhibiting acyl-coenzyme A thioesterase activity. According to the invention, any mode of culture allowing the production on an industrial scale of molecules of interest can be envisaged. Advantageously, the culture is carried out in bioreactors, in particular in batch, fed-batch, chemostat and / or continuous culture mode. Controlled vitamin supply during the process may also benefit productivity (Alfenore et al., Appl Microbiol Biotechnol. 2002. 60: 67-72). The culture is generally carried out in bioreactors, with possible steps of solid and / or liquid precultures in Erlenmeyer flasks, with an appropriate culture medium.
D'une manière générale, les conditions de culture des microorganismes selon l'invention sont aisément adaptables par l'homme du métier, en fonction du microorganisme. Par exemple, la température de culture est notamment comprise pour les levures entre 20°C et 40°C, de préférence entre 28°C et 40°C, et plus particulièrement d'environ 30°C pour 5 cerevisiae. In general, the conditions for the culture of the microorganisms according to the invention are easily adaptable by a person skilled in the art, depending on the microorganism. For example, the culture temperature is in particular for yeasts between 20 ° C and 40 ° C, preferably between 28 ° C and 40 ° C, and more particularly around 30 ° C for cerevisiae.
Le microorganisme selon la présente invention peut être cultivé pendant 1 à 30 jours, et de préférence de 1 à 10 jours. La présente invention concerne également l'utilisation d'un microorganisme selon l'invention pour catalyser la conversion d'un carboxyl-CoA, de préférence de formule (I) en un acide carboxylique, de préférence de formule (II). Elle concerne en outre un procédé pour catalyser la conversion d'un carboxyl-CoA, de préférence de formule (I) en un acide carboxylique, de préférence de formule (II), comprenant la culture d'un microorganisme selon l'invention en présence dudit carboxyl-CoA ou de l'un de ces précurseurs, et éventuellement la récolte et/ou la purification dudit acide carboxylique. Tous les modes de réalisation décrits ci-dessus concernent également cet aspect. The microorganism according to the present invention can be cultured for 1 to 30 days, and preferably 1 to 10 days. The present invention also relates to the use of a microorganism according to the invention for catalyzing the conversion of a carboxyl-CoA, preferably of formula (I) into a carboxylic acid, preferably of formula (II). It further relates to a process for catalyzing the conversion of a carboxyl-CoA, preferably of formula (I) into a carboxylic acid, preferably of formula (II), comprising the culture of a microorganism according to the invention in the presence of said carboxyl-CoA or of one of these precursors, and optionally the harvest and / or purification of said carboxylic acid. All of the embodiments described above also relate to this aspect.
En particulier, le microorganisme selon l'invention peut être utilisé pour catalyser la conversion du féruloyl-CoA en acide férulique, du caféoyl-CoA en acide caféique, du 5- hydroxyféruloyl-CoAen acide 5-hydroxyférulique et/ou du sinapoyl-CoAen acide sinapique.In particular, the microorganism according to the invention can be used to catalyze the conversion of feruloyl-CoA to ferulic acid, of caféoyl-CoA to caffeic acid, of 5-hydroxyferuloyl-CoAen to 5-hydroxyferulic acid and / or of sinapoyl-CoAen acid. sinapic.
Selon un mode de réalisation préféré, le carboxyl-CoA est le féruloyl-CoA, l'acide carboxylique est l'acide férulique et le précurseur est choisi parmi le glucose, la phénylalanine, la tyrosine, l'acide cinnamique, l'acide p-coumarique, l'acide caféique et le caféoyl-CoA, de préférence est de l'acide caféique. According to a preferred embodiment, the carboxyl-CoA is feruloyl-CoA, the carboxylic acid is ferulic acid and the precursor is chosen from glucose, phenylalanine, tyrosine, cinnamic acid, p acid. -coumaric, caffeic acid and caffeoyl-CoA, preferably is caffeic acid.
Selon un autre mode de réalisation préféré, le carboxyl-CoA est le sinapoyl-CoA, l'acide carboxylique est l'acide sinapique et le précurseur est choisi parmi le glucose, la phénylalanine, la tyrosine, l'acide cinnamique, l'acide p-coumarique, l'acide 5- hydroxyférulique et le 5-hydroxyféruloyl-CoA, de préférence est de l'acide 5- hydroxyférulique. According to another preferred embodiment, the carboxyl-CoA is sinapoyl-CoA, the carboxylic acid is sinapic acid and the precursor is chosen from glucose, phenylalanine, tyrosine, cinnamic acid, acid. p-coumaric, 5-hydroxyferulic acid and 5-hydroxyferuloyl-CoA, preferably is 5-hydroxyferulic acid.
Toutes les références citées dans cette description sont incorporées par référence dans la présente demande. D'autres caractéristiques et avantages de l'invention apparaîtront mieux à la lecture des exemples suivants donnés à titre illustratif et non limitatif. All references cited in this description are incorporated by reference into the present application. Other characteristics and advantages of the invention will emerge more clearly on reading the following examples given by way of illustration and without limitation.
Tableau 1 : DESCRIPTION DES SEQUENCES Table 1: DESCRIPTION OF SEQUENCES
EXEMPLES EXAMPLES
Matériels et méthodes Materials and methods
Souches Strains
Les souches de levure utilisées dans les exemples ont été obtenues à partir de Saccharomyces cerevisiae S288C (Mortimer RK and Johnston JR (1986) Genealogy of principal strains of the yeast genetic stock center. Genetics 113(l):35-43). Cette levure possède une auxotrophie pour l'uracile, le tryptophane et la leucine. The yeast strains used in the examples were obtained from Saccharomyces cerevisiae S288C (Mortimer RK and Johnston JR (1986) Genealogy of principal strains of the yeast genetic stock center. Genetics 113 (1): 35-43). This yeast has an auxotrophy for uracil, tryptophan and leucine.
Les constructions ont été réalisées dans la souche d'Escherichia coli MH1 avant leur transfert chez la levure. The constructions were carried out in the strain of Escherichia coli MH1 before their transfer to the yeast.
Dans toutes les souches construites pour cette étude, les gènes AR010 (YDR380W) et FDC1 (YDR539W) ont été inactivés, c'est à dire par intégration en lieu et place du cadre de lecture ouvert, d'un ADN linéaire comprenant un marqueur de sélection borné par les régions amont et aval du gène. In all the strains constructed for this study, the AR010 (YDR380W) and FDC1 (YDR539W) genes were inactivated, i.e. by integration instead of the open reading frame, of a linear DNA comprising a marker of selection bounded by the upstream and downstream regions of the gene.
Tableau 2 : Liste des souches construites Table 2: List of strains constructed
Clonage des gènes Gene cloning
Les gènes dont les codons ont été optimisés pour s'exprimer dans la levure ont été synthétisés par Twist Biosciences, San Francisco, USA ou DC Biosciences, Dundee, UK. Les gènes AR04 (GenBank accession number : NP_009808) et AR07 (GenBank accession number : NP_015385) ont été amplifiés par PCR à partir de l'ADN génomique de S. cerevisiae, puis ont été mutés afin que leur produit soit résistant à la rétro-inhibition (FBR: Feed Back Résistance) (Gold et al., Microb Cell Fact. 2015;14:73). The genes whose codons have been optimized for expression in yeast have been synthesized by Twist Biosciences, San Francisco, USA or DC Biosciences, Dundee, UK. The genes AR04 (GenBank accession number: NP_009808) and AR07 (GenBank accession number: NP_015385) were amplified by PCR from the genomic DNA of S. cerevisiae, then were mutated so that their product was resistant to retro- inhibition (FBR: Feed Back Resistance) (Gold et al., Microb Cell Fact. 2015; 14: 73).
Les promoteurs et terminateurs (Wagner et al., Fungal Genet Biol. 2016;89:126-136) ont été amplifiés par PCR à partir de l'ADN génomique de S. cerevisiae. The promoters and terminators (Wagner et al., Fungal Genet Biol. 2016; 89: 126-136) were amplified by PCR from the genomic DNA of S. cerevisiae.
Les gènes obtenus par synthèse ou par PCR comprennent à l'extrémité 5' et 3', un site de restriction Bbsl (GAAGAC) ou Bsal (GGTCTC), compatible avec le système de clonage utilisé. Tous les gènes, les promoteurs et les terminateurs ont été clonés dans les sites de restriction du vecteur pSBK. Le vecteur pSBK comprend le marqueur de sélection URA3, LEU2 ou TRP1. The genes obtained by synthesis or by PCR comprise at the 5 'and 3' end, a BbsI (GAAGAC) or Bsal (GGTCTC) restriction site, compatible with the cloning system used. All of the genes, promoters and terminators were cloned into the restriction sites of the pSBK vector. The vector pSBK comprises the selection marker URA3, LEU2 or TRP1.
Conditions de culture Cultivation conditions
Les souches de levure ont été cultivées 72h à 30°C, en plaque 24 puits, sous agitation continue (200 RPM), dans 1 ml de milieu SD (Dutscher, Brumath, France) supplémenté ou non par du CSM (Complété Supplément Mixture; Formedium, UK). The yeast strains were cultured for 72 hours at 30 ° C., in a 24-well plate, with continuous stirring (200 RPM), in 1 ml of SD medium (Dutscher, Brumath, France) supplemented or not with CSM (Completed Supplement Mixture; Formedium, UK).
Le glucose est ajouté à 20 g/L et, lorsque cela est requis, de l'acide p-coumarique, de l'acide caféique ou de l'acide 5-hydroxy-férulique a été ajouté dans le milieu à une concentration de 100 mg/L. Chaque souche a été inoculée à DO 0,2 à partir d'une préculture de 24h cultivée dans les mêmes conditions. Glucose is added at 20 g / L and when required p-coumaric acid, caffeic acid or 5-hydroxy-ferulic acid has been added to the medium at a concentration of 100 mg / L. Each strain was inoculated at OD 0.2 from a 24 h preculture cultivated under the same conditions.
Standards Les standards pour l'acide p-coumarique, l'acide caféique, l'acide férulique, l'acide 5- hydroxyférulique et l'acide sinapique ont été obtenus chez le fournisseur Sigma-Aldrich. Standards Standards for p-coumaric acid, caffeic acid, ferulic acid, 5-hydroxyferulic acid and sinapic acid were obtained from the supplier Sigma-Aldrich.
Méthode analytique Analytical method
Préparation des échantillons : Des échantillons de 100 μL sont récupérés pour chaque expérience. 50 pL sont transférés dans une nouvelle plaque, auxquels sont ajoutés 50 pL de la solution d'étalon interne. Chaque échantillon est ensuite homogénéisé par aspiration- refoulement, puis centrifugé pendant 5 min à 3000 rpm à température ambiante. La concentration finale de l'étalon interne (Acide Protocatéchuique) est de 0,5 mg/L. Preparation of the samples: Samples of 100 μL are collected for each experiment. 50 µL are transferred to a new plate, to which are added 50 µL of the internal standard solution. Each sample is then homogenized by suction-discharge, then centrifuged for 5 min at 3000 rpm at room temperature. The final concentration of the internal standard (Protocatechuic Acid) is 0.5 mg / L.
Analyse par UHPLC-TQ : Les échantillons ont été analysés par une UHPLC Vanquish-H (Thermo) couplée à un triple-quadripôle UHPLC-TQ. (Thermo). La colonne est une colonne Waters Acquity UPLC@ USST3 (8 pm 2,1 X 100 mm) associée à une pré-colonne HSST3 1,8 pm 2,1 X 5 mm. Analysis by UHPLC-TQ: The samples were analyzed by a UHPLC Vanquish-H (Thermo) coupled to a triple-quadrupole UHPLC-TQ. (Thermo). The column is a Waters Acquity UPLC @ USST3 column (8 µm 2.1 X 100 mm) associated with a HSST3 1.8 µm 2.1 X 5 mm pre-column.
La phase mobile A est une solution de 0,1 % d'acide formique dans de l'eau de qualité LC/MS et la phase mobile B est une solution de 0,1 % d'acide formique dans de l'acétonitrile pur de qualité LC/MS. La température de la colonne est de 50°C et la température du passeur d'échantillons à 10°C. Mobile phase A is a solution of 0.1% formic acid in LC / MS grade water and mobile phase B is a solution of 0.1% formic acid in pure acetonitrile of LC / MS quality. The temperature of the column is 50 ° C and the temperature of the autosampler is 10 ° C.
Tableau 3 : conditions chromatographiques pour la détection des molécules d'intérêt : Table 3: chromatographic conditions for the detection of molecules of interest:
Les paramètres de la source électrospray sont : - voltage du spray mode positif à 4000V The parameters of the electrospray source are: - voltage of the positive mode spray at 4000V
- gaz rideau : à 50 (unité arbitraire) - curtain gas: at 50 (arbitrary unit)
- gaz auxiliaire à 15 (unité arbitraire) - auxiliary gas at 15 (arbitrary unit)
- température du tube de transfert à 300°C - temperature of the transfer tube at 300 ° C
- température du vaporisateur à 300°C Tableau 4 : Les ions suivis et les conditions defragmentation pour les molécules d'intérêt : - vaporizer temperature at 300 ° C Table 4: The ions monitored and the fragmentation conditions for the molecules of interest:
Résultats Production d'acide férulique à partir d'acide caféique Results Production of ferulic acid from caffeic acid
Le gène codant pour la thioestérase d’Arabidopsis thaliana (Thiol, SEQ ID NO : 1) ou de Pétunia hybrida (Thio3, SEQ. ID NO : 2) a été inséré dans la souche 221 qui exprime la 4CL d’Arabidopsis thaliana (4CL1, SEQ ID NO : 5) et la CCoAMT d’Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et dans laquelle les gènes ArolO et Fdc ont été inactivés (souche 221). Les souches obtenues sont les souches 345 et 239. The gene encoding the thioesterase of Arabidopsis thaliana (Thiol, SEQ ID NO: 1) or of Petunia hybrida (Thio3, SEQ. ID NO: 2) was inserted into the strain 221 which expresses the 4CL of Arabidopsis thaliana (4CL1 , SEQ ID NO: 5) and the Arabidopsis thaliana CCoAMT (CC0AMT6, SEQ ID NO: 15) and in which the ArolO and Fdc genes have been inactivated (strain 221). The strains obtained are strains 345 and 239.
Les gènes codant pour la CCR de Populus tomentosa (SEQ ID NO : 4) et pour l'ALDH d ’Arabidopsis thaliana (SEQ ID NO : 3) ont également été insérés dans la souche 221 pour obtenir la souche 214. The genes encoding the CCR of Populus tomentosa (SEQ ID NO: 4) and for the ALDH of Arabidopsis thaliana (SEQ ID NO: 3) were also inserted into strain 221 to obtain strain 214.
La production d'acide férulique est testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec la souche 221. The production of ferulic acid is tested with each of these strains in the presence of 100 mg / L of caffeic acid. It is compared with that obtained with strain 221.
Les résultats sont présentés dans la figure 1 et montrent que les thioestérases, CCR et ALDH de plante exprimées de manière hétérologue dans la levure sont actives et capables de convertir le féruloyl-CoA en acide férulique. The results are shown in Figure 1 and show that plant thioesterases, CCR and ALDH heterologously expressed in yeast are active and capable of converting feruloyl-CoA to ferulic acid.
De manière similaire, le gène codant pour la thioestérase d ’Oryza meyeriana var. granulata (Thio30, SEQ ID NO : 39) a été inséré dans une souche qui exprime la 4CL de Citrus clementina (4CL5, SEQ ID NO : 6) et la CCoAMT d ’Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et dans laquelle les gènes ArolO et Fdc ont été inactivés. La souche obtenue est la souche 806. La production d'acide férulique est testée en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec une souche qui exprime la 4CL de Citrus clementina (4CL5, SEQ ID NO : 6), la CCoAMT d 'Arabidopsis thaliana (CC0AMT6, SEQ ID NO : 15) et la thioestérase de Pétunia hybrida (Thio3, SEQ ID NO : 2). Après 72h de culture, la souche 806 et la souche contrôle ont produit respectivement 40 mg/L et 42 mg/L d'acide férulique. Ce résultat montre que la thioestérase d ’Oryza meyeriana var. granulata (Thio30, SEQ ID NO : 39) exprimée de manière hétérologue dans la levure est active et capable de convertir le féruloyl-CoA en acide férulique. Production d'acide sinapique à partir d'acide 5-hydroxy-férulique Similarly, the gene encoding the thioesterase of Oryza meyeriana var. granulata (Thio30, SEQ ID NO: 39) was inserted into a strain which expresses the 4CL of Citrus clementina (4CL5, SEQ ID NO: 6) and the CCoAMT of Arabidopsis thaliana (CC0AMT6, SEQ ID NO: 15) and in which the ArolO and Fdc genes have been inactivated. The strain obtained is strain 806. The production of ferulic acid is tested in the presence of 100 mg / L of caffeic acid. It is compared with that obtained with a strain which expresses the 4CL of Citrus clementina (4CL5, SEQ ID NO: 6), the CCoAMT of Arabidopsis thaliana (CC0AMT6, SEQ ID NO: 15) and the thioesterase of Petunia hybrida (Thio3, SEQ ID NO: 2). After 72 hours of culture, strain 806 and the control strain produced 40 mg / L and 42 mg / L of ferulic acid, respectively. This result shows that the thioesterase of Oryza meyeriana var. granulata (Thio30, SEQ ID NO: 39) heterologously expressed in yeast is active and capable of converting feruloyl-CoA to ferulic acid. Production of sinapic acid from 5-hydroxy-ferulic acid
Une souche a été obtenue en insérant les gènes codant pour la thioestérase de Pétunia hybrida (Thio3, SEQ ID NO : 2), la 4CL de Citrus sinensis (4CL5, SEQ ID NO : 6) et la CCoAMT de Vitis vinifera (CCoAMTl, SEQ ID NO : 10) dans une souche dans laquelle les gènes ArolO et Fdc ont été inactivés. La souche ainsi obtenue est la souche 367. Les gènes codant pour la 4CL de Citrus sinensis (4CL5, SEQ ID NO : 6), la CCoAMT de Vitis vinifera (CCoAMTl, SEQ ID NO : 10), la CCR de Populus tomentosa (SEQ ID NO : 4) et l'ALDH d 'Arabidopsis thaliana (SEQ ID NO : 3) ont été insérés dans une souche dans laquelle les gènes ArolO et Fdc ont été inactivés. La souche ainsi obtenue est la souche 616. A strain was obtained by inserting the genes encoding the thioesterase of Petunia hybrida (Thio3, SEQ ID NO: 2), the 4CL of Citrus sinensis (4CL5, SEQ ID NO: 6) and the CCoAMT of Vitis vinifera (CCoAMTl, SEQ ID NO: 10) in a strain in which the ArolO and Fdc genes have been inactivated. The strain thus obtained is strain 367. The genes encoding the 4CL of Citrus sinensis (4CL5, SEQ ID NO: 6), the CCoAMT of Vitis vinifera (CCoAMT1, SEQ ID NO: 10), the CCR of Populus tomentosa (SEQ ID NO: 4) and ALDH from Arabidopsis thaliana (SEQ ID NO: 3) were inserted into a strain in which the ArolO and Fdc genes have been inactivated. The strain thus obtained is strain 616.
La production d'acide sinapique est testée avec chacune de ces souches en présence de 100 mg/L d'acide 5-hydroxy-férulique. Elle est comparée à celle obtenue avec la souche 617.The production of sinapic acid is tested with each of these strains in the presence of 100 mg / L of 5-hydroxy-ferulic acid. It is compared with that obtained with strain 617.
Les résultats sont présentés dans les figures 2 et 3 et montrent que les thioestérases, CCR et ALDH de plante exprimées de manière hétérologue dans la levure sont actives et capables de convertir le sinapoyl-CoA en acide sinapique. Optimisation de la voie de production d'acide férulique à partir d'acide caféique et de la voie de production d'acide sinapique à partir d'acide 5-hydroxy-féruliqueThe results are shown in Figures 2 and 3 and show that plant thioesterases, CCR and ALDH heterologously expressed in yeast are active and capable of converting sinapoyl-CoA to sinapic acid. Optimization of the ferulic acid production pathway from caffeic acid and the sinapic acid production pathway from 5-hydroxy-ferulic acid
Différentes souches de levures ont été construites, toutes exprimant la thioestérase de Pétunia hybrida (Thio3, SEQ ID NO : 2) et dans lesquelles les gènes ArolO et Fdc ont été inactivés . Dans ces souches ont été ajoutés cinq 4CL différentes (4CL1, 4CL5, 4CL7, 4CLA et 4CLB). Les 5 souches ainsi obtenues sont les souches 334, 335, 336, 337 et 338. Different strains of yeast were constructed, all expressing the thioesterase from Petunia hybrida (Thio3, SEQ ID NO: 2) and in which the ArolO and Fdc genes have been inactivated. In these strains were added five different 4CL (4CL1, 4CL5, 4CL7, 4CLA and 4CLB). The 5 strains thus obtained are strains 334, 335, 336, 337 and 338.
Ses souches ont ensuite été combinées à sept CCoAMT différentes (CCoAMTl, 2, 3, 4, 5, 6, 7, respectivement SEQ ID NO : 10 à 16)). 35 souches ont ainsi été obtenues : 339 à 343, 345, 347, 367 à 371, 373, 375, 395 à 399, 401, 403, 423 à 427, 429, 431, 451 à 455, 457 et 459. La production d'acide férulique est testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Elle est comparée à celle obtenue avec les souches contrôles sans CcoAMT, à savoir les souches 334 à 338. Les résultats sont présentés dans la figure 4.Its strains were then combined with seven different CCoAMTs (CCoAMT1, 2, 3, 4, 5, 6, 7, respectively SEQ ID NO: 10 to 16)). 35 strains were thus obtained: 339 to 343, 345, 347, 367 to 371, 373, 375, 395 to 399, 401, 403, 423 to 427, 429, 431, 451 to 455, 457 and 459. The production of ferulic acid is tested with each of these strains in the presence of 100 mg / L of caffeic acid. It is compared with that obtained with the control strains without CcoAMT, namely strains 334 to 338. The results are presented in FIG. 4.
Les meilleures combinaisons permettant la production d'acide férulique à partir d'acide caféique sont : The best combinations for producing ferulic acid from caffeic acid are:
- Thio3-4CL5-CCoAMTl (souche 367) - Thio3-4CL5-CCoAMTl (strain 367)
- Thio3-4CL5-CCoAMT6 (souche 373) - Thio3-4CL5-CCoAMT6 (strain 373)
- Thio3-4CL5-CCoAMT7 (souche 375) - Thio3-4CL5-CCoAMT7 (strain 375)
La production d'acide sinapique est testée avec chacune de ces souches en présence de 100 mg/L d'acide 5-hydroxy-férulique. Elle est comparée à celle obtenue avec les souches contrôles sans CcoAMT, à savoir les souches 334 à 338. Les résultats sont présentés dans la figure 5. The production of sinapic acid is tested with each of these strains in the presence of 100 mg / L of 5-hydroxy-ferulic acid. It is compared with that obtained with the control strains without CcoAMT, namely strains 334 to 338. The results are presented in FIG. 5.
La mesure de l'activité des CCoAMT seules (en absence de 4CL et Thio3) a été réalisée afin de confirmer que la synthèse d'acide férulique ou d'acide sinapique passe bien par les formes CoA et n'est pas obtenue directement à partir de l'acide caféique ou de l'acide 5- hydroxy-férulique. The measurement of the activity of CCoAMT alone (in the absence of 4CL and Thio3) was carried out in order to confirm that the synthesis of ferulic acid or sinapic acid does indeed pass through the CoA forms and is not obtained directly from caffeic acid or 5-hydroxy-ferulic acid.
Par ailleurs, la souche 335 a été combinée à deux CCoAMT différentes (CC0AMT8 et 9, respectivement SEQ ID NO : 40 et 41)). Les souches 623 et 912 ont ainsi été obtenues. La production d'acide férulique a été testée avec chacune de ces souches en présence de 100 mg/L d'acide caféique. Après 72h de culture, les souches 623 et 912 ont respectivement produit 42 mg/L et 41 mg/L d'acide férulique. Furthermore, strain 335 was combined with two different CCoAMT (CC0AMT8 and 9, respectively SEQ ID NO: 40 and 41)). Strains 623 and 912 were thus obtained. The production of ferulic acid was tested with each of these strains in the presence of 100 mg / L of caffeic acid. After 72 hours of culture, strains 623 and 912 respectively produced 42 mg / L and 41 mg / L of ferulic acid.
Ce résultat montre que les CCoAMT de Panicum virgatum (CC0AMT8, SEQ. ID NO : 40) et de Rauvolfia serpentina (CCoAMT9, SEQ ID NO : 41) exprimées de manière hétérologue dans la levure sont actives et capables de convertir le caféoyl-CoA en féruloyl-CoA, lequel est ensuite converti en acide férulique par la thioestérase. This result shows that the CCoAMTs of Panicum virgatum (CC0AMT8, SEQ. ID NO: 40) and of Rauvolfia serpentina (CCoAMT9, SEQ ID NO: 41) heterologously expressed in yeast are active and capable of converting caffeoyl-CoA into feruloyl-CoA, which is then converted to ferulic acid by thioesterase.
Production d'acide férulique à partir d'acide p-coumarique Production of ferulic acid from p-coumaric acid
Une souche de levure 507 a été construite dans laquelle les gènes ArolO et Fdc ont été inactivés et qui exprime un gène codant pour HpaB de Pseudomonas aeruginosa (SEQ ID NO : 17) et un gène codant pour HpaC de Salmonella enterica (SEQ ID NO : 18). La souche 507 a ensuite été modifiée par insertion des combinaisons 4CL-CCoAMT-Thio les plus performantes : A yeast strain 507 was constructed in which the ArolO and Fdc genes were inactivated and which expresses a gene encoding HpaB from Pseudomonas aeruginosa (SEQ ID NO: 17) and a gene encoding HpaC from Salmonella enterica (SEQ ID NO: 18). Strain 507 was then modified by inserting the best performing 4CL-CCoAMT-Thio combinations:
Souche 595 : insertion de 4CL5 {Citrus sinensis, SEQ ID NO : 6), CCoAMTl ( Vitis vinifera, SEQ ID NO : 10) et Thio3 (Pétunia hybrida, SEQ ID NO : 2) ; Souche 596 : : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO : 16) et Thio3 (Pétunia hybrida, SEQ ID NO : 2) ; et Strain 595: insertion of 4CL5 {Citrus sinensis, SEQ ID NO: 6), CCoAMT1 (Vitis vinifera, SEQ ID NO: 10) and Thio3 (Petunia hybrida, SEQ ID NO: 2); Strain 596:: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO: 16) and Thio3 (Petunia hybrida, SEQ ID NO: 2); and
Souche 597 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO : 15) et Thio3 (Pétunia hybrida, SEQ ID NO : 2). Ces souches ont ensuite été cultivées en présence d'acide p-coumarique (100mg/L). Strain 597: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO: 15) and Thio3 (Petunia hybrida, SEQ ID NO: 2). These strains were then cultured in the presence of p-coumaric acid (100 mg / L).
La production d'acide férulique de ces souches a été mesurée après 24h. Les résultats sont présentés dans la figure 6. The production of ferulic acid from these strains was measured after 24 hours. The results are shown in Figure 6.
Insertion d'une voie complète de production d'acide férulique chez la levure Une souche de levure 516 a été construite dans laquelle les gènes ArolO et Fdc ont été inactivés et qui exprime un gène codant pour un allèle d'Aro4 résistant au rétrocontrôle (AR04K229L, SEQ ID NO : 23), un gène codant pour un allèle d'Aro7 résistant au rétrocontrôle (AR07G141S, SEQ. ID NO : 24), un gène codant pour HpaB de Pseudomonas aeruginosa (SEQ ID NO : 17), un gène codant pour HpaC de Salmonella enterica (SEQ ID NO : 18), un gène codant pour TAL de Rhodotorula glutinis (SEQ ID NO : 19), un gène codant pour PAL d 'Arabidopsis thaliana (SEQ ID NO : 20), un gène codant pour C4H d 'Arabidopsis thaliana (SEQ ID NO : 21) et un gène codant pour CPR1 de Catharantus roseus (SEQ ID NO : 22).Insertion of a Complete Ferulic Acid Production Pathway in Yeast A yeast strain 516 was constructed in which the ArolO and Fdc genes were inactivated and which expresses a gene encoding an Aro4 allele resistant to feedback (AR04 K229L , SEQ ID NO: 23), a gene encoding an Aro7 allele resistant to feedback (AR07 G141S , SEQ. ID NO: 24), a gene encoding HpaB from Pseudomonas aeruginosa (SEQ ID NO: 17), a gene encoding HpaC from Salmonella enterica (SEQ ID NO: 18), a gene encoding TAL from Rhodotorula glutinis (SEQ ID NO: 19), a gene encoding PAL from Arabidopsis thaliana (SEQ ID NO: 20), a gene encoding C4H from Arabidopsis thaliana (SEQ ID NO: 21) and a gene encoding CPR1 from Catharantus roseus (SEQ ID NO: 22).
La souche 516 a ensuite été modifiée par insertion des combinaisons 4CL-CCoAMT-Thio les plus performantes : Souche 592 : insertion de 4CL5 (Citrus sinensis, SEQ ID NO : 6), CCoAMTl (Vitis vinifera, SEQ ID NO : 10) et Thio3 (Pétunia hybrida, SEQ ID NO : 2) ; Strain 516 was then modified by inserting the best performing 4CL-CCoAMT-Thio combinations: Strain 592: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMTl (Vitis vinifera, SEQ ID NO: 10) and Thio3 (Petunia hybrida, SEQ ID NO: 2);
Souche 593 : : insertion de 4CL5 ( Citrus sinensis, SEQ ID NO : 6), CCoAMT7 ( Populus trichocarpa, SEQ ID NO : 16) et Thio3 ( Pétunia hybrida, SEQ ID NO : 2) ; et Strain 593:: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CCoAMT7 (Populus trichocarpa, SEQ ID NO: 16) and Thio3 (Petunia hybrida, SEQ ID NO: 2); and
Souche 594 : insertion de 4CL5 ( Citrus sinensis, SEQ ID NO : 6), CC0AMT6 ( Arabidopsis thaliana, SEQ ID NO : 15) et Thio3 (Pétunia hybrida, SEQ ID NO : 2). Strain 594: insertion of 4CL5 (Citrus sinensis, SEQ ID NO: 6), CC0AMT6 (Arabidopsis thaliana, SEQ ID NO: 15) and Thio3 (Petunia hybrida, SEQ ID NO: 2).
Ces souches ont ensuite été cultivées en présence de glucose (20 g/L). These strains were then cultured in the presence of glucose (20 g / L).
La production d'acide férulique de ces souches a été mesurée après 24h. Les résultats sont présentés dans la figure 7. The production of ferulic acid from these strains was measured after 24 hours. The results are shown in Figure 7.
Claims
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP21733850.8A EP4153732A1 (en) | 2020-05-20 | 2021-05-20 | Method for the biosynthesis of phenylpropanoids |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| FR2005378 | 2020-05-20 | ||
| FR2005378A FR3110598B1 (en) | 2020-05-20 | 2020-05-20 | PHENYLPROPANOID BIOSYNTHESIS METHOD |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2021234309A1 true WO2021234309A1 (en) | 2021-11-25 |
Family
ID=73793240
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/FR2021/050911 Ceased WO2021234309A1 (en) | 2020-05-20 | 2021-05-20 | Method for the biosynthesis of phenylpropanoids |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP4153732A1 (en) |
| FR (1) | FR3110598B1 (en) |
| WO (1) | WO2021234309A1 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115820577A (en) * | 2022-11-29 | 2023-03-21 | 中国科学院华南植物园 | Lycium barbarum 4-coumaric acid: application of gene and protein encoding coenzyme A ligase |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1033405A2 (en) * | 1999-02-25 | 2000-09-06 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
| US8809028B2 (en) | 2011-11-07 | 2014-08-19 | University Of Georgia Research Foundation, Inc. | Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0503657D0 (en) * | 2005-02-22 | 2005-03-30 | Fluxome Sciences As | Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof |
-
2020
- 2020-05-20 FR FR2005378A patent/FR3110598B1/en active Active
-
2021
- 2021-05-20 WO PCT/FR2021/050911 patent/WO2021234309A1/en not_active Ceased
- 2021-05-20 EP EP21733850.8A patent/EP4153732A1/en active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP1033405A2 (en) * | 1999-02-25 | 2000-09-06 | Ceres Incorporated | Sequence-determined DNA fragments and corresponding polypeptides encoded thereby |
| US8809028B2 (en) | 2011-11-07 | 2014-08-19 | University Of Georgia Research Foundation, Inc. | Biosynthesis of caffeic acid and caffeic acid derivatives by recombinant microorganisms |
Non-Patent Citations (20)
| Title |
|---|
| "GenBank", Database accession no. NP _009808 |
| "NCBI", Database accession no. 852152 |
| ADEBESIN ET AL., PLANT J, vol. 93, no. 5, March 2018 (2018-03-01), pages 905 - 916 |
| ADEBESIN ET AL., PLANT J., vol. 93, January 2018 (2018-01-01), pages 905 - 916 |
| ALFENORE ET AL., APPL MICROBIOL BIOTECHNOL, vol. 60, 2002, pages 67 - 72 |
| CHAO ET AL., PLANTA, vol. 245, no. 1, January 2017 (2017-01-01), pages 61 - 75 |
| CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, pages 1 - 10 |
| ELLIS T. ET AL., INTEGRATIVE BIOLOGY, vol. 3, no. 2, 2011, pages 109 - 118 |
| FRASERCHAPPEL, ARABIDOPSIS BOO, vol. 9, 2011, pages e0152 |
| GOLD ET AL., MICROB CELL FACT, vol. 14, 2015, pages 73 |
| HOFFMANN LAURENT ET AL: "Purification, cloning, and properties of an acyltransferase controlling shikimate and quinate ester intermediates in phenylpropanoid metabolism", JOURNAL OF BIOLOGICAL CHEMISTRY, AMERICAN SOCIETY FOR BIOCHEMISTRY AND MOLECULAR BIOLOGY, US, vol. 278, no. 1, 3 January 2003 (2003-01-03), pages 95 - 103, XP009083239, ISSN: 0021-9258, DOI: 10.1074/JBC.M209362200 * |
| MANUELA GOTTARDI ET AL: "Pathway engineering for the production of heterologous aromatic chemicals and their derivatives in Saccharomyces cerevisiae: bioconversion from glucose", FEMS YEAST RESEARCH, vol. 17, no. 4, 1 June 2017 (2017-06-01), GB, NL, XP055491963, ISSN: 1567-1356, DOI: 10.1093/femsyr/fox035 * |
| MILKE LARS ET AL: "Production of plant-derived polyphenols in microorganisms: current state and perspectives", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, SPRINGER BERLIN HEIDELBERG, BERLIN/HEIDELBERG, vol. 102, no. 4, 16 January 2018 (2018-01-16), pages 1575 - 1585, XP036390154, ISSN: 0175-7598, [retrieved on 20180116], DOI: 10.1007/S00253-018-8747-5 * |
| MORTIMER RKJOHNSTON JR: "Genealogy of principal strains of the yeast genetic stock center", GENETICS, vol. 113, no. 1, 1986, pages 35 - 43 |
| PANDEY ET AL., BIOTECHNOL ADV., vol. 34, 2016, pages 634 - 662 |
| RAMIREZ-AHUMADA ET AL., PHYTOCHEMISTRY, vol. 67, no. 18, September 2006 (2006-09-01), pages 2017 - 29 |
| SCHNEIDER KATJA ET AL: "A New Type of Peroxisomal Acyl-Coenzyme A Synthetase from Arabidopsis thaliana Has the Catalytic Capacity to Activate Biosynthetic Precursors of Jasmonic Acid", JOURNAL OF BIOLOGICAL CHEMISTRY, vol. 280, no. 14, 26 January 2005 (2005-01-26), US, pages 13962 - 13972, XP055844959, ISSN: 0021-9258, Retrieved from the Internet <URL:https://www.jbc.org/action/showPdf?pii=S0021-9258(19)60478-3> DOI: 10.1074/jbc.M413578200 * |
| VERDUYN ET AL., YEAST, vol. 8, 1992, pages 501 - 17 |
| VISSER ET AL., BIOTECHNOLOGY AND BIOENGINEERING, vol. 79, 2002, pages 674 - 81 |
| WAGNER ET AL., FUNGAL GENET BIOL, vol. 89, 2016, pages 126 - 136 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN115820577A (en) * | 2022-11-29 | 2023-03-21 | 中国科学院华南植物园 | Lycium barbarum 4-coumaric acid: application of gene and protein encoding coenzyme A ligase |
Also Published As
| Publication number | Publication date |
|---|---|
| EP4153732A1 (en) | 2023-03-29 |
| FR3110598B1 (en) | 2025-05-02 |
| FR3110598A1 (en) | 2021-11-26 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2020165182A1 (en) | Method for biosynthesising diosmetin and/or hesperetin in a microorganism | |
| JP5528108B2 (en) | Metabolically modified cells for producing pinosylvin | |
| WO2020165189A1 (en) | Method for the biosynthesis of diosmin and/or hesperidin in a microorganism | |
| US9834793B2 (en) | Metabolically engineered cells for the production of resveratrol or an oligomeric or glycosidically-bound derivative thereof | |
| CA2547695C (en) | Advanced microorganism for producing 1,2-propanediol | |
| US20120244588A1 (en) | Method of producing 3-hydroxypropionic acid using malonic semialdehyde reducing pathway | |
| CN113614240B (en) | Improved means and methods for producing isobutylene from acetyl-CoA | |
| US20240254525A1 (en) | Method for the incorporation of formaldehyde into biomass | |
| EP4055142A1 (en) | Recombinant yeast capable of producing caffeic acid and/or ferulic acid | |
| JP7186261B2 (en) | Biotechnological production of ω-functionalized carboxylic acids and their esters | |
| EP3464556A1 (en) | Production of frambinone by a recombinant fungal microorganism | |
| Zhan et al. | Systematic metabolic engineering of Bacillus licheniformis for hyperproduction of the antioxidant hydroxytyrosol | |
| US20220162661A1 (en) | Production of 2-Hydroxyacyl-CoAs and Derivatives Thereof | |
| WO2020165178A1 (en) | Method for biosynthesising eriodictyol and/or luteolin in a yeast | |
| EP4153732A1 (en) | Method for the biosynthesis of phenylpropanoids | |
| WO2023094774A1 (en) | Method for the biosynthesis of caffeic acid and ferulic acid | |
| JP2017055702A (en) | Recombinant cell, method for producing recombinant cell, and method for producing shyobunol |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21733850 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| ENP | Entry into the national phase |
Ref document number: 2021733850 Country of ref document: EP Effective date: 20221220 |